Web 分析データ収集方法の説明: Web ログ JS タグとパケット スニファー

Web 分析データ収集方法の説明: Web ログ JS タグとパケット スニファー

ウェブサイト分析の歴史を振り返ると、「あなたは***番目の訪問者です」という表現から、現在の専門ツールプロバイダーの隆盛に至るまで、ウェブサイト分析は徐々に科学へと発展してきました。しかし、さまざまな形式の分析データに直面して、多くの人が依然としてデータのソースについて混乱しています。Web サイトの分析データを収集する原則を理解することで、これらの混乱を解決できる可能性があります。

現在、Web サイトの分析データを収集する主な方法は、Web ログ、JavaScript タグ、パケット スニファーの 3 つです。

1. ウェブログ

下の図は、Web ログ データ収集プロセスの概略図です。

上の図から、ウェブサイト訪問者が URL を入力し、ウェブサイト サーバーに http リクエストを送信すると、ウェブサイト分析データの収集が開始されることがわかります。リクエストを受信すると、Web サイト サーバーは独自のログ ファイルにレコードを追加します。レコードの内容には、リモート ホスト名 (または IP アドレス)、ログイン名、フル ログイン名、リクエストの日付、リクエストの時刻、リクエストの詳細 (リクエスト方法、アドレス、プロトコルを含む)、リクエストの戻りステータス、およびリクエストされたドキュメントのサイズが含まれます。その後、Web サーバーはページを訪問者のブラウザに返して表示します。

一部のプロフェッショナル ツール メーカーは、大量のログ データを処理し、処理したデータを独自のデータベースに保存するための専用の処理サーバーを備えています。ウェブサイト運営者は、分析レポート システムにアクセスして、ウェブサイトの分析データを表示します。中小規模のウェブサイト所有者の中には、コストを考慮して専門のツールメーカーの支援を求めない人もいます。彼らは、シンプルなウェブサイトログ分析ソフトウェアを使用してログデータの処理を完了します。もちろん、処理されたデータには一定の制限があります。

2. JavaScript タグ

次の図は、JavaScript タグ収集データ プロセスの概略図です。

上記の JavaScript タグは、Web サイトの訪問者が http リクエストを行うことから始まり、Web ログと同じようにデータを収集します。違いは、JavaScript タグによって訪問者に返される Web ページ コードに、ページが表示されるときに実行される特別な JavaScript コードが含まれることです。このコードは、訪問者の Cookie から詳細情報 (アクセス時間、ブラウザ情報、ツール製造元によって現在の訪問者に割り当てられたユーザー ID など) を取得し、ツール製造元のデータ収集サーバーに送信します。データ収集サーバーは収集されたデータを処理し、データベースに保存します。ウェブサイト運営者は、分析およびレポート システムにアクセスしてこのデータを表示します。

JavaScript タグは、そのスピードと精度からほとんどのツールメーカーに好まれており、最も人気のあるデータ収集方法となっています。

3. パケットスニファー

次の図は、パケット スニファーがデータを収集するプロセスの概略図です。

上の図から、Web サイトの訪問者が送信したリクエストが Web サイト サーバーに到達する前に、まずパケット スニファーを通過し、次にパケット スニファーがリクエストを Web サイト サーバーに送信することがわかります。パケット スニファーによって収集されたデータは、ツール製造元のサーバーによって処理され、データベースに保存されます。ウェブサイト運営者は、分析レポートシステムを通じてこのデータを閲覧できます。

4. データ収集方法の長所と短所の比較

完璧なデータ収集方法はありません。データ収集方法によっても、それぞれの特徴が異なります。さまざまな収集方法の長所と短所を理解することは、ツールを選択する際の指針にもなります。

次の表は、3 つのデータ収集方法の長所と短所を詳細に比較したものです。

Web ログ JavaScript マーカー パケット スニファー

利点: データソースの入手が容易

・履歴データの再処理に便利

・検索エンジンクローラーのアクセス記録を記録できる

・ファイルのダウンロード状況を記録・柔軟なデータ収集と強力なカスタマイズ性

・キャッシュやプロキシサーバへのアクセスを記録可能

・訪問者の行動をより正確に追跡・クロスドメインアクセスを監視するのがより便利

・リアルタイムデータを取得するとより便利

デメリット: キャッシュとプロキシサーバーへのアクセスを記録できない

・カスタマイズされたビジネス情報を取得できない

・来場者の位置づけが曖昧すぎる

・クロスドメインアクセスの監視が難しい ・ユーザー側のJS設定がデータ収集に影響する

・ダウンロードやリダイレクトの記録が難しい

・WebサイトのJSスクリプト負荷が増加する・初期導入コストが高い

・キャッシュやプロキシサーバへのアクセスを記録できない

・ユーザーデータのプライバシーに対する潜在的なセキュリティリスク

どのデータ収集方法を選択するかを決定する前に、ニーズを理解する必要があります。ウェブサイトのトラフィック データを第三者に取得されたくない場合は、ウェブ ログが間違いなく最適な選択肢です。ただし、Web サイト訪問者の行動に関するより正確なデータを取得したい場合は、JavaScript タグを使用してデータを収集する必要があります。このデータ収集方法は、キャッシュ アクセスとプロキシ アクセスを正確に記録できるだけでなく、Cookie を通じて独立した訪問者の位置をより正確に特定することもできます。

もちろん、多面的なデータを取得するために、複数のデータ収集方法を同時に使用するウェブサイトもあります。たとえば、JavaScript タグは正確なデータを収集するために使用されますが、検索エンジンの最適化のために、Web ログ内の検索エンジン クローラー レコードも分析されます。パケット スニファーを使用してデータを収集し、キャッシュ アクセス用に JavaScript タグ付けを実行するものもあります。

採用するデータ収集方法によって、分析ツールの選択は大きく決まりますが、この側面だけでツールの選択方法を検討するだけでは十分ではありません。次のコンテンツでは、ツールを選択する前にツールプロバイダーからどのような技術的パラメータを理解する必要があるかを詳しく紹介し、合理的な判断を下せるようにします。

(著作権はDigital Forest Website Analysis Blogに帰属します。転載は歓迎しますが、出典を明記してください。)

オリジナルリンク: http://blog.digitalforest.cn/wangzhanfenxi-shujushouji


原題: ウェブサイト分析データ収集方法の詳細説明: ウェブログ JS タグとパケットスニファー

キーワード: ウェブサイト分析、データ収集方法、詳細な形式、ウェブ、ログ、タグ、パケットスニッフィング、レビュー、ウェブマスター、ウェブサイトのプロモーション、収益化

<<:  ウェブマスターと一緒に歩き、タオバオアフィリエイトコンテストがウェブマスターにもたらす機会を確認します

>>:  Webmaster.com の毎日のレポート: 独身の日に大手 e コマース企業 7 社が競い合う; Xiaomi が有料プランを開始

推薦する

クラウドコンピューティングの大きな障害

最近、「クラウド」についてよく話題になっています。技術の急速な発展に伴い、クラウド技術は拡大し続けて...

2023年、クラウドコンピューティングの方向性は変化した

2022 年はクラウド コンピューティングにとって「転換点」となる年です。過去2年間の好況と比較する...

Bilibiliでは、1億人の中国のティーンエイジャーが成長しました!

ビリビリの若々しい場所では、10代の若者たちが成長し、父親や妻になるなど、社会の主流に入り、役割を果...

Tencent Cloud は、アジア太平洋地域の Gartner Peer Insights Container Management Customer Voice で「Strong Performer」に選出されました。

中国のコンテナメーカーは世界中のユーザーから認知されつつあります。ガートナー社の最新の「コンテナ管理...

Baidu Webmaster Platform: プレッシャーフィードバックツールの名前が変更され、一時的なサイト閉鎖機能が追加されました

多くのウェブマスターは、「プレッシャーフィードバック」の意味を理解していないと述べました。現在は「ク...

「みんながみんなに伝えよう」より多くのユーザーの心からの推薦を獲得する方法

Baidu の「検索エンジン最適化ガイド 2.0」には、「インターネット上には、同じコンテンツやサー...

ソフト記事プロモーションを使って少しお金を稼ぐ方法についてのヒントを共有します

前回のブログ記事「母を南京に連れて行く」で、ソフトテキストプロモーションでお金を稼ぐちょっとしたコツ...

Linux ホスト/サーバーに PPTP をインストールして展開する方法

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っていますサーバーに...

2019年、世界のIaaSパブリッククラウドサービス市場は37.3%成長しました。

ガートナーによると、世界のインフラストラクチャ・アズ・ア・サービス(IaaS)市場は2018年の32...

テンセントは依然としてテンセントだが、ゲーム市場はもはや同じ市場ではない

時が経つにつれ、シャンダは姿を消した。2009年に中国のオンラインゲームのトップの座から退いたシャン...

SEO運用における個人的な経験

長い間何も書いていませんでした。今日は少し自由な気分なので、何か書きたいので、キーボードで何か入力す...

六易クラウド:全品10%オフ、クラウドサーバー(香港\ロサンゼルス)、高防御CDN半額、リチャージキャッシュバック

Liuyi Cloud は、主にクラウド サーバー、仮想ホスト、CDN、高防御サービスを提供する中国...

中国の外部リンク専門家の悲しさについて語る

SEO 作業において、外部リンクの専門家は極めて重要なポジションです。外部リンクは SEO 最適化に...

Hawkhost - 25% オフ/生涯価格/シンガポール VPS/ソフトレイヤー データ センター/Alipay/PayPal

Hawkhost は 7 月にプロモーションを実施し、仮想ホスト\再販業者\半専用\VPS が 25...

テンセントが2020年のR&Dビッグデータレポートを発表:R&D人材が68%を占める

テンセントは3月18日、2020年の「テンセントR&Dビッグデータレポート」を正式に発表した。この報...