Google AnalyticsとBaidu Statisticsの原理の分析

Google AnalyticsとBaidu Statisticsの原理の分析

Google AnalyticsとBaidu Statisticsの統計データには違いがあり、その差は非常に大きいです。根本的な理由は、データ統計の原理とメカニズムが異なるためです。以下は、Google Analytics と Baidu Statistics の主な分析です。

百度統計の動作原理の分析

Baidu Statistics が提供する JS は、実際にはページにコード hm.baidu.com/h.js を導入します。コードの内容は、それに続くパラメータによって異なります。h.js? に続くパラメータは、Baidu Statistics での ID です。

h.js コードを取得すると、Baidu Statistics は「HMACCOUNT」という名前の Cookie をブラウザに書き込みます。この Cookie の有効期限は 2038 年なので、ブラウザの Cookie をクリアしない限り、基本的に期限切れになることはありません。

h.js がダウンロードされると、そのスクリプトが実行され、画面サイズ、色深度、フラッシュ バージョン、ユーザー言語など、ブラウザー関連の情報やアクセス ソースが取得されます。

js コードから、すべてのパラメータに「cc、cf、ci、ck、cl、cm、cp、cw、ds、ep、et、fl、ja、ln、lo、lt、nv、rnd、sb、se、si、st、su、sw、sse、v」が含まれていることがわかります。これらのパラメータの意味は次のとおりです。

cc: わからない、通常は1

cf: URLパラメータhmsrの値

ci: URLパラメータhmciの値

ck: クッキーをサポートするかどうか 1:0

cl: 色深度(「32 ビット」など)

cm: URLパラメータhmmdの値

cp: URLパラメータhmplの値

cw: URLパラメータhmkwの値

ds: 画面サイズ(例: '1024×768')

ep: 初期値は '0' で、ページの滞在時間を反映する時間変数です。形式は、おおよそ次のようになります: 現在の時間 - 読み込み時間 + "," + 別の非常に小さな時間値

et: 初期値は '0' です。ep 時間変数が 0 でない場合は、別の値になります。

fl: フラッシュバージョン

ja:javaは1:0をサポートします

ln: 言語 zh-cn

lo: 不明、通常は 0

lt: 最初のリクエストには含まれない日付time.time()(「1327847756」など)

nv: 不明、通常は 1 または 0

rnd: ランダムな10桁の数字

sb: 360seブラウザの場合、値は「17」になります

se: 検索エンジンに関連する

si: 統計コードID

st:

su: 前のページ document.referrer

sw: わかりません。おそらく検索エンジンに関連しているのでしょう。通常は空です。

sse: わかりません。おそらく検索エンジンに関連しているのでしょう。通常は空です。

v: 統計コードのバージョン。現在の値は「1.0.17」です。

これらすべてのパラメータが設定されている場合(一部のパラメータには値が割り当てられていません)、値が割り当てられているパラメータをフィルタリングし、それらを hm.baidu.com/hm.gif のパラメータとして使用して、次のような URL を組み立てます:http://upload.chinaz.com//?cc=1&ck=1&cl=32-bit& ds=1366×768&ep=0&et=0&fl=11.0&ja=1&ln=zh-cn。次に画像をリクエストします。

Baidu 統計サーバーはこのリクエストを受信し、画像の URL に添付されたパラメータから関連情報を取得して、訪問者のアクセス履歴を記録します。ユーザーがページを閉じると、hm.gif のリクエストもトリガーされますが、このプロセスはすべてのブラウザおよびすべての閉じるアクションでサポートされているわけではありません。

Wireshark (ネットワーク パケット キャプチャ ツール) を使用してテストすると、ブラウザーがサーバーに合計 4 つのリクエストを送信していることがわかります。

js スクリプトをリクエストします。

読み込みが完了すると、リクエストが行われ、パラメータが渡されます

ページを終了する際にリクエストが行われ、パラメータが渡されます。上記と比較すると、epパラメータが変更されていることがわかります。

Baidu Statistics は Cookie に基づいています。js スクリプトが要求されると、永続的な Cookie がコンピューターに保存され、ユーザー ID として機能します。同時に、終了時にパラメータ ep が初期の 0 から「7289%2C115」に変化し、終了後は「7289, 115」になることがわかりました。これらは 2 つのミリ秒単位、つまり 7.2 秒と 0.1 秒です。同時に、lt パラメータ (time、javascript: (new Date).getTime()) は、hm.gif の最初の 2 つのリクエストでは変更されません。 rnd 乱数は毎回変わります。

Google アナリティクスの仕組み

ユーザーが Google アナリティクスの統計コードを含むページにアクセスすると、このコードはユーザーのブラウザによって実行されます。このコードの目的は、閲覧したページの URL、ブラウザの種類、オペレーティング システム、システム言語、画面解像度など、訪問者に関する情報を収集することです。

GA 統計コードは、この訪問者情報を Cookie に保存します。Cookie は、ローカルに保存され、訪問した Web サイトに関連付けられた短いテキストです。Cookie は、ユーザーが初めて訪問したのか、複数回訪問したのか、ページの参照元、その後のページ閲覧情報などを判断するために使用されます。

最後に、収集されたすべての情報は Google Analytics データ サーバーに送信されます。このプロセスは非常に巧妙です。サーバー ログ ファイルにすべてのファイル リクエスト情報が記録されることはわかっています。Google Analytics がデータを収集する方法は、サーバーから透明な 1×1 GIF 画像ファイルをリクエストすることです。このファイル リクエストとリクエスト時間はサーバー ログに記録され、ファイル リクエスト情報には、GA 統計コードによって収集されたデータと Cookie 情報が含まれます。このように、この GIF 画像がリクエスト アプリケーションを受け取るたびに、訪問者のアクセス情報が Google Analytics データ サーバーによって収集されます。

ただし、Google アナリティクスは 1 つの gif リクエストのみを送信しますが、複数の gif リクエストが送信されることもよくあります。 gif 画像をカウントできない場合、GA は他の gif リクエストを送信します。

要約:

ウェブ分析の第一人者である Avinash 氏は、データの精度が 90% であれば、タイムリーにアクションを起こすことができる、とかつて言っていました。重要なのは、傾向を把握し、行動を起こし、時間をかけてテストと最適化を行えることです。

<<:  nofollow タグはウェブマスターの外部リンクにどれくらいの時間を浪費するのでしょうか?

>>:  ウェブサイトの外部リンク構築を最適化し、フォーラムリソースを活用するための 5 つの戦略

推薦する

推奨: vps.us-5 USD/Xen/1g RAM/10g HDD/50m 無制限/無料ドメイン名

vps.us は 11 か月間 Hostcat に登場していません。今回はすべての VPS に適用さ...

実名登録は単なるマーケティング戦略。出会い系サイトは信頼の危機に直面している

ネット恋愛や結婚、電子商取引、その他のオンラインコミュニケーションなど、実名登録は発展のトレンドにな...

2022 年に推奨されるホスティング プロバイダーは何ですか?

現在、マネージド サービス市場は、リモート ワークや需要の高い人材を IT チームに配置するという課...

中国インターネット界のナマズ、周紅一:巨人と戦ってさらに大きくなる

周宏偉はじめに:360 が決して諦めず、常に巨人に挑戦し続けることを支えているのは、周紅義の攻撃的な...

raksmart: 日本の VPS、無制限のトラフィック、Windows システム、夕方のピーク時の PING が超低

raksmart が日本のデータセンターに VPS を新規導入しました。トラフィック制限がなく、主流...

大手企業がクラウド コンピューティングの覇権を競い合う! 5Gと疫病はどんな新たな変化をもたらすのでしょうか?

パソコンやインターネットに続き、クラウドコンピューティングが IT 業界に新たな改革の波を起こしまし...

#推奨# ultravps - 40 ユーロ/年/KVM/2G メモリ/50gSSD/1Gbps 帯域幅/オプションのコンピュータ ルーム 5 室

Ultravps に新しいニュースがあります。米国 (ダラス、ロサンゼルス)、ドイツ (デュッセルド...

ユーザーエクスペリエンスデザインの初期の成果物をより視覚的にする

[編集者注] この記事の著者はBarnabas Nagyで、@C7210が翻訳しました。 Barna...

中国におけるクラウドコンピューティング:2025年までの展望

中国は、比較的ゆっくりとしたスタートの後、クラウドコンピューティングへの移行を急速に進め、現在では米...

Webmaster.com からの毎日のレポート: アリババが買い戻し計画を完了、12306 枚のチケット予約が困難

1. ゴールデンウィークの列車チケットが発売され、12306予約システムでログイン障害が頻発最近、中...

Vultr 無料 $5 (VPS-12 データセンター)

Vultr は本日、ウェブサイトの再設計を完了し、5 ドルのトライアル割引をリリースしました。割引は...

健全なウェブサイト内部リンク構造を構築する方法

百度は6月22日と28日に公式声明を発表し、低品質サイトへの取り締まりの厳しさを厳粛に強調し、独自の...

NexusbytesのAMDシリーズの日本向けVPSの簡単なレビュー

Nexusbytes は長年運営されていますが、その人気はここ 1 ~ 2 年でわずかに高まっただけ...

moack: 韓国のサーバー、40% オフ、CN2+LG ハイブリッド、Windows をサポート、Alipay が利用可能

moack 韓国データセンターには、2 つの特別な独立サーバー プロモーションがあり、永久に 40%...

2020 AWS テクノロジーサミットとパートナーサミットがオンラインで開催され、業界のデジタル変革とパートナーとのイノベーションに焦点を当てる

2020年9月10日から11日にかけて、クラウドコンピューティング分野における毎年恒例の大規模技術イ...