ウェブログ分析の初心者向けガイド

ウェブログ分析の初心者向けガイド

ウェブサイトのログ分析は、経験豊富なウェブマスターにとっては非常に簡単です。彼らは、ログコードの確認からログ分析で見つかった問題の解決まで、すべてを知っています。実は、ウェブサイトのログ分析は難しくないのですが、初心者は意味が分からないため、問題があると考えてしまうのです。ウェブサイトのログをさらに読むと、その意味が理解できるようになります。ここでは、Lucky Racing Web サイトのログを例に、初心者にこの作業をすぐに開始する方法を説明します。

実は、コードはみんなが想像するほど難しくありません。私が初めて宝くじウェブサイトの最適化作業を行い、コードに触れたとき、こんなに難しいラッキーレース http://www.7ien.cn/xysc.aspx ウェブサイトのログコードを理解できるウェブマスターは本当にすごいと思いました。彼らに対する私の尊敬の念は言葉では言い表せません。しばらくウェブサイトのログを眺めていたら、彼らが優秀だったわけではなく、自分がまだ新人だったことに気づきました。自分で考えようとすると、Web サイトのログ分析を始めるのに長い時間がかかります。ここでは、私の経験をいくつか紹介します。初心者がすぐに始められるようになると思います。

1. 蜘蛛の名前の紹介

ウェブサイトのログでは、スパイダー名は通常、Baidu->baiduspider、Google->Googlebot、Msn->msnbot、Yahoo->Slurp、Yodao->YoudaoBot、Sogou->Sogou+get+spider のカテゴリに分類されます。ログで上記のクモの名前を検索すると、この種類のクモの移動痕跡が表示されます。

2. スパイダークロールリターンタイプ

スパイダーがクロールするとコードが返されます。** ステータスを確認することでクロール結果を確認できます。主な HTTP ステータス コードは次のとおりです。

(1)200コードは、スパイダークロールが正常であることを示す。

(2)304コードは、コンテンツが前回のクロール以降更新されていないことを示します。一般的に、Web サイトの画像はこの値を返すことが多いです。

(3)404コード:アクセスしたリンクは間違ったリンクです。この間違ったリンクは、元々存在していたが後に削除された Web ページからのものである可能性があります。一方、最初は存在しなかったが、他の誰かがリンクした Web ページからのものである可能性もあります。

(4)一時的なリダイレクトを示す302コード。

(5)301コードは永続的なリダイレクトを示します。

(6)500コードはプログラムエラーを示します。

3. ログコードの解釈

#ソフトウェア: Microsoft インターネット インフォメーション サービス 6.0

#バージョン: 1.0

#日付: 2013-12-22 16:00:39

#フィールド: 日付、時刻、s-サイト名、s-コンピュータ名、s-ip、cs-メソッド、cs-uri-stem、cs-uri-query、s-ポート、cs-ユーザー名、c-i​​p、cs-バージョン、cs(ユーザーエージェント)、cs(Cookie)、cs(リファラー)、cs-ホスト、sc-ステータス、sc-サブステータス、sc-win32-ステータス、sc-バイト、cs-バイト、所要時間

date はレコードのアクセス日を示します。

時間アクセス時間;

s-sitename は仮想ホストのエイリアスです。

s-ip 訪問者 IP;

cs-method はアクセス方法を示します。一般的な方法は 2 つあります。アクセスする URL を開くときのアクションである GET と、フォームを送信するときのアクションである POST です。

cs-uri-stem はアクセスするファイルです。

cs-uri-query は、asp file? の後に文字列 id=12 が続くなど、アクセス アドレスの追加パラメータを参照します。パラメータがない場合は、-; で表されます。

s-port アクセスするポート。

cs-username 訪問者名;

c-ip ソース IP;

cs (User-Agent) アクセス ソース。

sc-status ステータス、200 は成功、403 は権限なし、404 はページにアクセスできない、500 はプログラム エラーを意味します。

sc-substatus サーバーからクライアントに送信されたサイズ(バイト単位)。

cs – win32-status クライアントがサーバーに送信するサイズ(バイト単位)。

具体的な事例分析:

2013-12-22 18:47:12 W3SVC2137573334 D-901195C886694 119.147.151.150 GET /a.aspx id=2230&TypeId=91 80 - 123.125.71.28 HTTP/1.1 Mozilla/5.0+(compatible;+Baiduspider/2.0;++http://www.baidu.com/search/spider.html) - - www.7ien.cn 200 0 0 59004 243 2250

このログは、Baiduspider: はスパイダー クロール タイプが Baidu スパイダーであることを示し、GET /a.aspx id=2230&TypeId=91 はスパイダー クロール ファイル名が a.aspx id=2230&TypeId=91 であることを示します。返される結果は 200 です。


元のタイトル: ウェブサイトログ分析の初心者向けガイド

キーワード: ウェブサイトログ分析、初心者向けガイド

<<:  SEOウェブサイト監査を開始する方法

>>:  ウェブサイトの最適化はユーザーエクスペリエンスを向上させるために最も重要なことです

推薦する

タオバオは偽造取引を取り締まる。ジャック・マー氏:「誇大広告を取り締まるのは無駄だ」

中国国家放送、北京、12月7日(記者 劉立、インターン記者 任玉謙)中国国家放送の「ニュースパノラマ...

カフカのこの「千里眼」について知っておく必要があります! ! !

[[413084]] Kafka クラスターの担当者としては、メッセージのバックログや繰り返しの再バ...

タオバオがPinterestのようなウェブサイト「Wantu」を立ち上げ、ソーシャルイメージショッピング戦略を開始

Admin5によると、Taobaoは4月9日、写真共有コミュニティ「Wantu」を立ち上げるため、第...

ソリューション共有 | インターネット住宅リフォームのブランド企画とマーケティングプロモーションのご提案!

新しいメディアマーケティングの世界では競争が激しく、多くの人は自分の計画を他の人と話し合うよりも自分...

1cloud: 月額 7 ドルのクラウド サーバー、ロシア、カザフスタン、ベラルーシのデータ センター

1cloud は、2017 年に設立されたロシアのクラウド サーバー プロバイダーです。基盤となるオ...

データセンター分散スケジューリングのスーパーマン: DCOS - 急成長するデータ都市へご案内

DCOS は、データセンター全体に分散スケジューリングおよび調整機能を提供し、データセンター レベル...

vpsdatabase - カナダ/ロシア/米国で KVM が 21% オフ

すべての VPS が 21% オフ、7 日間の無条件返金保証、クーポン コード: BlackJack...

SEO検索エンジン最適化によりランキングが向上します

多くの SEO 担当者は、ウェブサイトのキーワードのランキングを非常に気にしており、これを利用して ...

「私は特殊部隊の兵士2: 国家の刃」のマーケティングハイライトを共有します

最近、江蘇衛星テレビのドラマ「私は特殊部隊の兵士2:国家の刃」が大人気で、筆者も最近このドラマを追い...

張青:ウェブマスターツールのエラーウェイトが一夜にして0から3になった話

今日、ブロガーの友人であるミプのブログの管理者から連絡があり、彼女のブログに異常な現象が起きていると...

クラウド3.0の3つの大きな課題

[51CTO.com クイック翻訳] Cloud 1.0 は、仮想化ベースの Infrastruct...

マイクロサービス展開モデルの紹介

マイクロサービスをデプロイするいくつかの方法を見てみましょう。マイクロサービスは、大規模で複雑なアプ...

ネット偽薬転売事件、総額22億元、140以上の違法サイトが閉鎖

新華社が北京で14日に伝えたところによると(記者:白楊邵偉)、記者が14日に公安部から得た情報による...

クラウドネイティブセキュリティベンダーのXiaoyou Technologyが数千万ドルのプレAラウンドの資金調達を完了

最近、国内大手のクラウドネイティブセキュリティ企業である北京小友科技が、プレA資金調達の完了を発表し...