SEO診断事例2: ウェブサイトの収集とスナップショットがタイムリーではない

SEO診断事例2: ウェブサイトの収集とスナップショットがタイムリーではない

みなさんこんにちは。私はMuzi Chengzhouです。 SEO 診断は、私が常にやり続けてきた仕事です。これまで、SEO 診断に関するさまざまなアイデアについてお話ししてきました。その多くは、友人からの質問や相談、また私自身の Web サイトの問題の発見や調査から生まれたものです。今日は別の診断事例を紹介します。主な問題は、ウェブサイトのインクルードとスナップショットがタイミングよく行われないという問題です。

昨日、友人が私のところに来て、彼のウェブサイトの症状の診断を手伝ってほしいと頼んできました。彼とやり取りした後、彼のウェブサイトについていくつかの情報を知りました。彼のウェブサイトは毎日更新されていますが、Baiduは翌日にはそれを組み込んで公開しません。毎週または毎月の更新時に多くの以前のページをリリースするだけです。スナップショットも非常にゆっくりと更新されていますが、徐々に組み込みとリリースに追いつきます。この状況は1か月以上続いています。以下は私のアイデアですが、皆様のお役に立てれば幸いです。

まず、この友人にウェブサイトの LOG ログを確認することを提案します。LOG ログには、ウェブサイト内の Baidu スパイダーのクローリング状況が反映される可能性があるからです。私の知る限り、多くの友人は現在、LOG ログを確認する習慣がないか、頻繁に LOG ログを確認することができません。この友人もその 1 人です。彼は LOG ログを確認したが、それを分析する方法がわからないと言っていました。以下は私の分析のアイデアの簡単な紹介です。

1. 検索エンジンスパイダーのクローリングサマリー分析をチェックして、各検索エンジンスパイダーの訪問数、総滞在時間、総クローリング量、割合を把握します。以下は、友人のウェブサイトのサマリー分析です(Lightyearログ分析ツールを使用して結果を表示します)。Baiduスパイダーは、292ワード、126訪問、総滞在時間8.873時間で、ウェブサイトのクローリング量が良好であり、すべてのスパイダーの41.011%を占めていることがはっきりとわかります。

ウェブサイト LOG ログ概要分析

Baidu スパイダーの総滞在時間は非常に長く、単一滞在時間は短くないので (PS: スパイダー単一滞在時間 = 総滞在時間 / 訪問数 = 0.0704 時間 / 時間 = 4.225 分)、なぜ Web サイトのインクルードが追いつかないのかと疑問に思う人もいるかもしれません。このような疑問を持って、Baidu スパイダーによる他のページのクロールについて分析してみましょう。

2. Baidu Spider によるウェブサイト ディレクトリのクロールを確認します。次のクロール チャートから、Baidu Spider がホーム ディレクトリと製品ディレクトリをより多くクロールしている一方で、ウェブサイト内のもう 1 つの重要なディレクトリであるニュースをあまりクロールしていないことがはっきりとわかります。このディレクトリは、ウェブサイトで毎日より頻繁に更新される作業ディレクトリです。スパイダーは、upload、files、img などのバックグラウンド ファイル ディレクトリもクロールします。

ウェブサイトディレクトリのクロール

上記の分析から、BaiduスパイダーによるWebページの内部部分のクロールが不合理であることがわかります。主な問題は次のとおりです。1. Webサイトの内部構造がニュースコラムをクロールするのに十分強力ではありません。2. ホームディレクトリはコミュニティとして使用され、製品ディレクトリは製品センターとして使用されているため、Webサイトスパイダーのクロールリソースが分散しています。3. Webサイトには、不要なクロールディレクトリに対する適切な制限がありません。問題を解決するには、これら 3 つの側面から始める必要があります。

1. サイト内の相互リンクのインポート、サイト外への外部リンクのリリースなど、更新されたページへのリンクの入り口をさらに作成するなど、スパイダーがニュース ディレクトリの下にあるより多くの Web ページをクロールするように誘導します。

2. ウェブサイトのコミュニティをチェックして、基本的に更新がないことを確認します。最初にホーム ディレクトリをブロックして、より多くの重みとスパイダーをニュース コラムに誘導することを検討できます。商品ディレクトリは比較的重要なディレクトリですが、含まれていない商品や新商品をクロールするように誘導する方がよいでしょう。ウェブサイトの商品ページを確認したところ、関連商品の推奨が十分ではなく、改善の余地があることがわかりました。

3. ロボット ファイルまたは nofollow タグを使用して、Web サイト上の重要でないディレクトリやページ、および一部のバックグラウンド ファイルを制限します。

さらに、もう1つ考慮すべき点があります。Baiduスパイダーは滞在時間が長いですが、クロールの量は特に多くありません。Baiduスパイダーがページをクロールするときに返すステータスコード200、304、404の割合も確認する必要があります。 304 が多数ある場合は、クロールされていないページにこれらのスパイダー リソースを割り当てることを検討してください。 404 ページが多数ある場合は、スパイダーが何らかの罠にかかっているかどうかを検討する必要があります。Web サイト内で 404 ステータス コードの原因となっているページを確認し、修正してください。

これまでお話ししたのは主にサイト内のスパイダークローリングの分布でしたが、サイト外のスパイダー誘導が十分に強力でない場合、Web サイトを組み込んでその重みを向上させるという作業は依然としてうまくいきません (PS: Web サイトのスナップショットは Web サイトの重みを反映しています)。使用できる方法は次のとおりです。

1. HTML および XML 形式のマップを含む Web サイト マップを再確立し、ロボット ファイルにクロール ルールを記述して、スパイダーが Web サイト サイトマップ マップをクロールするように誘導します。書き方は以下の通りです。

サイトマップ: http://www.xxx.com/sitemap.html

2. より多くの内部リンクと外部リンクを確立し、Web サイトのそれぞれの Web ページにできるだけ多くのスパイダー クローリングの入り口を提供して、Web ページのクローリング量を最大限に増やします。特に外部リンクの構築については、ウェブサイトが更新された直後にフォーラムやブログなどの権威の高いプラットフォームにアクセスし、記事やディレクトリへのリンクを投稿して、スパイダークローラーを引き付けることを検討できます。

今回は、LOG ログ解析に関するいくつかのアイデアについて、私なりの視点から簡単に、かつ表面的にお話ししましたが、皆様のお役に立てれば幸いです。

この記事はQQ Personalized Signature Network (http://www.yy521.com/qq/) によって公開されています。転載を歓迎します。転載の際はこのリンクを残してください。ご協力ありがとうございます!

原題: SEO診断事例2: ウェブサイトの収集とスナップショットがタイムリーではない

キーワード: SEO、診断事例、ウェブサイト、コレクション、スナップショット、みんな、成州、ウェブマスター向け、ウェブサイトのプロモーション、収益化

<<:  高品質な外部リンクを判断する基準

>>:  電子商取引ウェブサイトの外部リンク構築戦略とテクニック

推薦する

netdedi: 韓国の VPS サーバー、ネイティブ IP、韓国の SK および KT データ センター、PayPal、Alipay

Renet.Co., Ltd.傘下のnetdediは、主に韓国のSKデータセンターと韓国のKTデータ...

ウェブサイトメンテナンスの重要性

当社のオンライン調査によると、国内企業の80%が自社のコーポレートサイトを保有していますが、そのうち...

新しいウェブサイトのインターネットマーケティングを行う方法

新しいサイトでは、このタイプの顧客に対応する過程で、顧客が常にお金を稼ぐ方法、お金を早く稼ぐ方法、そ...

新しいメディアメトリックスコンピューティングクロスプラットフォームサービスにはさまざまな意見がある

世界的なデジタル測定会社であるcomScoreは今週、新しいMedia Metrixマルチプラットフ...

鄧亜平、ジケソウについて語る:重要なのは金儲けではなく国家の責任を果たすことだ

「我々は国家を代表している。あなた方(百度)は我々を倒す必要はない。我々をもっと助け、もっと助言をす...

中国のプライベートクラウド業界の現状と競争:市場規模は急速に拡大し、競争は激化している

プライベート クラウドは単一の顧客向けに構築されます。顧客はインフラストラクチャを所有し、このインフ...

新たなドメイン名ビジネス: ICANN の新規則がインターネットドメイン名をめぐる争いを引き起こす

6月14日、非営利の国際組織であるインターネットネーム・番号割当機関(ICANN)は、新しい汎用トッ...

今こそ、新しいエンタープライズ テクノロジー ベンダーとの提携を検討する時期でしょうか?

多くの企業は、IT サプライヤーと長期的な関係を築いていると考えられます。いずれにしても、確立された...

ユーザーエクスペリエンスを維持するために 404 ページを最適化する方法

ウェブサイトでは、404 ページは避けられません。ユーザーが間違った URL を入力したり、ウェブマ...

Pod IPのKubernetes管理のソースコード分析

1. kube-controller-managerはネットワークセグメントを管理するkube-co...

ビッグデータモデルが検索エンジン垂直分野初の競争に挑戦

検索エンジンが互いに競争する中、検索エンジンと交わるところがないように見えるアプリケーションが、検索...

OneMind Technologyは中国のエッジパブリッククラウドサービス市場で3年連続3位にランクイン

最近、International Data Corporation (IDC) は「中国エッジクラウ...

世界トップのPaaSプロバイダー

トップ PaaS プロバイダーはクラウド コンピューティングで重要な役割を果たしており、クラウドの導...

wholesaleinternetはどうですか? nocixはどうですか?国内ネットワークの実測データを共有します!

wholesaleinternet は、1999 年にカンザス州で設立された古いアメリカのブランドで...