Baidu スナップショットに関して言えば、ウェブマスターは皆その重要性を知っています。これは Baidu の重み付けの重要な要素の 1 つであり、友好的なリンクを交換したり、ウェブサイトを測定したりするための重要な基準でもあります。スナップショットをタイムリーに更新すると、サイトがスパイダーによってクロールされる頻度と、スパイダーの間でサイトがどの程度人気があるかが直接示されます。今日は、これ以上長々と話さずに、タイトルの説明がなく URL だけがあり、スナップショットが停止している、サイトのホームページのスナップショットの異常なキャプチャの問題を解決するプロセスを皆さんと共有します。 私のウェブサイト「中国紡織人材ネットワーク」は、これまでずっと比較的タイムリーにスナップショットを更新してきました。たまに数日遅れることもありましたが、すぐに回復しました。しかし、しばらく前にメインキーワードを入力すると、出てきたスナップショットは9月12日のものでした。まだ説明はなく、URLと名前だけがありました。おかしいですね。一体何が起こっているのでしょうか?ずっとあったICOラベルさえも消えてしまいました。美観は二の次です。このような状況は、ウェブサイトに対する顧客の信頼に直接影響します。私はこの問題に注目し始めました。 まず、ウェブサイトに問題がある場合は、ツールで確認する必要があります。私は、chinazウェブマスターツールを使用して、ウェブサイトのデッドリンクとフレンドリーリンクを確認します。私たちは、この2つの領域を毎週メンテナンスしています。私はツールで確認します。また、ウェブマスターツールを使用して、インデックスボリュームとクロールの異常を確認しましたが、大きな変動は見つかりませんでした。これらの指標に明らかな変化がないので、サイト内に何らかの問題があるのでしょうか?そういえば、Google の管理者ツールをおすすめします。多くのウェブマスターがこのツールを使用していると思います。クロール エラーの通知は比較的速く、基本的に問題があればすぐに通知されます。 Google の管理者ツールで分析した結果、当サイトには 404 ページが多数存在していました。その多くは、以前のパス変更によって残ったものでした。また、最近はサーバーの問題が多く発生しており、アクセスが不安定になっています。 Google の管理者ツールの利点の 1 つは、404 ページを通知した後、そのページにリンクしているドメイン名も表示されるため、問題をすばやく見つけて解決できることです。404 がサイト全体に与える影響については、多くを語る必要はありません。それは癌のようなものです。小さいときは大したことはありませんが、爆発すると、権威が一気に低下します。 この時点で、部分的に解決したはずだと思っていました。2日後、Baiduに入力したとき、大丈夫だろうと思いましたが、それは単なる考えでした。現実は常により厳しいものです。今回は状況がさらに悪く、URLで直接確認したスナップショットも9月12日のものでした。私はパニックになりました。別の問題があるのでしょうか? 次のステップは、IIS アクセス ログをダウンロードすることです。IIS ログに関しては、あまり見たことがありませんが、Web サイトに問題がある場合は、見方がわからなくても見なければなりません。結局のところ、ログはスパイダーの状況を最も直接的にフィードバックするものです。ログをダウンロードした後、まずはLight Year Logツールで分析し、各ディレクトリのアクセス状況を確認する方法を学びました。ログに関しては、各ウェブマスターが独自のツールを持っており、それは各ディレクトリの下のリターンコードを分析するだけです。私たちは主にBaiduで作業しているので、当然、Baiduスパイダーのアクセス状況を主に分析します。 1つ目は304ページです。サイトを分析すると、304リターンコードがたくさん見つかりました。Baiduで検索したところ、304はページリクエストが更新されない状況であることがわかりました。304が多すぎると、スパイダーは新しいコンテンツを長時間取得できず、Webサイトのスナップショットが時間内に更新されない状況につながります。もう一つのコードは管理者によって発見されました。彼はツールを使わずにソースコードを直接チェックする方法を採用しました。今回は、テキスタイルタレントネットワークのホームページであるインデックスディレクトリで、200 0 64という大量のコードを発見しました。インターネット上では200 0 64についてさまざまな意見があります。私もグループの多くの人に尋ねました。正常だと言う人もいれば、異常だと言う人もいます。ほとんどの人は、クロールが不完全だと言っています。つまり、スパイダーがページに来て情報をキャプチャしましたが、それを持ち去る過程で問題が発生しました。つまり、情報が返されませんでした。自分のサイトの状況と合わせると、ページが更新されず、スパイダーのクロールも異常な状態です。 問題が浮上したので、次のステップはそれを解決することです。当社の繊維人材ネットワークのホームページを分析した結果、毎日更新されるセクションが非常に少ないことがわかりました。結局のところ、顧客はわずかであり、新しい顧客がいても毎日ホームページに追加されるわけではありません。しかし、ホームページの問題はまだ解決する必要がありました。どうすればいいでしょうか? リアルタイムで更新できる新しいセクションとコンテンツを追加しました。次に、効果を計画し、オンラインでコンテンツを制作しました。その後、Baidu Snapshot に苦情を申し立てました。数日後、スナップショットが徐々に回復し、これまでのところ基本的に正常になりました。 この経験を総括すると、どう言えばいいでしょうか?Baiduスナップショットの異常にはさまざまな原因があります。時にはBaidu自体に問題がある可能性もありますが、スナップショットが3日以上異常な場合は、サイトの内部的な問題であるかどうかを検討する必要があります。同時に、問題を確認する際には、多くの側面を考慮し、考えられるすべての問題を 1 つずつ確認する必要があります。問題が発生した場合は、ログを確認する必要があります。ログは、すべてのツールよりも実際の状況をより正確に反映できるからです。問題を本当に解決できるものが必ず 1 つあります。 この記事の著者: 中国紡織人材ネットワーク www.texhr.cn A5 初版、転載の際は著作権情報を保持してください。 元のタイトル: スナップショットのクロール例外、タイトルの説明のない URL のみの解決プロセス キーワード: スナップショット例外、説明のないスナップショット、Baidu スナップショット、スナップショット キャプチャ例外 |
<<: BATのメンバー3人が2013年フォーブス中国富豪リストのトップ10にランクイン
独立系ブログが今後も生き残れるかどうかという話題を、私は一度や二度は耳にしたことがあります。QQグル...
文学に一位はなく、武術に二位はありません。厳密に言えば、戦闘力の評価は、最終的には候補者の戦闘勝率を...
私はSiyiouからのソフトな記事を見ました。それはいくつかの権威あるウェブサイトの判断について述べ...
Raksmart は、数量限定で 3 つの安価なクラスター サーバーを提供しています: (1) 日本...
[[413839]] [51CTO.com クイック翻訳] Kafka Connect は、特に強力...
パブリック クラウド サービス プロバイダーは最大限のデータ可用性と耐久性を提供できますが、データ ...
[[221381]] 「クラウドコンピューティング」という用語は、2007 年以来、国内でよく使われ...
新しいウェブマスターでも、古いウェブマスターでも、ウェブサイトを最適化するときに、多くの人は基本的に...
アリババクラウドは9月22日、タイで開催された国際クラウドサミットで、海外市場展開を引き続き加速し、...
最適化を学びたいと思っていましたが、インターンシップ用のウェブサイトがありませんでした。 A5に長く...
テンセントの製品であるテンセントSosoは、QQの力を借りて、侮れないウェブサイト訪問者の源です! ...
ネットイーステクノロジーは2月26日夜、奇虎が発表したばかりの2011年第4四半期の財務報告で、同社...
domain.com は、いつも特定の時期に皆様にサプライズをお届けします。今回は、3 種類のドメイ...
最近、Baidu は「Web2.0 におけるスパム対策の詳細ガイド」を発表しました。実際、スパム対策...
中国の自動運転市場には大きな可能性がある。マッキンゼーは、中国の乗用車市場では、2040年までに自動...