ロボットのルールに関するよくある誤解と、Google と Baidu のロボット ツールの使い方

ロボットのルールに関するよくある誤解と、Google と Baidu のロボット ツールの使い方

誰もがウェブサイト上の robots.txt ファイルの役割を知っていますが、観察してみると、一部の友人が robots.txt ファイルのルールについてまだ誤解していることがわかります。

たとえば、多くの人が次のように書いています。

ユーザーエージェント: *

許可する: /

禁止: /mulu/

このルールが実際には効果がないということに気付いたかどうかはわかりません。最初の文 Allow: / はスパイダーがすべてのコンテンツをクロールすることを許可することを意味し、2 番目の文 Disallow: /mulu/ は /mulu/ の下にあるすべてのコンテンツを禁止することを意味します。

表面的には、このルールの目的は、スパイダーが /mulu/ を除く Web サイトのすべてのページをクロールできるようにすることです。ただし、検索エンジンのスパイダーはルールを上から下に実行するため、2 番目のコマンドは無効になります。

正しいルールは次のようになります。

ユーザーエージェント: *

禁止: /mulu/

許可する: /

つまり、まず禁止コマンドを実行し、その後に許可コマンドを実行することで無効にならないようにします。さらに、Baidu スパイダーが犯すもう 1 つの一般的な間違いは、Disallow コマンドと Allow コマンドがスラッシュ / で始まる必要があるため、次のように記述する人がいることです: Disallow: *.html これは Baidu スパイダーでは間違っており、次のように記述する必要があります: Disallow: /*.html 。

こうしたルールを記述するときに、気づかない問題が発生することがあります。Baidu Webmaster Tools (zhanzhang.baidu.com) と Google Webmaster Tools を使って、これらのルールをテストできるようになりました。比較的言えば、Baidu Webmaster Tools のロボット ツールは比較的シンプルです。

Baidu Robots ツールは、各コマンド行が文法規則に準拠しているかどうかを検出することしかできず、実際の効果やクロール ロジック ルールは検出できません。

比較すると、図に示すように、Google の Robots ツールの方がはるかに使いやすいです。

Google ウェブマスター ツールではクローラ権限と呼ばれ、Google がサイトのページをクロールするときにブロックされる URL の数を報告します。

Robots の変更の効果をオンラインでテストすることもできます。もちろん、ここでの変更はテスト用です。問題がなければ、robots.txt ファイルを生成するか、コマンド コードを robots.txt テキスト ドキュメントにコピーして、Web サイトのルート ディレクトリにアップロードすることができます。

Google のテストは Baidu のテストとは大きく異なります。1 つ以上の URL を入力して、Google スパイダーがこれらの URL をクロールできるかどうかをテストできます。

テスト結果は、Google スパイダーによるこれらの URL のクロール状況です。このテストは、Robots ファイルのルールが特定の URL に対して有効かどうかを確認するためのものです。もちろん、2 つのツールを組み合わせる方がよいでしょう。これで、ロボットの書き方を完全に理解できたはずです。

転載の際は、Xiaoyao Blogからの転載であることを明記してください。この記事のアドレスは、http://liboseo.com/1170.htmlです。転載の際は、出典とリンクを明記してください。

元のタイトル: ロボットのルールと Google および Baidu ロボット ツールの使用に関するよくある誤解

キーワード: ロボット、ウェブマスター、ウェブサイト、ウェブサイトのプロモーション、収益化

<<:  高品質なコンテンツと外部リンクを構築するときに注意すべき点

>>:  内部 SEO で独創性と独自性を強化するためのパーソナライズされた方法

推薦する

6月28日のBaidu Kサイト大量発生の真相と考察

最近、SEO界では本当の災難が次々と起こっています。6.22の直後、6.28には再びKステーションが...

詳細が成功か失敗かを決める:ウェブサイトのディレクトリパスの最適化設計方法

ウェブサイトの最適化において、多くのウェブマスターは全体的な最適化戦略を追求していますが、いくつかの...

データ仮想化のさまざまな形式を理解する方法

データ仮想化は企業に多くのメリットをもたらします。たとえば、ビッグデータのセキュリティと整合性から、...

消防活動の反撃戦略: クラウドネイティブ + DevOps + SRE + ITIL

序文この共有は、次の重要なポイントから始まります。時代: 時代の傾向と全体的な方向性を理解することに...

生成 AI とクラウド ネイティブは期待が膨らんでいる時期にあります。それらは企業変革よりも重要ですか?

今年、業界には「AI記者会見でない記者会見はもう存在しない」というジョークがある。そうです、ほぼすべ...

技術概要: 分散システムにおける一般的な同期メカニズム

高いデータ可用性を確保するには、分散システムでデータの複数のコピーを保存する必要があります。次の疑問...

#10% オフ プロモーション# turnkeyinternet - $1/cpanel パネル/仮想ホスト/無制限の Web サイト構築

Turnkeyinternet のブラック フライデー プロモーションには、専用サーバーと VPS ...

パブリッククラウドに移行する前に尋ねるべき3つの質問

[[203629]]多くの企業は、パブリック クラウドがすべてのアプリケーションをホストできる唯一の...

情報ニュースサイトの革新的な運営におけるいくつかの重要なポイントの簡単な分析

多くのウェブマスターは、情報ニュースサイトを個人で運営するのは難しく、コンテンツが頭痛の種だと考えて...

ビットコインの適正価格と市場価値はいくらですか?これまでで最も包括的な計算

この記事は、バンク・オブ・アメリカ・メリルリンチのアナリストチームによるレポート「ビットコイン:原因...

5° 特殊ビジュアルデザイン ウェブ特殊デザインのいくつかの手法の分析

このトピックは、2012 年下半期の社内共有です。まだ記事にはなっていません。春節が近づいているので...

AMinerがAI 2000リストを発表:アリババは世界トップ10のコンピュータネットワーク研究機関にランクイン

最近、権威ある組織AMinerが2022年のAI 2000の最も影響力のある人工知能リストを発表しま...

推奨: XenPower-6$/Xen/1g メモリ/120g ハードディスク/2T トラフィック/ダラス/ミラノ

Intel E5 v2 CPU、RAID10 のエンタープライズ ハード ディスク 12 台、データ...

ウェブサイトの内部リンクと最適化に関する簡単な説明

内部リンクの最適化は、水を水路に流すようなものです。適切に行われなければ、損失率は非常に高くなります...

2020 年のモバイル業界で予測される 5 つの主要トレンド!

モバイル業界にとって、2019 年は終わりに近づいており、来年はさらに幅広い発展の見通しが期待されて...