誰もがウェブサイト上の robots.txt ファイルの役割を知っていますが、観察してみると、一部の友人が robots.txt ファイルのルールについてまだ誤解していることがわかります。 たとえば、多くの人が次のように書いています。 ユーザーエージェント: * 許可する: / 禁止: /mulu/ このルールが実際には効果がないということに気付いたかどうかはわかりません。最初の文 Allow: / はスパイダーがすべてのコンテンツをクロールすることを許可することを意味し、2 番目の文 Disallow: /mulu/ は /mulu/ の下にあるすべてのコンテンツを禁止することを意味します。 表面的には、このルールの目的は、スパイダーが /mulu/ を除く Web サイトのすべてのページをクロールできるようにすることです。ただし、検索エンジンのスパイダーはルールを上から下に実行するため、2 番目のコマンドは無効になります。 正しいルールは次のようになります。 ユーザーエージェント: * 禁止: /mulu/ 許可する: / つまり、まず禁止コマンドを実行し、その後に許可コマンドを実行することで無効にならないようにします。さらに、Baidu スパイダーが犯すもう 1 つの一般的な間違いは、Disallow コマンドと Allow コマンドがスラッシュ / で始まる必要があるため、次のように記述する人がいることです: Disallow: *.html これは Baidu スパイダーでは間違っており、次のように記述する必要があります: Disallow: /*.html 。 こうしたルールを記述するときに、気づかない問題が発生することがあります。Baidu Webmaster Tools (zhanzhang.baidu.com) と Google Webmaster Tools を使って、これらのルールをテストできるようになりました。比較的言えば、Baidu Webmaster Tools のロボット ツールは比較的シンプルです。 Baidu Robots ツールは、各コマンド行が文法規則に準拠しているかどうかを検出することしかできず、実際の効果やクロール ロジック ルールは検出できません。 比較すると、図に示すように、Google の Robots ツールの方がはるかに使いやすいです。 Google ウェブマスター ツールではクローラ権限と呼ばれ、Google がサイトのページをクロールするときにブロックされる URL の数を報告します。 Robots の変更の効果をオンラインでテストすることもできます。もちろん、ここでの変更はテスト用です。問題がなければ、robots.txt ファイルを生成するか、コマンド コードを robots.txt テキスト ドキュメントにコピーして、Web サイトのルート ディレクトリにアップロードすることができます。 Google のテストは Baidu のテストとは大きく異なります。1 つ以上の URL を入力して、Google スパイダーがこれらの URL をクロールできるかどうかをテストできます。 テスト結果は、Google スパイダーによるこれらの URL のクロール状況です。このテストは、Robots ファイルのルールが特定の URL に対して有効かどうかを確認するためのものです。もちろん、2 つのツールを組み合わせる方がよいでしょう。これで、ロボットの書き方を完全に理解できたはずです。 転載の際は、Xiaoyao Blogからの転載であることを明記してください。この記事のアドレスは、http://liboseo.com/1170.htmlです。転載の際は、出典とリンクを明記してください。 元のタイトル: ロボットのルールと Google および Baidu ロボット ツールの使用に関するよくある誤解 キーワード: ロボット、ウェブマスター、ウェブサイト、ウェブサイトのプロモーション、収益化 |
<<: 高品質なコンテンツと外部リンクを構築するときに注意すべき点
>>: 内部 SEO で独創性と独自性を強化するためのパーソナライズされた方法
最近、SEO界では本当の災難が次々と起こっています。6.22の直後、6.28には再びKステーションが...
ウェブサイトの最適化において、多くのウェブマスターは全体的な最適化戦略を追求していますが、いくつかの...
データ仮想化は企業に多くのメリットをもたらします。たとえば、ビッグデータのセキュリティと整合性から、...
序文この共有は、次の重要なポイントから始まります。時代: 時代の傾向と全体的な方向性を理解することに...
今年、業界には「AI記者会見でない記者会見はもう存在しない」というジョークがある。そうです、ほぼすべ...
高いデータ可用性を確保するには、分散システムでデータの複数のコピーを保存する必要があります。次の疑問...
Turnkeyinternet のブラック フライデー プロモーションには、専用サーバーと VPS ...
[[203629]]多くの企業は、パブリック クラウドがすべてのアプリケーションをホストできる唯一の...
多くのウェブマスターは、情報ニュースサイトを個人で運営するのは難しく、コンテンツが頭痛の種だと考えて...
この記事は、バンク・オブ・アメリカ・メリルリンチのアナリストチームによるレポート「ビットコイン:原因...
このトピックは、2012 年下半期の社内共有です。まだ記事にはなっていません。春節が近づいているので...
最近、権威ある組織AMinerが2022年のAI 2000の最も影響力のある人工知能リストを発表しま...
Intel E5 v2 CPU、RAID10 のエンタープライズ ハード ディスク 12 台、データ...
内部リンクの最適化は、水を水路に流すようなものです。適切に行われなければ、損失率は非常に高くなります...
モバイル業界にとって、2019 年は終わりに近づいており、来年はさらに幅広い発展の見通しが期待されて...