ウェブサイトでの robots.txt の使用に関するよくある誤解

ウェブサイトでの robots.txt の使用に関するよくある誤解

数日前、robots.txt のルールに関する誤解について書き、Baidu と Google のロボット ツールの使用を紹介しました。robots.txt ファイルのルールに関する誤解をいくつか紹介しましたが、実際にはそれ以上に、誰もが気づいていない誤解がたくさんあることがわかりました。

今日は、robots.txt の実際の使用に関するよくある誤解を再度リストアップしてみましょう。

誤解 1: Allow は Disallow よりも広い範囲をカバーし、Disallow の前に配置されます。

たとえば、多くの人が次のように書いています。

ユーザーエージェント: *

許可する: /

禁止: /mulu/

すべてのスパイダーが /mulu/ の下の URL を除くこのサイトのすべてのページをクロールし、/mulu/ の下のすべての URL のクロールを禁止するようにします。

検索エンジンのスパイダーはルールを上から下へ実行するため、2 番目のコマンドは失敗します。これは、/mulu/ ディレクトリのクロール禁止ルールが無効であることを意味します。正しくは、Disallow が Allow より上に設定され、有効になるはずです。

誤解 2: Disallow コマンドと Allow コマンドはスラッシュ「/」で始まりません。

これも見落とされやすいです。たとえば、 Disallow: 123.html と書いても効果はありません。スラッシュ「/」は、ルートディレクトリに対するファイルの相対的な場所を示します。これがないと、どの URL であるかを判別できないため、これは誤りです。

正解は Disallow: /123.html です。これにより、/123.html ファイルがブロックされ、このルールが有効になります。

誤解 3: ブロックされたディレクトリの後にスラッシュ「/」がありません。

たとえば、/mulu/ ディレクトリのクロールをブロックしたい場合、Disallow: /mulu と記述する人もいます。それでこれは正しいのでしょうか?

まず、このように記述すると (Disallow: /mulu)、確かに /mulu/ の下にあるすべての URL をブロックできますが、/mulu123.html などの /mulu で始まるすべてのページもブロックされ、Disallow: /mulu* と同じ効果があります。

ディレクトリのみをブロックしたい場合は、最後にスラッシュ「/」を付けるのが正しい方法です。

転載の際は、Xiaoyao Blogの記事であることを明記してください。この記事のアドレスは、http://liboseo.com/1193.htmlです。

転載の際は出典とリンクを明記してください!

元のタイトル: ウェブサイトでの robots.txt の使用に関するよくある誤解

キーワード: ロボット、ウェブマスター、ウェブサイト、ウェブサイトのプロモーション、収益化

<<:  大規模なウェブサイトを構築できない場合は、SEO に重点を置く必要があります。

>>:  Google リンク 外部リンク リソースに関するもう 1 つの秘密のヒント

推薦する

[10月] Hawkhost - 50% オフ/VPS/仮想ホスト/2日間有効なフラッシュセール

Eagle Host は、オランダのアムステルダム データ センターの仮想ホストと VPS のフラッ...

分散データベースを使用した後、パフォーマンスが 50% 向上したのに、なぜ諦めたのでしょうか?

最近、Lao Yu はある事例を耳にしました。ある銀行が、業務の中核となる集中型データベースの代わり...

SEO診断では、企業ウェブサイトのランキング低下を解決する方法について簡単に説明します

A5 Webmaster NetworkのSEO診断チームは、基本的に毎日何人かの企業ウェブマスター...

私は自分のフォーラムを閉じて、皆さんと私の経験を共有しました。

今日、私は地元のフォーラムを自ら閉会し、涙を流しながら自分の考えや経験を共有しました。私が Disc...

#BlackFriday# itldc: 20 年の歴史を持つブランド、11 のデータセンターの VPS が 50% オフ、年間 16 ユーロから、トラフィック制限なし

20年以上運営している老舗企業です。今年のブラックフライデーには、11のデータセンターのVPSを50...

高級品ウェブサイトがパンデミックに終止符を打つ:オンライン購入におけるサプライチェーンの混乱

中国の高級品オンラインショッピングの巨大な市場需要は、少しの混乱で簡単に変わることはないだろう。現在...

301と404が争う2つの投稿について

今日、A5 と SEOWHY で、転載リンクの悪意ある改変や外部リンクのエラーにより、スパイダーが外...

厳選: 米国最速のVPSのおすすめ

どの米国の VPS がより高速ですか?国内のネットワーク環境に慣れていない初心者の多くは、米国の V...

Baidu の最近の微妙な変化に気づきましたか?

草の根ウェブマスターになるのはとても忙しいです。毎日オリジナルの記事を探し、たくさんの外部リンクを投...

ウォルマート テンセント クラウド サーバーレス アプリケーションを実践し、消費者のショッピング体験を完全に保証

小売業に携わるには、中国ほど適した場所はなく、今ほど適した時期もありません。 1996年、国際小売大...

COVID-19パンデミック下での現地生産においてエッジコンピューティングが重要な役割を果たす

[[359008]] COVID-19パンデミックにより、製造業者が現地生産と流通へとシフトするにつ...

360 Searchの独立ブランド「360 Search+」を体験

360総合検索は8月31日、独立ブランド「360 Search+」を立ち上げ、新しい独立ドメイン名3...

ssdvps-5ドル/2IP/1gメモリ/30gSSD/2Tトラフィック/3データセンター

ssdvps の VPS サービスはかなり良いです。個人的にも使っています。サーバーは安定していて、...

8月23日のハイパーリンク不正に関するアルゴリズムアップグレードの解釈

Baidu Webmaster Platform は、2012 年 10 月 23 日午前 10 時...

他の人と友好的なリンクを交換する方法

多くの新しいウェブマスターは、フレンドリー リンクを交換する勇気がありません。どのフレンドリー リン...