「Google ウェブマスター ツールから URL を削除するか、ロボット ファイルを使用してスパイダーによる特定の種類のリンクのクロールをブロックすると、Google はこれらのコンテンツをインデックス ライブラリから自然に削除します。」私を含め多くの人がそう思っていると思いますが、これは実際には完全に正しいわけではありません。 まず、Google 管理者の URL 削除ツールは、主に 2 種類の URL を削除するために使用されます。1 つは 404 エラー URL であり、もう 1 つはスパイダーがログ ファイルに大量にクロールする無効なアドレス (Web サイトの内部リンク、パラメータを含むリンクなど) です。これら 2 種類のアドレスを削除申請すると、検索結果に表示されなくなる場合があります。ただし、検索エンジンのインデックス ライブラリでは、明確な HTTP 戻りコード 404 Not Found を持つページはインデックス ライブラリに存在しなくなりますが、2 番目のタイプのスパイダーによって大量にクロールされた無効なアドレスは、実際にはインデックス ライブラリにまだ存在します。 次に、ロボット ファイルを使用してスパイダーによる特定の種類のリンクのクロールをブロックすると、Google がこれらのリンクをインデックスするのを防ぐことができます。ただし、ロボット ファイルを使用してブロックするのが Google がこれらのリンクをインデックスする前か、Google がこれらのリンクをインデックスした後かによって異なります。これら 2 つの操作の効果は異なります。最初のタイプでは、Google がこれらのリンクをインデックスする前に、ロボット ファイルを使用してクロールしたくないリンクをブロックします。この場合、これらのリンクはクロールされず、Google インデックス ライブラリに含まれることもありません。2 番目のタイプでは、Google がこれらのリンクをインデックスした後に、ロボット ファイルを使用して特定の種類のリンクをブロックします。この場合、これらの種類のリンクは Google インデックス ライブラリに残りますが、スパイダーはこれらのリンクをクロールしなくなり、検索結果に表示されなくなります。同時に、スパイダーが限られたクロール量内でより意味のあるリンクをクロールできるようにすることもできます。 上記の紹介を通じて、Google のインデックス ライブラリからコンテンツを削除することと、検索結果からコンテンツを削除することは 2 つの異なる概念であることを説明したいと思います。インデックス ライブラリから削除されたコンテンツは、検索結果に表示されなくなりますが、検索結果から削除されたコンテンツはインデックス ライブラリにまだ存在する可能性があり、Web サイトのインデックス ボリュームに関する有効な統計に影響します。 したがって、Google のインデックスからコンテンツを削除する場合は、これらのコンテンツ リンクがスパイダーによってクロール可能であり、これらのコンテンツ リンクがロボット ファイルによってブロックされないようにする必要があります。これを行うには、次の 3 つの方法があります。 (1)メタタグ ページの<head>コードに<meta name="robots" content="noindex,follow">を追加して、ページがインデックスに登録されないようにすることができます。 (2)404点または410点 404 - ファイル、クエリ、または URL が見つかりません 410 - リソースはサーバー上で利用できなくなり、これ以上の参照はありません これら 2 つのタグは一般的に同じものと考えられていますが、微妙な違いがあります。410 タグは通常再クロールを必要としないため、410 でマークされたリンクは 404 でマークされたリンクよりも早く Google のインデックスから削除されます。実際には、両者の微妙な違いは重要ではありませんが、410 マークをうまく使用できる場合は、410 マークが適切な選択となります。 スパイダーが 404/410 エラー リンクにクロールすると、Web サイトのログと管理者ツールのクロール エラー セクションに反映されます。このとき、URL 削除ツールを通じて削除することができ、削除されたコンテンツはインデックス化されません。 (3)301リダイレクトまたはその他の方法 301 リダイレクトは、Google のインデックスからコンテンツを削除し、古いリンクの重みの大部分を新しいリンクに移行するのにも適したオプションです。ただし、このプロセスは比較的長く、古いリンクの重みを新しいリンクに移行するのにどれくらいの時間がかかるのか、移行される重みの割合はどれくらいになるのかなど、Google は明らかにしていません。 上記内容は著者の個人的意見です。間違っている点がありましたら、ご指摘や議論をいただければ幸いです。 元のタイトル: Google のインデックスまたは検索結果からコンテンツを削除することに関する簡単な説明 キーワード: URL の削除、ウェブマスター、ウェブサイト、ウェブサイトのプロモーション、収益化 |
<<: テンセント、WeChatパブリックアカウントの再認証プロセスを是正する措置を講じる
>>: ウェブマスターの皆さん、現状に直面しても前進できますか?
5月28日、2021 Alibaba Cloud Summitにおいて、Alibaba Cloudと...
最適化担当者にとって、自社サイトを最適化する場合でも、サイトの最適化を依頼する場合でも、開始する前に...
JD.comの2020 11.11グローバルラブシーズンが正式に終了しました。 11月11日24時現...
今夜、QQ グループの友人が、オンライン マーケティングがますます困難になっていることについて話して...
ウェブマスターは、SEO 最適化を長年行ってきた結果、独自の最適化原則を持っています。たとえ全員が「...
背景分散トランザクションは、エンタープライズ統合における技術的な難しさであり、あらゆる分散システム ...
smartape は、チェコの TIER3 および 4 データセンターで VPS および専用サーバー...
導入Filebeat は、logstash を置き換えてログを収集できる、導入が簡単なログ データ ...
2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています企業の発展...
ウェブマスターは、Baidu が自社製品、特に Baidu Knows を重視し好んでいることをご存...
サイト上のページの種類は、静的ページ、動的ページ、疑似静的ページの 3 種類に進化しました。最適化の...
現在、多くのフォーラムにはトラフィックがありますが、フォーラムはアクティブではありません。率直に言え...
過去数年間で、IT インフラストラクチャはハイブリッドおよびマルチクラウド モデルへと進化してきまし...
インターネットは情報革命です。インターネットの急速な発展に伴い、情報を取得する方法は徐々に進化してお...
導入インターネットシステムでは、理想的には、システムが「一貫性」、「可用性」、および「パーティション...