Google のインデックスまたは検索結果からコンテンツを削除することについての簡単な説明

Google のインデックスまたは検索結果からコンテンツを削除することについての簡単な説明

「Google ウェブマスター ツールから URL を削除するか、ロボット ファイルを使用してスパイダーによる特定の種類のリンクのクロールをブロックすると、Google はこれらのコンテンツをインデックス ライブラリから自然に削除します。」私を含め多くの人がそう思っていると思いますが、これは実際には完全に正しいわけではありません。

まず、Google 管理者の URL 削除ツールは、主に 2 種類の URL を削除するために使用されます。1 つは 404 エラー URL であり、もう 1 つはスパイダーがログ ファイルに大量にクロールする無効なアドレス (Web サイトの内部リンク、パラメータを含むリンクなど) です。これら 2 種類のアドレスを削除申請すると、検索結果に表示されなくなる場合があります。ただし、検索エンジンのインデックス ライブラリでは、明確な HTTP 戻りコード 404 Not Found を持つページはインデックス ライブラリに存在しなくなりますが、2 番目のタイプのスパイダーによって大量にクロールされた無効なアドレスは、実際にはインデックス ライブラリにまだ存在します。

次に、ロボット ファイルを使用してスパイダーによる特定の種類のリンクのクロールをブロックすると、Google がこれらのリンクをインデックスするのを防ぐことができます。ただし、ロボット ファイルを使用してブロックするのが Google がこれらのリンクをインデックスする前か、Google がこれらのリンクをインデックスした後かによって異なります。これら 2 つの操作の効果は異なります。最初のタイプでは、Google がこれらのリンクをインデックスする前に、ロボット ファイルを使用してクロールしたくないリンクをブロックします。この場合、これらのリンクはクロールされず、Google インデックス ライブラリに含まれることもありません。2 番目のタイプでは、Google がこれらのリンクをインデックスした後に、ロボット ファイルを使用して特定の種類のリンクをブロックします。この場合、これらの種類のリンクは Google インデックス ライブラリに残りますが、スパイダーはこれらのリンクをクロールしなくなり、検索結果に表示されなくなります。同時に、スパイダーが限られたクロール量内でより意味のあるリンクをクロールできるようにすることもできます。

上記の紹介を通じて、Google のインデックス ライブラリからコンテンツを削除することと、検索結果からコンテンツを削除することは 2 つの異なる概念であることを説明したいと思います。インデックス ライブラリから削除されたコンテンツは、検索結果に表示されなくなりますが、検索結果から削除されたコンテンツはインデックス ライブラリにまだ存在する可能性があり、Web サイトのインデックス ボリュームに関する有効な統計に影響します。

したがって、Google のインデックスからコンテンツを削除する場合は、これらのコンテンツ リンクがスパイダーによってクロール可能であり、これらのコンテンツ リンクがロボット ファイルによってブロックされないようにする必要があります。これを行うには、次の 3 つの方法があります。

(1)メタタグ

ページの<head>コードに<meta name="robots" content="noindex,follow">を追加して、ページがインデックスに登録されないようにすることができます。

(2)404点または410点

404 - ファイル、クエリ、または URL が見つかりません

410 - リソースはサーバー上で利用できなくなり、これ以上の参照はありません

これら 2 つのタグは一般的に同じものと考えられていますが、微妙な違いがあります。410 タグは通常再クロールを必要としないため、410 でマークされたリンクは 404 でマークされたリンクよりも早く Google のインデックスから削除されます。実際には、両者の微妙な違いは重要ではありませんが、410 マークをうまく使用できる場合は、410 マークが適切な選択となります。

スパイダーが 404/410 エラー リンクにクロールすると、Web サイトのログと管理者ツールのクロール エラー セクションに反映されます。このとき、URL 削除ツールを通じて削除することができ、削除されたコンテンツはインデックス化されません。

(3)301リダイレクトまたはその他の方法

301 リダイレクトは、Google のインデックスからコンテンツを削除し、古いリンクの重みの大部分を新しいリンクに移行するのにも適したオプションです。ただし、このプロセスは比較的長く、古いリンクの重みを新しいリンクに移行するのにどれくらいの時間がかかるのか、移行される重みの割合はどれくらいになるのかなど、Google は明らかにしていません。

上記内容は著者の個人的意見です。間違っている点がありましたら、ご指摘や議論をいただければ幸いです。


元のタイトル: Google のインデックスまたは検索結果からコンテンツを削除することに関する簡単な説明

キーワード: URL の削除、ウェブマスター、ウェブサイト、ウェブサイトのプロモーション、収益化

<<:  テンセント、WeChatパブリックアカウントの再認証プロセスを是正する措置を講じる

>>:  ウェブマスターの皆さん、現状に直面しても前進できますか?

推薦する

最適化計画を成功させるために必要な7つの要素を分析する

最適化担当者にとって、自社サイトを最適化する場合でも、サイトの最適化を依頼する場合でも、開始する前に...

オンラインマーケティングの今後の発展方向:ブランドプラスコンテンツマーケティング

今夜、QQ グループの友人が、オンライン マーケティングがますます困難になっていることについて話して...

ウェブマスターが語るSEO最適化の詳細を公開

ウェブマスターは、SEO 最適化を長年行ってきた結果、独自の最適化原則を持っています。たとえ全員が「...

5つの分散トランザクションソリューションの長所と短所の比較

背景分散トランザクションは、エンタープライズ統合における技術的な難しさであり、あらゆる分散システム ...

チェコの VPS: smartape、月額 4.96 ドルから、1G メモリ/2 コア/50g ハード ドライブ/200M 帯域幅、無制限のトラフィック

smartape は、チェコの TIER3 および 4 データセンターで VPS および専用サーバー...

CentOS は、kafka にログを収集するために filebeat をインストールします

導入Filebeat は、logstash を置き換えてログを収集できる、導入が簡単なログ データ ...

対外貿易産業は順調に発展しており、中国企業動態はインターネットマーケティングを支援している。

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています企業の発展...

Baiduはスキルが強力なツールになることを知っている

ウェブマスターは、Baidu が自社製品、特に Baidu Knows を重視し好んでいることをご存...

サイトの包含性を向上させるために3種類のページを合理的に使用する方法についての簡単な説明

サイト上のページの種類は、静的ページ、動的ページ、疑似静的ページの 3 種類に進化しました。最適化の...

フォーラム訪問者をメンバーに変える5つのステップ

現在、多くのフォーラムにはトラフィックがありますが、フォーラムはアクティブではありません。率直に言え...

OpenStackはプライベートクラウドであるだけでなく、ハイブリッドマルチクラウドの展開にも優れています。

過去数年間で、IT インフラストラクチャはハイブリッドおよびマルチクラウド モデルへと進化してきまし...

インターネット情報取得方法の進化とそれがSEOに与える影響について簡単に説明します。

インターネットは情報革命です。インターネットの急速な発展に伴い、情報を取得する方法は徐々に進化してお...

分散システムの一貫性保証ソリューションの概要

導入インターネットシステムでは、理想的には、システムが「一貫性」、「可用性」、および「パーティション...