初心者向け SEO の概念: クロールとインデックスの違い

初心者向け SEO の概念: クロールとインデックスの違い

クロールとインデックス作成は、SEO における 2 つの専門用語です。多くの初心者は SEO に触れると、この 2 つの単語を混同し、クロールとインデックス作成を同じものだと考えてしまいます。今日は、クロールとインデックスの違いについて詳しく説明します。

1. 這う

検索エンジンのスパイダーがサイトをクロールする場合、クロールされるサイト内の URL は 1 つだけです。検索エンジンは他の Web ページからのリンクを追跡してこのサイトにクロールできるため、クロールとは、検索エンジンがリンクに従ってサイトの特定の URL をクロールすることを意味します。

上記の概念は少し抽象的かもしれませんので、例を挙げて簡単に説明しましょう。たとえば、多くの場合、スパイダーがサイトをクロールしているとき、サイト内の次のようなリンクはクロールできません。

(1)リンクのエンコーディングはJavascriptです。これは「スパイダートラップ」と呼ばれ、サイトをクロールするときにスパイダーがこれらのリンクのクロールを自動的にブロックします。

(2)リンクはrobots.txtで「禁止」指示としてマークされています。

(3)孤立したリンク(誰も貼っていないsitemaps.xml、このようなリンクを含む)

(4)リンク先のページがリンクnofollow指示を含むページである

(5)このリンクは本来クロールされる予定でしたが、サーバーの不安定さのためクロールできませんでした。

2. 索引

インデックス作成とクロールの最大の違いは、インデックス作成は特定の URL をクロールするのではなく、ページ内の多数の URL をクロールすることです。簡単に言うと、検索エンジンはどのページをインデックスするかを決定すると、このページ内のすべての URL を処理してクロールします。クロール プロセス中、スパイダーはページの内容に基づいて適切な処理を実行します。簡単な例を挙げると、一部のページのコンテンツに URL がありますが、この URL に NOINDEX ディレクティブが追加されている場合、検索エンジンはこのページをクロールしません。

サイトのページがインデックスに登録されない理由:

(1)ページにNOINDEXディレクティブ()が含まれている

(2)重複コンテンツ:同じコンテンツのページはインデックスされない場合があります。

(3)その他の理由:リンク年齢とリンク人気

初心者がサイト内のどのページがインデックスされているかを知りたい場合は、「サイト + ウェブサイトのドメイン名」で検索できます。このようにして、検索エンジンはスパイダーによってインデックスされているページ数と、それがどのページであるかを表示します。

クローリングとインデックス作成はどちらもスパイダーがサイトを巡回することを指しますが、その指示は異なります。ここでは、これらを区別するために注意することをお勧めします。

この記事はもともと http://www.jiaodahaiwai.net に掲載され、最初に A5 に掲載されました。転載する際は有効なリンク アドレスをそのままにしておいてください。ありがとうございます!

元のタイトル: 初心者向け SEO の概念: クロールとインデックスの違い

キーワード: 初心者、SEO、コンセプト、クロール、インデックス、2、ウェブマスター、ウェブサイト、ウェブサイトのプロモーション、収益化

<<:  5月のCNドメイン名の成長率は4%で、これは個人登録の開始によって若干影響を受ける可能性がある。

>>:  Dangdangはコミュニティマーケティングを模索し、Pinterestのようなプラットフォームを立ち上げる

推薦する

独立したブログを使用して外部リンクを構築するときに初心者ウェブマスターが避けるべき間違い

多くのウェブサイトでは、ブログの外部リンクを確立する方法やブログの外部リンクを確立することの重要性が...

羅均:月額368元から、広州移動1Gbps帯域幅VDS(100G防御付き)、常州聯通1Gbps帯域幅VDS、テストデータ付き

ラルキュンは現在、主に国内回線でマシンを運用しており、最大速度1Gbpsのサーバーを提供しています。...

chicagovps-$39/C2750 オクタコア/8g メモリ/250g ハードドライブ/10T トラフィック/5IP

chicagovps からプロモーション メールが届きました。主に 4 台のサーバーとエンタープライ...

外部の敵は自ら足を引っ張っているのでしょうか? HTML5 採用の血なまぐさい歴史

近年、HTML5 の波は止められないようです。デスクトップ アプリケーション環境では、主要なブラウザ...

#サイト グループ サーバー#-tcloud-E3-1230/16g メモリ/1T ハード ディスク/100M 帯域幅/258IPv4

tcloud、英国での登録社名はTcloud Limited、中国での登録社名はNingbo Zho...

クラウドインスタンスの最適化を妨げる5つの一般的な問題

[[205059]]現在のパブリッククラウド環境 (AWS、Microsoft Azure、Goog...

検索エンジン戦争: ウェブマスターは何をすべきか?

360検索エンジンが正式にリリースされた後、多くのウェブマスターがそれをBaiduや他の検索エンジン...

Docker で Node Server を効率的にデプロイする方法

[[419575]]みなさんこんにちは。Shanyueです。効率的で合理的なデプロイメント ソリュー...

中国のクラウド サービス プロバイダーの 4 大企業を評価すると、次の 10 年間を支配するのはどの企業でしょうか?

[[342930]]この記事はWeChat公式アカウント「悲しくて傷ついたシロサイ」から転載したもの...

フォーチュン500企業のSEOプロジェクト運営における混乱

今朝、私のパートナーから、フォーチュン 500 企業が SEO に興味を持っていると聞きました。両者...

SAP、すべてのクラウド事業の成長を加速し、収益と利益の見通しを引き上げ

• 現在のクラウドバックログとクラウド収益の成長は前四半期比で加速o 現在のクラウドバックログは20...

トレーニングと研究をアップグレードし、CNPC Richfit と Microsoft HoloLens が複合現実の旅を開始

デジタル経済の発展は急速に進み始めました。 2022年までに世界のデジタルGDPは46兆米ドルに達し...

メモリ管理は2つの部分から成ります: 仮想メモリ管理

[[402636]]この記事はWeChatの公開アカウント「Flying Veal」から転載したもの...

ライブ放送を視聴する人が数千人しかいなくても、それでも行う価値はあるのでしょうか?

ライブストリーミングは、昨年から始まったビジネス関連業界のキーワードです。大きなプロモーションがある...