ウェブサイトを最適化すると検索エンジンがコンテンツをクロールしてインデックスしやすくなる理由を簡単に分析します。

ウェブサイトを最適化すると検索エンジンがコンテンツをクロールしてインデックスしやすくなる理由を簡単に分析します。

オンラインの世界は非常に広大で、新しいコンテンツが常に生成されています。 Google 自身のリソースには限りがあります。ほぼ無限の Web コンテンツがある場合、Googlebot はそのうちの一定の割合しか見つけてクロールできません。そうすると、すでにクロールしたコンテンツのうち、その一部しかインデックス化できなくなります。 URL は、Web サイトと検索エンジン クローラーの間の橋渡しのような役割を果たします。Web サイトのコンテンツをクロールするには、クローラーがこれらの橋渡しを見つけて通過できる必要があります (つまり、URL を見つけてクロールする必要があります)。 URL が複雑または長い場合、クローラーは URL を何度もたどる必要があり、時間がかかります。URL が簡潔で、独自のコンテンツに直接リンクしている場合、クローラーは空のページをクロールしたり、異なる URL に誘導されて同じ重複コンテンツをクロールしたりするのではなく、コンテンツの学習に集中できます。

上のスライドでは、避けるべき反例をいくつか見ることができます。これらは、ハッキングされた URL やエンコード、URL パスの一部として偽装された冗長なパラメータ、無限のクロール スペースなど、実際の URL の例です (ただし、プライバシー上の理由から名前は変更されています)。また、この URL の迷路を整理し、クローラーがコンテンツをより速く、より適切に見つけられるようにするためのいくつかの提案も見つかります。主な提案には、URL からユーザー関連のパラメータを削除することが含まれます。セッション ID や並べ替えパラメータなど、ページのコンテンツに影響を与えない URL 内のパラメータは、URL から削除され、Cookie によって記録されます。この情報を Cookie に保存し、「クリーンな」 URL に 301 リダイレクトすることで、元のコンテンツを維持し、同じコンテンツを指す URL の数を減らすことができます。

無限の空間をコントロールします。あなたのサイトには、過去と未来の日付へのリンクが無数にあるカレンダーがありますか (各リンクは一意です)?ページの数がそれほど多くない場合でも、パラメータ &page=3563 を追加した後も、Web アドレスは 200 コードを返しますか?この場合、サイトにはいわゆる「無限のスペース」が存在し、クローラーとサイトの両方の帯域幅が無駄になります。 「無限の空間」を制御するためのヒントをいくつか紹介します。 Google クローラーが処理できないページをクロールしないようにします。 robots.txt ファイルを使用すると、ログイン ページ、お問い合わせフォーム、ショッピング カート、およびクローラーが処理できないその他のページをブロックできます。 (クローラーはケチで恥ずかしがり屋として知られているため、通常は自分で「商品をカートに追加」したり「お問い合わせ」したりすることはありません)。こうすることで、クローラーが処理できる範囲でサイトのコンテンツをクロールする時間を長くすることができます。

一人一票。 URL、コンテンツの一部。理想的な世界では、URL とコンテンツは 1 対 1 で対応します。つまり、各 URL は固有のコンテンツに対応し、各コンテンツには固有の URL を通じてのみアクセスできます。この理想的な状況に近づくほど、Web サイトのクロールとインデックス作成が容易になります。コンテンツ管理システムまたは現在のサイト設定によりこれが難しい場合は、rel=canonical 要素を使用して、特定のコンテンツを参照するために使用する URL を設定することができます。

元のタイトル: ウェブサイトを最適化すると検索エンジンがコンテンツをクロールしてインデックスしやすくなる理由の簡単な分析

キーワード: 検索エンジン

<<:  1 か月で毎日の IP を 1,000 から 20,000 に増やす方法

>>:  スパムの9つの種類を解明

推薦する

ウェブサイトのスナップショットのロールバックによる悪影響に冷静に対処する (パート 2)

みなさんこんにちは。Qingfeng Danying です。前回の「Web サイトのスナップショット...

中国オートレンタルはウォーバーグ・ピンカスから2億ドルの投資を受けるが、これはIPOの資金調達額を上回る額である。

7月9日の午後、CAR社とウォーバーグ・ピンカスは、ウォーバーグ・ピンカスがCAR社に2億ドルの株式...

半年間の取引量は7兆元近く、第三者支払いレイアウトはインターネット金融

中国中央銀行が発表した半期ごとの調査報告によると、2013年上半期、中国の第三者決済会社の取引量(オ...

ウェブサイトの最適化のどの詳細がユーザーエクスペリエンスに影響しますか?

ご存知のとおり、ウェブサイトの最適化プロセスで私たちが常に提唱してきた最適化方法は、通常のホワイトハ...

namecheap は 3 月 23 日に com ドメイン名を 0.98 ドルで登録しました。

数日前、0.98 登録ドメイン名は新規ユーザーのみ利用可能でしたが、2 週間以内に再び利用可能になり...

タオバオアフィリエイトサイト管理者の告白(オフサイトマーケティングの本格的な実践経験、小規模販売者はご遠慮ください)

うっかりしてまた長い記事を書いてしまいました。せっかちな人なら、この記事はあなたには不向きで、何かを...

Wofang.com のキーワードレイアウトの裏話

前回の記事では、ウェブサイトのキーワード分析と選定における4大基準について書きました。皆さんはどれだ...

ウェブデザイナー必読:インターネット企業のウェブサイト制作プロセス

多くのウェブデザインの専門家は、以前にインターネット企業で働いた経験があり、インターネット企業の給料...

SEO スタッフ: バックリンクと外部リンクの違いをどのように解釈すればよいでしょうか?

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っていますSEO 初...

マルチクラウドがビジネスを変革する5つの方法

マルチクラウドでは複数のクラウド プラットフォームが使用されますが、シンプルさが追加されます。これは...

Baiduは贈り物は受け付けず、オリジナル作品のみ受け付けます

オリジナルコンテンツといえば、SEOを行う私のウェ​​ブマスターの友人たちは、オリジナルコンテンツに...

ITエリートが「田舎に行く」:農業のインターネット化はさまざまな結果をもたらす

IT 関係者の視点から見ると、丁磊が豚を飼育しているのは目新しいことではない。劉強東さんは米を栽培し...

国美電子商取引の3大謎を分析:Kubaブランドは消滅するのか?

[はじめに] Gome OnlineはKubaと統合し、バックエンド管理とリソース共有の統一を実現し...

Weiboマーケティングとは何ですか?特徴は何ですか?

ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービス新しいメディアの急速な発...

V Chat CPS Allianceはオンラインでお金を稼ぐための新しい出発点です

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています時代の継続...