検索エンジンの仕組み

検索エンジンの仕組み

全文検索エンジン

検索エンジンの分類のセクションでは、Web サイトから情報を抽出して Web ページ データベースを構築する全文検索エンジンの概念について説明しました。

通常検索

検索エンジンの自動情報収集機能には2種類あります。 1 つは定期的な検索です。つまり、定期的に (たとえば、Google は通常 28 日)、検索エンジンが「スパイダー」プログラムを積極的に送信して、特定の IP アドレス範囲内のインターネット サイトを検索します。新しい Web サイトが見つかると、検索エンジンは自動的に Web サイトの情報と URL を抽出し、独自のデータベースに追加します。

サイト検索を送信

もう 1 つは、ウェブサイト検索を送信する方法です。つまり、ウェブサイトの所有者が URL を検索エンジンに積極的に送信します。一定期間内 (2 日から数か月まで) に、検索エンジンは「スパイダー」プログラムをウェブサイトに送信してウェブサイトをスキャンし、ユーザーのクエリに関連する情報をデータベースに保存します。近年、検索エンジンのインデックスルールは大きく変化したため、URL を積極的に送信しても、Web サイトが検索エンジンのデータベースに登録される保証はありません。したがって、現時点での最善の方法は、より多くの外部リンクを取得して、検索エンジンがあなたを見つけて Web サイトを自動的に含める機会を増やすことです。

ユーザーがキーワードを使用して情報を検索すると、検索エンジンはデータベースを検索します。ユーザーの要件に一致するWebサイトが見つかった場合、特別なアルゴリズムを使用して、Webページ内のキーワードの一致度、出現場所/頻度、リンクの品質などに基づいて各Webページの関連性とランキングを計算し、関連性に応じてWebページのリンクを順番にユーザーに返します。

カタログインデックス

ディレクトリ インデックスは、全文検索エンジンと比べて多くの違いがあります。

まず、検索エンジンはウェブサイトを自動的に検索しますが、ディレクトリのインデックス作成は完全に手動操作に依存します。

ユーザーが Web サイトを送信すると、ディレクトリ エディターが Web サイトを実際に閲覧し、独自の評価基準やエディターの主観的な印象に基づいて Web サイトを受け入れるかどうかを決定します。

第二に、検索エンジンにウェブサイトが含まれている場合、そのウェブサイト自体が関連規則に違反していない限り、通常は正常にログインできます。

一方、ディレクトリのインデックス作成では、Web サイトに非常に高い負荷がかかるため、複数回ログインしても成功しない場合があります。特にYahoo!のようなスーパーインデックスの場合、ログインはさらに困難になります。 (Yahoo!へのログインは最も難しく、企業のオンラインマーケティングの激戦区でもあるため、後ほど特設コーナーでYahoo!へのログインのコツを紹介する予定です。)また、検索エンジンにログインする場合は、通常、Web サイトの分類を考慮する必要はありませんが、ディレクトリ インデックスにログインする場合は、Web サイトを最も適切なディレクトリ (Directory) に配置する必要があります。

情報の抽出

最後に、検索エンジン内の各ウェブサイトの関連情報はユーザーのウェブページから自動的に抽出されるため、ユーザーの観点からはより自律性があります。一方、ディレクトリインデックスではウェブサイト情報を手動で入力する必要があり、さまざまな制限があります。さらに、スタッフが、あなたが提出したウェブサイトのディレクトリとウェブサイト情報が不適切であると判断した場合、もちろん事前にあなたと話し合うことなく、いつでもそれを調整することができます。

ディレクトリインデックスは、その名の通り、ウェブサイトをカテゴリ別に該当するディレクトリに保存することです。そのため、ユーザーが情報を照会する際には、キーワード検索を選択したり、カテゴリディレクトリに従って階層ごとに検索したりすることができます。キーワードで検索すると、検索エンジンと同じ結果が返され、情報の関連度に応じてウェブサイトがランク付けされますが、より多くの人的要素が関係します。階層ディレクトリで検索する場合、ディレクトリ内のウェブサイトの順位はタイトルのアルファベット順で決まります(例外もあります)。

現在、検索エンジンとディレクトリインデックスは相互に統合・浸透する傾向にあります。

純粋な全文検索エンジンの中には、ディレクトリ検索も提供するものがあります。たとえば、Google は Open Directory を使用して分類検索を提供しています。 Yahoo! のような旧来のディレクトリ インデックスは、Google などの検索エンジンと提携することで検索範囲を拡大してきました。デフォルトの検索モードでは、中国の Sohu、Sina、NetEase など、一部のディレクトリ検索エンジンは、最初に独自のディレクトリ内の一致する Web サイトを返しますが、Yahoo など、他の検索エンジンはデフォルトで Web 検索を返します。

早めにこのサイトに連絡して、お名前をお知らせください。連絡先メールアドレス: mb5u#vip.qq.com (# を @ に変更してください)。

元のタイトル: 検索エンジンの仕組み

キーワード: 検索エンジン

<<:  検索エンジン最適化の詳細

>>:  最適化のアイデア: 検索エンジンアルゴリズムのコピーウェブページ

推薦する

グラフィックカード仮想化の過去と現在

クラウド デスクトップの使用体験の違いは、構成の違い、より直接的には、グラフィック カードが仮想化さ...

【ピークシーズン準備ガイド】初心者向けSEO対策のヒント(パート1)

検索エンジン最適化 (SEO) は科学であると同時に芸術でもあります。実際、SEO の原理は非常にシ...

EUはデータセンターを宇宙に送る計画を立てている。クラウドコンピューティングは本当に空に向かっているのでしょうか?

今後 10 年間で、複数の商業宇宙ステーションと数千の衛星が低地球軌道に打ち上げられ、人類は前例のな...

適切なハイブリッドクラウド管理アプローチを選択する方法

ハイブリッド クラウド管理 (HCM) 市場は最近まで停滞していましたが、最近になって状況は一変しま...

PinduoduoとTeslaは最終的に戦うことになるだろう!

最近、PinduoduoとTeslaが争いました。事件のタイムラインは長く、双方が応酬し、どちらも譲...

アリババがKuPan個人向けクラウドストレージサービスを停止

「絶対に失われない高速な個人用クラウドストレージ」をうたうアリババのCoolPanは、2015年10...

Interserver VPS シンプルレビュー (初月 0.1 USD)

週末は何もすることがなかったので、以前書いた特別オファーのいくつかを整理し、それらがまだ購入する価値...

キューブクラウド:全品15%オフ、香港3ネットワークCN2 GIA(300M帯域幅)/米国CN2 GIA/米国CUVIP、遅延のない高速VPS

Cubecloudの毎年恒例のダブル11イベントが始まりました。サイト全体で生涯15%オフの継続割引...

分析データの氾濫を克服するクラウドコンピューティングの役割

情報インフラストラクチャを近代化する戦略の一環として、企業はクラウド コンピューティングをより有効に...

ハリウッド女優がヌード写真でグーグルを訴える

ハリウッドのヌード写真スキャンダルに関与した有名人数名の代理人を務める弁護士マーティ・シンガー氏は、...

SEOER初心者はベテランの経験を効果的に活用できるのか

SEO 最適化のベテランと初心者の違いは、ベテランがハイテクな SEO 最適化手法を習得しているかど...

ベイゼン:デジタル化を全面的に受け入れ、組織の人材を管理する方法を模索

[51CTO.comからのオリジナル記事] 今年の流行は人々の仕事や生活に大きな影響を与えましたが、...

Dreamweaver SEO: 内部リンクを本当に自動化する方法と、自動内部リンクのバグを解決する方法

最近、ウェブサイトを改訂し、Deamweaver 5.7 のバージョンを採用しました。記事を自動的に...