検索エンジン技術の3つの核心問題

検索エンジン技術の3つの核心問題

月給5,000~50,000のこれらのプロジェクトはあなたの将来です

検索エンジン技術は私たち SEO 担当者が考慮すべきものではありませんが、それでも彼らがどのような問題を研究しているのかは理解しておく必要があります。今日、小小科堂 SEO 自習ネットワークは「検索エンジン技術の 3 つの核心問題」をお届けします。これが皆さんのお役に立てば幸いです。

1. 検索エンジンの関連性技術

①関連性の概念

検索エンジンは、ユーザーの検索用語とページ間の関連性を正確に判断し、関連性の強さに基づいてページ コレクションの初期スクリーニングと並べ替えを完了する必要があります。

②関連性分類

1) 検索語の関連性

検索エンジンは、まずユーザーのクエリの意味を判断する必要があります。同じ単語でも、状況によって意味が変わることがあるためです。意味を正しく判断して初めて、関連性が高いページをより適切に一致させることができます。判断が間違っていると、検索結果ページにユーザーが必要とするコンテンツが含まれない場合があり、ユーザーの検索エクスペリエンスが大幅に低下します。

たとえば、ユーザーが「apple」を検索すると、検索エンジンは iPhone の結果を表示しますが、ユーザーが実際に検索したいのは普通のリンゴだけである可能性があります。

もちろん、ほとんどの検索エンジンの結果に iPhone が表示されるのは正常です。なぜなら、ほとんどのユーザーが「Apple」という単語を検索するとき、その意味も iPhone だからです。もちろん、実際の Apple の結果ページもいくつか表示されます。

2) ユーザーの関連性

ユーザーが記事やウェブサイトを見たことがある場合、そのユーザーが特定の単語を検索すると、記事とウェブサイトのランキングが異なります。

ユーザーは、特定の分野の専門家、またはこの分野に頻繁に注目する愛好家です。このユーザーがこの分野で特定の単語を検索すると、複数回アクセスする Web サイトのランキングにプラスの影響を与える可能性があります。

もちろん、これらのユーザーの関連性は、SEO ではパーソナライズされた検索またはパーソナル検索と呼ばれることが多いものです。

③ 検索モデル

ユーザーの検索用語に対する Web ページの関連性を検索するために、検索エンジンの研究者はさまざまな検索モードを提案していますが、その中で最も広く使用されているのは「TF-IDF」です。

TF-IDF の核となる概念は、TF (キーワードの頻度または密度) と IDF (キーワードの逆文書頻度) の値をある程度まで高めることです。この 2 つの最終スコアが、ページの関連性を判断するための値となります。

簡単に言えば、キーワードの頻度や密度を高め、同時に百度内で関連する検索結果の数が少ない単語を探します。

2. 検索エンジン評価技術

検索エンジンの評価システムは非常に重要です。関連性の調査は、初期のスクリーニングと分類に過ぎませんが、それがユーザーが本当に期待するものかどうかは、評価システムを通じて完了する必要があります。

① ユーザーのクリックによって生成されるログデータ

検索エンジンは、ユーザーがクリックしたデータをバックグラウンドで記録し、大量のログデータを生成し、このデータを使用して検索エンジンを評価することができます。

②検索エンジン評価方法

その一つが、シリル・クレバードンの評価方法です。

評価には 2 種類の指標があります。

1) 正確性

精度とは、検索された文書のうち関連する文書の割合を指します。

2) 思い出す

再現率は、すべてのドキュメントの中で検出されたドキュメントの割合を指します。

3. 検索エンジンのユーザー検索エクスペリエンス技術

検索エンジンはユーザー指向であり、ユーザーの検索エクスペリエンスは検索エンジンの品質を評価する上で最も重要な要素の 1 つです。これが、検索エンジンが現在、ユーザーの検索エクスペリエンスを非常に重視している理由です。

検索エンジンはデータを使用して、どのページやウェブサイトがユーザーの検索エクスペリエンスに優れているかを分析し、ランキングやサイト全体の重み付けを改善できます。悪いエクスペリエンスを提供しているページやウェブサイトについては、ランキングやサイト全体の重み付けが低下します。

これは、Web サイトを最適化するときに、高いポイント対拡張率や UV よりもはるかに高い PV などのデータが、Web サイトのユーザー エクスペリエンスが優れていることを証明し、検索エンジンもそのような Web サイトに高いランキングを与えるようなものです。上記は、小小科堂 SEO 自習ネットワークがお届けする「検索エンジン技術の 3 つの核心問題」です。ご視聴ありがとうございました。 SEO トレーニングについては、Xiaoxiao Classroom をご覧ください。その他の SEO チュートリアルについては、Xiaoxiao Classroom を検索してください。オリジナル記事の転載は歓迎されており、著作権は留保されています。

原題: 検索エンジン技術の3つの核心問題

キーワード:

<<:  モーメントをスワイプすることがますます難しくなっている今日、これは突破口となるかもしれない

>>:  Toutiao が義烏に進出、数十万人のビジネスオーナーがインターネットマーケティングを習得できるように支援

推薦する

大学マーケティングのための効果的なプロモーションチャネルを確立するにはどうすればよいでしょうか?

大学マーケティングは主に学生を対象としています。学校が比較的集中しており、学生の購買力が強いため、効...

個人的な経験:タオバオの商人はユーザーを騙し、オンラインショッピングをする際には注意するよう皆に警告している

インターネット セキュリティは絶えず求められ、推進されており、2014 年のクリーン インターネット...

ウェブマスターは逆境の中でどのように自分を励ますことができるでしょうか?

朝、鶏が鳴く頃には、すでに記事を書くために起きているかもしれません。夜になっても、まだ外部リンクを投...

簡単な議論: 特殊車両ウェブサイトのユーザーエクスペリエンスを向上させる方法

昨日は工場の電気がなかったので、今日は出勤に回ったので、昨日Niziが書いた記事は見ていません。昨日...

エッジコンピューティングとは何ですか?なぜそれがモノのインターネットの発展にとって避けられない選択なのでしょうか?

エッジ コンピューティングは、コンピューティング リソースを集中型データ センターやクラウドからデバ...

knownhost-高品質の完全管理型VPS/サーバー、商用ユーザーに推奨

2005 年に設立された knownhost.com は、完全に管理されたホスティング プロバイダー...

【IDCC2017】キングソフトクラウドの曹希剛氏に聞く、IaaSトップ3社のデータセンターレイアウト

少し前に、IDC は 2017 年上半期の中国パブリック クラウド市場追跡レポートを発表しました。中...

JD Cloud SLA アップグレード

最近、JD Cloud は、最大 99.995% の可用性を保証する、新たにアップグレードされたクラ...

2018 年のクラウド コンピューティング: オープン ソース、マルチクラウド、マイクロサービス、インテリジェンス

2018年、ブロックチェーンは世界で最も人気のあるテクノロジーであり、それ以前に人気があった人工知能...

SEO サービス: 顧客を獲得するために注意すべきこと

他のオンライン マーケティング サービスと比較すると、SEO にはより多くのポイントが関係し、効果を...

Kubernetes を採用しますか?避けるべき落とし穴をいくつか紹介します

ツールの使い方を知ることは、それをうまく使うための鍵であり、この概念は週末の趣味のプロジェクトだけに...

バングラデシュ サーバー: zenlayer、ダッカ データ センター、30% 割引、月額 167 ドルから、最大 10Gbps の帯域幅

Zenlayerは南アジアのバングラデシュに自社データセンターを持ち、バングラデシュのサーバー、CD...

ジェネレーティブAIを活用して製造業の新たな成長エンジンを生み出す方法

今年1月に終了したダボス会議の世界経済フォーラム2024年年次総会では、 「生成型人工知能:第4次産...

クラウドへの効果的な移行のための 7 つのヒント

[[358359]]調査会社ガートナーは、適切な戦略を採用しないと、クラウド プラットフォームに移行...

ウェブマスターが1000回話すことは禁じられています。1回だけ話す方が良いです。

話すことは常に最も簡単です。21世紀の新参者として、理論は報酬と交換できることは誰もが知っていますが...