検索エンジンの結果をもっと正確にする方法

検索エンジンの結果をもっと正確にする方法

注: どのようなタイトルを付ければよいか本当にわかりません。記事の内容のほとんどは、個人的な経験から得た改善点です。私は検索エンジンの専門家ではないので、これは私がこれまでに学んだ知識の要約にすぎません。

1. 検索エンジンの原理とユーザーの習慣

1.1 検索エンジンは誰でも検索できるデータベースです

図1: 検索エンジンの単純な人間とコンピュータの相互作用プロセス

で:

1) 検索対象となるデータベースは、検索エンジンによって取得された Web ページのデータです。

元のデータがスパイダーによってクロールされた後、検索エンジンはそれを処理してからデータベースに保存します。つまり、Google の PageRank など、誰もがよく知っている検索エンジンの検索アルゴリズムのことです (もちろん名前だけで、内容や原理は極秘です)。

2) 検索エンジンは高度に単純化された製品です。

ユーザーが行う必要があるのは、検索したいキーワードを入力し、確認し、結果を表示することだけです。ここで説明する必要があるのは、ユーザーが検索条件を入力する必要すらないということです。検索エンジンに関しては、膨大なデータの中から関連する結果を素早く見つけるだけでなく、ユーザーの期待を推測し、適切なコンテンツを抽出する必要があります。その内部の仕組みはもはや煩雑とは言えません。

難しさは、大量の本の中から未知の質問に対する答えを素早く正確に見つけることに似ています。

図 2: フィルターをかけて撮影した国立図書館。

1.2 検索エンジンのデータ処理

検索エンジンは非常に複雑なシステムであり、その具体的な内部処理ルールや技術原理は簡単に説明することはできません。このプロセスは、プロダクト思考を通じて理解できます。分析のための論文を書くことを例に挙げてみましょう。論文を書く前に資料を整理するプロセスは、おおよそ次のようになります。

1) インターネット、図書館、書籍、雑誌、講義などから大量のオリジナル情報を収集します。

2) 関連する重複コンテンツを排除する

3) トピックに関係のないコンテンツを除外する

4) 主題、論理的順序、優先順位などに基づいて手動で計算、分析、レイアウト、処理などを実行します。このプロセスは最も面倒で時間のかかるものであり、使用される武器は歴史上最も強力なツール、つまり人間の脳です!!!

5) 入力結果の文書化

繰り返しになりますが、すべての製品は実際の人間の社会活動を模倣しています。 。 。製品マネージャーがこれを理解することは非常に重要です。

検索エンジンのデータ処理プロセスは基本的に同様です (詳細を知りたい場合は、関連する情報を自分で検索できます)。唯一の違いは、検索エンジンが排除したいものにあります。

1 つは感情的かつ論理的な人間の脳による分析であり、もう 1 つは特定のルールに従った機械による分析です。

したがって、より正確な検索結果が必要な場合は、入力データを分析して、人間の脳のように結果を入力させます。

まあ、あまり現実的ではないとも思いますが、より正確にする方法は見つかるでしょう。

2. 情報入手方法

私たちは今でも日常の行動から始めて、製品がどのように動作するかを推測します。

2.1 一般的に、私たちは周囲の環境から次のように情報を得ます。

1. 既知の入手方法と手段

今日の米ドルから人民元への為替レートや北京から青島までの航空運賃と時刻表を知りたい場合、ルートはすでにわかっているので、地図をたどるだけで情報を得ることができます。違いは、異なるアプローチにかかるコストにあります。為替レートはオンライン、電話、銀行支店などで確認できます。明らかに最初の方法の方が便利です。 (それは本当にナンセンスです)。

この情報は正規化されており、概念は明確です。

2. 整理すべき核心的なポイントを理解する

前述のように、論文執筆においては、テーマが弱い関係のコミュニティデザインであると仮定すると、弱い関係とは何か、強い関係とどう違うのか、既存のデザイン事例にはどのようなものがあるのか​​を問う必要があります。

この情報の取得は人間による分析に基づいています。

2.2 質問方法

2つの例を挙げてみましょう。

1. 完全な序論の論理を形成する前に、子どもの質問の仕方が最も単純なキーワードです。大人がすべきことは、子どもの喃語を通して子どものニーズを理解することです。大人は子どもの習慣、行動、やり方、特徴などをよく知っているので、一般的に正確な予測をすることができます。

2. 完全な言語論理により、私たちは通常、直接質問することを選択します。今日の為替レートはいくらですか?北京から青島への航空券の価格はいくらですか?そして、何時に出発しますか?人間の脳はこれらの質問も処理できます。もちろん、人間は複雑な感情を持つ動物であり、多くのことは文字通りの意味だけでは完全に理解できません。あまり適切ではない例を挙げましょう。デート中に、女の子があなたに現在の住宅価格についてどう思うか尋ねました。文字通りの意味は住宅価格であり、根底にある意味は住宅を購入する能力です。

2.3 検索エンジンはこれをどう扱うべきか

検索エンジンが人間と同じような脳を持っていると仮定すると、問題の処理方法は次のようになるはずです。

1.クエリが検索キーワードなのか質問なのかを分析する

2. 結果には 3 つの種類があります。

答えがわかっている場合は、結果が直接出力されます。

パスはわかっているので、ソリューション パスを入力します。

ユーザーの選択に対するユーザーの期待に最も合った並べ替え結果を提供する

3. さまざまな状況で組み合わせが発生します。検索エンジンがキーワードをより完全に理解すればするほど、結果はより正確になります。

3. 改善方法と戦略

ユーザーの操作行動をまとめてみましょう。

3.1 ユーザーがキーワードを入力すると:

1) ユーザーの特性を考慮して、特性に応じて検索結果を並べ替える

2) ユーザー特性が不明な場合は、通常のクエリとみなされます。構造化された検索結果、つまり関連性の高いプロンプトを提供します。関連性が高いほど、結果も高くなります。

3.2 ユーザーが質問する場合:

1) 質問の意味を分析し、単純な意味結果またはパスを出力する

2) 正確なセマンティクスを分析し、ユーザーに複数の結果を提供し、ユーザーのフィードバックに基づいて結果を継続的に調整することは不可能です。これもユーザー特性の一部です。

3.3 検索結果が重複している場合、Tongyang はユーザーの行動特性を参照して結果を並べ替える必要があります。

いくつか用語がありますので、興味があれば再度検索してみてください: Baidu-ボックスコンピューティング、Google-ナレッジグラフ、Facebook-ソーシャルグラフ検索、Siri-セマンティック検索、確率マルコフモデル。

率直に言うと、

検索エンジンがユーザーの検索意図を理解すればするほど、データベースはより完全になり、出力結果もより正確になります。

これを説明するために例を挙げましょう。同じ質問に対して、親しい友人の答えは一般に見知らぬ人の答えよりも良いものです。なぜなら、親しい友人はあなたがその質問をした動機、背景、さらにはあなたが期待する答えまで理解してくれるからです。

問題は、コンピューターは結局のところ生き物ではなく、単にルールに従うだけであるということです。私たちができることは、あなたの行動や特徴の一部を収集して、あなたの好みを推測することです。

1. 個人情報:氏名、性別、出身地、職業、業種、興味・趣味、利用嗜好等

2. 個人の行動:検索履歴、閲覧履歴、ソーシャル行動など

3. 処理方法: クラスタリング、分類、データマイニング

実は、これはレコメンデーションエンジンなのです。さらに詳しい知識と操作方法については、IBM Developer の記事「レコメンデーション エンジンの秘密を探る」をお読みください。

———-境界線————

もともとは推奨アルゴリズムについて書きたかったのですが、いくつかの情報を確認した後、まだ知識が少なすぎて、一生懸命勉強する必要があることがわかりました。つづく。


元のタイトル: 検索エンジンの検索結果をより正確にする方法

キーワード: 検索方法、エンジン、結果、より正確、わからない、何、タイトル、記事、ウェブマスター、ウェブサイト、ウェブサイトのプロモーション、収益化

<<:  360 での集団恐喝?未来探索への道は茨に満ちている

>>:  百度のグループ購入事業はO2Oレイアウトの準備のために開始されました

推薦する

あなただけのブランドロゴを持つ時が来ました!

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています多くのロゴ...

HTML5: 明日は小雨が降るでしょう。あなたが立っている場所は晴れですか、それとも雨ですか?

HTML の明日は晴れでしょうか、それとも雨でしょうか?王淮(元Facebook決済バックエンドおよ...

オンラインマーケティング記事を書く上で、人間化は最優先事項です

哲学的に言えば、法則は客観的な事物の発展過程における本質的なつながりであり、事物の発展の必然的な傾向...

Weiboのトピックを見てSEOの価値を分析する

昨晩Weiboをチェックしていたところ、興味深い話題が2つ見つかったので、返信し、ネットユーザーのコ...

記事サイトで無敵になるためのSEO最適化の方法についての簡単な説明

みなさんこんにちは。私はChinese Quotationsです。私の記事を読んだことがある人は、私...

フランスのVPSの推奨、いくつかの便利なフランスのVPS(フランスのクラウドサーバー)業者が推奨

フランスの VPS の推奨事項、フランスの VPS のレンタル、どのフランスの VPS が最適ですか...

ウェブサイト構築では小さな親切を見逃さないでください

「たとえ小さなことであっても、善行は報われずにはおかない」とは、劉備が死ぬ前に息子の劉禅に言った言葉...

2回の核分裂実験の後、これらの提案と注意事項を知っておく必要があります

月収10万元の起業の夢を実現するミニプログラム起業支援プラン今年初めから、分裂はインターネット業界で...

Baiduの最近の改善点をいくつか見てみましょう

長い間、捜索や捜狗などの検索エンジンは百度の優位な地位を揺るがすことができず、ブラウザの入り口をコン...

インターネットの発展とトレンド!

過去2年間で、ユーザーは次々と「無料」に別れを告げてきました。支払い残高の引き出しには料金がかかり、...

Ben Feng: TusDesign プライベート クラウド データ センター構築の実践 | V教室109号室

第109回[スマート製造+V教室]「優秀なCIO」テーマ共有月間第1回では、Tus-Designグル...

共同購入サイト約2,000件が1年で消滅、第三者の統計は矛盾

Meituan.comは不正なパフォーマンスと「資金調達のための不正行為」を否定。今年5月に信頼性の...

ウェブサイトの3大タグの問題

検索エンジン最適化を行うときは、ウェブサイトの 3 つの主要なタグ、つまりタイトル、キーワード、説明...

鉄鋼情報サイト引用記者:会社が同僚に懲戒処分を通告した裏側

徐飛は最近辞職を考えている。有名な鉄鋼情報ウェブサイトの見積もり作成者として、彼は自分が属する業界に...

業界アプリケーションの革新とアップグレードのコアビジネスクラウド実装

時が経つのは早いもので、第 8 回データ テクノロジー カーニバルでの素晴らしいスピーチは今でも私た...