以前は百度の単語分割研究にあまり注意を払っていませんでしたが、ある時、最適化を行っていたときに、単語のたった1文字の違いがランキングに大きな違いをもたらすことを偶然発見しました。 「中古住宅」というキーワードを使ったのですが、私のページのキーワード設定は「中古住宅 情報源」になっています。これで問題ないと言う友人もいるかもしれませんが、「中古住宅 情報源」には「中古住宅」というキーワードは含まれていないのでしょうか?百度の単語分割を注意深く研究しないと、2つの単語の違いがわからないかもしれません。しかし、検索結果に少し注意を払えば、手がかりがわかります。百度の「中古住宅」と「中古住宅源」という2つの単語の単語分割は異なります。百度は独自の語彙を構築しているため、「中古住宅」という単語全体を扱いますが、「中古住宅源」という単語については、百度は「中古」と「住宅源」という2つの単語に分割します。当然、他の人が「中古住宅」というキーワードを検索しても、私のページは見つかりません。この小さな詳細を通して、私は百度の単語分割について詳細な研究を行う必要があると思います。私は大まかに次の点をまとめました。 1. Baidu の単語分割は、コンテンツ内でのキーワード関連単語の初出に基づいて行われます。たとえば、テキストの最初に「今日」という単語が表示された場合、ページのキーワードは「今日」と「新しくオープンした熱血江湖SF」の2つの単語に分割されます。タイトルにはキーワードが含まれている必要がありますが、完全に一致する必要はありません。ただし、コンテンツに表示されるキーワードは、Baiduの単語分割と完全に一致する必要があります。完全一致の場合、ファイルのURLパスの深さに応じて並べ替えられます。キーワードが完全に一致する場合、たとえば、ディレクトリはファイルよりも優先され、ルートディレクトリのファイルはセカンダリディレクトリのファイルよりも優先されます。完全一致が最初にランク付けされ、次に部分一致がランク付けされます。 2. キーワードが完全に一致しない場合、単語の分割がある場合、たとえば、キーワード「ブラウザ ダウンロード」の場合、ある Web ページに最初に表示されるキーワードはブラウザであり、キーワード密度が高いですが、この Web ページにはキーワード「ダウンロード」がなく、別の Web ページに最初に表示されるキーワードがダウンロードである場合、この Web ページのキーワードは 2 つの単語「ブラウザ ダウンロード」に分割されます。2 番目の Web ページには「ブラウザ」と「ダウンロード」が含まれていますが、1 番目の Web ページは 2 番目の Web ページよりも上位にランク付けされ、キーワードの前半部分が最も重要であることが示されます。 3. キーワードの最初の部分の頻度がランキングの鍵となります。たとえば、「ブラウザ ダウンロード」の場合、2 つの Web ページが完全に一致せず、両方に 2 つの分詞が含まれている場合、「ブラウザ」の密度が高い Web ページが 1 位にランク付けされます。 4. 完全に一致しているが、キーワードがページ コンテンツの最後に最初に表示される場合、この Web ページのランキングは前のページよりも低くなります。したがって、キーワードがコンテンツのできるだけ早く表示されることが非常に重要です。 5. Baidu は、関連キーワードの初出に基づいて単語を分割します。関連キーワードの初出がキーワードの末尾である場合は、後ろから分割を開始し、前部である場合は、前から分割を開始します。つまり、Web ページの内容の順序と逆順に従って単語の分割が行われます。順序の場合は、キーワードの前半が開始点として使用され、逆順の場合は、キーワードの後半が開始点として使用されます。たとえば、「newly turned on」というキーワードの場合、Web ページに表示される最初のキーワードが「hot blooded martial arts sf」であれば、ページのキーワードは「hot blooded martial arts sf」と「newly turned on」という 2 つの単語に分割されます。 6. Baidu の単語分割原則に従って、作成しやすいキーワード ヘッダーを選択できます (つまり、Web ページのコンテンツに初めて表示されるキーワードを調整します)。つまり、手動で単語の分割が行われます。Baidu は前から後ろに向かって判断し、後ろから前に向かって分割します。 7. セグメンテーションの前半と後半が繰り返される場合、繰り返されるものは繰り返されないものよりも低いランクになります。ただし、両方が繰り返される場合は、前半の密度を使用してランクが決定されます。 原題: Baidu 単語分割研究 - 高品質のロングテールトラフィックを獲得する方法 キーワード: |
<<: ウェブサイトの最適化: テクノロジーよりもユーザーに重点を置く
>>: エッジ要素: Cheshijie.com の最適化とプロモーションの提案
6月3日より、Baiduウェブマスタープラットフォームはウェブ検索不正対策チームが毎日生成するデータ...
今年6月18日、生誕100周年を迎えたオレオクッキーのマーケティング事例が、カンヌ広告祭のPR部門で...
「優れたクラウド戦略は、10~20ページからなる短くて実行可能な文書であるべきだ」とガートナーの副社...
昨日、新たに26件のサードパーティ決済「ライセンス」が発行されました。 「中国ビジネスデイリー」の記...
「ダブル11」は、タオバオモールが2009年11月11日に最初のプロモーションを開催して以来、14年...
外部リンクは、ウェブサイトのランキングに影響を与える最も重要な要素の1つです。ランキングの品質は外部...
クラウド コンピューティングとは、簡単に言えばコンピューティング サービスの提供です。これらのサービ...
Amazon のページの読み込みに 1 秒余計にかかるごとに、同社は年間収益で 16 億ドルを失って...
プラットフォームの数と取引量は倍増し、機関投資家や個人投資家が参入しています...P2Pプラットフォ...
月収10万元の起業の夢を実現するミニプログラム起業支援プランブロードバンド事業者は絶えず価格を下げて...
インターネットの急速な発展により、多くの人がオンラインショッピングを意識するようになり、電子商取引は...
オンプレミスのデータベース インフラストラクチャと従来のデータベース管理システムが衰退するにつれ、ク...
鄭爽インターネットに対する当初の恐怖から徐々に「オンライン化」へと移行し、高級品はこの道をゆっくりと...
前回の記事「入札促進のための情報源をどうやって入手するか?」に引き続き、 》 3. 垂直フォーラムの...