ソース分析を遡ってウェブサイトの類似性が高い問題を解決する方法

ソース分析を遡ってウェブサイトの類似性が高い問題を解決する方法

ウェブサイトがK状態になることは、ウェブサイト運営において避けられない状況です。ウェブマスターとして、自分のサイトがK状態になり、ウェブサイト運営の分析においてコンテンツや外部リンクを無視すると、分析していない大きな側面がしばしばあります。それは、Web ページ コンテンツの類似性の問題です。というのも、今年6月と7月に起きた百度の大規模なKステーション事件の際、筆者の観察によれば、多くのウェブマスターが「不当だ」と叫び、自分たちのコンテンツが明らかにオリジナルであるにもかかわらず、なぜ無慈悲にKステーション化されたのかと疑問を抱いていたからだ。著者は、その理由はウェブサイトの類似性にあると考えています。ウェブサイトのコンテンツがオリジナルであっても、類似性が高すぎると、検索エンジンによって重複コンテンツと誤認されてしまいます。この記事では、この問題の根本をたどり、ウェブサイトの類似性が高いという悩みを解決する方法を分析します。

原因を遡ったので、まずはウェブサイト間の類似性の高さの問題を理解する必要があります。

1 大量のコンテンツを集めることは理解しやすいです。他人のコンテンツを自分のサイトに掲載して自分で使用することは、訪問者を騙すことになるかもしれませんが、検索エンジンを騙すことはできません。

2. ウェブサイトにはコンテンツが少なく、画像が多い。この状況は主にウォーターフォール フローのウェブサイトで発生します。この状況では重複コンテンツが直接含まれることはありませんが、検索エンジンが画像をうまく認識しないことは誰もが知っています。写真が多くてもコンテンツが少ない場合、類似性が高くなりすぎて掲載に影響し、不必要なペナルティが発生する可能性もあります。

3: ウェブサイトは動的ページと静的ページの両方を生成しますが、ロボットを使用していずれかのページをブロックしないため、ウェブサイトのコンテンツが大量に重複します。

4: サイトコンテンツが複数回再投稿されることにより、コンテンツの類似性が高まります。この状況は主にサイトの RSS 購読設定で発生します。

もちろん、重複コンテンツが発生する理由は他にもたくさんあります。ここでは、これら 4 つの理由を簡単に説明します。では、ウェブサイト運営においてこれらの重複コンテンツをどのように取り除けばよいのでしょうか?

1 まず、最も重要なことは、独創性を強化することです。盗作でウェブサイトを構築することはできません。他の人のコンテンツを使用すると、サイトのページが充実しますが、ウェブサイトの読みやすさと検索エンジンの使いやすさが大幅に低下します。ウェブサイトのコンテンツは、ユーザーと検索エンジンの関係において最も重要な部分であることを知っておく必要があります。

2 ウェブサイトの独自の構造をカスタマイズします。現在、ほとんどのウェブサイトはウェブサイト構築システムを使用して構築されているため、これらの主流のウェブサイト構築プログラムは通常、ウェブマスターがサイト独自の構造をカスタマイズすることをサポートしています。したがって、CSS のこの機能を使用すると、ウェブサイトの特性が豊富な構造を作成でき、ウェブサイトの類似性を減らすのに非常に役立ちます。

4. ページの独自性を向上させます。たとえば、ページに固有のタイトルを設定してスパイダーにページの独自性を知らせたり、メタタグを手動で変更して各 Web ページの説明をわずかに異なるものにしたりします。これは、A5 がコンテンツ ページでこれら 2 つのタグをどのように使用しているかを見るとわかります。タイトルはコンテンツのタイトルを呼び出し、説明はコンテンツの最初の数文字を使用します(下の図を参照)。

5 上で述べたように、写真が多すぎると類似度が高くなりすぎるという問題も発生します。この問題に対処するには、次の点から始めることができます。

①画像ページごとに独立したタイトルをつける。

②画像ページごとに豊富な説明コンテンツを使用します。

③ それぞれの画像ごとに完全な ALT タグを作成します。

④「おすすめ」欄を活用して、他のページを合理的に呼び出す。

これらの方法の助けを借りて、ある程度、サイトの類似性が高いという問題を基本的に解決できると言えます。もちろん、本当に治癒したいのであれば、やはり忍耐が必要です。この記事が、類似度の高い問題に対処する際に役立つことを願っています。この記事はもともと Graduation Design http://www.bycxlw.com/ のウェブマスターによって作成され、最初に A5 で公開されました。転載の際は当社のアドレスをそのまま残してください。

元のタイトル: ソース分析を遡ってウェブサイトの類似性が高い問題を解決する方法

キーワード: ソースの追跡、ソースの追跡、解決方法の分析、ウェブサイト、類似性、問題、操作、ウェブマスター、ウェブサイトのプロモーション、収益化

<<:  ハードウェアに加えて、アップルはアマゾンなどのインターネット大手との激しい競争に直面している。

>>:  Kステーション事件が頻発、SEOはジレンマに

推薦する

フォーカス |機械学習に役立つ 7 つのクラウド コンピューティング サービス

データ分析は、多くの組織がクラウド コンピューティング プラットフォーム上で実行する主要なコンピュー...

SEO の最初の 2 年間でウェブマスターが学ぶべきこと

SEMWATCHのデータが失われ、以前書いた記事もいくつか消えてしまいました。 Baidu スナップ...

abelohost: オランダの Windows VPS、苦情防止、40G 防御、無制限のトラフィック

オランダのサーバー業者 abelohost が新製品を発表しました。オランダの Windows VP...

Baidu 入札キーワード価格調整の 5 つのステップ

2012年5月2日、iResearchは2012年第1四半期の国内検索エンジン調査を発表しました。中...

インスタント メッセージング ソフトウェアの「10 年間の進化」

【ゼロからのスタート】 2003 年には、QQ や NetEase Bubble などのインスタント...

中小規模のウェブサイト構築、リモート利用などに最適なraksmart香港VPSの簡単なレビュー。

香港のVPSは登録する必要がなく、本土からのアクセス速度が速く、他の国との接続も非常にスムーズです。...

サイト分析: HTML アウトライン アルゴリズムが構造に与える影響

HTML5 がリリースされてから長い時間が経ちますが、日々の仕事や個人の Web サイトに HTML...

ウェブサイトのユーザーエクスペリエンス分析: 画像最適化手法についての簡単な説明

ウェブサイトの最適化では、画像が適切に最適化されていれば、ページの読み込み速度が向上し、ウェブサイト...

vds4you: 月額 13 元、ロシア VPS、無制限トラフィック、KVM 仮想化

vds4you をご紹介します。これはロシアの商人 HAYTEK TECHNOLOGIES が運営す...

Hostus-7 USD/3g RAM/3g Vswap/70 HDD/3T トラフィック

Hostus、新年のプロモーション、ここでは大容量メモリを備えた特別なVPSのみを選択します。母鶏は...

Pacificrack: 「定額制 VPS」が 50% オフ、最低 $10/年、1G RAM/1 コア/20g SSD

Pacificrackは本日、新製品シリーズ「PR-M」を正式に発売しました。KVM仮想化はそのまま...

Kafka のコアな知識をまとめた記事です。

[[421913]]基本的な紹介Apache Kafka は、LinkedIn が Scala と ...

2014 年の草の根ウェブマスターの脱出方法

おそらく多くの人が私のように、どんな種類のウェブサイトを構築すればいいのかわからず戸惑ったことがある...

ビッグデータ ストリーム処理: Flume、Kafka、NiFi の比較

ビッグ データ パイプラインを構築するときは、Hadoop エコシステムのエントリ ポイントで通常発...