プロキシハイジャックとは

プロキシハイジャックとは

PR ハイジャックと同様に、私は、多くの場合、罪のないウェブマスターに大きな損害を与える可能性があるため、防止するのがより困難なブラックハット フレーミング手法について積極的に議論したくありませんでした。

2 日前の SEO のケースで、プロキシ ハイジャックについて触れました。プロキシ ハイジャックとは何かと尋ねられた方がいました。今日はそれを説明したいと思います。このようなことは諸刃の剣です。悪意のある人にとっては、他人に危害を加え、自分に利益をもたらすもう 1 つの手段となります。一方、すでに大きな被害を受けているウェブマスターにとっては、これを読むことで予防や回復に役立つかもしれません。

簡単に言えば、プロキシ ハイジャックとは、検索エンジンがプロキシ サーバーを介して閲覧された Web ページを含め、元の実際の Web ページを罰したり削除したりすることを意味します。

国内のウェブマスターはプロキシ サーバーに精通している必要があります。プロキシ サーバーを使用して他の Web サイトにアクセスする場合、ブラウザーに表示される URL は通常、次のようになります。

http://www.proxysite.com/proxy/www.proxysite.com

このうち、proxysite.com はプロキシ サーバーのドメイン名であり、proxysite.com は実際にアクセスしたい Web サイトです。

この種の URL をブラウザで開くことには確かに問題はありませんが、検索エンジンがこの種の URL をクロールすると、元の Web サイトと完全に重複したコンテンツの Web ページが形成されます。重複コンテンツのページはほとんどの場合単に無視されますが、場合によっては検索エンジンが誤った判断を下し、元のバージョンをコピーとしてペナルティを課したり削除したりすることがあります。

一般的に、プロキシ経由でアクセスされる URL はインデックス化されません。しかし、誰かが悪意を持ってこのプロキシ URL にリンクすると、検索エンジンもそれにアクセスしてクロールします。

プロキシによるランキングの乗っ取りを防止または復元するにはどうすればよいでしょうか?

最も簡単な方法は、Web ページがプロキシによってハイジャックされていることがわかった場合は、プロキシ サーバーの IP アドレスを確認し、自分のサーバーでその IP アドレスをブロックして、クロールを禁止することです。

しかし、プロキシ サーバーの IP アドレスは変更される場合があり、プロキシ サーバーの数が多いとすべてをブロックすることが不可能になる場合があります。より複雑な方法は、サーバーがプログラムを使用して、訪問者が検索エンジン スパイダーであるかどうか、また実際の検索エンジン スパイダーであるかどうかを識別します。

場合によっては、プロキシ URL 経由でアクセスするときに検索エンジン スパイダーが使用するブラウザー タイプ (ユーザー エージェント) が、検索エンジン スパイダーのブラウザー タイプのままになることがあります。ただし、プロキシ サーバーの中には、元の IP アドレスとユーザー エージェントを隠すように設定されているものもあり、検索エンジン スパイダーであるかどうかを判断するのが非常に困難になります。

このとき、ウェブサイト プログラムは、訪問者が実際の検索エンジン スパイダーであるかどうかを積極的に検証する必要があります。プログラムがそれが本当に本物のスパイダーであることを確認すると、通常のページに戻ります。ユーザーがスパイダーではなく、通常のユーザー、または偽のスパイダーであることが検出された場合、返される Web ページに noindex タグと nofollow タグが追加されます。この方法では、プロキシ経由でアクセスした場合、これらの元の Web ページは検索エンジンによってクロールされません。

2月にGoogleのBlackboardとWebmaster Blogに掲載された、Googleスパイダーの検証方法に関するMatt Cutts氏の投稿(Matt Cutts氏の元の投稿は自身のブログではなく、Webmaster Blogの英語版に掲載されていた)は、面白半分に投稿されたのではなく、深い意味がある。これまでのところ、引用リンクとコメントがゼロであることから判断すると、ほとんどの人はこの投稿が何についてのものか全く分かっていない。

理論的には、検索エンジンはこの種のプロキシハイジャックを判断する方法を持っている必要があります。そうしないと、一部の人々が競合他社を陥れる簡単な方法になってしまいます。しかし、どんなアルゴリズムにも抜け穴は存在します。たとえアルゴリズムが 99% の正しい判断を下すことができたとしても、網をすり抜けた 1 つのエラーによって、無実の Web サイトが削除されてしまう可能性があります。

この記事は、より多くの人に知ってもらい、より効果的に予防できるようになることを願って書きました。誰もが、他人を陥れるためにこの方法を使うことを嫌うだろうと私は信じています。

私が記事を書くとき、それを理解できる人が少なければ少ないほど良いと考えることはめったにありません。これは一つです。

元のタイトル: プロキシハイジャックとは何ですか?

キーワード:

<<:  Baidu 最適化の全体概要

>>:  PR値更新時間予測

推薦する

vps.net - 50% オフ / ONAPP / XEN / 18 のデータセンター

VPS.netの公式サイトでは、ちょっとしたプロモーション[最初の3ヶ月は半額]が始まっています。効...

Baidu は、Web サイトにブラック ハット SEO 行為があるかどうかをどのように判断しますか?

Baidu は、Web サイトにブラック ハット SEO 行為があるかどうかをどのように判断しますか...

エージェントがWeChatモーメンツを活用する方法

2011年にWeChatが台頭して以来、私の周りの友人たちもどんどんWeChatやモーメントを使い始...

ウェブサイトを最適化するための推奨ツール

経験豊富なウェブマスターがウェブサイトの最適化を行う場合、多くの SEO ツールとソフトウェアを手元...

SEO トレンドに関する考察: 軽量 Web サイトがトレンドになりつつあるのでしょうか?

今年6月、蔡蔡はA5に「ウェブサイトのコンテンツは毎日更新する必要があるか?」と題する記事を掲載した...

2018 年 9 月のカンファレンスで発表される Apple のハードウェア製品が明らかに: MacBook と iPad Pro も含まれる!

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っていますA5ベンチ...

販売理論は最適化に役立ちますか?

SEOは包括的なテーマですが、参入の敷居は低いです。特定の理論的知識を習得した後は、それを実際に適用...

無料のVPSサーバー速度最適化ネットワーク:BBR、ワンクリックインストール

bbr [TCP BBR 輻輳制御アルゴリズム] を紹介します。これは Google の成果です。B...

全国人民代表大会はネットワーク情報保護に関する決定草案を審議する

北京の新華社通信が12月19日に伝えたところによると(楊維漢記者)、インターネット技術の広範な応用と...

Yuqiao Video: 企業ビデオはどのようにして企業ブランドのマーケティングとコミュニケーションの強力なツールになるのでしょうか?

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています2018年...

レポート: サーバーレスは多くのソフトウェアスタックの重要な部分となっている

Datadog は、クラウドネイティブのスタートアップから大企業まで、あらゆる規模の組織でサーバーレ...

アリババ:注目を集めるSEO

実のところ、この記事は 2013 年の終わりには書くべきだったのですが、今日まで延期されました。もち...

熊暁峰 SEO シリーズ: 検索エンジンアルゴリズムの進化の 4 つの段階が明らかに

月収10万元の起業の夢を実現するミニプログラム起業支援プラン前回の記事では、ステーショングループの遊...

Linodeについてはどうですか? [年] Linode Japan 東京クラウドサーバーのレビューと共有

Linodeの日本データセンターのクラウドサーバーの現状はどうなっていますか?ネットワーク QOS ...

Cloud 2.0時代において、事業者はクラウドのトレンドを把握できるでしょうか?

2017 年は Cloud 2.0 の元年と言えます。さまざまなクラウド サービス プロバイダーが独...