SEO実践(1) - SEO前のデータ準備

SEO実践(1) - SEO前のデータ準備

振り返ってみると、SEMWATCH は長い間更新されていませんでした。ブログのトラフィックは減少していますが、非営利団体のブログとして、本当に必要としている人々に少しでも実用的で役立つ記事を提供できれば十分です。編集部の一員として、微力ながらこの精神を引き継いでいく必要があると考えています。

SEO の仕事を始めるとき、私たちが最初にすることは、私たちが行うすべてのことが、私たち自身の直感ではなく、データによって裏付けられていることを確認することです。 SEO の主なデータ ソースは、Web サイトのサーバー ログとサードパーティのトラフィック分析ツールの 2 つの部分から得られます。

Webサーバーログ

Apache や Nginx などの一般的なサーバーに組み込まれたログ構成形式の組み合わせにより、ほとんどの SEO 分析ニーズをすでに満たすことができます。次のようになります:

111.111.111.111 – - “[20/Feb/2012:18:09:25 +0800]” “GET / HTTP/1.1″ 200 3121 “http://semwatch.org/” “Mozilla/5.0 (互換; Googlebot/2.​​1; +http://www.google.com/bot.html)”

記録する必要がある情報には、アクセス元 IP、アクセス時間、アクセス ページ、HTTP 応答ステータス コード、アクセス元、クライアント ID などがあります。これらはすべて Combine ログ形式に含まれています。

サーバー ログが他部門の分析ニーズを満たすことができることを保証しながら、少なくとも上記の項目はサーバー ログに記録される必要があります。ただし、記録できるすべてのデータを記録するのではなく、実際に必要な部分のみを選択してください。そうしないと、Web サイトのログが非常に大きくなり、分析の効率が低下します。これらの問題は、運用と保守を通じて伝達され、解決される必要がある場合があります。

ログ分析に関しては、データソースがオリジナル(raw のほうが面白そう?)なので、選択できるデータ次元はほぼ無制限なので、決まった準備はあまりないと思います。したがって、実際のニーズに応じて対応する処理と分析を実行することが特に重要です。

特に要求が厳しくないログ分析のニーズには、Lightyear ログ分析システムの使用を試みることができます。個人的にはすべてのグラフィカル インターフェイス ユーティリティ プログラムが気に入っているわけではありませんが、データのディメンションに関して非常に優れたアイデアがいくつか提供されています。

大規模な旅行ウェブサイトでは、ログ分析に MongoDB と Map/Reduce を組み合わせて使用​​していると聞きました。私自身も、上記の光年ログ分析の重要な機能のいくつかを MongoDB で実装しました。したがって、MongoDB は検討する価値のある選択肢であると感じています。

サードパーティのトラフィック分析ツール

Google Analyticsのインストール

無料のトラフィック解析ツールといえば、Google Analytics(以下、GA)が断然ベストです。ただし、ウェブサイトの月間ページビューが 500 万を超える場合、Google Adwords ユーザーのみが引き続き GA を無料で使用してトラフィックを記録および分析できます。以下ではこれを例として使用します。

トラフィックを追跡したいウェブサイトを GA に追加すると、追跡する必要がある各ページのタグの前に JavaScript コードを追加するように求められます。コードの追加は、Web サイトのテンプレート レイヤーに応じて、簡単な作業になる場合もあれば、非常に面倒な作業になる場合もあります。

まず、一般的なオープンソースのブログプログラムであるWordPressの方式について説明します。WordPressは包括的なテンプレート処理方式を採用しています。たとえば、Webサイトのホームページ、リストページ、記事ページなどのテンプレートはその一部にすぎません。 Web ページのロゴなどが含まれる Web ページ ヘッダーは、WordPress の get_header メソッドを使用して別の独立したテンプレート ファイルを読み込みます (get_header メソッドは基本的に PHP の include 関数です)。つまり、header.php ファイルにコードを追加するだけで、そのコードを含むすべての Web ページがそれに応じて変更され、GA コードをすばやく追加できます。

しかし、状況は必ずしも理想的ではなく、特にウェブサイトフレームワーク自体を使用して開発されたウェブサイトの場合、そのような方法が十分に活用されていないことがあります。これは、Web サイトの構築仕様が不完全であること、または Web サイトの要件により WordPress と同様の組み込み方法を使用できないことが原因である可能性があります。次に、少なくとも各 Web ページのヘッダーに、グローバル JavaScript をロードするための追加の小さなブロックを含めて、グローバル JavaScript コードの追加を容易にします。

GA コードを追加するときに、必ずしも潜在的に問題のある Web サイト テンプレート構造を変更する必要はありませんが、せいぜい数十の異なるテンプレート ファイルにコードを追加するだけで済みます (もちろん、ページが欠落していないことを確認するためにも、ある程度の時間を費やす必要があります)。しかし、統計コードのセットを変更するなど、いくつかの重要な問題を一度に解決すると、将来的に多くの利便性がもたらされます。

最も面倒なことは、一見小さな要件に合わせてテンプレート構造を変更するようプログラマーを説得する方法ですが、ここでは省略します。

Google Analyticsの基本的な設定

SEO の場合、最も基本的な設定の 1 つは、Web サイト上で SEO に価値のあるページを分類することです。ページを区別し、そのトラフィックの状態と傾向を理解して初めて、SEO の焦点を把握し、Web サイト上の各 SEO 変更の効果をより適切に分析できるようになります。

たとえば、Web サイトに外部リンクが 1,000 個ある場合、それらのリンクを Web サイトのコラムページに付与するべきでしょうか、それとも製品ページに付与するべきでしょうか。これは主に、どのタイプのページのコンバージョン率が高く、SEO トラフィックの改善の余地が大きいかによって決まります。

これはウェブサイトごとに異なります。たとえば、書籍の電子商取引 Web サイトのリスト ページには、それほど多くのトラフィックは発生しません。「コンピューター ブック」を検索する人は多くありませんが、「スティーブ ブッシュの自伝」などを検索する人は多くなります。これは、ユーザーには非常に明確なニーズがあるためです。電子商取引の衣料品店の場合、「2012年春の新作白シャツ」よりも「シャツ」を検索する人の方が多くなります。これは、ユーザーがウェブサイトで服を選びたいだけだからです。需要の意図はありますが、具体的な需要は漠然としています。

上記2つは典型的な例ですが、直感だけでは正確な判断ができない状況は他にもたくさんありますので、交通データを活用して事実を収集する必要があります。

ブログのトラフィックデータは分析する価値があまりありませんが、ブログでは優れた記事がすべてです。ここではSEMWATCHを例にその方法を簡単に紹介します。 SEMWATCHのコラムページと記事ページのトラフィックを区別する必要がある場合、それらのURLは次のようになります: /category/seo/、/2012/02/post/

まず、GA データ ページに移動し、高度なセグメント化を見つけて、右側の [新しいカスタム セグメント] をクリックします。次に、次のような設定を行います。

通常、ページの URL を正規表現と照合することでページを区別できます。ウェブサイトの初期の URL 計画が完璧でない場合、URL を使用してページの種類を区別できないという非常に悪い状況につながる可能性があることに注意してください。ページの種類ごとに独自の独立した URL 識別子があることを確認してください。

この例では、SEMWATCH のコラムページに一致する正規表現は ^/category/.*?/$ であり、記事ページに一致する正規表現は ^/2[0-9]{3}/[0-9]{2}/.*?/$ です。

最も厳密な正規表現の記述方法を使用するようにしてください。これにより、多くの不必要な混乱を避けることができます。また、古いバージョンの GA では、「含める」フィルターはデフォルトで正規表現を使用しますが、新しいバージョンの GA では「正規表現に一致」オプションを選択する必要があることにも注意してください。

正規表現に関しては、スペースの都合上、説明は不可能です。分からない場合は、プログラマーに助けを求めることも検討してください。しかし、私の個人的なアドバイスとしては、できるだけ自分で習得することです。これは比較的基本的な技術要件であり、SEO ではこれに困惑するべきではありません。正規表現は見た目がひどいですが (少なくとも私は自分が書いた正規表現を理解できません)、実際には習得するのは非常に簡単です。

つまり、上記の手順により、ページの種類を簡単に区別することができます。元の例に戻ると、SEMWATCH がランダムに配布する外部リンクが 1,000 個ある場合、どのページに外部リンクを付与すればよいでしょうか。コラム ページにはトラフィックがほとんどなく、記事ページには当然トラフィックが非常に多いことがわかります。ほとんどの場合、これは記事ページにトラフィック開発の余地が大きいことを証明しており、記事ページに外部リンクを割り当てるのが最も賢明なアプローチです。 (ただし、コラムページのSEOに大きな問題がある可能性も否定できません。この問題は決して珍しいものではありません。したがって、私たちの常識と他の分析の側面を組み合わせて総合的に判断する必要があります。)

スペースが限られているため、この記事はこれで終わりです。また、SEMWATCHではGoogle Analyticsに関する様々な体験談が数多く共有されており、誰でも検索機能を活用できます。

最終まとめ

実際に私たちが直面する可能性のある問題は他にもたくさんありますが、もちろん 1 つの記事ですべてを網羅することはできません。上記は、主なデータ 2 つにすぎません。実際の SEO プロセスでは、ウェブサイト レベルの Google ウェブマスター ツール、Aizhan によるトラフィック推定、SEMRush、Google Adplanner、HitWise、キーワード ベースの Google キーワード ツール、Baidu Sinan、リンク ベースの MajesticSEO、Ahrefs などのデータも使用する必要があるかもしれません。

最近、「マッキンゼー方式」を読んでいたのですが、そこには「事実に基づき、厳密に構造化され、仮説に基づく」と書かれていました。SEO についても同様に要約すると、「データに基づき、厳密に論理的であり、結果を目標とし、テクノロジーを手段とする」となります。この記事は、データの基礎を基礎として構築することのみを目的としています。データ自体に価値はなく、データだけを見ると、単なる固定した数字に過ぎません。

データを活用して、最も必要な場所で SEO を変更し、トラフィックの大幅な増加を達成して Web サイトの価値を高める方法。これは私たちが本当に重点を置くべき部分であり、後でゆっくりと分解する必要があります。

p.s. 私は通常、まとまりのないスタイル、一貫性のない文章、不明瞭な要点など、かなり気楽に記事を書いています。しかし、これが許容できると思われる場合は、私の個人ブログ http://tech-field.org/ をご覧になることをお勧めします。もちろん、この連載記事はSEMWATCHでのみ連載されているので、そのアクセスを奪うことはできません。

原題: SEO実践(1) - SEO前のデータ準備

キーワード: SEO、実践、開発、準備、最初のリリースに戻る、SEMWATCH、久しぶり、ウェブマスター、ウェブサイト、ウェブサイトの宣伝、お金を稼ぐ

<<:  SEO実践(2) - ウェブサイトを検索エンジンに適したものにする

>>:  内部ページランキングを向上させるいくつかの方法

推薦する

クラウド コンピューティング、仮想化、コンテナを 1 つの記事で理解する

「クラウド コンピューティング」という言葉は、皆さんもよくご存知だと思います。情報技術の発展の主流の...

hostodo: ウェブサイトを刷新、OpenVZ を削除、NVMe KVM シリーズを追加、年間 19.99 ドルから、Alipay に対応

Hostodo がウェブサイトをリニューアルしたことをご存知ですか? OpenVZシリーズVPSはウ...

私が残した年月: 個人ウェブマスターの回想録

ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービス私は 2005 年に個人...

2019年中国オンライン動画市場年次分析

インターネット市場におけるビデオのトレンドは止められない。コアオンラインビデオは依然として積極的に市...

ネットワークマーケティングに影響を与える3つの要因

オンラインマーケティングのマーケティング手法は、その特殊なプラットフォームの特性上、従来のマーケティ...

検索エンジンのスパイダーがあなたのオリジナルコンテンツに興味を持たない理由

私たちのサイトの場合、検索エンジンに登録されるためには、まず検索エンジンのスパイダーをクロールさせる...

思考と行動の有機的な統一は、タオバオの良き顧客になるための前提条件です。

タオバオアフィリエイトの運営がますます難しくなっているのは紛れもない事実です。タオバオアフィリエイト...

Huawei Cloud GaussDB: 自らを破壊することから業界を破壊することへ、データベース市場の新たな様相を一新

周知のとおり、疫病の「ブラックスワン」は企業のデジタル化の程度を試す試金石となっており、これは研究機...

百度の監視期間中の新規サイトは軽視すべきではない

⑴. ウェブサイトを構築する前に検索エンジンに送信しない:一部のウェブマスターは、ウェブサイトが検索...

外部の敵は自ら足を引っ張っているのでしょうか? HTML5 採用の血なまぐさい歴史

近年、HTML5 の波は止められないようです。デスクトップ アプリケーション環境では、主要なブラウザ...

Festo は SAP Concur を使用してコンプライアンスの高い企業文化を構築しています

「2015年に初めてフェスト グレーター チャイナに赴任し、財務管理を担当していた頃を振り返ると、社...

Bilibiliは「収益化」のためにゲームに依存しているのでしょうか?

2次元プラットフォームとしてスタートしたビリビリは、投資主導の企業になりつつある。関連メディアデータ...

有名なフラッシュセールサイトFabが訪問者にオープン、登録ユーザー数は700万人に達する

本日、有名なフラッシュセールサイトFabは、ユーザー登録とログインプロセスの廃止を発表しました。訪問...

ヘイティーが「沈没」を先導する。

2022年はHEYTEAにとって決断の年です。今日、ずっと直営を主張してきた黒茶は正式にフランチャイ...