Baidu の画像審査条件に基づいて、Baidu が画像からどのような情報をキャプチャして収集しているかを分析する

Baidu の画像審査条件に基づいて、Baidu が画像からどのような情報をキャプチャして収集しているかを分析する

360 の画像検索機能のベータ版が正式にリリースされたというニュースをネットで見たので、試してみました。 306画像検索が現在サポートしている検索条件は画像のサイズに制限されていることがわかりました。Baidu画像検索の多くの詳細な設定項目と比較すると、この機能はまだ比較的シンプルです。百度がこれほど多くの画像検索条件を提供できるのは、より包括的な画像情報インデックスライブラリを構築しているからだ。では、百度が画​​像を集める際、ネットユーザーの正確な検索を助けるためにどのような情報を収集するのだろうか?

画像検索の主な基準は画像の alt とタイトルのアンカー テキストであることは誰もが知っています。つまり、画像を検索すると、検索したキーワードが画像のアンカー テキストと一致する場合にのみ、画像が検索結果に表示されます。画像の位置情報のテキストに加えて、Baidu は画像に関するどのような情報を取得するのでしょうか。Baidu の検索フィルター項目を見て、Baidu の画像取得情報項目を分析してみましょう。

1. 画像フォーマット

これは、Baidu の画像検索ホームページで「詳細」をクリックした後、入力される詳細検索のスクリーンショットです。このインターフェースを通じて、キーワードと画像限定 URL に加えて、Baidu が現在 jpg、gif、bmp、png の 4 つの形式で画像検索を提供できることが直感的にわかります。つまり、Baidu が画像を収集する際、画像形式が情報ポイントとしてキャプチャされ、インデックス化されます。

2. 画像が撮影された時刻

たとえば、Baidu でクリスマスを検索すると、基本的に上位の画像にはクロールされた時間のヒントが含まれています。つまり、Baidu は検索が完了した後、デフォルトで新しくクロールされた画像を上位にランク付けすることになります。以前にキャプチャされた他の画像には、スナップショットの時刻がマークされます。

3. 画像のピクセルサイズ。

画像検索結果の左側には、フィルタリング オプションの列があります。 1 つ目は画像サイズです。Baidu では、事前に設定された正確な画像サイズに基づいた検索も提供しています。これは、Baidu が画像を含めるときに、画像の正確なサイズ データをキャプチャして記録することを示しています。

4. 画像全体の色分布データ

Baidu は特徴的な色に基づいて画像をフィルタリングする機能を提供しており、現在は 12 色のフィルタリングをサポートしています。この機能を通じて、百度が写真を収集する際に、写真全体における特定の色の割合の閾値に従って、これらの12色ごとに写真を分類し、これを基礎としてネットユーザーが正確にスクリーニングするための検索項目を確立すると推測できます。

5. 画像の動的および静的形式。

前述のように、Baidu には現在 4 つの形式の画像が含まれており、これら 4 種類の画像を動的と静的の 2 つのカテゴリに分類しています。しかし、スクリーニングしてみると、Baidu のこの検索項目は gif 形式の画像のみを抽出して動画像とみなし、他の 3 つの形式の画像は静止画像として分類されていることがわかりました。

6. 写真の主な内容

Baidu の最後の正確な項目によって提供されるフィルタリング項目から、Baidu は実際にすでに画像に表示されるコンテンツに対して一定の判断と評価を行うことができることがわかります。この機能は現時点ではまだ非常に弱いですが、検索エンジンが画像で表現されたコンテンツを認識できるようになることは前進です。将来的には、Baidu が写真に表示されるコンテンツを認識する技術をさらに強化することが予想されます。

周知のとおり、Baidu の画像クロール機能は、テキストコンテンツに比べるとまだ比較的弱いです。しかし、360 の画像検索などの他の検索エンジンと比較すると、Baidu は依然としてかなりの優位性を持っています。もちろん、360 にあまり要求しすぎることはできません。結局のところ、3B 戦争はまだ始まったばかりであり、今後、検索分野で両者の衝突が増えると考えています。ユーザーの観点からは、3B の衝突ごとに、よりエキサイティングな検索体験がもたらされることを期待しています。

この記事は、http://www.8dai.cn のウェブサイト運営・保守担当者によって作成されたものであり、担当者自身の行動に責任があります。 A5 Webmaster Network が独占公開しました。再投稿の際は、Web サイトと A5 のリンクを残してください。ご協力ありがとうございます。


元のタイトル: Baidu の画像スクリーニング条件に基づいて、Baidu が画像からどのような情報をキャプチャして収集しているかを分析する

キーワード: Baidu、画像、フィルター バー、クロール、含む、どれ、情報、1、ニュース、36、ウェブマスター、ウェブサイト、ウェブサイトのプロモーション、お金を稼ぐ

<<:  企業サイトが消費者を追従してSEOを行う方法の分析例

>>:  2013年の垂直B2Cの生死の瞬間を読んで、垂直電子商取引の発展の道筋についていくつかの考えがあります

推薦する

Google のクラウド コンピューティングに関するトップ 10 の予測

Google は最近開催された「Cloud Next」イベントで、あらゆるレベルの開発者や技術意思決...

クラウド コンピューティング戦略を推進するアプリケーションは何ですか?

クラウド コンピューティングは、それがもたらすビジネス上のメリットの可能性を経営者が認識するにつれて...

ウェブサイトのトラフィック統計を使用してウェブサイトのコンバージョン率を判断する方法

現在、インターネットは急速に発展しており、インターネットユーザー数は急増しており、オンラインマーケテ...

長巴とテンセントWeibo: 7日間で500万人のユーザーが戻ってきた典型的なケーススタディ

【はじめに】 製品の細部にこだわることで大きな利益を生む典型的な事例です。背景データシステムから見る...

ハイブリッドエンタープライズコンピューティングインフラストラクチャ

情報技術の分野では、ハイブリッド クラウド (またはクラウド コンピューティング インフラストラクチ...

dogyun: 虎の年、香港クラウド199元/年、10台のコンピュータールームのクラウドサーバー30%割引、チャージ10%増し、抽選など。

Dogyunの虎年特別新年プロモーションが始まりました:(1)香港特別価格CN2+BGP年間VPSが...

エッジ コンピューティングと 5G: エンタープライズ IT の今後は?

エッジ実装を推進する明らかな共通点がいくつかあります。コンテナーやその他のクラウドネイティブ テクノ...

クラウド時代のパフォーマンス監視戦略の隠れた利点を明らかにする

クラウド時代のパフォーマンス監視戦略焦点を失うことなく変化に迅速に対応し、事業開発を推進できることは...

Bステーションの拡張と抑制

最近、Bilibili(略してB Station )が香港で二次上場を模索しているというニュースが出...

インターネットの女王:BATとSohuが世界のトップ10ウェブサイトにランクイン

インターネットの女王:BATとSohuが世界のトップ10ウェブサイトにランクイン中国新聞社、5月30...

Kubernetes を使いやすくする 11 個のツール

これらの Kubernetes 関連コンポーネントを活用して、監視、コマンドライン操作、マルチクラス...

IBM Cloud Private: ビジネスに合わせた専用スペース

[51CTO.com からのオリジナル記事] プライベート クラウドは単一の顧客向けに構築されるため...

360とキングソフトの間で火薬のない戦争が再び始まろうとしている

今朝、コンピューターの電源を入れたとき、Kingsoft Internet Security が W...

ロングテールによるシングルページTaobaoプロモーションのヒントを共有する

Taobao Affiliate に関しては、ウェブサイトを構築する学生の多くはよく知っていると思い...