タオバオのカテゴリー属性システムについて簡単に説明:商品検索の背後にある論理アーキテクチャ

タオバオのカテゴリー属性システムについて簡単に説明:商品検索の背後にある論理アーキテクチャ

【ポイント】Taobao には数百万の加盟店と 10 億以上の商品があります。ユーザーが希望する商品を正確に見つけられるようにするにはどうすればよいでしょうか。その背後には強力な技術サポートがあります。

タオバオには現在、10億を超えるオンライン製品があります。ユーザーが欲しい製品を正確に見つけられるようにするにはどうすればよいでしょうか。長年の探求を経て、タオバオはついに完全なカテゴリ属性システムを確立することでこの問題を解決しました。今日は、タオバオのカテゴリ属性システムについてお話ししましょう。

歴史と建築について少し

2003 年に Taobao が初めて立ち上げられたとき、商品は非常に少なく、カテゴリもありませんでした。 その後、商品の数が数百に達したため、現在の第 1 レベルの産業カテゴリに似た単一のレベルで商品を分類し始めました。

製品が数万点になると、単一レベルの分類では需要を満たせなくなるため、カテゴリツリーである多段階の分類が始まります。属性は 2006 年に導入されました。販売者は属性テンプレートに従って属性を入力し、ユーザーは属性に従って商品をフィルタリングできます。

2008 年に、フロントエンド カテゴリとバックエンド カテゴリが分離されました。ユーザーはフロントエンド カテゴリに基づいて製品をフィルタリングし、販売者はバックエンド カテゴリに製品を追加しました。フロントエンド カテゴリ ツリーとバックエンド カテゴリ ツリーの間にマッピングが確立されました。

現在の Taobao カテゴリ属性システムは、主にバックエンド カテゴリ ツリー、フロントエンド カテゴリ ツリー、リーフ カテゴリに搭載された製品属性テンプレート、およびフロントエンド カテゴリとバックエンド カテゴリ間のマッピング関係を管理するカテゴリ管理プラットフォームで構成されています。全体的なアーキテクチャは次のとおりです。

図からわかるように、タオバオのカテゴリ属性システムは非常に基本的なデータサービスです。商品リリースページでは、販売者はバックエンドカテゴリを選択して商品情報をアップロードします。詳細ページには、商品が属するフロントエンドカテゴリがパンくずリスト形式でユーザーに表示されます。検索結果ページでは、ユーザーはフロントエンドカテゴリに基づいて商品をフィルタリングできます。運用担当者は、管理バックエンドを使用して、フロントエンド カテゴリとバックエンド カテゴリ間のマッピング関係と、バックエンド カテゴリの属性テンプレートを管理できます。

バックステージカテゴリー

バックエンド カテゴリは販売者向けであり、主に製品の分類と属性管理に使用されます。販売者が商品をアップロードすると、以下に示すように背景カテゴリが表示されます。

背景カテゴリには次の特性があります。

背景カテゴリ ツリーで最も重要なカテゴリはリーフ カテゴリです。リーフ カテゴリは、カテゴリ ツリー内でこれ以上下に分割できないカテゴリです。すべての製品は、背景リーフ カテゴリにマウントする必要があります。

リーフ カテゴリには属性テンプレートがマウントされています。販売者が商品を公開する際、カテゴリを選択し、属性テンプレートに従って必要な商品属性情報を入力してから、商品を正常にアップロードできます。

バックエンド カテゴリは比較的安定しており、任意に削除することはできず、リーフ カテゴリを繰り返すことはできません。

フロントデスク部門

フロントエンドの分類はユーザー指向であり、ユーザーが製品をフィルタリングしたり検索したりすることが容易になります。ほとんどの場合、ユーザーに表示されるカテゴリはフロントエンドのカテゴリです。次の図は、Taobao 検索結果ページの Taobao フロントエンド カテゴリ ツリーです。

フロントエンド カテゴリには次の特性があります。

ユーザーが購入するときに表示されるカテゴリは、フロントエンド カテゴリです。

フロントエンド カテゴリは、バックエンド マッピングを通じて間接的に製品に関連付けられます。

フロントエンド カテゴリは、バックエンド リーフ カテゴリ + 属性で構成されます。フロントエンド カテゴリには複数のバックエンド カテゴリを含めることができ、バックエンド カテゴリを複数のフロントエンド カテゴリにマップすることもできます。

フロントエンド カテゴリは、属性テンプレートを直接マウントしません。フロントエンド カテゴリに対応する属性は、バックエンド リーフ カテゴリのパブリック属性から取得されます。

フロントエンドのカテゴリは非常に柔軟性があり、重複したり削除したりできます。

フロントエンドとバックエンドのカテゴリを分けるのはなぜですか?

Taobao のカテゴリ属性システムを紹介した後、フロントエンド カテゴリとバックエンド カテゴリを分離する必要がある理由について疑問に思うかもしれません。カテゴリ システムを 1 つ使用するだけで十分ではないでしょうか。ここでその理由を説明します。2008 年までに、Taobao の製品数は日々増加し、カテゴリ階層はますます深くなり、購入者が希望する製品を見つけることがますます困難になりました。 Taobao の店員はカテゴリ属性を絶えず調整し始め、カテゴリツリーを浅くして、購入者が商品を見つけやすくしました。カテゴリ システムが 1 セットしかない場合、販売員が調整を行うたびに、販売者も調整を行う必要があります。一度だけの変更であれば、売り手はそれをほとんど受け入れることができませんが、これは周期的なものです。例えば、夏服のカテゴリーでは、ワンピースやシャツなどの夏服があり、冬にはレギンスやダウンジャケットなどの冬服になることがあります。セラー側もこれらの調整が合理的であることはわかっていますが、年間を通じてこのような調整を行うということは、年間を通じてカテゴリーを編集していることになり、一日中カテゴリーを変更するために数人の人を雇わなければならない場合もあり、目に見えない形でセラーの運営コストが増加します。

2008年、タオバオの製品マネージャーは、オフライン小売大手のウォルマートに触発され、ウォルマートの倉庫のカテゴリー区分と棚エリアのカテゴリー区分が別々であることを発見しました。倉庫のカテゴリー区分は比較的安定しており、ほとんど変更されませんでしたが、棚エリアのカテゴリー区分は活動や季節に応じて頻繁に調整されていました。同様に、Taobao は元のカテゴリ システムをバックエンド分類とフロントエンド分類に分割することもできます。バックエンド分類は販売者向けであり、製品や属性テンプレートをマウントするために使用されます。比較的安定しており、変更されることはほとんどありません。フロントエンド分類はユーザー向けであり、主にユーザーが製品を見つけるのに便利です。非常に柔軟性が高く、頻繁に調整できます。バックエンド カテゴリとフォアグラウンド カテゴリはマッピングを通じてリンクされます。 1 つのバックエンド カテゴリを複数のフォアグラウンド カテゴリにマッピングすることができ、1 つのフォアグラウンド カテゴリに複数のバックエンド カテゴリを含めることもできます。

技術的な観点から言えば、フロントエンドカテゴリは、バックエンドカテゴリに基づいて確立された仮想カテゴリです。

検索におけるカテゴリ属性システムの応用

まず、カテゴリ属性システムが検索精度の向上にどのように役立つかを見てみましょう。次の図は、ユーザーのクエリから製品検索結果までのプロセス全体を示しています。

ユーザーが「iPhone」というクエリを入力すると、Taobao のカテゴリ属性システムは、このクエリに最も関連性の高いフォアグラウンド カテゴリは携帯電話であると予測します。次に、フォアグラウンド カテゴリはマッピングを通じてバックグラウンド カテゴリの携帯電話を見つけ、最終的にこのカテゴリの下にある製品「iPhone 5s Gold」を見つけます。

カテゴリ属性システムでは、ユーザーが iPhone を検索すると、Taobao は携帯電話カテゴリ内の製品のみを検索するため、携帯電話ケースなどのアクセサリは表示されません。

カテゴリ属性システムを使用すると、ユーザーは検索結果ページでカテゴリと属性によって製品を直接フィルタリングし、必要な製品をより効率的に見つけることができます。タオバオ検索は、クエリ検索後のユーザーのカテゴリ属性スクリーニング行動を記録することで、各クエリのカテゴリと属性の意図を正確に予測できます。ユーザーが再度検索すると、クエリのカテゴリ属性の意図とクエリテキストの関連性に基づいて商品のカテゴリと属性の関連性を計算でき、クエリを含み、ユーザーのカテゴリと属性の意図に最も関連性の高い商品が最初にユーザーに表示されます。これは、Baidu などの一般的な検索エンジンではカテゴリ属性システムがないため実行できないことです。

カテゴリ属性システムを使用すると、検索アルゴリズムの垂直最適化も実行できます。つまり、各サブカテゴリでは、異なる販売者の重みとブランドの重みを使用でき、異なる並べ替え式も使用できます。例えば、ユーザーが携帯電話を選ぶとき、さまざまなパラメータを考慮し、記事をより多くレビューします。このとき、対応するソートの重み付け要素を強化することができます。服を選ぶとき、メイン画像の美しさは非常に重要であり、ソート要素におけるメイン画像の品質の重みを高める必要があります。 カテゴリ属性システムを使用すると、カテゴリと属性に基づいてパーソナライズされた検索を行うこともできます。検索エンジンは、ユーザーのカテゴリ属性に基づいてログをフィルタリングし、性別、希望する価格帯、好みのブランド、好みのカテゴリなどのユーザーの特性を明らかにして、ユーザー向けにパーソナライズされた表示を行うことができます。

カテゴリ属性システムはどこにでもある

カテゴリ属性システムは、電子商取引以外にも、情報を素早く見つけるのに役立つさまざまな分野で見られます。たとえば、教育業界におけるコース分類、医療業界における疾病や病院の分類などです。ユーザーが探している情報をエンティティと見なす場合、エンティティを分類してすばやく見つけて検索できるようにするのは非常に一般的な方法です。この観点から見ると、Google の Knowledge Graph は、電子商取引 Web サイトの製品カテゴリ属性システムを世界中のあらゆるものに拡張したものと見ることができます。統一されたカテゴリ属性ネットワークを使用して、すべてのエンティティを網羅しようとしています。これは、一般的な検索エンジンのカテゴリ属性システムである可能性があります。

タイトル画像はHybris Softwareより

著者: @葛灿辉-検索データマイニング/検索プロダクトマネージャー

Baidu で働きながら、思慮深い検索プロダクト マネージャーになりたいと考えています。

出典: Geek Park、転載の際は著者と元のリンクを明記してください。

元の URL: http://www.geekpark.net/read/view/205894


元のタイトル: タオバオのカテゴリ属性システムに関する簡単な説明: 商品検索の背後にある論理アーキテクチャ

キーワード:

<<:  Zhaopin.com、求人サイトJobs DBの中国事業を1572万ドルで買収

>>:  ソソの死:あなたの手は手に入らない

推薦する

SEO運用における個人的な経験

長い間何も書いていませんでした。今日は少し自由な気分なので、何か書きたいので、キーボードで何か入力す...

クラウドベースのアクセス制御はスマートビルディングの鍵となる

クラウドベースのアクセス制御には、特にスマートビルディング市場が勢いを増し始めている現在、多くの利点...

鄧亜平、ジケソウについて語る:重要なのは金儲けではなく国家の責任を果たすことだ

「我々は国家を代表している。あなた方(百度)は我々を倒す必要はない。我々をもっと助け、もっと助言をす...

2014年、レノボ・モバイルは「空約束」を実現できるだろうか?

2014 年 4 月 22 日の午後、オリンピック スポーツ センターの国立オリンピック体育館で、レ...

Alibaba Cloudの技術専門家が世界最大のオープンソースコミュニティのApacheメンバーに選出

最近、世界最大のオープンソースコミュニティであるApache Software Foundation...

何年も SEO に携わった後、私はすべてを失いました。今回はユーザーだけを気にしています。

みなさんこんにちは。私は四海釣魚網(www.sihaidiaoyu.com)のウェブマスターです。ま...

ウェブサイト推奨システム「Guess What You Like」は、あなたの考えをどのように推測するのでしょうか?

最近では、人々がオンラインで買い物をするとき、システムから返される「あなたは(おそらく)好きでしょう...

#独占リソース - より高い要件を持つユーザーに適したVultrの新しいVDS

Vultr.com は、最小構成 (2CPU、8G メモリ、110G SSD、10T トラフィック/...

クリーンアプローチによってコードがより明確でシンプルになり、強力になる理由

この記事は、プログラマー必読の書籍の 1 つとされる「Clean Code」の第 1 章から抜粋した...

他の人のアプリランキングが急上昇しているのを見て、ポイントウォール チャネルを通じてプロモーションを行う前にどのような準備が必要ですか?

ASOプロモーションチャネルの多様化に伴い、ポイントウォールは徐々に主流のiOSプロモーションチャネ...

リスクとセキュリティに関する SaaS 契約交渉のベスト プラクティス 5 つ

COVID-19パンデミックによりリモートワークへの大規模な移行が進んだため、今年はSaaS製品の導...

SEOの考え方: 高いところにいるときだけ、遠くまでおしっこができる

中国の旧正月まであと1ヶ月ちょっとです。ここ数日、専門家は皆、Googleは長い間PRを更新しないだ...

itldc (1995~): 無制限帯域幅の VPS、40% オフ、年間 23 ユーロ、米国、シンガポールなどで 15 のデータ センターが利用可能。

1995年に設立されたブルガリアの企業itldcは、15のデータセンターの「無制限トラフィックVPS...

デジタルトランスフォーメーションでDevOpsを保護する方法

最近のテクノロジー業界で最もホットな流行語は「デジタルトランスフォーメーション」です。これは、企業が...

2023 年のデータ分析とビジネス インテリジェンス開発のトレンドは何ですか?

2023 年を迎える今こそ、データ分析とビジネス インテリジェンスのトレンドが新年にどのようになるか...