アリババクラウドの新たなAIのブレークスルー:AIレジ係が人間よりも速く正確に勤務

アリババクラウドの新たなAIのブレークスルー:AIレジ係が人間よりも速く正確に勤務

[[230167]]

「チョコレート5杯、バニララテ2杯、チョコレートとクリーム。」

「ミディアムサイズのキャラメルラテ2杯、1杯はホット、もう1杯はコールド。」

「忘れてください。チョコレートはいらないんです。」

「氷少なめのスモールモカをあと6杯、キャラメル入りが3杯、バニラ入りが3杯。」

「そして、冷たいラテのラージサイズ、氷なし、砂糖半分、スキムミルクを持ち帰ります。」

Yan Zhijie は、1 秒あたり最大 5 語の速度で機械に命令を出しました。マシンは会話に正確に反応したが、待機していた経験豊富なバリスタは「早すぎて覚えられない」と言い、途中で諦めてしまった。

これは5月23日の雲奇会議武漢サミットで起こった。ヤン・ジージエ氏はアリババ機械知能技術研究所の音声インタラクションの上級科学者である。ヤン・ジージエ氏の2度目の話を聞いた後、人間のバリスタは2分37秒で注文を完了したが、機械はわずか49秒しかかからなかった。

「今日、私たちは機械が人間の話し言葉を理解する能力を新たなレベルに引き上げました」とヤン・ジージエ氏は語った。このインタラクション方法は、「音声ウェイクアップ + 音声コマンド」という従来の命令型インタラクション方法を完全に打ち破ります。当社の先駆的なストリーミング マルチインテント音声言語理解エンジンは、人間の日常的で自然な話し言葉の理解を大幅に向上させ、ウェイクアップなしで自然な人間とコンピューターのコミュニケーション スタイルの音声対話を実現できます。

上記の注文プロセスには、注文の変更、削除、追加などの複数回のダイアログが含まれます。コミュニケーションプロセス全体を通じて、顧客は「こんにちは、注文機」などの退屈なウェイクアップの言葉を言う必要がなく、直接注文することができ、これは人々の間の自然な会話にさらに沿っています。

Yan Zhijie 氏によると、これらのモジュールは単純にカスケード接続されるのではなく、公共の場の強い騒音環境での信号処理と音声認識、ビデオ認識と顔認識、シーン認識、その他のマルチモーダル融合知覚インテリジェンスを含む、深く統合されてマルチモーダル音声インタラクション ソリューションを形成します。同時に、ストリーミング ダイアログ、マルチラウンドおよびマルチインテントの音声言語理解、ビジネス ナレッジ グラフの適応などの認知インテリジェンスも統合します。

Alibaba Cloud のソリューションは、レジ機能に加えて、地下鉄のチケット販売もできるとされています。現在、上海地下鉄はこの技術を導入しています。乗客は目的地を言うだけで、券売機が適切な停留所とルートを選択します。これは上海に到着したばかりの乗客にとって特に役立ちます。 10 を超える路線と 300 を超える駅を前にすると、誰でも混乱するでしょう。テストデータによると、通常のチケット購入には 30 秒以上かかることが多いのに対し、音声チケット購入には約 10 秒しかかかりません。

Yan Zhijie 氏は、適応型ビジネス ナレッジ グラフのテクノロジを利用することで、このソリューションをより多くのシナリオに迅速に実装できると紹介しました。実装されているシナリオには、車載音声アシスタント、電話によるインテリジェントな顧客サービス、リモコンなしで操作できる遠距離音声テレビ、複数の人の会話を正確に区別できるスマートマイクなどがあります。 「将来的には、公共空間にあるあらゆるものが相互に通信できるようにしたいと考えています。」

アリババクラウドの製品ディレクターである何雲飛氏は、アリババクラウドは昨年「産業用AI」戦略を提示し、AI技術を業界に統合し、株価を吊り上げるためのマーケティング用語とならないように業界に呼びかけたと述べた。コーヒーの注文から地下鉄の切符の販売まで、私たちは AI が実際の業界のシナリオでその価値を実現できるようにしています。これは、研究室でスキルを披露する AI よりも有意義で、重要なことです。

アリババクラウドは、これらのソリューションのほかに、ET シティブレイン、ET インダストリアルブレイン、ET メディカルブレインなどを含む ET ブレインもリリースしているとのことです。現在、ET インダストリアルブレインは工業製造企業が数十億ドルの利益を生み出すのを支援しており、ET シティブレインは杭州、マカオ、クアラルンプールなどの都市に導入され、交通の最適化や安全な都市などの責任を担っています。

<<:  馬化騰:テンセントはクラウド時代に「3つのネットワーク」を構築する

>>:  テンセントクラウドは、351の都市指標を網羅した「クラウド利用状況」レポートを発表した(レポートのダウンロードリンクを添付)

推薦する

パーソナライズされた検索を妨げる可能性のある主な要因

最近の広告研究財団の会議で、私はメディア計画、メディア購入、メディアターゲティングにおけるコミュニテ...

2021 Dell Technologies Summit プレビュー | Dell Technologies は、クラウドネイティブのアジャイルな創造性を構築し、「未来の企業」を強化します。

[[414055]] 「ソフトウェアがすべてを定義する」とき激流が押し寄せ、人々はこう答えた。将来の...

タオバオで悪質な購入者6万人を摘発:さまざまな手段を使って脅迫

リーガルネットワーク記者 陳東勝 リーガルネットワーク特派員 李翔商品を探す - 商品の写真を撮る ...

クラウドコンピューティングの8つのメリット

クラウド コンピューティングとは、インターネット経由でコンピューティング サービスを提供することです...

パブリッククラウドとプライベートクラウドの主な利点と違い

クラウド コンピューティング サービスと実践が成熟するにつれ、プライベート クラウド モデルとパブリ...

myserverplanet-$5/kvm/1g メモリ/80g ハードディスク/3T トラフィック/Windows

myserverplanet は、2009 年に設立された小規模なホスティング会社で、イングランドお...

プレビュー: ロサンゼルス データセンターの Ramnode-VPS が間もなく登場

確認されたニュースによると、Ramnode は 1 月にロサンゼルスのデータセンターで VPS を開...

最高の検索エンジン最適化テクニックを教えます

誰もが良いハックが大好きですよね?お母さんでも使える SEO のヒント 55 個をご紹介します。ああ...

ウィンドウ期間: 今年、他にどの中国のインターネット企業が株式を公開する可能性があるでしょうか?

2014年は中国のインターネット企業が米国株式市場に上場する最初の年と言えるだろう。 4月17日、新...

クラウド アプリケーション開発を始める方法

[[436453]] [51CTO.com クイック翻訳]クラウドコンピューティングアプリケーション...

OpenStack の運用と保守は不可欠です。 Ketong Cloudの2つのサービスモードが保証されています

技術の観点から見ると、クラウドコンピューティングは主にIaaS、PaaS、SaaSに分けられます。 ...

justhostはどうですか?カナダの VPS レビュー (トロント データ センター)

justhost はカナダのトロントデータセンターに VPS を追加しました。帯域幅は 200M か...

インターネットマーケティング - セルフマーケティング

マーケティングを行うときは、まず自分自身をマーケティングしなければならないと言う人がいます。この発言...

Vultr: 韓国のクラウドサーバー、SKデータセンター、迂回せずに中国本土に直接接続

クラウドサーバー業者の Vultr は、すでにバックエンドに韓国のデータセンターを持ち、韓国のクラウ...

福建省は今年4万以上のウェブサイトを検査し、200以上の違法ウェブサイトを閉鎖した。

福建省が今年3月に開始した、インターネットやモバイルメディアにおけるわいせつ、ポルノ、下品な情報の流...