記者らは、ダブル11の前夜、アリババのAIバーチャルキャスターがタオバオ生放送ルームに登場し、ダブル11の実際のキャスターに代わったことを知った。このバーチャルキャスターは形も精神も備えており、声、感情、動きは実在の人物に近い。彼は、何百万人もの視聴者と聞き、話し、流暢にコミュニケーションできるだけでなく、ダンスやラップ、さまざまな複雑な動きをすることもできます。アリババのAIバーチャルアンカーが、ジバンシィ、ロレアル、ネスレなどの小売業者のライブ放送ルームに近々導入される予定だと報じられている。 ライブストリーミングは、電子商取引、金融などの分野で標準となっています。実際のアンカーはコストが高く、オンライン時間が限られているため、認知能力を備えた仮想アンカーが実際の人間に代わる最良の選択肢となっています。 従来のバーチャルヒューマンの機械的な表現とは異なり、アリババのバーチャルアンカーは、DAMOアカデミーの最先端の認知インテリジェンスと知覚インテリジェンス技術の統合をリードしてきました。生放送の状況に応じて、表情や動き、生放送内容がリアルタイムで変化します。例えば、アリババが独自に開発したディープネットワークモデルに基づき、バーチャルキャスターが「OMG!」などのキャッチフレーズを叫ぶと、それに応じた口の形、表情、ボディランゲージの動きを見せて驚きを表現します。さらに、バーチャルアンカーはライブ放送室の何千万人ものユーザーとリアルタイムでやり取りすることもできます。チャットでも、製品に関する質問でも、バーチャルアンカーがリアルタイムで応答します。 タオバオのライブ放送室でも、狭帯域高解像度や大規模低遅延などの基本的な革新技術が採用されていると報じられている。たとえば、低遅延テクノロジーにより、世界中のさまざまな環境やさまざまなデバイスの消費者が画像と音声を同期して受信できるようになります。 DAMOアカデミーのインテリジェントサービスチームの責任者である趙坤氏は、「バーチャルアンカーの背後には、視覚、音声、自然言語処理などのマルチモーダル融合アルゴリズムを網羅した複雑なアルゴリズムとエンジニアリングシステムがあります。これは、機械が人間と自然にコミュニケーションするための基礎です。今後、私たちはこのヒューマンコンピューターインタラクション技術を金融、教育、医療などの分野に応用していきます」と語った。 |
<<: 分散コンセンサスアルゴリズム EPaxos について 1 つの記事で学ぶ
>>: ファーウェイの洪方明氏:クラウドイノベーションは政府と企業のインテリジェントアップグレードを加速する
Pacificrack の評判は常に極端に二極化しています。ほとんど問題なく非常に効果的だと感じる人...
[[382171]]この記事はWeChatの公開アカウント「JAVA Daily Knowledg...
月収10万元の起業の夢を実現するミニプログラム起業支援プランロゴはブランドビジョンの中核として、ブラ...
8月11日、2022年アリババクラウド飛天テクノロジーサミットが深センで開催されました。 Aliba...
2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っていますマーケティ...
LeTVが最近非常に人気になっているのは明らかです。これは、LeTVがコアビジネスで素晴らしい成果を...
魂を問う質問この自己を問う質問は、業績評価中に起こりました。パフォーマンスレビューでは、SEO の ...
IDCはこのほど、「中国パブリッククラウドサービス市場(2022年第3四半期)追跡」レポートを発表し...
ファンを集めて広告を掲載するWeiboマーケティングが増加中現在、数百万人のフォロワーを持つWeib...
クラウド コンピューティングは、デジタル経済の発展を支える重要なインフラストラクチャとなっています。...
2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っていますSEO ラ...
urpad のデフォルト プローブでは一部の情報が表示されません。なぜ表示されないのかと聞かれました...
Pinterest が世界で最も急成長しているウェブサイトにピンタレスト2011年11月、Admin...
5G商用時代の完全な進歩により、エッジコンピューティングは革新的なアプリケーションサービスを促進する...
最近、SAP は 2020 年の第 4 四半期および年間財務報告を発表したほか、今四半期に中華圏で締...