アリババはAI分野で4つの「オスカー」賞を受賞した。 AIはビデオターゲットの位置を正確に予測できる

アリババはAI分野で4つの「オスカー」賞を受賞した。 AIはビデオターゲットの位置を正確に予測できる

先日、世界最高峰のコンピュータービジョンカンファレンスであるCVPR 2020が主要なチャレンジの結果を発表しました。アリババは4つの大会で世界選手権に優勝した。その中で、最も難しかったDAVISチャレンジにおいて、アリババは映像ターゲットの位置を正確に予測できる手法を提案し、80点以上の得点で初めて1位を獲得した。

CVPR は AI 分野における最大のカンファレンスであり、コンピューター ビジョン分野の「オスカー賞」として知られています。コンピューター ビジョンの分野における将来を見据えた学術研究と産業アプリケーションを取り上げます。会議の研究結果は、ビジュアル AI 分野の研究動向を反映しています。ビデオ会議やライブストリーミングなどのアプリケーションがますます普及するにつれて、トップテクノロジー企業の今年の研究成果は、画像からビデオ分野へと徐々に広がり、ビデオ圧縮、ビデオセグメンテーション、3次元ビジョンなどの領域をカバーしています。

画像認識とは異なり、AI がビデオを分析して理解するための技術的なハードルは高くなります。長い間、ビデオ AI 技術の研究において業界で大きな進歩が見られることはほとんどありませんでした。 CVPR カンファレンスで最も難しい競技の 1 つである DAVIS (Densely Annotated Video Segmentation) を例に挙げてみましょう。このコンテストでは、参加チームは複雑なビデオ内の急速な動き、外観の変化、オブジェクトの遮蔽などの情報を正確に処理する必要があります。過去数年間、世界トップクラスのテクノロジーがこの競争で80点以上を獲得したことは一度もありません。

アリババが参加した4つのコンテストはいずれもビデオ技術分野のものだと報じられている。デイビスチャレンジでは、アリ選手が初の躍進を遂げ、昨年の1位より7.4ポイント高い84.1点で優勝した。

Alibaba AIはDAVISコンペティションで84.1点を獲得し、優勝した。

公開情報によると、アリババは従来のSTM方式における時間的順序の欠如というボトルネックを打破する新しい空間制約方式を提供し、システムがビデオの前のフレームに基づいて次のフレームの対象オブジェクトの位置を予測できるようにしています。さらに、アリババはセマンティックセグメンテーションにおいて洗練されたセグメンテーション微調整モジュールも導入し、セグメンテーションのレベルを大幅に向上させました。最後に、動的ターゲットの輪郭境界が正確に識別され、背景から分離されて、ピクセルレベルのターゲットセグメンテーションが実現されます。

Alibaba AI は、ビデオの前のフレームに基づいて、次のフレームの対象オブジェクトの位置を正確に予測できます。

業界関係者は一般的に、ビデオセグメンテーション技術がオンライン会議、ライブストリーミング、自動運転、映画やテレビ番組の制作などのシナリオの標準になると考えています。たとえば、ライブ放送のシナリオでは、Alibaba AI アルゴリズムを使用して 1 秒で背景を置き換えることができます。自動運転では、ビデオセグメンテーションは自動運転システムが障害物を識別するための重要な技術でもあります。

アリババは4つのコンテストで優勝したほか、自動運転分野の研究成果を含む17本の論文がCVPR 2020に選ばれたと報じられている。本論文では、3D物体検出の精度と速度の両方を初めて実現し、自動運転システムの安全性能を効果的に向上させる汎用的で高性能な自動運転検出器を提案しています。

現在、アリババのビジュアルAI技術は、世界で大規模な実装を実現する上で先頭に立っています。例えば、この技術は、City Brain、Pailitao、Youku Video など、Alibaba グループの内部ビジネス シナリオで大規模に使用されています。アリババのCT画像AIは、世界中の600以上の医療機関にサービスを提供しており、流行期間中に50万件以上の症例の臨床診断を完了した。

<<:  クラウドコンピューティング: 5G と IoT の未来

>>:  ファーウェイの石耀宏氏:産業のアップグレードの重要な10年、ファーウェイのクラウドとコンピューティングは企業の追い越し達成を支援する

推薦する

エッジ コンピューティングとクラウド コンピューティング: 主な違いは何ですか?

エッジコンピューティングとクラウドコンピューティングの主な違いは何ですか?コンピューティングでは、「...

Z世代のためのブランドマーケティングの秘訣

Z世代とは、1995年から2010年の間に生まれた人々を指します。しかし、私は、特定の時点で生まれた...

周囲のリソースを活用してウェブサイト開発のレベルを決定する方法

私は3年間ウェブサイトを作ってきました。何も知らない小さなウェブマスターから、5つのウェブサイトを所...

ウェブサイトが悪意を持って利用されていないか確認する

マルウェアやスパムに感染したくない人は誰もいません。だからこそ、安全な Web サイトを運営するため...

適切なハイブリッドクラウド管理アプローチを選択する方法

ハイブリッド クラウド管理 (HCM) 市場は最近まで停滞していましたが、最近になって状況は一変しま...

サイバーマンデー - VPS プロモーション

今年のサイバーマンデーが到来し、HostCat は VPS プロモーション リストを立ち上げ、国内外...

ユニオン生命保険のユニバーサル保険のオンライン販売は法律を回避している。宣伝は誤解を招く恐れがある

オンラインで保険を販売することが、蛇年で最も人気のあるマーケティング手法の 1 つになりつつあること...

Apache Struts2 の高リスク脆弱性が近づいています。早めに注意してください。

国内の有名なセキュリティ脆弱性プラットフォームであるWuyunによると、昨日から、多数の国内の有名な...

垂直型電子商取引は「溝を越える」ことができるか?

現在、垂直型電子商取引が直面している困難は、オンラインショッピングの深さと幅が十分ではなく、ユーザー...

コンバージョン率の低さへの反撃:心を掴む営業戦略

ウェブサイトにとって最も頭の痛い問題は何でしょうか。それはウェブサイトのトラフィックが全くないことで...

Rise with SAP の使用に適した企業はどのような企業ですか?

[[433172]]約1年前、SAPはRise with SAPという新製品を発表しました。当時、C...

Hostdime: トップ Tier IV 認定データセンター、コロンビア VPS、コロンビア専用サーバー

コロンビアの VPS、コロンビアのサーバー、コロンビアのデータセンターは、現在のホスティング市場では...

VMware の Xinlei Zheng: オープンソースの採​​用、イノベーション = 創造性 × 実装

今日のデジタル時代において、イノベーションは企業の魂となり、持続可能な発展を促進するための重要な保証...

百度のホームページで急速にランク付けするための6つの単語のマントラ

すべてのウェブマスターがウェブサイトの構築に一生懸命取り組んだ後、次に最も重要なことは、正確にターゲ...