テンセントYoutu AI手話翻訳機がテンセントグローバルデジタルエコシステムカンファレンスでデビュー、温かい人工知能を創出

テンセントYoutu AI手話翻訳機がテンセントグローバルデジタルエコシステムカンファレンスでデビュー、温かい人工知能を創出

2019年デジタルエコシステムカンファレンスが5月21日から23日まで昆明で開催されました。AIサブフォーラムでは、テンセントYoutuラボの共同ディレクターで優秀な科学者であるJia Jiaya氏が、YoutuのAI手話認識における最近の画期的な成果である、独自開発のアルゴリズムに基づく「Youtu AI手話翻訳機」の発表を共有しました。

賈佳亜氏によると、AI手話翻訳機は手話収集装置として普通のカメラを使用し、バックグラウンド計算には高性能コンピューターを利用している。ユーザーがカメラに向かって手話表現を完了するだけで、翻訳機が結果を素早く計算し、手話をテキストに変換できます。将来的には、空港や民事窓口などの公共の場に導入・実装され、情報化都市の構築に貢献することが期待されます。

(テンセントYoutuラボ共同ディレクター、テンセントの著名な科学者、賈佳雅氏)

AI手話翻訳機:手話認識の「ブラックテクノロジー」を実現する独自開発アルゴリズム

手話認識(SLR)とは、コンピュータアルゴリズムを使用して、手話表現におけるさまざまなジェスチャーや動き、およびこれらのジェスチャーと動きの切り替えを自動的に区別し、最終的に表現された手話をテキストに変換することを指します。しかし、他の AI 視覚認識技術の研究と比較すると、手話認識の研究開発はより大きな困難と課題に直面しています。手話表現の地域性、複雑さ、多様性により、データの収集とクリーニングの難しさやコストが大幅に増加します。しかし、データのサイズと人工的に設計された機能の欠陥により、多くの従来の研究方法は適応性、一般化、堅牢性の点で非常に制限されています。

[[266133]]

(Youtu AI手話翻訳インターフェース)

賈佳雅によると、テンセント・ユートゥが発表したAI手話翻訳機は、聴覚障害者の手話表現習慣に基づいて手話データを収集し、先進的なジェスチャー認識、動作認識、シーケンス翻訳技術を参考にし、独自開発のアルゴリズムにより複雑な手話表現の認識技術の飛躍的進歩を実現したという。他の方法と比較して、Youtu AI 手話翻訳のデータ セットは、約 1,000 の日常的な表現と 900 の一般的な単語をカバーしています。また、データのさらなる分析と要約も行います。現在、最大の中国語手話認識データセットを保有しており、手話表現の全文認識をサポートしています。ユーザーがリアルタイム翻訳を終了して完了したかどうかを直接判断できます。

アプリケーションの探索: 視覚AIがバリアフリー情報の構築を支援

北京聴覚協会の2017年の公開データによると、中国には7,200万人の聴覚障害者がいると推定されており、これは北京の常住人口(2015年時点で約2,200万人)の3倍以上です。私の国では情報アクセシビリティの分野への投資が徐々に増加していますが、国内の聴覚障害者のニーズはまだ満たされていません。 Youtu AI手話翻訳機の導入により、聴覚障害者のコミュニケーション障壁がある程度緩和されるだろう。

賈家亜氏はスピーチで、「今後は、聴覚障害者や手話使用者との密接な交流を通じて、公共の場で聴覚障害者により良いサービスを提供し、情報アクセシビリティの構築をより良く支援していきたい」と述べた。次のステップでは、Youtu LabはAI手話翻訳機を最適化およびアップグレードし、日常のサービス窓口や手話教育などのシーンに実装して、聴覚障害者に真の利便性をもたらすことを目指します。

現在、Youtu Labは深セン市情報アクセシビリティ研究協会とAI手話認識共同プロジェクトチームを設立し、手話データ収集、製品アルゴリズムの最適化などの分野で長期的かつ綿密な協力を展開し、聴覚障害者や手話ユーザーとのさらなる接触を通じて、データ容量の拡大、データ仕様の改善を図り、その後の製品とサービスの展開と情報アクセシビリティ構築の推進に努めています。

(ウトゥと深セン情報アクセシビリティ研究協会AI聴覚障害者アクセシビリティ共同プロジェクトチーム)

このデジタルエコシステムカンファレンスで展示された Youtu AI 手話翻訳機は、テンセントが情報アクセシビリティを構築するための最初の試みではありません。テンセントは2009年初頭から情報アクセシビリティの検討を始めました。現在までに、QQ、QQ Space、WeChat、Tencent.com、Tencent News、App Store、Penguin FMなど、同社のほとんどの製品は障害を持つユーザー向けに特別に最適化されており、障害を持つ人々にとって情報に優しい社会の構築に取り組んでいます。 2013年、Tencent YoutuチームとモバイルQQは協力してOCRエンジン技術を改良しました。コンピュータービジョンアルゴリズムと自然言語処理機能に基づいて、画像上のテキストを編集可能な構造化テキストに直接変換できるため、視覚障害者がバリアフリーの情報コミュニケーションを実現するのに役立ちます。

デジタルエコシステムカンファレンスのAIサブフォーラムで初公開された異年齢顔認識技術と同様に、Youtu AI手話翻訳機もテンセントの「テクノロジーで善を」実践の重要な現れです。 Youtu Labは今後も「Technology for Good」の理念を掲げ、最先端技術の社会シーンへの応用を推進し、より実践的な問題を効果的に解決していきます。温かみのあるAIを創り、テクノロジーでより大きな社会的価値を生み出しましょう。

<<:  テンセントブルーアーミー:サイバーセキュリティを守る軍隊

>>:  テンセントYoutuラボ、テクノロジーの普及促進のためAI+公共福祉成果2件を発表

推薦する

stablehost: サマーセール、仮想ホスティング 30% オフ、VPS 50% オフ

私が stablehost について最後に言及したのは、昨年の 9 月でした。2009 年に設立され...

IaaSからSaaSまで、テンセントの20年にわたる自社開発技術がクラウド上に集結

テンセントは22年の歴史の中でどれだけの自社開発技術を蓄積してきたのでしょうか?データセンターやネッ...

エンタープライズO2Oマーケティングの10原則 プラットフォームユーザーの視点からO2Oを見る

O2Oに関しては、起業家たちがプラットフォームの構築に群がります。しかし、O2O は本質的にはアイデ...

SEO の最高峰である 3 つの例からキーワードを独自に作成する方法について簡単に説明します。

最適化を行う多くの人は、日々サイトのメインキーワードの順位を気にしながら、同時にトラフィックを獲得す...

質問ベースの文章を使用してターゲットトラフィックを引き付ける方法についての簡単な説明

修辞的質問とは何でしょうか?百度百科事典を見ると、修辞的質問とは、内容の特定の部分を強調するために意...

プロのウェブマスターの変革の苦しみ

インターネットの波の中で、プロのウェブマスターがどれだけ生き残っているかはわかりません。記事の最初の...

コンテンツの品質を確保し、質の高いユーザーを維持する方法

インターネットは膨大な情報リポジトリです。インターネットは毎日どれくらいの情報を生成するのでしょうか...

予算vm-$169/253IP/E3-1270V3/32Gメモリ/2Thdd/240gSSD/20Tトラフィック/Gポート/ロサンゼルス

Enzuの有名なIDCブランドbudgetvmは、ロサンゼルスデータセンターで特別なサーバープロモー...

SEOの考え方を活用してネガティブな情報を巧みに解決する方法

運営の過程で、企業やブランドが悪いニュースに遭遇することは避けられません。その一部は、当社のサービス...

chicagovps-全品50%オフ/Windows/1gメモリ/4コア/40g SSD/2Tデータ/年額35ドル

chicagovps.net は、米国選挙日に VPS イベントを開催し、chicagovps シリ...

2018UBDC: Umeng+ COO の Shang Zhihu 氏が、ビッグデータがデジタル マーケティング手法をどのように変えるのかを語る

月給5,000~50,000のこれらのプロジェクトはあなたの将来ですUmeng+が主催する2018 ...

大量電子商取引の時代が到来。小売業はクリエイティブな電子商取引に取って代わられる

北京時間11月20日、ベンチャーキャピタル会社アンドリーセン・ホロウィッツ(A16Z)のパートナーで...

AWS が AWS Outposts の一般提供を発表

AWS 設計のハードウェア、完全に管理され、構成可能なラックにより、お客様はオンプレミスでワークロー...

新聞出版総局は莫言の著作物の著作権を明確にしたが、合法なのは3つか4つだけである。

莫言の書籍や電子書籍が大量に市場に流通し、著作権をめぐって混乱が生じている現状を受け、昨日午後、国家...

Alibaba データベースカーネルの詳細な分析: HLC に基づく分散トランザクションの実装

分散トランザクションは、分散データベースで克服するのが最も難しいテクノロジーの 1 つです。分散トラ...