9月28日、工業情報化部、北京市人民政府、国際電気通信連合ITU-Tの主催による2020年AIIA人工知能開発者会議で、主催者は中国初のインテリジェントテキスト認識(OCR)機能評価および応用白書を正式に発表した。この白書は、OCR 開発の背景、技術の進化、業界の発展状況、技術の標準化、開発動向など、さまざまな側面から現在の国内 OCR 業界を詳細にレビューし、OCR 技術の産業化の加速的な実施と持続可能な発展を総合的に推進します。 OCR は光学文字認識の略称で、画像内の手書きまたは印刷されたテキストをコンピューターで直接処理できる形式に変換する機械の使用を指します。コンピューター ビジョンの重要な分野である OCR の典型的な用途は、画像とテキストの認識を通じて情報の入力を実現することです。同時に、テキストと記号には豊富な意味情報が含まれているため、OCR に基づいてテキスト情報を抽出し、それを分析することで、機械が画像をよりよく理解できるようになります。 このホワイトペーパーは、中国情報通信科学院、中国人工知能産業発展連盟、テンセントクラウドAIコンピュータービジョンセンター、テンセントセキュリティ戦略研究部、テンセントYoutuラボが共同で起草したと理解されています。 新しいインフラが新しい機会をもたらす、OCR技術開発の3つの大きなトレンド 近年、人工知能技術の助けを借りて、OCR パフォーマンスが継続的に向上し、産業のデジタル化によって生まれた、より複雑な OCR アプリケーション シナリオをしっかりとサポートできるようになりました。同時に、携帯電話、電子製品、クラウドサービスなど、より多様化したサービスキャリアにより、OCRの普及がさらに加速し、社会生産と生活のより多くの分野に浸透し続けています。 特に、今年4月、国家発展改革委員会は人工知能インフラを「新型インフラ」の範囲に明確に含めた。 OCR 業界は、人工知能の応用分野の中で最も現実的で商業的に成熟した分野であるため、間違いなく「新インフラ」を背景に新たな発展の機会をもたらし、関連技術も新たな変化をもたらすでしょう。 報告書では、OCR技術の今後の発展の3つの主要な方向性として、統合されたエンドツーエンドのOCRモデル、高性能と高効率を兼ね備えたOCR、知覚から認知までのインテリジェントOCRを挙げています。 具体的には、統合されたエンドツーエンドのネットワークを構築し、同時にテキストの検出と認識をトレーニングすることが、OCR テクノロジの開発における重要なトレンドの 1 つになります。エンドツーエンドのネットワーク設計により、繰り返し計算を削減できるだけでなく、機能の品質が向上し、タスクのパフォーマンスの向上が促進されます。同時に、多数の OCR アプリケーションを、リソースが制限されたモバイル デバイス上で実行する必要があります。現在のモバイル OCR アルゴリズムのほとんどは、実行速度と引き換えに、ある程度のアルゴリズムの精度を犠牲にしています。モバイルデバイスのパフォーマンスと効率の両方を考慮した軽量 OCR モデルを設計することは、将来の開発の重要な方向性となります。 さらに、知覚から認知までのインテリジェント OCR の場合、OCR テクノロジは通常、コンピューター ビジョンの分野から始まります。今後は、自然言語処理技術やナレッジグラフなどのより幅広い分野とクロス統合し、セマンティクスと知識のディープマイニングを通じてOCRのパフォーマンスを向上させることが重要なトレンドとなるでしょう。さらに、強化学習やメタ学習などの新しい学習パラダイムを OCR に導入して、機械がテキストの認識方法を自律的に学習できるようにすることも研究のホットスポットになるでしょう。 市場規模は133億8100万ドルに達し、OCRはテクノロジー大手の標準機能となった。 現在、OCR 技術は、金融、保険、医療、運輸、教育など、多くの業界で深く成熟して応用されています。今後、伝統産業のデジタル変革に伴い、OCRの適用範囲とシナリオはさらに拡大し、市場規模はさらに拡大するでしょう。権威ある組織は、世界の OCR 市場規模が 2025 年に 133 億 8,100 万米ドルに達すると予測しています。 初期の頃は、技術開発の限界により、OCR メーカーは通常、ナンバープレート認識システムなどの特定のアプリケーションに焦点を合わせ、一連の専用機器を形成していました。近年、OCR 技術が組み込まれた端末デバイスやアプリケーションがますます増え、インフラストラクチャ、基本機能から端末アプリケーションに至るまで、完全な産業チェーン エコシステムが徐々に形成されてきました。カード、証明書、請求書などのセグメント化された一連の OCR 機能も派生しており、組み合わせたアプローチを通じてさまざまな業界にサービスを提供しています。 OCR 業界エコシステムマップ OCR テクノロジが徐々に基本的な機能として「定着」し、さまざまな上位レベルのビジネス アプリケーションに基礎的な技術サポートを提供していることは容易に理解できます。 Tencent Cloud に代表されるテクノロジー大手とクラウド コンピューティング ベンダーは、OCR の導入を加速しています。社内のビジネスニーズを満たしながら、高度な OCR 機能を継続的に外部に公開しています。 OCR はテクノロジー大手にとって標準的な機能となっています。 複数の業界シナリオでの成熟した実装とOCR評価標準の最初のリリース 具体的な応用面では、カードや紙幣の認識など標準的なシナリオでのテキスト認識はすでに比較的成熟しており、教育や物流などの業界での手書きテキスト認識の応用も拡大しています。複雑で動的なシーンにおける OCR 技術とアプリケーションは、過去 2 年間で注目されている研究分野となっています。たとえば、OCR は、無人運転やロボットなどのシナリオで視野内に表示されるテキストを認識するために使用されます。 今回公開されたホワイトペーパーでは、Tencent Cloud は OCR 分野における代表的な実装事例も多数発表しました。 テンセントクラウドとテンセントYoutu研究所が提供するIDカードOCR技術を使用することで、FengchaoエクスプレスロッカーはIDカードフィールドの認識精度が最大99%になり、ユーザーの荷物の発送と受け取りの効率が大幅に向上します。寧波銀行は、テンセントクラウドとテンセントYoutu研究所が開発したインテリジェントな紙幣OCRソリューションを採用することで、認識フィールドの精度を90%以上に高め、銀行業務のシナリオのニーズをよりよく満たしています。 Sogou の広告画像テキストレビューでは、OCR 製品サービスを使用して、顧客が大量の画像テキストコンテンツを自動的に識別できるようにし、広告画像内の違法コンテンツを効率的に識別して、顧客のビジネスにおける違反のリスクを軽減します。 特筆すべきは、OCR関連分野における応用の敷居を総合的に下げ、混在状況を回避するために、ホワイトペーパーでは初めてOCRの評価基準と仕様も発表されたことである。 今年4月、中国人工知能産業発展連盟は「OCRサービスのインテリジェントグレーディングの技術要件と評価方法」を策定し、機能、性能、セキュリティなどの観点からOCRサービスの技術要件と評価方法を規定しました。7月には、OCRサービスの要件と評価方法が国際電気通信連合ITU-T SG16グループによって承認され、ディープラーニングに基づくOCR評価方法が国際標準化機構に徐々に受け入れられていることを示しています。 このプロセスにおいて、テンセントは OCR 分野における技術革新と標準設定の推進に深く関与し、企業がさまざまな OCR サービスの機能を客観的かつ総合的に評価できるように支援しています。現在、テンセントクラウドが中国人工知能産業発展連盟の指導の下で開発した天江OCRサービスエンジン自動評価プラットフォームは、OCR技術サプライヤーに技術テストサービスを提供できるだけでなく、OCR技術や製品のテスト結果を公開して、需要者に客観的で公平な選択基準を提供することもできます。 |
<<: クラウド コンピューティング セキュリティのリーダーシップを発揮する方法
トラフィックの急増は、外部リンクの構築だけではなく、コンテンツのリリースも含まれます。トラフィックの...
クラウドコスト管理会社 Yotascale の創設者兼 CEO である Asim Razzaq 氏は...
高さ 1 センチメートル未満、長さ 10 センチメートル未満のこの長方形 (正確なデータ: Goog...
profitserver は現在、ロシアの「チェリャビンスク」データセンターにある UberKVM ...
D.Phone D.Phoneグループ本社 李建松 モバイル:18612887718 QQ:9666...
NetApp は本日、新しい NetApp ONTAP ソフトウェア、フラッシュ システム、および拡...
Racknerd は今年のブラックフライデーに特別な VPS プロモーション パッケージを導入しまし...
weloveservers.net の 60% 割引は、実はしばらく前から提供されていたのですが、気...
おそらく、あなたの会社や組織は、ウェブサイトの外部に、SEO を通じて受け取るトラフィックの質と量を...
Li Tian (仮名) さんは、マウスを動かしてページを更新した後、ウェブページにいくつかの大きな...
インターネット マーケティングは、低コスト、高効率、優れた結果が特徴です。インターネット マーケティ...
ある人がとても美しいと言うとき、その人の容姿の良さを指しているのかもしれません。私たちが彼を良い人だ...
ウェブサイトは、過度に最適化されたために検索エンジンからペナルティを受けました。この現象は一般的であ...
1. タオバオが様相を変え、ソーシャルショッピングガイドサイトになる最近、百度で美麗碼や莫孤街などの...
年に一度、11月のバーチャルホストのプロモーションがここにまとめられ、比較、参照、購入のために提供さ...