画像認識技術を実装し、多様な応用シナリオを探索

画像認識技術を実装し、多様な応用シナリオを探索

Alpha Goの勝利により、人工知能における「ディープラーニング」の概念が急速に普及し、画像認識の分野で「機械学習」を突破して「ディープラーニング」に移行する最初のノードが発生しました。

平安証券の「通信業界における人工知能画像認識に関する特別レポート」によると、画像認識は生体認証、物体・シーン認識、ビデオ認識に分けられます。 2020年までに生体認証技術の市場規模は250億米ドルに達し、今後5年間の平均年間成長率は約14%になると予測されています。中でも顔認識は最も急速な成長率を示しており、2015年の9億ドルから2020年には24億ドルに増加しています。

さまざまなシーンアプリケーションの中で、顔認識は現在最も一般的であり、機械はすでに認識能力において人間を上回っています。 2週間前の「The Brain」では、百度のトップ科学者アンドリュー・ン氏が彼のXiaoduロボットを人間のプレイヤーと競わせ、顔認識プロジェクトで3対2のスコアで勝利した。しかし、連想能力や常識理解能力の面では、画像認識は人間に遠く及ばず、関連企業は垂直産業アプリケーションへの参入を積極的に進めています。

画像認識の実装

画像認識の背後にある技術は、新しいタイプの機械学習、つまりディープラーニングです。具体的には、データに基づいて、手動で設定するのではなく、コンピュータが自動的に特徴量を生成し、その特徴量に基づいてコンピュータが分類を実行します。

「2012年の技術と比較すると、近年、画像認識技術は再び大きな進歩を遂げています」と、シュシャンテクノロジーのCEO、デン・リバン氏は21世紀ビジネスヘラルドの記者に語った。「技術的な観点から言えば、始めるのは簡単です。0から40または60ポイントまでの閾値は比較的低いです。90ポイントまで向上するには、ディープモデルが必要です。」

画像認識技術が急速に導入されている理由は数多くある。一方では、多くの大企業がすでに基本的なツールをオープンソース化している。鄧立邦氏は「顔認識に関しては、多くの学術機関がかなり長い間研究を行っており、多くの論文を発表している。これらの論文は実用化にも取り入れられている。しかし、顔以外の感情などのテーマは、まだ比較的難しい」と述べた。

一方、産業チェーンの更新と反復は、画像技術の基礎も築いた。平安証券のレポートでは、高性能AIコンピューティングチップとディープラーニングアルゴリズムが画像認識の発展を促進する要因であると言及されている。その中で、基盤となるAIアーキテクチャはCPU+GPUからFPGA、そしてAI専用チップへと進化し、その動作性能は継続的に刷新されてきました。現在、NVIDIAのDGX-1チップは、古いGPUアクセラレーションソリューションよりも12倍高速にプログラムを実行します。

Tupu Technologyはまた、近年、コンピュータの速度の向上、大規模クラスタ技術の台頭、GPUの応用、多数の最適化アルゴリズムの出現により、数か月かかるトレーニングプロセスが数日、さらには数時間に短縮され、ディープラーニングが徐々に産業化に活用されるようになっていると記者団に語った。

多様なアプリケーションシナリオ

まだ真の人工知能には至っていませんが、成熟度が増す画像認識技術は、さまざまな業界での応用を模索し始めています。以前、Tupu TechnologyのCEOであるLi Mingqiang氏は記者に対し、現在重要なのは人工知能を特定の業界に統合し、垂直産業でビッグデータを取得して管理することだと語った。

画像認識技術が農林業に応用されていると報告されています。中国林業協会アフリカ支部の丁磊事務局長は21世紀ビジネスヘラルドの記者に次のように語った。「木材の生産には多くの工程が関わっており、かつては多くの人材が必要でした。今日では、画像認識は森林調査などの多くの工程に応用されています。森林調査では、ドローンで画像を収集し、画像分析システムで森林樹種の被覆率や森林樹木の健康状態を分析し、より科学的な採掘計画を立てることができます。丸太検査の点では、画像認識によって木材の樹種、品質、仕様を素早く判断できるため、多くの手作業が不要になります。」

平安証券は調査報告書の中で、金融分野では身分認証とスマート決済により身分セキュリティと決済効率・品質が向上すると指摘。セキュリティ分野では将来、ハードウェア導入からバックエンドソフトウェア管理プラットフォーム構築への転換において、画像認識システムがスマートシティ構築の中核となると指摘。医療分野では人工知能による迅速なマッチングに基づく医療画像処理により、医師は患者の画像データをより迅速かつ正確に読み取ることができるようになると指摘。無人運転分野では低コストのカメラと映像処理ソフトウェアソリューションが無人運転の商用化の基盤を築くとしている。

さらに、画像認識は、スマートホームや電子商取引などの業界でもさまざまな程度に使用されています。現在の適用事例から判断すると、To B 業界がほとんどですが、Face++ などの To C 製品もあります。ディープラーニングでは、各企業が業界ごとに異なる知識を持つ画像認識マシンを開発しています。今後は、画像をもとにビッグデータをいかに収集し、処理するかが、業界内のプレーヤー間の新たな競争ポイントとなるだろう。

<<:  ディープラーニングチップ研究の新潮流:処理の中核となるメモリ

>>:  AI開発の次のステップ:独自の言語でコミュニケーションするロボット

ブログ    
ブログ    

推薦する

モバイルデバイスでのリアルタイムディープラーニング

[[210219]] 2017 年には、モバイル アプリケーション向けのディープラーニングにおいて大...

Appleは、生成AIをiPhone上でローカルに実行できるようにするために、より多くの人材を採用している。

8月6日、今年初めから、生成型人工知能への熱狂がテクノロジー業界全体を席巻しているというニュースが...

マイクロソフトは低コストのAIモデルを見つけるために多方面に賭けている

マイクロソフトはOpenAI LPの半分以下を所有していると言われているが、それでもパワーは劣るがよ...

AIは単細胞生物が脳なしで意図した方向に移動する仕組みを説明するのに役立つ

単純な生物はどのようにして特定の場所へ移動できるのか?ウィーン大学で開発された人工知能と物理モデルが...

AIが金融犯罪を予測、検出、防止する方法

調査によると、金融詐欺は個人や企業に多大な損失をもたらします。銀行は、フィンテックと競争するために機...

...

最終支払いを控える人々のダブル11不安:配達ロボットは解決できるか?

今年のダブル11のクライマックスが終わり、最後の支払いをしなければならなかった人たちも、速達を待つ苦...

Google のアルゴリズムの背後: 検索リクエストは平均 2,400 キロメートルの往復を移動する

3月12日の朝、Googleが検索リクエストを完了するのにかかった時間は1秒未満でしたが、平均往復距...

オープンソースのビデオ切り抜き技術が人気です!背景を変える方法は、それが真実か嘘かを判断するのが非常に難しい

グリーンスクリーンは、映画やテレビドラマで画像を切り取ったり背景を変えたりするのに強力なツールですが...

オープンモデルの重みはAIを制御不能にすると言われ、Metaはプラカードで抗議され、LeCun:オープンソースAIコミュニティは活発化している

AIの分野では、オープンソースとクローズドソースの選択については、常に意見が分かれてきました。しかし...

データ分析 VS アルゴリズムモデル、どのように作業を分割し、効率的に連携するか?

[[438791]]この記事はWeChat公式アカウント「地道学院」から転載したもので、著者は地道...

...

Uber Ludwig は、ローコード機械学習用のオープンソース フレームワークです。

[[330500]] 【51CTO.com クイック翻訳】ディープラーニング モデルのトレーニング...

Google の公式 Android Market ランキング アルゴリズムとルール

1. ランキングの計算式にはどのような指標が含まれていますか?指標 A、B、C とは何ですか? 重み...

...