2021年になっても、データにラベルを付ける方法がまだわかりませんか?なぜ人工知能にはデータ注釈が必要なのでしょうか?

「データを持っている者は人工知能を持っている。」現在、人工知能は私たちの生活の中で当たり前のものになっています。「Siri」「指紋ロック解除」「顔認識」などはすべて人工知能の範疇に入ります。しかし、人工知能の上流の基礎産業であるデータラベリングについてはあまり知られていません。データラベリングは非常に大きな産業です。データラベリング業界内では、実務家はAI業界とともに必然的に市場セグメントを追う段階に入ります。チャンスと課題が隣り合わせであり、起業家が創出する多くのチャンスと、社会に多くの新しい雇用機会を生み出していると言えます。では、データラベリングの応用シナリオと、それがなぜ人気があるのでしょうか?

データアノテーションの応用シナリオ

顔認識

顔認識は、肖像認識または顔認識とも呼ばれ、顔の特徴情報に基づいて、さまざまな年齢、角度、表情、光源の人物の顔画像を収集し、本人確認を完了する生体認証技術です。顔認識に関わる技術には、主にコンピュータービジョンや画像処理などがあります。

中国における顔認証（視覚認識技術の応用）の応用は、おおむね公安分野から商業分野へと拡大している。当初、この技術は空港、高速鉄道駅、ホテルなどで個人の身元を確認するために使用されていましたが、その後、商業銀行も顔認識を使用して遠隔口座開設を可能にし始めました。その後、顔スキャン決済や顔スキャンアクセス制御も次々と登場し、顔認識は限られた場面から徐々に人々の日常生活に浸透していきました。現在、顔認識技術は金融、司法、公安、国境検査、航空宇宙、電力、教育、医療など、多くの分野で広く使用されています。

顔認識技術が成熟し、社会的認知が高まるにつれて、より多くの分野に応用され、人々の生活にさらなる変化をもたらすでしょう。

スマート交通

近年、人工知能の台頭に伴い、無人運転車やインテリジェント交通安全システムが私たちの生活に入り込んできました。多くの国内企業が自律運転や無人運転車の研究に投資しています。例えば、百度は「百度無人運転車」プログラムを立ち上げました。同社が独自に開発した無人運転車アポロも2018年CCTV春節祝賀会に登場しました。

[[377193]]

もう一つの例は、最近上海の街に現れたグラウンドロックパーキングのブラックテクノロジーです。車を駐車すると、アシスタントがドアハンドルに駐車リマインダーカードを置きます。 7分間駐車した後、駐車スペースの下の表示灯が緑から赤に変わり、金属製のアースロックが上がり、車のシャシーがロックされました。車を受取る際に、地面にあるQRコードを携帯電話でスキャンすると、駐車時間や料金情報が一目で分かりました。駐車料金を支払うと、地上表示灯が赤から緑に変わり、地上ロックが下がり、電子請求書をリアルタイムで取得できます。

[[377194]]

これらはすべて、運転ビデオの収集、道路状況の抽出、3D ポイントクラウド障害物、信号、車線ライト、高精度マップを含む駐車スペースのラベル付けに人工知能データラベリングの介入に依存しています。歩行者認識、車両認識、信号認識、車線認識などの技術に正確なトレーニングデータを提供して、インテリジェントな交通を保護します。

インテリジェント音声

[[377195]]

インテリジェント音声とは、言語を絆として利用した人間と機械の間のコミュニケーションです。人間の大脳皮質が日々処理する情報のうち、音声情報は20%を占め、コミュニケーションにおいて最も重要なリンクとなっています。機械による音声認識の人間による研究は 1950 年代に始まり、それから 70 年以上経ちました。 2016年、ディープニューラルネットワークの助けにより、機械音声認識の精度が初めて人間のレベルに達し、インテリジェント音声技術の実装期が到来したことを意味します。

音声におけるデータ注釈の主な応用シナリオは、音声言語収集、音声コンテンツ処理、感情判断、音声からテキストへの変換などです。音声認識 (ASR)、音声合成 (TTS) などの音声データの品質を向上させて、スマートデバイスがユーザーの音声をより適切に理解できるようにします。 Xiao Ai アプリ、Tmall Silent、携帯電話の音声入力、さらには時々受けるマーケティングの電話にも、すべてインテリジェントな音声が搭載されています。

画像処理：医療画像

医療画像処理は、医療分野における人工知能の代表的な応用であり、その処理対象は、臨床医学で広く使用されている磁気共鳴画像法や超音波画像法などのさまざまな画像化機構によって生成された医療画像です。

従来の医療画像診断では、主に2次元のスライス画像を観察することで病変を検出しており、判断には医師の経験が必要になる場合が多くありました。コンピュータ画像処理技術を使用することで、医療画像の画像セグメンテーション、特徴抽出、定量分析、比較分析を実行し、病変の識別とラベル付け、腫瘍放射線治療のための画像内のターゲット領域の自動描画、外科手術のための 3 次元画像再構成を完了することができます。

このアプリケーションは、医師が病変やその他の対象領域の定性的分析や定量的分析を行うのを支援し、医療診断の精度と信頼性を大幅に向上させます。さらに、医療画像処理は、医療教育、手術計画、手術シミュレーション、さまざまな医療研究、医療の2次元画像再構成においても重要な補助的な役割を果たします。

データを手に入れた者は人工知能を手に入れる

人工知能アルゴリズムの主な応用分野は、コンピュータービジョン、音声認識/音声合成、自然言語処理の 3 つの側面に集中しています。

画像に関して言えば、新しく開発されたコンピュータービジョンアルゴリズムには、トレーニング用に数万から数十万枚のラベル付き画像が必要です。新しい機能の開発にはトレーニング用に 1 万枚近くの画像が必要であり、アルゴリズムの定期的な最適化にも数千枚の画像が必要です。スマートシティ向けのアルゴリズムアプリケーションでは、毎年数十万枚の画像が安定して需要があります。

音声に関しては、大手企業は累計で100万時間以上の注釈付きデータセットを適用しており、年間の需要は依然として20%～30%の割合で増加しており、データサービスプロバイダーは専門的な音響知識とデータ注釈の経験を習得するだけでなく、音声合成のアルゴリズム機能も備えている必要があります。

自然言語処理の面では、産業、医療、教育における AI 応用製品のさらなる爆発的な増加に伴い、より多くのインタラクション方法が登場し、自然セマンティックデータ処理の需要は引き続き高まり、画像と音声に次ぐ第 3 位の市場になると予想されています。

[[377197]]

これらの膨大なデータのほとんどは、データラベラーによる手動のラベリングに依存しています。データラベリング業界のギャップはかなり大きく、データラベリングはさまざまな業界で広く使用されており、業界も徐々にアップグレードし、産業化に向けて動き始めています。産業発展の過程において、産業人材の育成は最大の内発的原動力でなければなりません。

「データを持っている者は人工知能を持っている。」今後、AIの応用シナリオが徐々に多分野化していくにつれ、データラベリング業界の専門家は必然的にAI業界とともにニッチ市場を追いかける段階に入り、それはチャンスと課題が混在する段階であると言えます。

<<: 2020 年の世界トップ 10 AI ガバナンスイベントと変革トレンドの展望

>>: テクノロジー | 12人の専門家が2021年の人工知能の発展動向について語る