AIオープンクラス | データのラベル付けについてはあまりご存じないのではないでしょうか?

AIオープンクラス | データのラベル付けについてはあまりご存じないのではないでしょうか?

人工知能の分野が日々急速な発展と進歩を遂げていることは疑いの余地がありません。

携帯電話の電源を入れ、美容アプリのさまざまな AI フィルターを有効にすると、私たちが目にするのは面白いアバターやかわいい表情ですが、アプリが「見る」のは私たちの顔にある何百ものポイントです。

[[285286]]

私たちは長い間、さまざまな AI フィルターに慣れてきましたが、これらのアプリがどのようにして目や鼻がどこにあるかを認識するかについてはほとんど考えていません。

実際、これらすべては、AI 時代の最もかわいらしいけれども、最も見落とされがちな人々のグループのおかげです。彼らは、人工知能の「教師」と呼ばれるデータ ラベラーです。

人工知能の背後にある人工知能

朝8時30分、Xiao Xinは「データラベル割り当てタスクグループ」というQQグループを開き、朝の仕事を始めました。

[[285287]]

グループのオーナーは、今日ラベルを付ける必要のあるビデオと写真をすでにグループに送信していました。Xiaoxin には 3 時間のビデオ録画が割り当てられました。

これは、ある歯科大学の先生が講義中に録画したビデオです。ビデオの内容は主に口腔内の虫歯の紹介と分類に焦点を当てています。Xiaoxinの主な仕事は、ビデオ内の黒い虫歯を見つけ、マウスを使用して虫歯の周りにデジタルの「境界線」を描いてマークすることです。

シャオシンは午前中、ビデオが終わるまで同じ動作を何百回も繰り返さなければなりません。最後に、シャオシンはマークされた新しいビデオをグループにフィードバックして、午前中の作業を終了します。

シャオシンさんは医療専門家ではないので、虫歯の跡が残っている部分の機能が何なのかよく分かりません。しかし、目に見えないところで、小欣は人工知能医療システムの「先生」になっています。大量のデータの反復処理を通じて、AIはどの歯が虫歯であるか、また虫歯の進行度を正確に識別することができます。

シャオシンは「データラベリング」という職業について聞いたことがないかもしれませんが、日々実践的な行動でデータラベラーとしての責任を果たし、機械が大量のデータを通じて学習し、無事に「卒業」できるようにしています。

大波に襲われる一般人

過去2年間で、中国ではデータラベリング企業が大規模に出現し始めており、これは中国の人工知能開発の初期段階で必要とされる大量のデータと密接に関係している。

テクノロジー企業が必要とするデータは膨大であるため、データラベリング企業はラベリング作業の大部分を下請けすることになる。データの波はAIをよりスマートにすると同時に、多くの雇用機会をもたらす。

貴陽市の中心部から50キロ離れた白鳥河デジタルタウンには、500人規模の「データファクトリー」がある。500人のラベル付け作業員のうち、ほぼ半数が近隣の貧困支援専門学校の学生だ。

彼らは月に1,500元を稼ぐことができ、経済的に自立し、家族の収入を補うのに十分であると理解されています。レストランでの料理の提供やテイクアウトの配達などのパートタイムの仕事と比較すると、データラベリングは比較的簡単でまともです。

[[285288]]

貧困緩和専門学校の学生がデータラベリング作業を実施

押し寄せるデータの波は資本と技術を巻き込み、無数の夢と野望を背負って突き進む。資本と野望のもと、無数の一般人は当面はこれらの変化を理解していないものの、変化から利便性と利益を得ることができる。

我々が知らない物語

ほとんどの生徒にとって、「データラベリング」は馴染みのない専門用語であり、校長先生が全員にこの知識を話すのは初めてのことでした。実際、データ ラベリングの分類、データ ラベリング業界の発展と影響、データ ラベリングが完全に人間に依存しているかどうかなど、データ ラベリングをめぐる興味深いトピックは数多くあります...

データのラベリングについて、より深く、より全面的に理解してもらうために、AI大学の第26回科学技術夜間自習会では、iFLYTEKのAIリソース部門の音声データディレクターであるLiu Dan氏を特別に招待し、 12月12日19時にAI大学のライブ放送室に来てもらい、データのラベリングの背景にあるストーリーについて学生たちとチャットしました。

【授業内容】

語られざる物語 - データ注釈

【コース講師】

Liu Dan、iFlytek、AI リソース部門、音声データ スーパーバイザー

【講習時間】

2019年12月12日 19:00(今週木曜日)

【コースリンク】

リンクhttp://www.aidaxue.com/live?id=29&ch=ctoをクリックしてライブコースルームに入室してください。

<<:  Tan Mingzhou: テクノロジーイノベーター - あまり知られていない道│LeaTech Global CTO Leadership Summit レビュー

>>:  人工知能市場の需要と応用

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

映画はヒットできるでしょうか?機械学習を使用して正確な予測を行う

映画データベース (TMDB) は映画データ用の API を提供し、ユーザーはこのデータベースからデ...

食品サービス機器業界の主な動向

[[442813]]画像ソース: https://pixabay.com/images/id-673...

...

IBM、AI導入を加速しAIの透明性を向上するオープンプラットフォームを発表

[[247168]]最近、IBM は、AI アプリケーションがどのように意思決定を行うかを説明する際...

...

AIシステムのグレーディングを通じて企業のコスト管理を支援

翻訳者 | 張毅校正 | 梁哲、孫淑娟自動車技術協会(SAE)が自動運転車を分類しているのと同じよう...

...

...

ボストン・ダイナミクスCEO:軍の命令は否定しないが、ロボット犬を粗雑に扱っていると思う

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

...

ディープラーニングの悪循環は驚くべき結果をもたらすだろう

[[191396]]カルロス・E・ペレスコンピレーション | 聖人、ワンショットオックスフォード大学...

...

ファーウェイ、2020年に向けて次世代マシンビジョンカメラと新製品を発表

【中国杭州、2020年5月25日】本日、「クリエイティブビジョン | インテリジェントな世界への目を...

世界的なIT大手はAIを活用してデータセンターのエネルギー節約と排出量削減に取り組んでいる

データ センターは、世界中の何十億もの人々が毎日使用するアプリケーション、Web サイト、サービスに...