AIオープンクラス | データのラベル付けについてはあまりご存じないのではないでしょうか?

AIオープンクラス | データのラベル付けについてはあまりご存じないのではないでしょうか?

人工知能の分野が日々急速な発展と進歩を遂げていることは疑いの余地がありません。

携帯電話の電源を入れ、美容アプリのさまざまな AI フィルターを有効にすると、私たちが目にするのは面白いアバターやかわいい表情ですが、アプリが「見る」のは私たちの顔にある何百ものポイントです。

[[285286]]

私たちは長い間、さまざまな AI フィルターに慣れてきましたが、これらのアプリがどのようにして目や鼻がどこにあるかを認識するかについてはほとんど考えていません。

実際、これらすべては、AI 時代の最もかわいらしいけれども、最も見落とされがちな人々のグループのおかげです。彼らは、人工知能の「教師」と呼ばれるデータ ラベラーです。

人工知能の背後にある人工知能

朝8時30分、Xiao Xinは「データラベル割り当てタスクグループ」というQQグループを開き、朝の仕事を始めました。

[[285287]]

グループのオーナーは、今日ラベルを付ける必要のあるビデオと写真をすでにグループに送信していました。Xiaoxin には 3 時間のビデオ録画が割り当てられました。

これは、ある歯科大学の先生が講義中に録画したビデオです。ビデオの内容は主に口腔内の虫歯の紹介と分類に焦点を当てています。Xiaoxinの主な仕事は、ビデオ内の黒い虫歯を見つけ、マウスを使用して虫歯の周りにデジタルの「境界線」を描いてマークすることです。

シャオシンは午前中、ビデオが終わるまで同じ動作を何百回も繰り返さなければなりません。最後に、シャオシンはマークされた新しいビデオをグループにフィードバックして、午前中の作業を終了します。

シャオシンさんは医療専門家ではないので、虫歯の跡が残っている部分の機能が何なのかよく分かりません。しかし、目に見えないところで、小欣は人工知能医療システムの「先生」になっています。大量のデータの反復処理を通じて、AIはどの歯が虫歯であるか、また虫歯の進行度を正確に識別することができます。

シャオシンは「データラベリング」という職業について聞いたことがないかもしれませんが、日々実践的な行動でデータラベラーとしての責任を果たし、機械が大量のデータを通じて学習し、無事に「卒業」できるようにしています。

大波に襲われる一般人

過去2年間で、中国ではデータラベリング企業が大規模に出現し始めており、これは中国の人工知能開発の初期段階で必要とされる大量のデータと密接に関係している。

テクノロジー企業が必要とするデータは膨大であるため、データラベリング企業はラベリング作業の大部分を下請けすることになる。データの波はAIをよりスマートにすると同時に、多くの雇用機会をもたらす。

貴陽市の中心部から50キロ離れた白鳥河デジタルタウンには、500人規模の「データファクトリー」がある。500人のラベル付け作業員のうち、ほぼ半数が近隣の貧困支援専門学校の学生だ。

彼らは月に1,500元を稼ぐことができ、経済的に自立し、家族の収入を補うのに十分であると理解されています。レストランでの料理の提供やテイクアウトの配達などのパートタイムの仕事と比較すると、データラベリングは比較的簡単でまともです。

[[285288]]

貧困緩和専門学校の学生がデータラベリング作業を実施

押し寄せるデータの波は資本と技術を巻き込み、無数の夢と野望を背負って突き進む。資本と野望のもと、無数の一般人は当面はこれらの変化を理解していないものの、変化から利便性と利益を得ることができる。

我々が知らない物語

ほとんどの生徒にとって、「データラベリング」は馴染みのない専門用語であり、校長先生が全員にこの知識を話すのは初めてのことでした。実際、データ ラベリングの分類、データ ラベリング業界の発展と影響、データ ラベリングが完全に人間に依存しているかどうかなど、データ ラベリングをめぐる興味深いトピックは数多くあります...

データのラベリングについて、より深く、より全面的に理解してもらうために、AI大学の第26回科学技術夜間自習会では、iFLYTEKのAIリソース部門の音声データディレクターであるLiu Dan氏を特別に招待し、 12月12日19時にAI大学のライブ放送室に来てもらい、データのラベリングの背景にあるストーリーについて学生たちとチャットしました。

【授業内容】

語られざる物語 - データ注釈

【コース講師】

Liu Dan、iFlytek、AI リソース部門、音声データ スーパーバイザー

【講習時間】

2019年12月12日 19:00(今週木曜日)

【コースリンク】

リンクhttp://www.aidaxue.com/live?id=29&ch=ctoをクリックしてライブコースルームに入室してください。

<<:  Tan Mingzhou: テクノロジーイノベーター - あまり知られていない道│LeaTech Global CTO Leadership Summit レビュー

>>:  人工知能市場の需要と応用

ブログ    

推薦する

Langogo 2019 東京カンファレンス: 4 つの新製品が衝撃的なデビューを飾り、メディア界で話題に

(2019年11月21日、東京)Langogoは現地時間午前11時に神田明神文化交流センターで201...

テクノロジーファイナンスからスマートファイナンスまで、民生銀行の革新的な人工知能の応用をご覧ください

[51CTO.comからのオリジナル記事] 「インターネット+」から「インテリジェンス+」まで、革新...

...

アイデアから実装まで、2018 年の 13 の驚くべき新しい NLP 研究

2018 年には、自然言語処理の分野で多くの刺激的なアイデアやツールが生まれました。概念的な視点から...

MITとIBMが共同で「コンピュータービジョンの黄金時代に備える」ための新しいデータセットを発表

人工知能の分野における画像分類問題に関して言えば、トレーニングとテストに最もよく使用されるデータセッ...

午後を費やしてラベルのない画像10万枚にラベルを付け、上司の費用を3万ドル節約しました

[51CTO.com オリジナル記事] 上司がラベルのない写真 10 万枚を渡して、サンダル、パンツ...

TransformerはAI分野を支配するのでしょうか?結論を出すのは時期尚早だ

自然言語処理タスクから始まり、画像分類と生成の分野で活躍する無敵のトランスフォーマーは、次の伝説とな...

また一人の科学者が学界に復帰、AI産業の発展は冷え込みつつあるのか?

最近、一部メディアは、アント・ファイナンシャルの元副社長兼主任データサイエンティストである斉元氏が復...

...

200語あれば本一冊分は読める。GPT-3はすでに小説の要約を書くことができる

[[425896]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

...

人工知能の時代、どう生き残るのか?

[[355352]] 1 この時代、誰もがまだ新人ですが、世界が3つの部分に分かれていることはすで...

AIOps 実装をスムーズに開始するための 3 つのヒント

[[386134]]企業は、激しい市場競争に直面して、ビジネスと IT の間にスムーズな「リンク」を...

...

...