AIオープンクラス | データのラベル付けについてはあまりご存じないのではないでしょうか?

AIオープンクラス | データのラベル付けについてはあまりご存じないのではないでしょうか?

人工知能の分野が日々急速な発展と進歩を遂げていることは疑いの余地がありません。

携帯電話の電源を入れ、美容アプリのさまざまな AI フィルターを有効にすると、私たちが目にするのは面白いアバターやかわいい表情ですが、アプリが「見る」のは私たちの顔にある何百ものポイントです。

[[285286]]

私たちは長い間、さまざまな AI フィルターに慣れてきましたが、これらのアプリがどのようにして目や鼻がどこにあるかを認識するかについてはほとんど考えていません。

実際、これらすべては、AI 時代の最もかわいらしいけれども、最も見落とされがちな人々のグループのおかげです。彼らは、人工知能の「教師」と呼ばれるデータ ラベラーです。

人工知能の背後にある人工知能

朝8時30分、Xiao Xinは「データラベル割り当てタスクグループ」というQQグループを開き、朝の仕事を始めました。

[[285287]]

グループのオーナーは、今日ラベルを付ける必要のあるビデオと写真をすでにグループに送信していました。Xiaoxin には 3 時間のビデオ録画が割り当てられました。

これは、ある歯科大学の先生が講義中に録画したビデオです。ビデオの内容は主に口腔内の虫歯の紹介と分類に焦点を当てています。Xiaoxinの主な仕事は、ビデオ内の黒い虫歯を見つけ、マウスを使用して虫歯の周りにデジタルの「境界線」を描いてマークすることです。

シャオシンは午前中、ビデオが終わるまで同じ動作を何百回も繰り返さなければなりません。最後に、シャオシンはマークされた新しいビデオをグループにフィードバックして、午前中の作業を終了します。

シャオシンさんは医療専門家ではないので、虫歯の跡が残っている部分の機能が何なのかよく分かりません。しかし、目に見えないところで、小欣は人工知能医療システムの「先生」になっています。大量のデータの反復処理を通じて、AIはどの歯が虫歯であるか、また虫歯の進行度を正確に識別することができます。

シャオシンは「データラベリング」という職業について聞いたことがないかもしれませんが、日々実践的な行動でデータラベラーとしての責任を果たし、機械が大量のデータを通じて学習し、無事に「卒業」できるようにしています。

大波に襲われる一般人

過去2年間で、中国ではデータラベリング企業が大規模に出現し始めており、これは中国の人工知能開発の初期段階で必要とされる大量のデータと密接に関係している。

テクノロジー企業が必要とするデータは膨大であるため、データラベリング企業はラベリング作業の大部分を下請けすることになる。データの波はAIをよりスマートにすると同時に、多くの雇用機会をもたらす。

貴陽市の中心部から50キロ離れた白鳥河デジタルタウンには、500人規模の「データファクトリー」がある。500人のラベル付け作業員のうち、ほぼ半数が近隣の貧困支援専門学校の学生だ。

彼らは月に1,500元を稼ぐことができ、経済的に自立し、家族の収入を補うのに十分であると理解されています。レストランでの料理の提供やテイクアウトの配達などのパートタイムの仕事と比較すると、データラベリングは比較的簡単でまともです。

[[285288]]

貧困緩和専門学校の学生がデータラベリング作業を実施

押し寄せるデータの波は資本と技術を巻き込み、無数の夢と野望を背負って突き進む。資本と野望のもと、無数の一般人は当面はこれらの変化を理解していないものの、変化から利便性と利益を得ることができる。

我々が知らない物語

ほとんどの生徒にとって、「データラベリング」は馴染みのない専門用語であり、校長先生が全員にこの知識を話すのは初めてのことでした。実際、データ ラベリングの分類、データ ラベリング業界の発展と影響、データ ラベリングが完全に人間に依存しているかどうかなど、データ ラベリングをめぐる興味深いトピックは数多くあります...

データのラベリングについて、より深く、より全面的に理解してもらうために、AI大学の第26回科学技術夜間自習会では、iFLYTEKのAIリソース部門の音声データディレクターであるLiu Dan氏を特別に招待し、 12月12日19時にAI大学のライブ放送室に来てもらい、データのラベリングの背景にあるストーリーについて学生たちとチャットしました。

【授業内容】

語られざる物語 - データ注釈

【コース講師】

Liu Dan、iFlytek、AI リソース部門、音声データ スーパーバイザー

【講習時間】

2019年12月12日 19:00(今週木曜日)

【コースリンク】

リンクhttp://www.aidaxue.com/live?id=29&ch=ctoをクリックしてライブコースルームに入室してください。

<<:  Tan Mingzhou: テクノロジーイノベーター - あまり知られていない道│LeaTech Global CTO Leadership Summit レビュー

>>:  人工知能市場の需要と応用

ブログ    
ブログ    
ブログ    

推薦する

深層強化学習: 知能機械のトッププレイヤー

ラボガイドロボットがゲームの分野でもスーパーマスターになれると想像したことがありますか?あなたの夢を...

AI体温測定:仕事再開の波の中で構築された最初の防疫「障壁」

[51CTO.comより] 業務を再開する企業が相次ぐ中、新型コロナウイルス肺炎の流行は「輸入症例...

...

中国科学院は、プログラマーがバグを見つけるのを助けるために大きなモデルを使用し、102の論文を分析し、これらの解決策をまとめた。

中国科学院は「バグ発見」に着手し、一気に N 個の解決策をまとめました。魔法の武器は大きなモデルです...

...

DeepSpeechを使用してアプリ内で音声をテキストに変換する

アプリでの音声認識は単なる楽しい機能ではなく、重要なアクセシビリティ機能です。コンピュータの主な機能...

大規模言語モデルの詳細な分析: トレーニングから大規模モデルの展開まで

導入データサイエンスの分野が進歩するにつれ、複雑な自然言語を処理および生成できる高度な AI システ...

顔認識システムに関するよくある質問8つ

今日のスマートフォンやノートパソコンに搭載されている顔認識機能のおかげで、顔認識テクノロジーの概念は...

TCPとUDPの違いと、フロー制御、輻輳制御、高速再送、高速回復アルゴリズムの詳細な説明

[[413351]] UDPとTCPの違い前回の記事では、TCP の接続を確立するための 3 ウェイ...

...

...

Microsoft TensorFlow-DirectML 正式版リリース: WSL での GPU による機械学習の高速化

IT Homeは9月12日、Microsoftが最近、Windows Subsystem for L...

...

自動化と人工知能の違いをご存知ですか?

自動化の一般的な定義は、機械化と電動化の最高レベルであり、つまり、機械、設備、機器はすべて、指定され...

ロボットが宇宙飛行士に取って代わるでしょうか?この会社は『アバター』を宇宙に送りたい

地球上の仕事でロボットが人間に取って代わり、今ではロボットが宇宙に行って仕事をこなすようになっている...