人工知能が私たちの生活に大きな利便性をもたらすことができるのは、その背後に多くの機能があるからです。その中でも、データのラベリングは欠かせないものなのです! では、データラベリングとは一体何でしょうか? データラベリングはなぜ人工知能において重要な役割を果たすのでしょうか? 今日、Daxuejun がデータラベリングの謎を解き明かします。
データのラベル付けとは、簡単に言えば、テキスト、音声、画像、ビデオなどにマークを付け、アルゴリズムがこれらのラベルを理解し、学習を続け、最終的にインテリジェントな結果を達成できるようにすることです。 データラベリングを初めて学ぶ人にとって、上記の説明は少しわかりにくく、難解に感じるかもしれません。データラベリングをよりよく理解していただくために、次のような例え話をしました。 初期の人工知能ソフトウェアは、何も知らない新生児に例えることができます。そのため、赤ちゃんに周囲のものを認識できるように教え、これは鼻で呼吸に使うもの、これは口で話したり食べたりするのに使うものなどを伝える必要があります。人工知能についても同じことが言えます。機械に鼻と口の写真を与え、写真の中の鼻と口を指摘する必要があります。すると、機械は写真の中の鼻と口の特徴を学習し、ラベルを付けることで、それらを認識できるようになります。 それでも赤ちゃんを比較対象として使うのが複雑だと思うなら、もう一つ現実の例を挙げてみましょう。 退勤時の出勤記録用の指紋打刻機は誰もが知っていると思いますが、人工知能の原理も同様です。タイムレコーダーを使用する際は、まず従業員の指紋を入力し、次に指紋に対応する従業員の名前または番号を設定します。機械がそれを確認した後は、従業員は指紋を入力するだけでよく、機械は将来それを認識できるようになります。これは人工知能の最も単純な原理です。まず情報を入力し、次に機械がその情報を認識し、それを出力します。 もちろん、実際のデータラベリングはほとんどの場合、指紋入力よりもはるかに複雑ですが、基本的には一般の人が理解して習得できるレベルを超えることはありません。ただし、一部のデータラベリング作業にはトレーニングも必要です。これは、さまざまなシーンや照明によってさまざまな物の見え方が変わるため、人工知能はさまざまな種類や状態の物の写真を見たことがある必要があるためです。そのためには、さまざまなシーンでの物の写真という大量の基礎データが必要です。 データアノテーションの役割は、人工知能に提供される大量の画像からさまざまなシーン内の対象オブジェクトを見つけ、それを人工知能が認知を練習するためのトレーニングデータとして使用することです。 近年、中国政府は人工知能の技術進歩と産業発展を非常に重視しており、人工知能は今や国家戦略となっている。全国人民代表大会常務委員会は、立法理論の研究を強化し、人工知能、ブロックチェーン、遺伝子編集などの新技術・新分野に関連する法的問題の研究に重点を置く必要があると述べた。 データラベリング業界では、「知能と同じくらい人工知能も存在する」という有名な格言があります。人工知能産業が急速に発展するにつれ、「人工知能の先生」として機能するデータラベラーという新しい職業の需要と人材の数は確実に増加するでしょう。 |
>>: 人工知能と機械学習はエンタープライズアーキテクチャの一部となっている
この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...
高速鉄道網がますます充実するにつれ、列車は人々が長距離を移動する際に好まれる交通手段となってきました...
講演者紹介:王東:北京大学大学院 CreditEase テクノロジーセンター AI ミドルプラットフ...
世界中の政府は、AI技術革命に直面しても既存の法律、規制、枠組みが引き続き有効であることを保証し、新...
[[188605]] Numpy は Python 科学計算のコアライブラリの 1 つであり、主に多...
チップを作る上で最も重要な部分は何ですか? より高度な製造プロセスを使用してトランジスタ密度と計算能...
Google は、ジャーナリストの記事作成を「支援」すると主張し、新しい人工知能ツール Genesi...
ArcSoft ビジュアルオープンプラットフォームであるArcFace 3.0の発売以来、アルゴリ...
TensorFlow 2.4 が利用可能になりました!このリリースには、新しい機能、パフォーマンス...