厳選されラベル付けされたデータ セットを使用して AI システムをトレーニングすると、オブジェクト認識などのタスクに優れた特殊な AI モデルが生成されます。 しかし、このアプローチだけに頼ることには実際的な限界があり、そのうちの 1 つは特に重要だと考えています。それは、このようなシステムでは、日常生活では一般的であるが、AI システムのトレーニングに使用されるデータでは十分に表現されていないオブジェクトを認識することが難しい場合があるということです。 特に、どの画像をトレーニングするか、どのようにラベルを付けるかについての選択によって、意図せずバイアスが導入される可能性があります。 たとえば、主に米国とヨーロッパの住宅の画像でトレーニングされた物体認識システムは、ネパールの住宅内の物体を認識するように求められた場合、それほど良いパフォーマンスを発揮しない可能性があります。 これが、私たちが開発した新しい高性能コンピューター ビジョン システムである SEER に期待を寄せている理由の 1 つです。 SEER は自己教師学習を活用することで、研究者が各オブジェクトを選択してラベル付けする必要なく、あらゆるデジタル画像のコレクションから学習できます。 予備評価では、数十億人の生活に存在しながらも、AI システムのトレーニングに使用される従来の画像データセットではあまり表現されていないオブジェクトの識別において、SEER は従来のコンピューター ビジョン システムよりも優れていることが示されています。 私たちは、SEER を使用して、これまで最も恩恵を受けてきたグループだけでなく、すべての人にとって AI がより良く機能するようにしたいと考えています。 人工知能をテストするために世界中から写真を集める私たちは、2019 年にコンピューター ビジョン システムのバイアスに関する調査で Dollar Street Dataset を使用して SEER をテストしました。 SEER によって提供される結果は刺激的であり、自己教師あり学習により人工知能は世界中の人々にさらに良いサービスを提供できるようになります。 Dollar Street データセット - 世界中のさまざまな国や地域のさまざまな収入を持つ世帯 例えば、ネパールの家族の写真では、SEERの識別結果は、調味料、薬、ボウル、果物、社交的な飲酒です。 教師あり学習モデルは、洗浄器具、台所の流し、陳列品、ボウル、果物、調理器具、鍋を特定した。 つまり、SEER は画像内の物体を正しく識別しましたが、従来のシステムでは識別できませんでした。 画像出典: Facebook AI ブログ 次の写真は中国人の家族の写真です。SEER識別の結果は、調理器具、ストーブ、鍋、道具です。 教師あり学習モデルは、玄関の鍵、電源スイッチ、調理器具、壁掛け時計、ストーブを特定しました。 つまり、SEER は炉を正しく識別しましたが、従来のトレーニング システムでは識別できませんでした。 画像出典: Facebook AI ブログ 下の写真はインドの小さな通りです。 SEERの認識結果は、自転車、街の風景、ゴミ、野菜畑です 教師あり学習モデルの認識結果は、果樹、家、自転車、ペット、屋根です。 画像出典: Facebook AI ブログ すべての人のためのAI自己教師学習は、ラベル付けされたトレーニング データとして使用できる大量のデジタル化されたテキストがない言語や方言でのパフォーマンスの向上に大きな可能性を示しています。 上記の例では、SEER はオブジェクト認識において優れた性能を発揮しています。これは、モデルがデータキュレーションなしでランダムなインターネット画像でトレーニングされたことを考えると、もう 1 つの興味深い結果です。 これは、SEER のトレーニングに使用される自己教師ありアプローチが、富裕層だけでなく世界全体に効果的に役立つ AI システムを構築する取り組みに大きな影響を与える可能性があることを示唆しています。これらの取り組みはまだ始まりに過ぎませんが、私たちが非常に刺激的な進歩の道を歩んでいることは明らかです。 |
<<: Truffleを使用してスマートコントラクトをデプロイする方法
>>: たった2枚の写真でAIは完全なモーションプロセスを生成できる
本日は、シンガポール科学技術研究庁 (A*STAR) と南洋理工大学 (シンガポール) が AAAI...
OpenAI は、人工知能 (AI) の作成と推進を専門とする非営利団体です。そのビジョンは、人間...
顔認識技術の応用を標準化するため、2023年8月8日、中国サイバースペース管理局が起草した「顔認識技...
「未来を今日どのように実現するか。その答えはシミュレーションだ」と、NVIDIAの創業者兼CEOのジ...
OpenAI ChatGPT Plus サブスクリプション支払いには強力な機能があり、高度な「データ...
よく見てください、ここはメカスーツまで多種多様な展示品がある「魔法博物館」です...魔法の鏡、クリス...
2017年、『エコノミスト』誌は、石油ではなくデータが世界で最も価値のある資源になったと宣言しました...
誰もがこのような経験をしたことがあると思います。道路を運転しているとき、携帯電話は位置情報と速度を送...
従来の機械学習の分野でも、今日注目されているディープラーニングの分野でも、明確なラベルや結果を持つト...
機械読解(MRC)は、自然言語処理の分野における最近の研究のホットスポットの 1 つであり、人間の言...