10億のパラメータを持つAIモデルSE​​ERは、すべての人を平等に扱い、富裕層と世界に貢献します。

10億のパラメータを持つAIモデルSE​​ERは、すべての人を平等に扱い、富裕層と世界に貢献します。

厳選されラベル付けされたデータ セットを使用して AI システムをトレーニングすると、オブジェクト認識などのタスクに優れた特殊な AI モデルが生成されます。

しかし、このアプローチだけに頼ることには実際的な限界があり、そのうちの 1 つは特に重要だと考えています。それは、このようなシステムでは、日常生活では一般的であるが、AI システムのトレーニングに使用されるデータでは十分に表現されていないオブジェクトを認識することが難しい場合があるということです。

[[397527]]

特に、どの画像をトレーニングするか、どのようにラベルを付けるかについての選択によって、意図せずバイアスが導入される可能性があります。

たとえば、主に米国とヨーロッパの住宅の画像でトレーニングされた物体認識システムは、ネパールの住宅内の物体を認識するように求められた場合、それほど良いパフォーマンスを発揮しない可能性があります。

これが、私たちが開発した新しい高性能コンピューター ビジョン システムである SEER に期待を寄せている理由の 1 つです。

SEER は自己教師学習を活用することで、研究者が各オブジェクトを選択してラベル付けする必要なく、あらゆるデジタル画像のコレクションから学習できます。

予備評価では、数十億人の生活に存在しながらも、AI システムのトレーニングに使用される従来の画像データセットではあまり表現されていないオブジェクトの識別において、SEER は従来のコンピューター ビジョン システムよりも優れていることが示されています。

私たちは、SEER を使用して、これまで最も恩恵を受けてきたグループだけでなく、すべての人にとって AI がより良く機能するようにしたいと考えています。

人工知能をテストするために世界中から写真を集める

私たちは、2019 年にコンピューター ビジョン システムのバイアスに関する調査で Dollar Street Dataset を使用して SEER をテストしました。 SEER によって提供される結果は刺激的であり、自己教師あり学習により人工知能は世界中の人々にさらに良いサービスを提供できるようになります。

[[397528]]

Dollar Street データセット - 世界中のさまざまな国や地域のさまざまな収入を持つ世帯

例えば、ネパールの家族の写真では、SEERの識別結果は、調味料、薬、ボウル、果物、社交的な飲酒です。

教師あり学習モデルは、洗浄器具、台所の流し、陳列品、ボウル、果物、調理器具、鍋を特定した。

つまり、SEER は画像内の物体を正しく識別しましたが、従来のシステムでは識別できませんでした。

[[397529]]

画像出典: Facebook AI ブログ

次の写真は中国人の家族の写真です。SEER識別の結果は、調理器具、ストーブ、鍋、道具です。

教師あり学習モデルは、玄関の鍵、電源スイッチ、調理器具、壁掛け時計、ストーブを特定しました。

つまり、SEER は炉を正しく識別しましたが、従来のトレーニング システムでは識別できませんでした。

[[397530]]

画像出典: Facebook AI ブログ

下の写真はインドの小さな通りです。 SEERの認識結果は、自転車、街の風景、ゴミ、野菜畑です

教師あり学習モデルの認識結果は、果樹、家、自転車、ペット、屋根です。

[[397531]]

画像出典: Facebook AI ブログ

すべての人のためのAI

自己教師学習は、ラベル付けされたトレーニング データとして使用できる大量のデジタル化されたテキストがない言語や方言でのパフォーマンスの向上に大きな可能性を示しています。

上記の例では、SEER はオブジェクト認識において優れた性能を発揮しています。これは、モデルがデータキュレーションなしでランダムなインターネット画像でトレーニングされたことを考えると、もう 1 つの興味深い結果です。

これは、SEER のトレーニングに使用される自己教師ありアプローチが、富裕層だけでなく世界全体に効果的に役立つ AI システムを構築する取り組みに大きな影響を与える可能性があることを示唆しています。これらの取り組みはまだ始まりに過ぎませんが、私たちが非常に刺激的な進歩の道を歩んでいることは明らかです。

<<:  Truffleを使用してスマートコントラクトをデプロイする方法

>>:  たった2枚の写真でAIは完全なモーションプロセスを生成できる

ブログ    
ブログ    

推薦する

微積分の最終試験に希望があります! AIが方程式を解くのを手伝います

最近、Facebook AI は、記号推論を使用して高度な数式を解き、その精度が Mathemati...

...

米国商務省は、生成型人工知能の潜在的なリスクに対処するために、公開AIワーキンググループを設立した。

6月25日、ジーナ・ライモンド米国商務長官は、国立標準技術研究所(NIST)が人工知能(AI)に関...

程偉:スマート交通に投資し、世界クラスのモデル都市を構築する

「滴滴出行がユーザーとドライバーをつなぐ旅行プラットフォームになるだけでなく、人、車、道路、信号、そ...

iQIYI機械学習プラットフォーム構築実践

機械学習プラットフォームを構築する以前、iQiyi にはすでに比較的成熟したディープラーニング プラ...

...

Baidu Brainのインテリジェント会話エンジンが9つのコア機能のリリースで「警笛を鳴らす」

言語は思考と知識を伝達し、人類の文明を推進します。そして会話によって機械はより賢くなり、人間にとって...

人工知能に関する 10 の質問: ますます普及する AI の将来はどこにあるのでしょうか?

近年、人工知能は爆発的な人気と発展を遂げ、その後、最近は人気が衰えています。人工知能は大企業だけが参...

GPT-4 に追いつく!李開復のYi-34Bの新しい結果が発表されました:勝率94.08%はLLaMA2などの主流の大型モデルを超えています

GPT-4に次ぐ、李開復のYi-34B-Chatの最新成果が発表されました——アルパカ認定モデル部門...

SMOTE アルゴリズムを使用せずに、マルチクラスの不均衡なデータをどのように処理できますか?

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...

産業用ロボットを正確に選択するにはどうすればいいですか?これら 9 つのパラメータが教えてくれます。

オートメーション業界のベテランや経験豊富な電気機械エンジニアにとって、適切な「ロボット」を選択するこ...

音声認識におけるCNNの応用

序文音声認識の現在の開発状況をまとめると、DNN、RNN/LSTM、CNN が音声認識における主流の...

脳をシミュレートする NLP、クヌース賞受賞: 文解析のためのニューロン集団計算

[[402907]]先週、Google Research はディープラーニングにおける概念理解に関す...

ついにAI、BI、ビッグデータ、データサイエンスをわかりやすく説明する人が出てきた

01 データデータは、携帯電話に残すデジタルフットプリントから健康記録、買い物履歴、エネルギーなどの...