強力な視覚 AI でもこれらの写真を正確に識別できないのはなぜでしょうか?

強力な視覚 AI でもこれらの写真を正確に識別できないのはなぜでしょうか?

▲ テーブルの上にいるのはマンホールの蓋でしょうか、それともトンボでしょうか?(写真提供:ダン・ヘンドリックス)

▲ 写真はグリーンイグアナでしょうか、それともリスでしょうか?(写真提供:ダン・ヘンドリックス)

▲これは一輪車でしょうか、それとも道路を横断するワニでしょうか?(写真提供:ダン・ヘンドリックス)

人間にとって、答えは明白です。しかし、世界最強の画像認識人工知能でも、上記の問題は解決できません。

これは、各写真が慎重に選択され、画像認識技術を「騙す」ように特別に設計されているためです。これらの写真は、カリフォルニア大学バークレー校、ワシントン大学、シカゴ大学の研究者らが収集した7,000枚の写真の専門データセットから集められたものである。

「現在の(機械学習)モデルは完璧ではない」と、カリフォルニア大学バークレー校のコンピューターサイエンスの博士課程の学生で、論文の著者でもあるダン・ヘンドリックス氏は言う。「人工データを使ってモデルを改善しようとする研究は数多くあるが、こうしたモデルは、(実際の写真から得た)特定の実データに直面すると、深刻かつ一貫して非常に大きな誤りを犯すことが多いことがわかった。」

この問題の重要性を説明するために、まず画像認識技術の発展を振り返ってみましょう。

画像認識ツールはここ数年で性能が向上し、高速化しました。これは主に、スタンフォード大学によって作成され、規模が拡大し続けているオープン データセットである ImageNet のおかげです。現在、データセットには 1,400 万枚以上の写真が含まれており、それぞれに「木」や「空」などのタグが付けられています。この巨大なデータベースは、人工知能のトレーニング教材の重要なコレクションとなっており、新しい AI システムが画像認識システムをトレーニングするための参照ベンチマークとしても使用できます。例えるなら、幼児が新しい言葉を学ぶための絵本のようなものです。現在、ImageNetを使用してトレーニングされた人工知能は、物体認識精度が最大95%と非常に高い精度を誇り、画像の内容の判別においては人間よりも優れています。

しかし、この最後の 5% の精度ギャップに対処することは大きな課題です。 2017年以降、コンピューターは画像を正確に認識することが比較的苦手になっています。そのため、研究者たちは、コンピューターが特定の画像を解釈できない理由を理解しようとしています。

研究者らは、新しい画像コレクションを使用して、ヤフーが所有する写真共有サイトFlickrでAIソフトウェアを混乱させる可能性のある写真を手動で検索した。次に、ImageNet データセットでトレーニングされた AI モデルでテストを行い、モデルが写真の内容を認識できなかった場合は、ImageNet-A (明らかに、名前は Anti-ImageNet の略) と呼ばれる新しいデータセットに追加されました。これら 7,000 枚の写真を識別する際、AI の精度は急速に 90% から 2% に低下しました。はい、お読みの通り、世界で最も先進的な視覚 AI モデルは、これらの写真の 98% を正しく識別できませんでした。

AI システムがこれらの画像を理解できない理由については、かなり複雑な問題です。

現在の AI トレーニングでは、基本的に大量のデータを「ブラックボックス」に投入します。つまり、最終結果に基づいてのみ精度を判断できます。たとえば、「ブラック ボックス」が木のさまざまな画像を十分に確認すると、新しい写真内の木のオブジェクトを認識し始め、トレーニングが成功したとみなされます (このタイプの反復タスクは機械学習と呼ばれます)。しかし問題は、AIが木を識別するためにどのような指標に頼っているのかが分からないことです。形でしょうか?色でしょうか?背景でしょうか?質感でしょうか?それとも、木には人間が気付いたことのない統一された核となる幾何学的パターンがあるのでしょうか?科学者は今のところこの疑問に答えることができません。

つまり、AI の能力の判断は、推論プロセスではなく結果によって行われます。これは、AI に予期せぬ偏りが発見される可能性があり、それが自動運転車や刑事司法などの分野における AI システムの実用化に影響を及ぼす可能性があることを意味します。とりわけ、これは画像認識システムが真にインテリジェントなものではなく、むしろ強力なマッチング ツールであることを意味します。

ImageNet-A データセットは、まさに AI を「騙す」ために構築され、これらの画像がシステムが正しい答えを見つけるのを妨げる理由を結論付けています。たとえば、AI がリスの写真をアシカと間違えると、AI の深い知性と推論能力の欠如が直接露呈します。システムは、識別のために、物体の相対的な大きさや形状ではなく、動物の質感のみに依存する場合があります。 「物体の形状の正しい判断を必要とする写真は、AIモデルを騙す可能性が最も高いようです」とヘンドリックス氏は語った。

研究者たちは、ImageNet-A を使用して、視覚 AI における 7,000 個の盲点を発見することに成功しました。しかし、これは、これらの画像を使用して、AI モデルのこの大きな問題を修正するための新しいトレーニング セットを構築できることを意味するのでしょうか。答えはおそらく「いいえ」です。 「現実世界には膨大な多様性と複雑さがあるため、これらの画像でトレーニングしても、モデルが視覚入力情報の全範囲を本当に確実に管理する方法を学習できない可能性があります」とヘンドリックス氏は言います。「たとえば、1兆枚の画像を収集してラベル付けすれば、モデルの盲点の一部に対処するのに十分かもしれませんが、新しいシーンが現れたり、環境が変化したりすると、以前は修正されていた盲点が再び露呈する可能性があります。」

言い換えれば、機械学習データセットに写真を追加するだけでは、AI モデルのロジックの根本的な欠陥は解決されません。結局のところ、コンピューターがこれまで見たことのない画像が必ず存在するのです。では、研究者はこの最後の 5% の精度ギャップにどのように対処するのでしょうか。ヘンドリックス氏は、より洗練された AI システムを作成するには、現代の機械学習の範囲外で新しい方法を開発する必要があると説明しています。そして、この目標を達成するまで、人間はまだ小さな優越感を保つことができます。現時点では、AI はまだいくつかの面で人間に匹敵することができません。

<<:  Face-api.jsフレームワークに基づいて、顔認識はフロントエンドで完了します

>>:  Github で 12000 以上のスターを獲得した機械学習のチュートリアル。理論、コード、デモが含まれています。

ブログ    
ブログ    
ブログ    

推薦する

AIカンファレンスは数多くあるが、私たちは違う

[51CTO.com からのオリジナル記事] テクノロジーが国の基盤であるならば、人工知能は将来の技...

...

1 つのバグが原因で 200 億ドルの損失が発生しました。ビジネス異常検出システムを構築するにはどうすればよいでしょうか?

【51CTO.comオリジナル記事】 1. AI ビジネス異常検出システムが必要な理由企業は、業務...

推奨される自動化およびオーケストレーションツール10選

自動化およびオーケストレーション ネットワーク ツールは、人間のオペレーターよりも高速かつ正確にタス...

9 つのディープラーニング アルゴリズム、ご存知ですか?

[[439436]] 1フェーズまたは2フェーズのアルゴリズム2 段階アルゴリズムには、候補ボック...

人間は形を見るが、AIは質感を見る:コンピュータービジョン分類の失敗についての議論

[[270985]]研究者たちは、ディープラーニングの視覚アルゴリズムが、主に形状ではなくテクスチャ...

李開復氏:反復労働の代替として、農村地域はAIロボットの着陸に最適な場所

人工知能技術は農業にどのような力を与えるのでしょうか?将来、農業に変化をもたらす最も重要な技術は何で...

冬季オリンピックは人工知能産業の導入を加速し、デジタル経済の徹底的な発展を推進するだろう

人工知能は、この冬季オリンピックに知能の要素を加え、競技の効率とレベルを向上させ、テクノロジーに満ち...

近い将来、人工知能は多くの人々の仕事を置き換えることになるだろう

清華大学金融学科教授の李道奥氏は、ハーバード大学で経済学の博士号を取得。スタンフォード大学フーバー研...

...

AutoAgentsは、あらゆるシナリオで独自のAIエージェントチームを作成するためにここにあります

最近、GitHubは新しいAIエージェントプロジェクト「AutoAgents」を立ち上げました。この...

2021年9月のドローン業界の最新動向を3分で振り返る

現在、人工知能や5Gなどの技術の助けを借りて、我が国のドローン開発は急速な成長の軌道に乗っています。...

ルーティングプロトコルアルゴリズム

ルーティング プロトコルの適用は、多くの大規模ネットワークで重要な役割を果たします。誰もがこの知識を...

シリコンバレーのエンジニアの間で大人気だったこの技術共有セッションで、ディディはどんなことを話したのでしょうか?

11月19日、滴滴出行は米国の新研究オフィスで地元の科学研究者向けの技術サロンを開催した。 Did...

RELX: 回答者の95%がAI人材の採用は課題であると考えている

海外メディアは、情報分析プロバイダーRELXの新しいレポートによると、回答者の95%が人工知能の人材...