画像認識AIは敵対的な画像に遭遇すると「盲目」になり、精度が90%低下する

画像認識AIは敵対的な画像に遭遇すると「盲目」になり、精度が90%低下する

[[271243]]

視覚に関して、AIと人間の間にはどれくらいのギャップがあるのでしょうか?カリフォルニア大学バークレー校と他の大学の研究者は、7,500 個の「自然な敵対的サンプル」のデータセットを作成し、多数のマシン ビジョン システムをテストした結果、精度が 90% 低下したことを発見しました。場合によっては、ソフトウェアは画像の 2% ~ 3% しか認識できませんでした。この種の AI が自動運転車に使用された場合、その結果は想像を絶するでしょう。

近年、コンピュータービジョンは大きく進歩しましたが、依然として重大な間違いを犯す可能性があります。間違いは頻繁に起こるため、AI が誤認することが多い「敵対的画像」と呼ばれる画像を研究する研究分野が存在します。これをコンピューターの錯覚と考えてください。木の上に猫がいるのを見ると、AI はリスを見ているのです。

AIは木登りする猫をリスと間違える

これらの画像を研究する必要があります。 AI セキュリティ カメラや自動運転車などの新しいテクノロジーの中核にマシン ビジョン システムを導入すると、コンピューターが人間と同じように世界を見ていると信頼できるようになります。敵対的な画像はそうではないことを証明しています。

敵対的画像は機械学習システムの弱点を悪用する

しかし、この分野では、AI を騙すために特別に設計された画像(Google のアルゴリズムが 3D プリントされたカメを銃と間違えるなど)に注目が集まっていますが、こうした欺瞞的な画像は自然発生的にも発生しています。このタイプの画像は、私たちの視覚システムが意図的に間違いを犯していなくても間違いを犯す可能性があることを示しているため、さらに心配です。

これを実証するために、カリフォルニア大学バークレー校、ワシントン大学、シカゴ大学の研究者チームが 7,500 個の「自然な敵対的サンプル」のデータセットを作成し、それを使って多数のマシン ビジョン システムをテストしたところ、精度が 90% 低下し、ソフトウェアによっては画像の 2% ~ 3% しか認識できないことが判明しました。

「自然な敵対的サンプル」データセットの例をいくつか示します。

AIが「難破船」と認識しているものは、実際には枯れ葉の上を這う虫である

AIはトーチを見る

AIはてんとう虫を見る

AIは日時計を見る

AIが野球選手を観察

これらのデータは、より強力な視覚システムの開発に役立つことが期待されています。

研究者らは論文の中で、このデータはより強力な視覚システムの開発に役立つ可能性があると述べている。研究者らは、画像が、ソフトウェアが見たものを識別するために「色、質感、文脈の手がかりに過度に依存」することから生じる「重大な欠陥」を悪用していると説明した。

例えば、以下の画像では、画像の背景が木目調であるためか、AI は左側の画像を誤って釘と認識しました。右側の画像では、ハチドリの餌箱にしか気づかず、実際にハチドリがいないという事実を見逃しています。

次の 4 枚のトンボの写真では、AI が色と質感を分析し、左から右にスカンク、バナナ、アシカ、手袋であると識別しています。それぞれの画像で、AI がなぜ間違いを犯したのかがわかります。

AI システムがこのような間違いを犯す可能性があるというのは、目新しいことではありません。研究者たちは長年、ディープラーニングを使って作られた視覚システムは「浅薄」で「脆弱」であり、人間とほとんど同じようには世界を理解していないと警告してきた。

これらの AI システムは数万枚のサンプル画像でトレーニングされますが、AI が判断を下すために画像のどの要素を使用するかは正確にはわからないことがよくあります。

ある研究では、アルゴリズムは画像全体を見てその全体的な形状や内容を考慮するのではなく、特定のテクスチャや詳細に焦点を当てていることが示唆されています。このデータセットで提示された結果は、この解釈を支持しているように見えます。たとえば、明るい表面にはっきりとした影が写っている画像は、誤って日時計として識別されます。

AIビジョンシステムは本当に絶望的でしょうか?

しかし、これはこれらのマシンビジョンシステムが破滅することを意味するのでしょうか?全くない。一般的に、これらのシステムが犯す間違いは、排水口の蓋をマンホールと間違えたり、トラックを高級車と間違えたりするなど、軽微なものです。

研究者らは、これらの「自然な敵対的例」はさまざまな視覚システムを騙すことができると述べているが、それはすべての視覚システムを騙せるという意味ではない。多くのマシン ビジョン システムは、医療スキャンで病気を特定するために使用されるものなど、高度に専門化されています。これらのシステムには欠点があり、世界や人間を理解できない可能性もありますが、がんを検出し診断する能力には影響しません。

マシンビジョンシステムは、時には手早くて雑な作業になることもありますが、通常は結果が得られます。このような研究により、機械イメージング研究における盲点やギャップが明らかになります。私たちの次の課題は、これらの盲点を埋めることです。

論文の宛先:

出典: http://arxiv.org/pdf/1907.07174.pdf

コードとデータセット:

https://github.com/hendrycks/natural-adv-examples

<<:  5 分で年配の方に機械学習について説明しましょう。説明するのはとても簡単です!

>>:  レポート予測:Appleは2020年にSiriオペレーティングシステムをリリースする

ブログ    
ブログ    

推薦する

バックトラッキングアルゴリズムの理論的基礎を一緒に復習しましょう。覚えていますか?

[[423516]]バックトラッキング アルゴリズムは、実は非常にわかりにくく、理解するのが困難で...

2018年のソフトウェア開発に関する10の予測、注目のブロックチェーンとAIを含む

[[221321]]ブロックチェーン、NLP、AI 駆動型ツール、機械学習、サーバーレス コンピュー...

ディープラーニングフレームワークの競争: TNN vs. MNN、NCNNは依然として定番

近年、「オープンソース」は開発者コミュニティにおける新たなトレンドとなっています。特にディープラーニ...

...

自然言語処理のためのオープンソースツール12選

[[316192]]独自の NLP アプリケーションで使用できる 12 個のツールを見てみましょう。...

TPU v4 チップの計算能力が新たな高みに到達しました。 Googleが世界最大の機械学習センターを建設

最近、Google の I/O 開発者会議で、Google は魅力的な新しい携帯電話、AR グラス、...

マイクロソフト、AIアシスタントCopilotを搭載したWindows 11のメジャーアップデートをリリース

11月1日(米国時間火曜日)、ソフトウェア大手マイクロソフトは、パソコン用OS「Windows 11...

AIコードツールが人気、複雑な操作が数秒で簡単になり、ネットユーザー:VS Codeを放棄

最近、AIコードエディタCursorが人気になってきました—— GPT-3.5/GPT-4 に接続す...

Apple が MobileViT を提案: モバイル デバイス向けの軽量で低遅延のビジュアル トランスフォーマー

この論文では、Apple の研究者がモバイル デバイス用の軽量な汎用ビジュアル トランスフォーマーで...

人工知能がスマートな警察活動を可能にする

[[257520]]都市化と経済発展の加速に伴い、我が国の社会保障を構成する要素が拡大し、公安機関の...

...

AIの大覚醒:チューリング賞受賞者のベンジオ氏は、AIは意識を持ち、将来の機械学習の核となるのは注意メカニズムであると語る

人工知能は意識を発達させることができるか?これはアメリカのテレビシリーズ「ウエストワールド」で取り上...

ロボットは「赤ちゃんを作る」こともできる:世界初の生きたロボットが生命の新たな繁殖方法を生み出す

[[437620]]彼らは何百もの自由細胞を集めて、「パックマン」の形をした「口」の中に「次世代」を...

機械学習はビジネスシナリオにどのように適用されますか? 3つの実際のビジネスプロジェクト

国府如和の長年にわたる指導過程において、多くの学生が次のような質問をしました。機械学習は実際のビジネ...