一枚の紙で AI を騙せる。これが OpenAI の最も先進的な視覚モデルでしょうか?

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。

今年初め、OpenAI は最新の AI ビジョンモデル CLIP をリリースしました。

まだ印象に残っている方も多いと思いますが、CLIP は膨大なデータセットで学習した結果、画像とテキストの認識や融合において驚くべき表現力を発揮しました。

たとえば、「ショックを受けた」というテキストを入力すると、AI は「見つめている」という主要な特徴を通じてそれを正確に提示し、テキスト、顔、ロゴなどの他のテキスト情報に基づいて新しい画像にマージします。

人間にとっては、キーワード理解を通じて新しいイメージを説明することは難しくないかもしれませんが、AIにとっては、テキスト認識や画像認識など、非常に高い視覚認識・理解能力が必要です。したがって、CLIP モデルは、既存のコンピュータービジョン研究の最高レベルを表していると言えます。

しかし、画像とテキストの両方の認識機能を備えたこの AI は、「紙」の前では失敗しました。

どうしたの？

AI に騙され、「Apple」が「iPod」に

最近、OpenAIの研究チームがテストを実施し、CLIPは「不快な画像」によって簡単に誤解される可能性があることを発見しました。

テストは次のようなものでした。研究者は CLIP に次の画像 (左) を入力しました。

AIはそれがリンゴであると認識しただけでなく、その品種である「グラニースミス」も表示しました。

しかし、研究者がリンゴの上に「iPod」と書かれた紙を置くと、AIは本当に誤認しました。右の写真に示すように、そのiPod認識率は99.7％に達しました。

研究チームはこのタイプの攻撃を「プリント攻撃」と呼んでいる。彼らは公式ブログにこう書いている。「モデルの強力なテキスト読み取り能力を活用することで、手書きのテキストの写真でもモデルを騙すことができる。『敵対的パッチ』と同様に、この攻撃はワイルドなシナリオでも効果的だ」

ご覧のとおり、この印刷攻撃は実装が簡単で、ペンと紙のみが必要であり、大きな影響を与えます。別のケースを見てみましょう。

左の写真では、AIがプードルの識別に成功しました（認識率39.3％）。

しかし、右の写真のプードルに「$$$」の文字を複数追加したところ、AIはそれを貯金箱として認識しました（認識率52.5％）。

この攻撃が暗黙的である理由について、研究者らは、その鍵は CLIP のマルチモーダルニューロンにあると説明している。このニューロンは、テキスト、シンボル、概念の形で提示された同じ概念に反応することができる。

しかし、このマルチモーダルニューロンは諸刃の剣です。一方では、画像やテキストを高度に制御できます。他方では、テキストや画像全体にニューロンが分散しているため、AI への攻撃も容易になります。

「マルチモーダルニューロン」が根本的な原因

では、CLIP のマルチモーダルニューロンはどのようなものなのでしょうか?

以前、OpenAI の研究者は「人工ニューラルネットワークにおけるマルチモーダルニューロン」という新しい論文を発表し、CLIP を有効にしてそのパフォーマンスを観察する方法を説明しました。

OpenAI は、モデルの活性化を理解するために、特徴の視覚化 (入力に対して勾配ベースの最適化を実行してニューロンの活性化を最大化する) とデータセットの例 (データセット内でニューロンの活性化が最大になる画像の分布を観察する) という 2 つのツールを使用します。

OpenAI は、これらの単純な方法を使用して、CLIP RN50x4 (EfficientNet スケーリングルールを使用して 4 倍にスケールアップされた ResNet-50) のほとんどのニューロンを説明できることを発見しました。これらのニューロンは「多面体ニューロン」の極端な例のように見えます。つまり、より高い抽象レベルでのみさまざまなユースケースに応答します。

さらに、物体の画像だけでなく、スケッチ、漫画、関連するテキストにも反応します。例えば：

CLIP の場合、スパイダーマンの画像を認識するため、ネットワーク内にはスパイダーマンの実際の画像、漫画本の画像、さらに「スパイダー」という単語に反応できる特定の「スパイダーマン」ニューロンがあります。

OpenAI チームは、AI システムも人間と同じようにこの知識を内面化できる可能性があることを示しました。 CLIP モデルは、将来 AI がより複雑な視覚システムを形成し、より複雑なターゲットを識別することを意味します。しかし、これはまだ初期段階です。今では、誰かが「iPod」という言葉が書かれたメモを Apple に貼り付けても、CLIP のようなモデルではそれを正確に識別することはできません。

この場合、CLIP は貯金箱の画像だけでなく、一連のドル記号にも反応しました。上記の例のように、チェーンソーの上に「$$」という文字列を重ねると、CLIP にそれを貯金箱として認識させることができます。

注目すべきは、CLIP のマルチモーダルニューロンの相関バイアスは主にインターネットから取得したデータから学習されたことです。研究者らは、このモデルはインターネットデータの厳選されたサブセットで訓練されたが、それでも制御されていない関連性の多くを学習したと述べた。これらの関連性の多くは良性ですが、悪性のものもあります。

たとえば、テロリズムは「中東」ニューロンと関連付けられ、ラテンアメリカは「移民」ニューロンと関連付けられます。さらに悪いことに、肌の色が黒い人やゴリラに関連付けられているニューロンが 1 つあります (これも米国では人種差別の原因となります)。

これらの偏見や有害な関連付けは、微調整設定とゼロショット設定の両方でシステム内に残る可能性があり、展開中に目に見える形とほとんど目に見えない形の両方で現れます。多くの偏った行動は事前に予測することが難しいため、その測定と修正が困難になります。

商用製品には導入されていない

マシンビジョンモデルは、コンピュータを使用して人間の視覚機能を実現し、コンピュータが客観的な世界の3次元シーンを認識、識別、理解する能力を持つことを目的としています。自動運転、工業製造、セキュリティ、顔認識など、現実世界での幅広い応用シナリオがあることは想像に難くありません。

いくつかのシナリオでは、特に自動運転の分野では、マシンビジョンモデルの精度に対する要件が非常に高くなります。

例えば、イスラエルのベングリオン・ネゲブ大学と米国のジョージア工科大学の研究者らは以前、テスラの自動運転システムのテストを実施した。彼らは道路脇の看板のビデオに「ハンバーガー攻撃画像」を追加し、滞留時間を0.42秒に設定した。

テスラ車がこの地点まで走行したとき、映像は一瞬しか流れなかったものの、テスラは「信号」を捉え、緊急ブレーキをかけた。このテストは、自動運転の視覚認識システムにはまだ明らかな抜け穴があることを意味している。

さらに、研究者らは、道路上に特定のステッカーを貼るだけで、テスラのオートパイロットソフトウェアを騙して警告なしに車線変更させることができることを明らかにした。

こうした攻撃は、医療から軍事まで、幅広い AI アプリケーションにとって深刻な脅威となります。

しかし、現時点では、この特定の攻撃はまだ制御可能な範囲内であり、OpenAI の研究者は、CLIP ビジョンモデルがまだ商用製品に導入されていないことを強調しています。

<<: Java プログラミングスキル - データ構造とアルゴリズム「バランスバイナリツリー」

>>: 「コーチ」はとても優しくて合格率も高いです！上海に「無人運転訓練」が登場。試してみませんか？

新型コロナウイルスワクチンの製造はAIに頼っているのか？ジョンソン・エンド・ジョンソンとPwCがAIをどのように活用しているかを学ぶ

一枚の紙で AI を騙せる。これが OpenAI の最も先進的な視覚モデルでしょうか?

AI に騙され、「Apple」が「iPod」に

「マルチモーダルニューロン」が根本的な原因

商用製品には導入されていない

新型コロナウイルスワクチンの製造はAIに頼っているのか？ジョンソン・エンド・ジョンソンとPwCがAIをどのように活用しているかを学ぶ

最新レビュー！拡散モデルと画像編集の愛憎関係

人工知能とはいったい何でしょうか?それは人間に取って代わるのでしょうか？ AIのすべてを解説した本

認知マップの科学的インベントリ: グローバルな第3世代AIの「大きな」機会

トレーニングなしでリアルタイムに動的値のアライメントを実現：オープンソースの値アライメント手法OPOは、クローズドソースとオープンソースの両方の大規模モデルで利用可能

自動化された機械学習は AI 研究の次の主流となるでしょうか?データサイエンティストの意見

機械学習は、モノのインターネットの発展に欠かせない未来となるだろう

画像や音声などのソーシャルデータを使用することで、人工知能技術は亡くなった親戚や友人とのコミュニケーションを可能にするかもしれない。

推薦する

人工知能の10大技術分野

研究室から生活まで、人工知能はどこまで進化しているのでしょうか?

今日の企業で人気の AI ユースケース 12 選

人工知能を始めるときに尋ねるべき10の質問

一流大学のAIが一流弁護士に勝つ：契約書のレビューを26秒で完了

第16回（2017年）中国政府ウェブサイトパフォーマンス評価結果発表および経験交流会議が北京で成功裏に開催されました。

PubDef: パブリックモデルを使用した転送攻撃の防御

人工知能が本格的に登場し、企業はその挑戦に挑む準備ができている

チャットAIは、わからないことに遭遇するとオンラインで検索できます。ネットユーザー：グループチャット中にこっそり百度で検索するのと同じです

TensorRT はどのようにしてより高速なアーキテクチャを実現するのでしょうか?

現在、CIOは企業におけるGenAIの応用価値を慎重に検討している。

データとAIの成熟度に到達することがビジネス価値を引き出す鍵