AIがAIに勝つ: Googleの研究チームがGPT-4を使ってAI-Guardianのレビューシステムを打ち破る

AIがAIに勝つ: Googleの研究チームがGPT-4を使ってAI-Guardianのレビューシステムを打ち破る

8月2日、Googleの研究チームはOpenAIのGPT-4を使用して他のAIモデルのセキュリティ保護対策を突破する実験を行っていた。同チームは現在、AI-Guardianレビューシステムを突破し、関連する技術的詳細を共有した

IT Homeは問い合わせたところ、AI-Guardianは写真に不適切な内容が含まれているかどうか、また写真自体が他のAIによって変更されているかどうかを検出できるAIレビューシステムであることを知りました。写真に上記の兆候が見られた場合、管理者が来て対処するよう促されます。

Google Deep Mindの研究者であるNicholas Carlini氏は、「LLM支援によるAI-Guardianの開発」と題した論文の中で、GPT-4を使用して「攻撃方法を設計し、攻撃の原則を記述」し、これらのソリューションを使用してAI-Guardianの防御メカニズムを欺くことを検討しました。

▲ 画像出典: Google リサーチ チーム

GPT-4はAI-Guardianを欺くために一連の誤ったスクリプトと説明を送信すると報告されています。論文では、 GPT-4はAI-Guardianに「銃を持っている人の写真」を「無害なリンゴを持っている人の写真」であると思わせることができ、AI-Guardianが関連する画像入力ソースを直接放出できるようになると言及されています。 Googleの研究チームは、GPT-4の助けを借りて、AI-Guardianの防御を「破り」、モデルの精度を98%からわずか8%にまで下げることに成功したと述べた。

関連する技術文書はArXivで公開されています。興味のある方はぜひご覧ください。ただし、AI-Guardianの開発者は、Google研究チームのこの攻撃方法は、AI-Guardianの将来のバージョンでは利用できなくなることも指摘しています。他のモデルも追随することを考えると、Googleの現在の攻撃計画は、将来的に参考程度にしか使えません。

<<:  複雑な課題に対するスマートなソリューション: 自動化の成功への道

>>:  GPTベースの開発者ツール

ブログ    

推薦する

清華大学は、2D拡散モデルを使用して不完全な3Dオブジェクトを補完する3D再構築の新しい方法、O²-Reconを提案しました。

コンピューター ビジョンでは、オブジェクト レベルの 3D サーフェス再構築テクノロジは多くの課題に...

ARにおける人工知能

今年3月、上海市経済情報化委員会は、同市の人工知能の革新と発展を支援する2018年特別プロジェクトの...

人工知能(AI)とスポーツスタジアムの融合

新型コロナウイルスCOVID-19の影響は今も続いており、世界中の多くのスポーツスタジアムが麻痺状態...

...

OpenAIの謎の新モデルQ*が暴露された。取締役会に警告するにはあまりにも強力だったため、ウルトラマン解任の導火線になるかもしれない

OpenAI 宮殿ドラマが終わったばかりですが、すぐにまた別の騒動が勃発しました。ロイター通信は、ア...

ドローン技術を都市計画に活用

ドローン技術は、都市計画がスマートシティを形成する方法を再定義するでしょう。都市計画は変化しており、...

将来、音声認識はどのような商業シナリオに適用される可能性がありますか?

Companies and Markets の評価レポートでは、世界の音声認識市場は今後さらに多様...

JetBrains が 2023 年開発者レポートをリリースしました。 35年来の危機は存在するのか?最高のプログラミング言語はどれですか?

開発者の間で大きな影響力を持つ JetBrains が、毎年恒例の「開発者エコシステムの現状」レポー...

...

...

5000億の大台を突破?多くの国で人工知能が急速に進歩している

近年、モノのインターネット、クラウドコンピューティング、人工知能などの新世代技術が急速に発展し、特に...

ソフトウェアエンジニアの年収は930万ドル! Googleの給与が明らかに:15億6千万ドルは史上最高額

シリコンバレーの大企業の中でも、グーグルの従業員はテクノロジー業界で最も高給を得ている社員の一部であ...

飲食店がセルフオーダー機や配達ロボットを導入すれば「無人飲食店」になるのでしょうか?

ケータリング業界における人件費は、事業者を悩ませる大きな問題です。レストランなどのケータリングのシナ...

会員数3億人、商品数4億点、大規模電子商取引の商品推奨にディープラーニングを応用!

電子商取引業界では、ユーザーに対する商品の推奨は常に非常にホットで重要なトピックです。比較的成熟した...