10月25日、AIの大規模モデルトレーニングデータソースの著作権問題は、常に業界にとって頭痛の種となってきました。最近、ハッカーがNightshadeと呼ばれるツールを実演しました。これは、イメージの外観や雰囲気を損なうことなく、イメージをわずかに変更できるものです。AIモデルがトレーニング中にこれらの「汚染された」イメージを使用すると、モデルの生の画像結果が破壊されます。 ▲ 画像出典:Arxiv Nightshadeツールは、具体的にはプロンプトワードから始まる攻撃手法であると報告されています。この手法は、「『プロンプトワードにトリガーワードを追加する』という現在のバックドア攻撃手法よりも単純」であり、モデルのトレーニングと展開プロセスへの介入を必要としないと言われています。 Nightshade ツールの機能は主に画像の内容をわずかに変更することです。変更された画像内容が AI モデルのトレーニング データになると、AI モデル全体が完全に破壊される可能性があります。ハッカーは、攻撃の有効性を検証するために、Stability AI の Stable Diffusion V2、SDXL、DeepFloyd を選択しました。 テストでは、AIモデルのヴィンセントグラフモデルを混乱させるには、少量の「毒入りサンプル」のみが必要であることが示されています。ハッカーは、改変された 100 枚未満の「犬の写真」を使用して、SDXL モデルがすでに開発していた「犬」の概念を汚染し、モデルが外部入力プロンプト「犬の写真を生成」を受け取った後、代わりに猫の写真を生成するようにしました。 ▲ 画像出典:Arxiv さらに、Nightshade 攻撃は単一のエンティティ「概念」をターゲットにしているわけではありません。ハッカーはいくつかの「犬の写真」のみを使用してモデルの「犬」の概念を破壊しようとしますが、モデル全体の生の画像結果は完全に破壊されます。 ▲ 画像出典:Arxiv IT Homeはまた、ハッカーらが、Nightshadeツールによって「汚染された」写真は、このツールが主にトレーニングデータセットの「特徴空間」に影響を与えるため、識別が難しいと主張していることも発見した。
|
<<: 21 個の新しい ChatGPT アプリ、どれをご存知ですか?
業界の需要が変化するにつれて、5G、AI、ビッグデータなどの新しいテクノロジーが登場し、従来の業界に...
1年前の今日、ChatGPTが誕生し、人工知能の新しい時代が到来したように思えました。 ChatG...
企業は、迅速かつ効率的に適応し、生産性、快適性、持続可能性を向上させるスマート オフィス テクノロジ...
従来の機械学習の分野でも、今日注目されているディープラーニングの分野でも、明確なラベルや結果を持つト...
<!-- /* Style Definitions */ p.MsoNormal, li.M...
翻訳者|朱 仙中レビュー | Chonglou導入近年、大規模言語モデルの開発は飛躍的に進歩しました...
[[345679]]序文今回は、バックトラッキング アルゴリズムについて確認します。この問題解決の...
マーケティング担当者は、ブランド認知度を高め、顧客にとって適切なターゲット ユーザーを見つけるために...
量子力学の基本方程式の一つとして、シュレーディンガー方程式は常に幅広い注目を集めてきました。昨年、D...
目視で観察すると、コメント欄は中国文学の巨匠の密度が比較的高く、侮辱やおどけのレベルも比較的高く、A...
IDCによると、世界の企業は2023年に160億ドル(ITホーム注:現在は約1169.6億人民元)を...