ハッカーがトレーニングデータセットを汚染し、AIモデルが「犬を入力して猫を生成」できるようにするNightshadeツールを公開

ハッカーがトレーニングデータセットを汚染し、AIモデルが「犬を入力して猫を生成」できるようにするNightshadeツールを公開

10月25日、AIの大規模モデルトレーニングデータソースの著作権問題は、常に業界にとって頭痛の種となってきました。最近、ハッカーがNightshadeと呼ばれるツールを実演しました。これは、イメージの外観や雰囲気を損なうことなく、イメージをわずかに変更できるものです。AIモデルがトレーニング中にこれらの「汚染された」イメージを使用すると、モデルの生の画像結果が破壊されます。

▲ 画像出典:Arxiv

Nightshadeツールは、具体的にはプロンプトワードから始まる攻撃手法であると報告されています。この手法は、「『プロンプトワードにトリガーワードを追加する』という現在のバックドア攻撃手法よりも単純」であり、モデルのトレーニングと展開プロセスへの介入を必要としないと言われています

Nightshade ツールの機能は主に画像の内容をわずかに変更することです。変更された画像内容が AI モデルのトレーニング データになると、AI モデル全体が完全に破壊される可能性があります。ハッカーは、攻撃の有効性を検証するために、Stability AI の Stable Diffusion V2、SDXL、DeepFloyd を選択しました。

テストでは、AIモデルのヴィンセントグラフモデルを混乱させるには、少量の「毒入りサンプル」のみが必要であることが示されています。ハッカーは、改変された 100 枚未満の「犬の写真」を使用して、SDXL モデルがすでに開発していた「犬」の概念を汚染し、モデルが外部入力プロンプト「犬の写真を生成」を受け取った後、代わりに猫の写真を生成するようにしました

▲ 画像出典:Arxiv

さらに、Nightshade 攻撃は単一のエンティティ「概念」をターゲットにしているわけではありません。ハッカーはいくつかの「犬の写真」のみを使用してモデルの「犬」の概念を破壊しようとしますが、モデル全体の生の画像結果は完全に破壊されます。

▲ 画像出典:Arxiv

IT Homeはまた、ハッカーらが、Nightshadeツールによって「汚染された」写真は、このツールが主にトレーニングデータセットの「特徴空間」に影響を与えるため、識別が難しいと主張していることも発見した

Nightshade はコンテンツの作成者や所有者向けのツールであり、「著作権通知を尊重しない」または「スクレイピング禁止/クロール オプトアウトを故意に回避する」 AI 実践者に対する強力な武器です。

<<:  21 個の新しい ChatGPT アプリ、どれをご存知ですか?

>>: 

ブログ    
ブログ    
ブログ    

推薦する

Google AIのスターがPika: ビデオ生成Lumiereの創設科学者に就任

動画世代が猛スピードで進化する中、ピカは偉大なる将軍を迎える―― Google の研究者である Om...

セキュリティ+ロボット業界の新動向:技術力の向上が急務

人口減少と人件費の高騰が進む中、ロボットは産業構造改革の中核となっている。ロボットが産業のアップグレ...

リーダーシップの大幅刷新後、Google Cloud の断片化と成長の鈍化の責任は誰にあるのでしょうか?

[[250357]]フェイフェイ・リー氏は去り、グーグルAI中国センターのリー・ジア所長も去った。...

ALS の少年がアリ数学コンテストで輝く!ブラックホールを研究するためにMITに独学で入学、指導者はホーキングと非常に似ている

今年のアリババ世界数学コンテストでは、特別優秀賞受賞者が決定しました。 ALSを患う20歳の少年、ル...

Pudu Technology が「2021 年最も革新的な中国のケータリング ブランド トップ 100」に選出されました

最近、ケータリングボスインサイダーが主催する「Upward 2021・第6回中国ケータリングイノベー...

...

...

チャットボットと人工知能は2018年に新たな産業革命をもたらすだろう

チャットボットが大きなトレンドであることは間違いありません。ますます多くの大手ブランドが、アプリのタ...

...

AIを使って内部脅威を特定することの倫理

マイノリティ・リポートのトム・クルーズを覚えていますか? AI は将来のリスクを示唆する従業員の行動...

説明可能なAI: 機械が自らを説明できるようにし、アルゴリズムによって生成されるバイアスを減らす

2018 年 5 月 25 日、一般データ保護規則 (GDPR) が欧州連合全域で発効し、組織による...

戻れる幼少時代!快手が「子供になる」特殊効果をリリース

「子供時代に戻りたい。子供の頃はよく食べて、よく寝て、あまり考えないことが好きだった」。山西省大同市...

顔検出と認識がますます普及しているのはなぜでしょうか?その背後にある技術は何ですか?

過去数年間、顔認識は広く注目を集めており、画像分析の分野で最も有望なアプリケーションの 1 つと考え...

マイクロソフトとパートナーは、AIへのアクセスを制限するデータ砂漠の縮小に取り組んでいる。

Microsoft は、多くの非営利団体のパートナーと協力して、これらのツールが失明や運動障害など...