オバマが強制的に「白人化」された後、AIは芸術作品における人種的偏見というタブーを犯した

オバマが強制的に「白人化」された後、AIは芸術作品における人種的偏見というタブーを犯した

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。

どのアートワークが AI によって作成されたかを特定できますか?

最も経験豊富なアーティストであっても、AI アート作品と人間のアート作品を区別できない場合があります。アート・バーゼルでは、来場者の53%が作品はすべて人間であると考えた。

実際、それらはすべて、ラトガース大学の芸術および人工知能研究所のチームによって作成されたニューラル ネットワーク AI から生まれたものです。

AIは古典的な芸術作品の創造的なスタイルと技法を認識し、それらを統合して新しい芸術作品を作成することを学習しました。上記の作品の創作素材は、15世紀から20世紀にかけての1,000人以上の芸術家による80,000点以上の絵画から得られています。これらの絵画には、印象派、キュビズム、初期ルネサンスなど、さまざまなスタイルが含まれています。

AIは、人間に劣らない高速性、効率性、創造力を備えており、アート生成の分野で広く利用されています。しかし、AI作品が増えるにつれて、私たちは「ブラックボックス」と呼ばれる芸術創作プロセスにおけるAIアルゴリズムの偏りがあるのではないかという疑問について考える必要があります。

最近、米国の富士通AI研究所の研究者が新しい論文「美術史の観点から見たジェネレーティブアートバイアス」を発表しました。

彼らは論文の中で、AIは芸術創作の過程における社会倫理の影響を考慮しておらず、明らかな偏見を示していると明確に指摘した。

AIアート制作の背後にある3つの大きな偏見

論文では、研究者らは因果モデルDAGを使用して既存のAIアート制作ツールと作品をテストし、偏りがあるかどうかを調べました。

研究の正確性を確保するため、研究者らは学術論文、オンライン AI プラットフォーム、関連アプリケーションにおける AI モデルを調査し、芸術スタイル (ルネサンス美術、印象派、表現主義、ポスト印象派、ロマン主義)、ジャンル (風景画、肖像画、戦争画、スケッチ、イラスト)、素材 (木版画、彫刻、絵画)、アーティスト (ハント、メアリー・カサット、フィンセント・ファン・ゴッホ、ギュスターヴ・ドレ、ジーノ・セヴェリーニ) を含む複数の種類の AI アート作品を評価対象として選択しました。

あるテストでは、AIが生成したアートツール「アバカス」には、ピエロ・ディ・コジモの絵画「若い男の肖像」を長い髪の若い男性を女性として識別するなど、明らかな性別による偏見があることが分かりました(iii-iv)。

(ii) と (iv) は (i) と (iii) の性別翻訳です。

さらに、一部の AI ツールには人種差別的な偏見が含まれている可能性があります。たとえば、GoArt は、ユーザーが他のアーティストのスタイルで絵を描き直すことができるプラットフォームです。表現主義的な作品で、GoArt はクレメンタイン・ハンターの黒人女性家長の顔を黒から赤に変えました。

しかしながら、デジデリオ・​​ダ・セッティニャーノの白いルネサンス彫刻「ジョヴェネート」は、表現主義的な変容を遂げても、その顔は赤くは変えられていない。

さらに、GoArt に似た AI ツールである Deepart にも、芸術的なスタイルの認識において明らかな欠陥があります。たとえば、下の中央の絵「ミス・メアリー・エリソン」(写実的なスタイル)を変換した左の絵には、表現主義の芸術的特徴は見られません。

右の絵は表現主義の作品、エルンスト・ルートヴィヒ・キルヒナーの「エルンスト」です。

AI による絵画、文章、音楽の作曲など。基本的な原理は、まず大規模なデータセットを通じてトレーニングして関連する知識を学習し、次に AI モデルを使用してトレーニングと出力を完了することです。

研究者たちは、上記の出力における偏りの根本的な原因は、トレーニング データ セットの不均衡にあると考えています。それは主に 2 つの側面で現れます。まず、データ セットの収集は人間の好みによって影響を受けます。例えば、AIアプリケーションPortraitsで使用されたルネッサンス時代の肖像画45,000枚は、ほとんどが白人だったことが判明しました。

2 番目に、データセットのラベル付けに矛盾が生じたり、データセットに注釈を付けるためにラベルを学習するプロセスでモデルに偏りが生じたりする可能性があります。注釈者によって好み、文化、信念が異なり、それが作成するデータ ラベルに反映されることがあります。

最後に、研究者らは、AI研究者や実践者は、検査、設計、適用のプロセスにおいて、社会政治的な文脈要因を十分に考慮する必要があるとも警告した。データセット作成の特定の詳細を誤ってモデル化したり無視したりすることで、AI生成アートは社会的、文化的、政治的な誤解を引き起こしたり、不必要な論争や対立を引き起こしたりする可能性がある。

現在、産業界と学術界の両方において、AIアルゴリズムの潜在的な偏見が人種差別スキャンダルを繰り返し引き起こしているため、幅広い注目を集めています。

オバマは白人化され、AIの人種偏見が論争を巻き起こす

近年、研究における継続的な進歩により、コンピューター ビジョン テクノロジーは飛躍的に発展しました。

したがって、アート生成の分野だけでなく、特に顔画像に関しては、AI はより広範な画像認識と合成においても潜在的なバイアスのリスクを伴います。例えば、今年上半期にはデューク大学が開発したPLUSEアルゴリズムが人種差別的であると非難され、ソーシャルプラットフォーム上で騒動が巻き起こった。

この論争は、PULSEが黒人の元米国大統領バラク・オバマ氏のイメージを白人のものに変更したことから起こった。

PULSE は、低解像度の画像を高解像度の画像に変換する (リアルで存在しない人物を生成する) 新しい超解像度アルゴリズムですが、出力には明確な肌の色の好みが生成されます。

オバマだけではない。ネットユーザーのテストでは、米国の下院議員レキサンドリア・オカシオ・コルテス氏や女優ルーシー・リュー氏らの肌の色もPULSEによって白く変色した。

コルテス

その結果、多くのネットユーザーは、AIには根深い人種的偏見があると信じています。

当時、PULSE の開発者らは、ピクセル化された画像を拡大すると、アルゴリズムが白人の特徴を持つ顔を生成する可能性が高くなることも認めていた。そして、彼は「このバイアスは、StyleGAN がデータセットから受け継いだものである可能性が高い」と述べました。

実際、この問題は機械学習では非常によく見られます。その主な理由は、AI のトレーニングに使用されるデータセットが、人口統計的に主に白人であることが多いためです。データセット内に黒人がまったく含まれていないか、または少ない場合、AI モデルのパフォーマンスに影響し、出力結果が白人になる可能性が高くなります。この事件以外にも、AIは顔認識アルゴリズムにおいて何度も人種論争を引き起こしている。

そうすると、データセットの偏りは必然的にアルゴリズムの偏りにつながります。では、データセットを効果的に改善するにはどうすればよいでしょうか?

データセットのバイアスを回避するにはどうすればよいでしょうか?

AI研究の基礎として、データセットをどのように修正し、補完するかが常に研究者の焦点となってきました。

実際、データセットには、頻繁に論争を引き起こす人種的偏見や性別による偏見に加えて、研究プロセスにおける測定バイアス、排除バイアス、関連バイアスなどの一連の問題もあります。しかし近年、研究者らは、少量のデータにラベルを付けることによってモデルの一般化能力を向上させたり、人間によるラベル付けによって生じる可能性のあるバイアスを軽減したりするなど、データバイアスの問題に対処するための多くの対策も開発してきました。

全体として、データの偏りを防ぐことは継続的なプロセスです。データやモデルに偏りがある場合、それを知ることが難しい場合があり、データセットごとに異なる基準が存在します。ただし、関連する研究者は、偏見を早期に検出して軽減するために、次のような一般的なガイドラインもまとめています。

  • 一般的なユースケースと潜在的な外れ値に注意し、データ サイエンティストとデータ ラベリング チームの多様性を確保します。

  • 測定チームの注釈の正確性と一貫性を確保するために、データ ラベル付けのゴールド スタンダードを作成します。

  • データの偏りが発生する可能性のあるプロジェクトでは、複数パスの注釈を使用します。たとえば、感情分析、コンテンツ モデレーション、意図の識別などです。

  • 敏感なグループに関連するトレーニング データをさらに収集することで、不公平に対処します。

  • Google、IBM、Microsoft などでは、さまざまなデータ タイプにおけるバイアスを分析するためのツールとガイダンスをリリースしています。

<<:  住宅地に顔認識システムを設置する前に、5つの主要なセキュリティの質問に答えてください

>>:  666!ボストンのロボット犬はすでにダンスができる、ネットユーザーは「早く飼いたい」と絶賛

ブログ    

推薦する

疫病との戦いに人工知能とビッグデータが爆発的に役立つでしょうか?

[[315014]]新型コロナウイルス感染症の発生と蔓延は、全国の人々の心を動かしました。社会のあ...

...

ジャック・マーの野望がついに暴露される!たった今、アリの無人ホテルがオープンしました!ウェイターもレジ係もいない…また混乱

[[248958]]今週末、インターネットは再び混乱に陥った。ジャック・マーが2年かけて準備してきた...

GoogleがAIトレーニングを高速化する新手法を提案、GPUのアイドル時間を圧縮して3倍以上高速化

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

シンプルで使いやすいPythonの顔認識アルゴリズムをいくつかまとめます

こんにちは、みんな。今日は、シンプルで使いやすい顔認識アルゴリズムをいくつかまとめます。顔認識はコン...

SASは、IoTイニシアチブにAIを組み込むことで企業が競合他社を飛び越えることができると述べている

SAS の新しいレポート「AIoT – IoT リーダーが困難を脱する方法」によると、組織のモノのイ...

復活したジャンルのトップ10を数えると、必ず気に入るジャンルが見つかる

統計モデルやその他のアルゴリズムに加えて、回帰は機械学習を正常に動作させるための重要な要素です。回帰...

...

ハッカーの天敵! AI はサイバー攻撃の防御にどのように役立つのでしょうか?

最近、ハッカーがサイバー攻撃を仕掛けてデータ漏洩を引き起こしているというニュースをよく耳にすると思い...

PyTorch を軽量化します。このディープラーニング フレームワークは価値があります。 GitHub 6.6k スター

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

Nvidiaの次世代GPUが発表、H100を超える!最初の3nmマルチチップモジュール設計は2024年にデビュー予定

3nmプロセス、H100をはるかに超える性能!つい最近、海外メディアのDigiTimesが、コードネ...

機械学習における正規化とはどういう意味ですか?

[[279210]]正則化はさまざまな記事や資料でよく見られます。たとえば、一般的な目的関数には次...

AIに「子犬」を認識させますか? Facebookは変化を感知できるAIを構築

[[388981]]今まで見たことのない犬種や色であっても、私たちは一目見てその犬を認識することがで...

MySQL などの従来のリレーショナル データベースは弱すぎます。 GPU データベースは将来のトレンドです!

データベース市場でMySQLの地位を揺るがすようなデータベースが登場したのは久しぶりのようです。主要...