オバマが強制的に「白人化」された後、AIは芸術作品における人種的偏見というタブーを犯した

オバマが強制的に「白人化」された後、AIは芸術作品における人種的偏見というタブーを犯した

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。

どのアートワークが AI によって作成されたかを特定できますか?

最も経験豊富なアーティストであっても、AI アート作品と人間のアート作品を区別できない場合があります。アート・バーゼルでは、来場者の53%が作品はすべて人間であると考えた。

実際、それらはすべて、ラトガース大学の芸術および人工知能研究所のチームによって作成されたニューラル ネットワーク AI から生まれたものです。

AIは古典的な芸術作品の創造的なスタイルと技法を認識し、それらを統合して新しい芸術作品を作成することを学習しました。上記の作品の創作素材は、15世紀から20世紀にかけての1,000人以上の芸術家による80,000点以上の絵画から得られています。これらの絵画には、印象派、キュビズム、初期ルネサンスなど、さまざまなスタイルが含まれています。

AIは、人間に劣らない高速性、効率性、創造力を備えており、アート生成の分野で広く利用されています。しかし、AI作品が増えるにつれて、私たちは「ブラックボックス」と呼ばれる芸術創作プロセスにおけるAIアルゴリズムの偏りがあるのではないかという疑問について考える必要があります。

最近、米国の富士通AI研究所の研究者が新しい論文「美術史の観点から見たジェネレーティブアートバイアス」を発表しました。

彼らは論文の中で、AIは芸術創作の過程における社会倫理の影響を考慮しておらず、明らかな偏見を示していると明確に指摘した。

AIアート制作の背後にある3つの大きな偏見

論文では、研究者らは因果モデルDAGを使用して既存のAIアート制作ツールと作品をテストし、偏りがあるかどうかを調べました。

研究の正確性を確保するため、研究者らは学術論文、オンライン AI プラットフォーム、関連アプリケーションにおける AI モデルを調査し、芸術スタイル (ルネサンス美術、印象派、表現主義、ポスト印象派、ロマン主義)、ジャンル (風景画、肖像画、戦争画、スケッチ、イラスト)、素材 (木版画、彫刻、絵画)、アーティスト (ハント、メアリー・カサット、フィンセント・ファン・ゴッホ、ギュスターヴ・ドレ、ジーノ・セヴェリーニ) を含む複数の種類の AI アート作品を評価対象として選択しました。

あるテストでは、AIが生成したアートツール「アバカス」には、ピエロ・ディ・コジモの絵画「若い男の肖像」を長い髪の若い男性を女性として識別するなど、明らかな性別による偏見があることが分かりました(iii-iv)。

(ii) と (iv) は (i) と (iii) の性別翻訳です。

さらに、一部の AI ツールには人種差別的な偏見が含まれている可能性があります。たとえば、GoArt は、ユーザーが他のアーティストのスタイルで絵を描き直すことができるプラットフォームです。表現主義的な作品で、GoArt はクレメンタイン・ハンターの黒人女性家長の顔を黒から赤に変えました。

しかしながら、デジデリオ・​​ダ・セッティニャーノの白いルネサンス彫刻「ジョヴェネート」は、表現主義的な変容を遂げても、その顔は赤くは変えられていない。

さらに、GoArt に似た AI ツールである Deepart にも、芸術的なスタイルの認識において明らかな欠陥があります。たとえば、下の中央の絵「ミス・メアリー・エリソン」(写実的なスタイル)を変換した左の絵には、表現主義の芸術的特徴は見られません。

右の絵は表現主義の作品、エルンスト・ルートヴィヒ・キルヒナーの「エルンスト」です。

AI による絵画、文章、音楽の作曲など。基本的な原理は、まず大規模なデータセットを通じてトレーニングして関連する知識を学習し、次に AI モデルを使用してトレーニングと出力を完了することです。

研究者たちは、上記の出力における偏りの根本的な原因は、トレーニング データ セットの不均衡にあると考えています。それは主に 2 つの側面で現れます。まず、データ セットの収集は人間の好みによって影響を受けます。例えば、AIアプリケーションPortraitsで使用されたルネッサンス時代の肖像画45,000枚は、ほとんどが白人だったことが判明しました。

2 番目に、データセットのラベル付けに矛盾が生じたり、データセットに注釈を付けるためにラベルを学習するプロセスでモデルに偏りが生じたりする可能性があります。注釈者によって好み、文化、信念が異なり、それが作成するデータ ラベルに反映されることがあります。

最後に、研究者らは、AI研究者や実践者は、検査、設計、適用のプロセスにおいて、社会政治的な文脈要因を十分に考慮する必要があるとも警告した。データセット作成の特定の詳細を誤ってモデル化したり無視したりすることで、AI生成アートは社会的、文化的、政治的な誤解を引き起こしたり、不必要な論争や対立を引き起こしたりする可能性がある。

現在、産業界と学術界の両方において、AIアルゴリズムの潜在的な偏見が人種差別スキャンダルを繰り返し引き起こしているため、幅広い注目を集めています。

オバマは白人化され、AIの人種偏見が論争を巻き起こす

近年、研究における継続的な進歩により、コンピューター ビジョン テクノロジーは飛躍的に発展しました。

したがって、アート生成の分野だけでなく、特に顔画像に関しては、AI はより広範な画像認識と合成においても潜在的なバイアスのリスクを伴います。例えば、今年上半期にはデューク大学が開発したPLUSEアルゴリズムが人種差別的であると非難され、ソーシャルプラットフォーム上で騒動が巻き起こった。

この論争は、PULSEが黒人の元米国大統領バラク・オバマ氏のイメージを白人のものに変更したことから起こった。

PULSE は、低解像度の画像を高解像度の画像に変換する (リアルで存在しない人物を生成する) 新しい超解像度アルゴリズムですが、出力には明確な肌の色の好みが生成されます。

オバマだけではない。ネットユーザーのテストでは、米国の下院議員レキサンドリア・オカシオ・コルテス氏や女優ルーシー・リュー氏らの肌の色もPULSEによって白く変色した。

コルテス

その結果、多くのネットユーザーは、AIには根深い人種的偏見があると信じています。

当時、PULSE の開発者らは、ピクセル化された画像を拡大すると、アルゴリズムが白人の特徴を持つ顔を生成する可能性が高くなることも認めていた。そして、彼は「このバイアスは、StyleGAN がデータセットから受け継いだものである可能性が高い」と述べました。

実際、この問題は機械学習では非常によく見られます。その主な理由は、AI のトレーニングに使用されるデータセットが、人口統計的に主に白人であることが多いためです。データセット内に黒人がまったく含まれていないか、または少ない場合、AI モデルのパフォーマンスに影響し、出力結果が白人になる可能性が高くなります。この事件以外にも、AIは顔認識アルゴリズムにおいて何度も人種論争を引き起こしている。

そうすると、データセットの偏りは必然的にアルゴリズムの偏りにつながります。では、データセットを効果的に改善するにはどうすればよいでしょうか?

データセットのバイアスを回避するにはどうすればよいでしょうか?

AI研究の基礎として、データセットをどのように修正し、補完するかが常に研究者の焦点となってきました。

実際、データセットには、頻繁に論争を引き起こす人種的偏見や性別による偏見に加えて、研究プロセスにおける測定バイアス、排除バイアス、関連バイアスなどの一連の問題もあります。しかし近年、研究者らは、少量のデータにラベルを付けることによってモデルの一般化能力を向上させたり、人間によるラベル付けによって生じる可能性のあるバイアスを軽減したりするなど、データバイアスの問題に対処するための多くの対策も開発してきました。

全体として、データの偏りを防ぐことは継続的なプロセスです。データやモデルに偏りがある場合、それを知ることが難しい場合があり、データセットごとに異なる基準が存在します。ただし、関連する研究者は、偏見を早期に検出して軽減するために、次のような一般的なガイドラインもまとめています。

  • 一般的なユースケースと潜在的な外れ値に注意し、データ サイエンティストとデータ ラベリング チームの多様性を確保します。

  • 測定チームの注釈の正確性と一貫性を確保するために、データ ラベル付けのゴールド スタンダードを作成します。

  • データの偏りが発生する可能性のあるプロジェクトでは、複数パスの注釈を使用します。たとえば、感情分析、コンテンツ モデレーション、意図の識別などです。

  • 敏感なグループに関連するトレーニング データをさらに収集することで、不公平に対処します。

  • Google、IBM、Microsoft などでは、さまざまなデータ タイプにおけるバイアスを分析するためのツールとガイダンスをリリースしています。

<<:  住宅地に顔認識システムを設置する前に、5つの主要なセキュリティの質問に答えてください

>>:  666!ボストンのロボット犬はすでにダンスができる、ネットユーザーは「早く飼いたい」と絶賛

ブログ    
ブログ    
ブログ    

推薦する

ドローンの出現と市場の需要の変化

ドローンの市場、入手可能性、需要が長年にわたってどのように増加してきたかを学びます。映画の架空の世界...

今後の国内人工知能産業の発展における5つの大きなトレンド

現在、中国で人工知能の分野で最も多くの投資を受けている5つのサブセクターは、コンピュータービジョン(...

ロボット工学は良いが、誇張しすぎるのは良くない

現在、ロボット工学は科学技術分野における最先端技術となっており、先進国は、この技術面で優位に立つこと...

海運業界は人工知能を活用して海賊行為と戦うことができる

今日、海賊行為は国際法、世界貿易、そして船員の安全と安心に対する複雑な課題であり続けています。電子機...

...

TensorFlow2を使用して細胞画像が感染しているかどうかを判断する方法を教えます

[[405128]]このチュートリアルでは、TensorFlow (Keras API) を使用して...

Chain World: シンプルで効果的な人間行動エージェントモデル強化学習フレームワーク

強化学習は、エージェントが環境と対話し、蓄積された報酬を最大化するために最適なアクションを選択する方...

2021 年の AI イノベーション トレンド トップ 10

人工知能は、人々の日常の仕事や生活を変えるテクノロジーとイノベーションに関して、最もホットなトレンド...

5つの重要なステップ!ディープラーニングモデルを構築するにはどうすればいいですか?

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...

フードデリバリー広告向け大規模ディープラーニングモデルのエンジニアリング実践

著者: Yajie Yingliang、Chen Long 他導入美団のフードデリバリー事業が成長を...

この AI ツールは最近、大騒ぎになっています!試してみますか?

Stable Diffusionをプレイしたことがある人は多いと思います。この製品はmjdjour...

自動運転によって交通事故はどれくらい減らせるのでしょうか?

自動運転技術の発達により交通事故の発生率を減らすことができるのは確かです。しかし、交通事故を完全に避...

プログラミングに熟練する必要はありません。人工知能への参入は思っているより簡単です

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

...

...