新しい AI スキル: 芸術の分類と鑑賞

新しい AI スキル: 芸術の分類と鑑賞

芸術作品の分類と分析は難しいことで知られており、ごく少数の専門家だけが発言権を持ち、この分野への人工知能の応用は長い間空白のままでした。しかし最近、いくつかの研究グループが機械学習と大規模な美術作品のデータベースを組み合わせて、作品を意味のある方法で分類し、説明しようと試みています。

まず、杭州にある浙江理工大学の研究者らが、複数のニューラルネットワークを比較し、芸術作品の分類におけるパフォーマンスを調べた。研究者たちは、WikiArt やその他のデジタル コレクションの画像を使用してニューラル ネットワークをトレーニングし、特定の芸術ジャンルの絵画間にどのような共通点が存在するかをモデルが理解できるようにしました。これを基に、研究者たちはさらに異なるニューラルネットワークモデルを使用して他の絵画の芸術的スタイルを識別しようと試みました。

明らかに、この作業は人間にとっても困難です。一部の絵画は、その絵画手法に非常に強いスタイルとジャンルの特徴があり、比較的簡単に識別できます。ニューラル ネットワークにとって、キュビズム派に属する作品を見つけることは問題ではありません。実際の問題は、いくつかの流派が互いに非常に類似しており、絵画制作過程における表現ポイントさえも非常に一貫しているため、プログラムが正確な判断を下すことが困難であることです。

[[390803]]

▲ ドイツ・ベルリンで開催中の展覧会で展示されているフィンセント・ファン・ゴッホの『星月夜』。人工知能もこの研究を利用して芸術のジャンルを分類しようとしています。

さらに、芸術作品を分類するニューラル ネットワークは、都市の風景と自然の風景の違いを区別するなど、人間にはまったく影響のない多くの細かい点に直面します。人間は建物と自然の景色を何の考えもなく区別できますが、コンピューターにとってはどちらも典型的な「屋外」の要素を表しているように見え、屋外を定義する主要な特徴である「雲」と「空」は、モデルが写真の内容を真に理解するのに役立ちません。

人間の芸術愛好家にとって、芸術作品がどのジャンルまたはカテゴリーに属するかを知ることは、比較的直接的かつ客観的な判断です。ニューラルネットワークと同様に、多数の芸術作品を調べて、同じジャンルの作品に共通するパターンを見つけることができます。しかし、人間と比較すると、コンピューターがさらに一歩進んで、芸術についての独自の意見を形成し、それに対する感情を言葉で共有することは困難です。しかし、それは単に難しいだけでしょうか、それとも不可能なのでしょうか?

人工知能の基礎はトレーニングデータから生まれます。したがって、芸術的スタイルについての意見や感情的な発言を形成することを AI に教えるためには、さまざまな芸術作品についての説明コンテンツを確立するために、依然として多くの人的資源を投入する必要があります。スタンフォード大学、エコール・ポリテクニーク、キング・アル・カドゥッラー科学技術大学の研究者らは、試してみることにし、WikiArt から収集された 8 万点以上の絵画の 40 万以上の感情属性と説明を含む ArtEmis データセットを作成しました。

ArtEmisデータセットを作成するために、研究チームはボランティアに芸術作品についての直感的な感情を共有し、言葉でコメントするよう依頼しました。ご想像のとおり、同じ作品に対しても人によってまったく異なる感想を持つことはよくあります。あなたの目に映る平和で穏やかな野原の光景は、私の目には憂鬱で陰鬱に見えるかもしれません。実際、同じ絵画に対して肯定的な感情と否定的な感情の両方を抱くというパターンは非常に一般的であり、ArtEmis データベース内のすべての絵画の 61% を占めています。

次に、AIのパフォーマンスに依存します。 ArtEmis データセットでトレーニングした後、各 AI システムは特定のアート作品のタイトルを生成しようとしました。結果の中には説得力のあるものもあるが、ほとんどは完全に的外れだ。例えば、レンブラントの絵画「洗礼者ヨハネの斬首」に対する AI の説明には、「女性は幸せそうに見える」や「真ん中の男性は惨めそうに見える」などが含まれていた。写真のシーンと合わせると、これは明らかにナンセンスです。

[[390804]]

▲ AIアルゴリズムが写真から識別した人間の感情に基づいて画像の説明を生成します。このアルゴリズムは、レンブラントの『斬首された洗礼者ヨハネ』を「女性は幸せそうに見える」と「真ん中の男性は惨めそうに見える」と表現した。

しかし、良いニュースとしては、コンピューターで生成された説明の約半数がチューリングテストに合格したということです。つまり、AI は実際に、オリジナルの芸術作品の説得力のある説明を生成することを学習できるということです。しかし、現状は完璧からは程遠い。結局のところ、ニューラルネットワークでは、絵画が自然の風景なのか都市の風景なのかを正確に判断することが難しいのだ。

多くの芸術作品は本質的に分類が難しく、絵画に対する人々の見方は極めて主観的であるため、人工知能が私たちの分類や説明の方法を理解するのがさらに困難になることを認識する必要があります。しかし、最新の研究によれば、コンピューターは特定のタスクの処理能力が向上していることが明らかになっています。芸術作品を分類し説明する能力は、おそらくまだ人間には及ばないかもしれませんが、AI プログラムはすでに追いつきつつあります。

<<:  人工知能に関するあまり知られていない3つの事実!古代中国にロボットは存在したのでしょうか?

>>:  フードデリバリーロボット市場は11.6億規模に到達。美団は「台頭」するか?

ブログ    
ブログ    

推薦する

高品質なマルチビュー画像生成、シーン素材を完璧に再現! SFUらはMVDiffusionを提案した

フォトリアリスティックな画像生成は、仮想現実、拡張現実、ビデオゲーム、映画制作などの分野で幅広く応用...

せっかちなGoogleのハードウェアから、中国と米国がAI商業化の問題をそれぞれどのように解決できるかまで

建国記念日の休日中は家にいて、Google カンファレンスを視聴しました。これらの製品のいくつかを見...

...

意思決定権を機械に委任することは可能でしょうか?

デジタルインテリジェンスは経営上の意思決定を促進し、驚くべき成果をもたらします名前が示すように、デー...

自動運転シナリオのビデオから生成された初のマルチビュー世界モデル | DrivingDiffusion: BEV データとシミュレーションの新しいアイデア

著者の個人的な考え自動運転の分野では、BEV ベースのサブタスク/エンドツーエンド ソリューションの...

医療画像技術の応用におけるAIの4つのコアバリュー

[51CTO.com クイック翻訳] 今年の ECR カンファレンスには 25 社を超えるソフトウェ...

協働ロボットはインダストリー4.0戦略の成功の核心です

インダストリー4.0戦略における自動化とロボットのシームレスな統合に対する関心が高まっています。しか...

人工知能について知っておくべきことすべて

人工知能とは何でしょうか? この質問に対する答えは、誰に尋ねるかによって異なります。 1950 年代...

ビジネスを阻害する 6 つの AI 神話

AI テクノロジーは職場環境に深く浸透しており、単調で反復的な手作業を置き換えるだけでなく、他の仕事...

Metaの最新自社開発チップの結果が明らかに、7nmプロセス、RISC-V CPUを統合

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

チューリング学習:新世代のロボットは観察するだけで人間を模倣できる

[[187204]]最近、シェフィールド大学自動制御システム工学部のロデリッヒ・グロス博士は次のよう...

...

ボストンダイナミクスの犬は48万8000元。美しい女性がビーチで犬を散歩させている。ネットユーザーから「金持ち」と呼ばれる

太陽の光、美しさ、ビーチ、他に何が思い浮かびますか?写真にボストンのロボット犬がいると言ったら、想像...

...