新しい AI スキル: 芸術の分類と鑑賞

新しい AI スキル: 芸術の分類と鑑賞

芸術作品の分類と分析は難しいことで知られており、ごく少数の専門家だけが発言権を持ち、この分野への人工知能の応用は長い間空白のままでした。しかし最近、いくつかの研究グループが機械学習と大規模な美術作品のデータベースを組み合わせて、作品を意味のある方法で分類し、説明しようと試みています。

まず、杭州にある浙江理工大学の研究者らが、複数のニューラルネットワークを比較し、芸術作品の分類におけるパフォーマンスを調べた。研究者たちは、WikiArt やその他のデジタル コレクションの画像を使用してニューラル ネットワークをトレーニングし、特定の芸術ジャンルの絵画間にどのような共通点が存在するかをモデルが理解できるようにしました。これを基に、研究者たちはさらに異なるニューラルネットワークモデルを使用して他の絵画の芸術的スタイルを識別しようと試みました。

明らかに、この作業は人間にとっても困難です。一部の絵画は、その絵画手法に非常に強いスタイルとジャンルの特徴があり、比較的簡単に識別できます。ニューラル ネットワークにとって、キュビズム派に属する作品を見つけることは問題ではありません。実際の問題は、いくつかの流派が互いに非常に類似しており、絵画制作過程における表現ポイントさえも非常に一貫しているため、プログラムが正確な判断を下すことが困難であることです。

[[390803]]

▲ ドイツ・ベルリンで開催中の展覧会で展示されているフィンセント・ファン・ゴッホの『星月夜』。人工知能もこの研究を利用して芸術のジャンルを分類しようとしています。

さらに、芸術作品を分類するニューラル ネットワークは、都市の風景と自然の風景の違いを区別するなど、人間にはまったく影響のない多くの細かい点に直面します。人間は建物と自然の景色を何の考えもなく区別できますが、コンピューターにとってはどちらも典型的な「屋外」の要素を表しているように見え、屋外を定義する主要な特徴である「雲」と「空」は、モデルが写真の内容を真に理解するのに役立ちません。

人間の芸術愛好家にとって、芸術作品がどのジャンルまたはカテゴリーに属するかを知ることは、比較的直接的かつ客観的な判断です。ニューラルネットワークと同様に、多数の芸術作品を調べて、同じジャンルの作品に共通するパターンを見つけることができます。しかし、人間と比較すると、コンピューターがさらに一歩進んで、芸術についての独自の意見を形成し、それに対する感情を言葉で共有することは困難です。しかし、それは単に難しいだけでしょうか、それとも不可能なのでしょうか?

人工知能の基礎はトレーニングデータから生まれます。したがって、芸術的スタイルについての意見や感情的な発言を形成することを AI に教えるためには、さまざまな芸術作品についての説明コンテンツを確立するために、依然として多くの人的資源を投入する必要があります。スタンフォード大学、エコール・ポリテクニーク、キング・アル・カドゥッラー科学技術大学の研究者らは、試してみることにし、WikiArt から収集された 8 万点以上の絵画の 40 万以上の感情属性と説明を含む ArtEmis データセットを作成しました。

ArtEmisデータセットを作成するために、研究チームはボランティアに芸術作品についての直感的な感情を共有し、言葉でコメントするよう依頼しました。ご想像のとおり、同じ作品に対しても人によってまったく異なる感想を持つことはよくあります。あなたの目に映る平和で穏やかな野原の光景は、私の目には憂鬱で陰鬱に見えるかもしれません。実際、同じ絵画に対して肯定的な感情と否定的な感情の両方を抱くというパターンは非常に一般的であり、ArtEmis データベース内のすべての絵画の 61% を占めています。

次に、AIのパフォーマンスに依存します。 ArtEmis データセットでトレーニングした後、各 AI システムは特定のアート作品のタイトルを生成しようとしました。結果の中には説得力のあるものもあるが、ほとんどは完全に的外れだ。例えば、レンブラントの絵画「洗礼者ヨハネの斬首」に対する AI の説明には、「女性は幸せそうに見える」や「真ん中の男性は惨めそうに見える」などが含まれていた。写真のシーンと合わせると、これは明らかにナンセンスです。

[[390804]]

▲ AIアルゴリズムが写真から識別した人間の感情に基づいて画像の説明を生成します。このアルゴリズムは、レンブラントの『斬首された洗礼者ヨハネ』を「女性は幸せそうに見える」と「真ん中の男性は惨めそうに見える」と表現した。

しかし、良いニュースとしては、コンピューターで生成された説明の約半数がチューリングテストに合格したということです。つまり、AI は実際に、オリジナルの芸術作品の説得力のある説明を生成することを学習できるということです。しかし、現状は完璧からは程遠い。結局のところ、ニューラルネットワークでは、絵画が自然の風景なのか都市の風景なのかを正確に判断することが難しいのだ。

多くの芸術作品は本質的に分類が難しく、絵画に対する人々の見方は極めて主観的であるため、人工知能が私たちの分類や説明の方法を理解するのがさらに困難になることを認識する必要があります。しかし、最新の研究によれば、コンピューターは特定のタスクの処理能力が向上していることが明らかになっています。芸術作品を分類し説明する能力は、おそらくまだ人間には及ばないかもしれませんが、AI プログラムはすでに追いつきつつあります。

<<:  人工知能に関するあまり知られていない3つの事実!古代中国にロボットは存在したのでしょうか?

>>:  フードデリバリーロボット市場は11.6億規模に到達。美団は「台頭」するか?

ブログ    
ブログ    

推薦する

機械学習プロジェクトの完全な構築プロセスとタスクリストが公開されており、収集する価値があります。

機械学習プロジェクトの作成というと、データ、モデリング、テストなどを思い浮かべる人がほとんどですが、...

Ali Wensheng ビデオが Gen-2 と Pika に挑戦、1280×720 の解像度で圧迫感なし、3500 万のテキスト ビデオ表示効果

ヴィンセントのビデオはどの程度詳細にできますか?最近、アリババの調査により、1280×720 の解像...

強化学習と3Dビジョンを組み合わせた新たなブレークスルー:高性能オンラインパレタイジングロボット

国立防衛技術大学、クレムソン大学、Seebit Robotics の研究者らが協力し、深層強化学習を...

Nature: 室温超伝導体はなぜ持続できないのか?

世界中で白熱した議論を巻き起こしたLK-99論争が終結した後、ネイチャー誌の見出しに再び「室温超伝導...

人工知能が VPS と共有ホスティング オプションの議論を再構築

人工知能は数え切れないほど多くの業界を前例のない形で変えています。ウェブホスティングは人工知能が関与...

「幾何学的ディープラーニング」からのディープラーニングの統合

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

[NCTSサミットレビュー] Testin Xu Kun: AIが次世代のテストをリード、iTestinがテストの未来を書き換える

2019年10月26日、Testinが主催する第2回NCTS中国クラウドテスト業界サミットが北京で開...

AWS が Amazon SageMaker の 9 つの新機能をリリース

12 月 9 日、Amazon Cloud Service (AWS) が開催する年次イベント AW...

マイクロソフト、物議を醸す顔認識機能を廃止へ

マイクロソフトは、動画や写真から対象者の感情を識別できると主張するツールを含む、人工知能による顔分析...

アリババ、1秒でフェイクニュースを暴く「AI噂クラッシャー」を正式リリース

[[261230]]エイプリルフールは私たちにとってただ楽しい日です。親にとって、ネット上の噂は日々...

AIの新たな方向性:敵対的攻撃

[[249559]]近年のAI分野を調査していく中で、近年、世界中の研究者の視野の中に敵対的攻撃とい...

自動運転企業Roadstar.aiはシリーズA資金調達で1億2,800万ドルを調達し、2020年までに1,500台の自動運転車を運行する予定だ。

自動運転企業Roadstar.aiは最近、 1億2,800万米ドルのシリーズA資金調達ラウンドの完了...