AIが油絵の描き方を教えます。どんなスタイルでも習得でき、ストロークのシーケンスも数秒で表示されます。

AIが油絵の描き方を教えます。どんなスタイルでも習得でき、ストロークのシーケンスも数秒で表示されます。

[[417713]]

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

AIはすでに油絵の描き方を教えることができます。

任意の画像を入力すると、数秒以内にストロークのシーケンスが表示されます。

たとえば、世界的に有名な絵画「モナ・リザ」。

あるいはリアルな鳥。

雰囲気を盛り上げる川灯籠もあります。

つまり、どんなスタイルでもコントロールできるのです。

このテクニックは、21 時間以内に Reddit で 600 件以上のいいねを獲得しました。

どうやって作られたのですか?

フィードフォワードネットワークによるストロークの予測

ニューラル ペインティングは、与えられた画像に対して一連のストロークを生成し、ニューラル ネットワークを使用して絵画のような方法でリアルな再現プロセスを実行するプロセスです。

研究チームは、フィードフォワード ネットワークを使用してストロークのパラメーターを予測する、Paint Transformer と呼ばれるトランスフォーマー ベースのフレームワークを提案しました。

現在、Paint Transformer をトレーニングするためのデータセットがないため、研究者はオブジェクト検出にヒントを得た自己トレーニング パイプラインを設計しました。

モデル全体は、ストローク予測モジュールとストローク レンダラーの 2 つのモジュールで構成されています。

ストローク予測子は、ターゲット イメージと中間キャンバス イメージが指定されると、現在のストローク セットを決定するための一連のパラメーターを生成します。

予測子は、特徴埋め込み用の 2 つの CNN ネットワークと、パラメータ予測用のトランスフォーマーで構成されます。

次に、ストローク レンダラーはストローク セット内の各ストロークのストローク イメージを生成し、キャンバスに描画して、サイズが512 x 512の結果イメージを生成します。

DETR (Object Detection with Transformer) に基づいて、ストロークを保持する必要があるかどうかを予測するためのバイナリ ニューロンが追加されます。

これにより、既存のデータセットがなくてもトレーニングが可能になり、優れた一般化機能を実現できます。

実験では、このアプローチは、トレーニングと推論のコストが低く、従来の方法よりも優れたペイント パフォーマンスを実現することが示されています。

Baidu NDUチームによって作成

この技術は、百度、南京大学、ラトガース大学が共同で開発した。

コードはオープンソース化され、Yike フォトアルバム アプリに適用されました。

論文の宛先:
https://arxiv.org/abs/2108.03798
GitHubのURL:
https://github.com/wzmsltw/PaintTransformer

<<:  人工知能によって破壊される可能性のある7つの業界

>>:  人工知能が高齢者の日常生活に影響を与えないようにする

推薦する

体験談まとめ VB.NET 暗号化アルゴリズムの分類

家が施錠されていなければ、誰でも勝手に入ることができ、暗号化なしでデータを勝手に変更できてしまうと、...

...

科学技術の力を感じる: 人工知能とスマートヘルスケアの 4 つの注目のアプリケーションの分析

人工知能業界は急速に発展しており、医療、輸送、家具、電子機器などの業界で関連する応用事例が見つかりま...

国際ビデオ品質評価アルゴリズムコンテスト:Volcano Engine が優勝

7月26日、マルチメディア分野の世界最高峰の学術会議であるICME 2021で開催された「圧縮UGC...

Apache Flink トークシリーズ - PyFlink のコアテクノロジーを公開

皆さんこんにちは。本日のサミットで Apache PyFlink のコア技術を皆さんと共有できること...

信頼できる AI ソリューション プロバイダー 5 社

人工知能は、機械内で知的な行動や人間のように考える能力をシミュレートすることで、ヘルスケア、自動車、...

自動運転車が将来の都市生活に及ぼす影響

倫理的配慮無人運転車の問題は、自動運転車の倫理性の問題として要約できます。この問題の典型的なバージョ...

推奨に値する 7 つの優れたオープンソース AI ライブラリ

[[406029]] [51CTO.com クイック翻訳]人工知能 (AI) 研究の分野では、Ten...

VB.NET バブルソートアルゴリズムの詳細な説明

VB.NET を学習する場合、中国語の情報が非常に少なく、大多数のプログラマーのニーズを満たすのが難...

...

人工知能が人々を失業させるのは悪いことではありません。それどころか、それは良い役割を果たします。

近年の科学技術の急速な発展に伴い、人工知能の概念が徐々に明確になってきています。特にOTT業界の重要...

自動運転車の未来に関するレポート:乗用車の95%が消滅し、7兆ドルの旅行市場に4つの大きなチャンスがある

[[199334]]自動運転車は20年以内に世界経済を劇的に変え、保険、メディア、セキュリティ、物流...

...

...

ついに、人工知能の3つの重要な機能を説明する人がいた。

これらすべての認知機能を 1 つのマシンに統合し、あらゆる一般的なシナリオを処理できる人工知能を汎用...