AIが油絵の描き方を教えます。どんなスタイルでも習得でき、ストロークのシーケンスも数秒で表示されます。

[[417713]]

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

AIはすでに油絵の描き方を教えることができます。

任意の画像を入力すると、数秒以内にストロークのシーケンスが表示されます。

たとえば、世界的に有名な絵画「モナ・リザ」。

あるいはリアルな鳥。

雰囲気を盛り上げる川灯籠もあります。

つまり、どんなスタイルでもコントロールできるのです。

このテクニックは、21 時間以内に Reddit で 600 件以上のいいねを獲得しました。

どうやって作られたのですか?

フィードフォワードネットワークによるストロークの予測

ニューラルペインティングは、与えられた画像に対して一連のストロークを生成し、ニューラルネットワークを使用して絵画のような方法でリアルな再現プロセスを実行するプロセスです。

研究チームは、フィードフォワードネットワークを使用してストロークのパラメーターを予測する、Paint Transformer と呼ばれるトランスフォーマーベースのフレームワークを提案しました。

現在、Paint Transformer をトレーニングするためのデータセットがないため、研究者はオブジェクト検出にヒントを得た自己トレーニングパイプラインを設計しました。

モデル全体は、ストローク予測モジュールとストロークレンダラーの 2 つのモジュールで構成されています。

ストローク予測子は、ターゲットイメージと中間キャンバスイメージが指定されると、現在のストロークセットを決定するための一連のパラメーターを生成します。

予測子は、特徴埋め込み用の 2 つの CNN ネットワークと、パラメータ予測用のトランスフォーマーで構成されます。

次に、ストロークレンダラーはストロークセット内の各ストロークのストロークイメージを生成し、キャンバスに描画して、サイズが512 x 512の結果イメージを生成します。

DETR (Object Detection with Transformer) に基づいて、ストロークを保持する必要があるかどうかを予測するためのバイナリニューロンが追加されます。

これにより、既存のデータセットがなくてもトレーニングが可能になり、優れた一般化機能を実現できます。

実験では、このアプローチは、トレーニングと推論のコストが低く、従来の方法よりも優れたペイントパフォーマンスを実現することが示されています。

Baidu NDUチームによって作成

この技術は、百度、南京大学、ラトガース大学が共同で開発した。

コードはオープンソース化され、Yike フォトアルバムアプリに適用されました。

論文の宛先:
https://arxiv.org/abs/2108.03798
GitHubのURL:
https://github.com/wzmsltw/PaintTransformer

<<: 人工知能によって破壊される可能性のある7つの業界

>>: 人工知能が高齢者の日常生活に影響を与えないようにする

Nougat: 科学文書の OCR 用トランスフォーマーモデル

ブログ

なぜ R&D 管理はコスト削減と効率向上のための永遠の特効薬と考えられているのでしょうか?

ブログ

500以上の研究と50以上のモデルを網羅したコードビッグモデルレビューがここにあります

ブログ

MITのコンピューターの先駆者ジョエル・モーゼス氏が死去！ 50年前にコンピューターに微積分を教えた

ブログ

2021 年の人工知能のトップ 10 トレンド

ブログ

サイバーセキュリティにおける機械学習の適用における困難さと対策

ブログ

カメラ、レーダー、地図は不要、二足歩行ロボットは「自分の感覚」で歩く

ブログ

双子: 効率的な視覚的注意モデルの設計を再考する

ブログ

旅の途中のハードウェアプロジェクトが公開されました。 Apple Vision Proのエンジニアがスーパーバイザーを務め、かつてはマスクの脳コンピューターインターフェース企業で働いていた

ブログ

AIが油絵の描き方を教えます。どんなスタイルでも習得でき、ストロークのシーケンスも数秒で表示されます。

フィードフォワードネットワークによるストロークの予測

Baidu NDUチームによって作成

Nougat: 科学文書の OCR 用トランスフォーマーモデル

なぜ R&D 管理はコスト削減と効率向上のための永遠の特効薬と考えられているのでしょうか?

500以上の研究と50以上のモデルを網羅したコードビッグモデルレビューがここにあります

MITのコンピューターの先駆者ジョエル・モーゼス氏が死去！ 50年前にコンピューターに微積分を教えた

2021 年の人工知能のトップ 10 トレンド

サイバーセキュリティにおける機械学習の適用における困難さと対策

カメラ、レーダー、地図は不要、二足歩行ロボットは「自分の感覚」で歩く

双子: 効率的な視覚的注意モデルの設計を再考する

旅の途中のハードウェアプロジェクトが公開されました。 Apple Vision Proのエンジニアがスーパーバイザーを務め、かつてはマスクの脳コンピューターインターフェース企業で働いていた

推薦する

2050年の世界はどのようになっているでしょうか?新たなエネルギー源が出現し、人工知能が社会に浸透

研究者は特別な画像を使って人工知能を「毒する」

プラットフォームのイノベーションを加速し、「クラウド、ビッグデータ、IoT、インテリジェンス」の新たな章を切り開く

人工知能の応用分野と必要な専門知識

ガイドはここにあります! GPT3.5を微調整して大規模モデルをカスタマイズしましょう！

Google I/O 2018 に注目: AI に始まり、AI に終わる

たった 10 行のコードでディープラーニングを実行できますか? PaddlePaddleフレームワークの高レベルAPIでAIを簡単に操作しよう

広州には AI があり、Huawei Ascend Academy は本格的に始動しています。