NVIDIA が Canvas を発表: AI を活用してシンプルな筆遣いをフォトリアリスティックな風景画に変換

NVIDIA が Canvas を発表: AI を活用してシンプルな筆遣いをフォトリアリスティックな風景画に変換

[[407129]]

2年前、NVIDIAは、大雑把な落書きをリアルタイムでフォトリアリスティックな画像に変換できるAIツールを披露した。このツールは「GauGAN」と呼ばれる生成的敵対ネットワークを使用しており、これは主にフランスのポスト印象派の芸術家ポール・ゴーギャンに敬意を表したものだ。現在、NVIDIA は、AI を使用して単純なブラシ ストロークをリアルな風景に変える Canvas という新しいアプリをリリースしました。このアプリはまだベータ版ですが、一般に公開されています。

ただし、Canvas アプリケーションを実行するには、Windows 10 と Nvidia GeForce Quadro または Titan RTX GPU、ドライバー バージョン 445 以上を実行する必要があることに注意してください。Canvas は 2 年前にリリースされた GauGAN アプリケーションに基づいていますが、開発者はインターフェイスを大幅に改善し、よりコンパクトでユーザーフレンドリーなものにしました。また、数百万枚の画像に対する 2 年以上にわたる AI トレーニングの恩恵も受けています。

生成的敵対的ネットワーク (GAN) は、ジェネレーターと識別器の 2 つのニューラル ネットワークを使用します。ジェネレーターは、その名前が示すように、何か(この場合は画像)を生成します。生成されたコンテンツは識別器に送信され、識別器は数百万の現実世界のサンプルからのトレーニングに基づいてコンテンツを評価します。次に、コンテンツを改善する方法についてジェネレーターにフィードバックを提供します (この場合はピクセル単位)。

<<:  ついに!この強力な「オープンソース画像認識システム」がオンラインになりました!

>>:  第4のパラダイム: AIによる意思決定が主要なビジネスシナリオを強化し、企業の質的変化の実現を支援

ブログ    

推薦する

5分でわかるReLU: 最も人気のある活性化関数

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...

DALL·E 3のベンチマーク!メタ最強の文豪エミュの技術レポートを公開

数日前、OpenAIはDALL·E 3をリリースしたばかりで、ビジュアルイメージは再び新たな段階に上...

顔認識はセキュリティの発展の障害になるのでしょうか?

現在、顔認識は人々の生活のあらゆる側面に組み込まれています。携帯電話のロック解除、顔をスワイプしての...

構造化データのためのテキスト生成技術の研究

1. テキスト生成入門まず、現段階で人気のテキスト生成について紹介します。 1.人工知能の発展段階人...

AI はクラウド コンピューティングをどのように改善するのでしょうか?

今日、AI とクラウド コンピューティングを組み合わせることで、企業はデータを管理し、情報のパターン...

機械学習アルゴリズムにおける分類知識の要約

この記事では、機械学習アルゴリズムにおける非常に重要な知識である分類、つまり入力データが属するカテゴ...

大きな出来事がやってくる: Google Bard は Gemini に改名される予定、Ultra 1.0 は強力だが有料、Android アプリも登場

最後に、Google が昨年 12 月に約束した Gemini Ultra はリリースされるのでしょ...

変化が起こっています!機械学習は人類をどこへ導くのでしょうか?

[[187530]]人工知能 (AI) がどのように未来を予測し、職場を変え、さらには雇用を生み出...

...

...

わずか4つの例から、DeepMindの800億のモデルは本当に学習した

知能の鍵となるのは、簡単な指示を与えられて新しいタスクを実行する方法を素早く学習する能力です。たとえ...

あるいは人間の目よりも鮮明です!世界初の3D人工眼球が発売され、何百万人もの人々が視力を取り戻す

[[327384]] 5月24日、メディアの報道によると、香港科技大学の研究者らがネイチャー誌に発表...

...

Groq LPU の謎を解明: 世界最速のハードウェア アクセラレータの基礎となるアーキテクチャ設計!

先月末、スタートアップ企業Groqの製品が一夜にして人気を博した。自社開発のハードウェアアクセラレー...