NVIDIA が Canvas を発表: AI を活用してシンプルな筆遣いをフォトリアリスティックな風景画に変換

NVIDIA が Canvas を発表: AI を活用してシンプルな筆遣いをフォトリアリスティックな風景画に変換

[[407129]]

2年前、NVIDIAは、大雑把な落書きをリアルタイムでフォトリアリスティックな画像に変換できるAIツールを披露した。このツールは「GauGAN」と呼ばれる生成的敵対ネットワークを使用しており、これは主にフランスのポスト印象派の芸術家ポール・ゴーギャンに敬意を表したものだ。現在、NVIDIA は、AI を使用して単純なブラシストロークをリアルな風景に変える Canvas という新しいアプリをリリースしました。このアプリはまだベータ版ですが、一般に公開されています。

ただし、Canvas アプリケーションを実行するには、Windows 10 と Nvidia GeForce Quadro または Titan RTX GPU、ドライバーバージョン 445 以上を実行する必要があることに注意してください。Canvas は 2 年前にリリースされた GauGAN アプリケーションに基づいていますが、開発者はインターフェイスを大幅に改善し、よりコンパクトでユーザーフレンドリーなものにしました。また、数百万枚の画像に対する 2 年以上にわたる AI トレーニングの恩恵も受けています。

生成的敵対的ネットワーク (GAN) は、ジェネレーターと識別器の 2 つのニューラルネットワークを使用します。ジェネレーターは、その名前が示すように、何か（この場合は画像）を生成します。生成されたコンテンツは識別器に送信され、識別器は数百万の現実世界のサンプルからのトレーニングに基づいてコンテンツを評価します。次に、コンテンツを改善する方法についてジェネレーターにフィードバックを提供します (この場合はピクセル単位)。

<<: ついに！この強力な「オープンソース画像認識システム」がオンラインになりました!

>>: 第4のパラダイム: AIによる意思決定が主要なビジネスシナリオを強化し、企業の質的変化の実現を支援

MIT スタンフォードトランスフォーマーの最新研究: 過剰トレーニングにより、中程度のモデルが構造一般化能力を「発現」できるようになる

MIT スタンフォードトランスフォーマーの最新研究: 過剰トレーニングにより、中程度のモデルが構造一般化能力を「発現」できるようになる

ブログ

AI陣営を理解するためのチャート: AIを学んで間違った側に立つと自滅につながる可能性がある

AI陣営を理解するためのチャート: AIを学んで間違った側に立つと自滅につながる可能性がある

ブログ

シスコが新たな調査レポートを発表：企業はAIの準備に大きなギャップを抱えている

シスコが新たな調査レポートを発表：企業はAIの準備に大きなギャップを抱えている

ブログ

畳み込みニューラルネットワークは「グラフ」構造化データを処理できないのですか?この記事でその答えが分かります

畳み込みニューラルネットワークは「グラフ」構造化データを処理できないのですか?この記事でその答えが分かります

ブログ

IBM TRIRIGA統合ワークプレイス管理システムに新機能が追加

IBM TRIRIGA統合ワークプレイス管理システムに新機能が追加

ブログ

EUはAI規制のルールを強化する計画で、最も厳しい法案を発表

EUはAI規制のルールを強化する計画で、最も厳しい法案を発表

ブログ

AI音声アシスタントの台頭：利便性とセキュリティのバランス

AI音声アシスタントの台頭：利便性とセキュリティのバランス

ブログ

360スマートブレインモデルが一般公開されました

360スマートブレインモデルが一般公開されました

ブログ

2018年栄智連ITイネーブラーサミットのゲストラインナップが発表されました

2018年栄智連ITイネーブラーサミットのゲストラインナップが発表されました

ブログ

ブログ

推薦する

AIOps で IT 運用にインテリジェンスを組み込む方法

クラウドプラットフォーム、マネージドサービスプロバイダー、デジタル変革を進めている組織は、AI...

表の数学的推論の正解率は98.78%です！ UCLA が新しい「カメレオン推論フレームワーク」を発表

自然言語処理タスクで目覚ましい成功を収めた大規模言語モデル (LLM) は、優れたパフォーマンスを示...

破壊的な AI プログラム: 人工知能が天文学の革新を推進する方法

[[349907]]あらゆる業界に嵐のように広がっている流行語があるとすれば、それは「人工知能」に違...

AIが認知症患者の自立した生活にどのように役立つか

[[279905]]写真はインターネットから照明や音楽を Alexa や Siri などの音声制御テ...

GoogleからNvidiaまで、テクノロジー大手はAIモデルを解読するためにレッドチームハッカーを採用している

ChatGPTの一般公開の1か月前に、OpenAIはケニアの弁護士Boru Golloを雇い、AIモ...

...

...

清華大学、マイクロソフトなど大学がリマインダーエンジニアを排除？ LLMと進化的アルゴリズムを組み合わせて強力なプロンプト最適化ツールを作成する

LLM の機能と従来のアルゴリズムを組み合わせることで、どのような火花が生まれるのでしょうか?清華大...

プラグアンドプレイ、トレーニング不要：ケンブリッジ大学、テンセントAIラボなどがトレーニング不要のクロスモーダルテキスト生成フレームワークを提案

1. はじめにこの論文では、新しい MAGIC (iMAge-guided text Generat...

海外の専門家による人工知能の発展見通しに関する衝撃的な4つの予測

[[240152]]人工知能技術が成熟するにつれ、この技術のより広範な社会的、倫理的影響に十分な注意...

...

2024年に注目すべきサイバー犯罪の5つの傾向

サイバー犯罪は人工知能の時代に入り、ランサムウェアやAPTなどの高度な脅威は「サイバー犯罪技術革命」...

CNNとRNNの比較と組み合わせ

CNNとRNNはディープラーニングのほぼ半分を占めているので、この記事ではCNN+RNNとさまざまな...

Google Geminiはリリース直後から疑問視されていた：テスト基準に偏りがあり、エフェクトビデオは編集されている疑いがある

Google待望の大躍進、 Gemini大型モデルがついに発売！最も目を引くのは、次の写真とビデオで...

...