この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 AI で描いた簡単な絵はどれくらい良くなるのでしょうか? アメリカの俳優ラミ・マレックの写真を見ると、この効果が現れます。 元の絵にかなり近いですか? 「友達」の写真を入力した場合の効果を見てみましょう。 登場人物は多いですが、棒絵で劇中の登場人物を区別することができます。 特に髪の毛が濃い人の写真でも、AI は処理できるのでしょうか? 若い女性の「アフロ」の端の毛は完璧に復元されたと言えます。 もっと近い距離ではどうでしょうか?テイラー・スウィフトの写真の効果を見てみましょう。 髪の毛の重なりや光、衣服のひだなどを最大限に表現しており、かなり緻密な作品であるといえる。 … これらはArtLineという AI による作品です。 また、Reddit でも非常に人気があり、人気度は 1100 を超えています。 このリアルな効果は GAN の結果だと思いますか? 間違っている! ArtLine は GAN を一切使用しません。 このため、ArtLineの効果はネットユーザーを本当に驚かせました。 それで、これはどうやって実現されるのでしょうか? ArtLineの背後にある3つの魔法の武器ArtLine の作者は、その背後にある3 つの主要なテクノロジーを喜んで共有してくれました。
次に、各テクノロジーの詳細を一つずつ見ていきましょう。 Self-Attention の部分で引用されている技術は、GAN の父であるIan Goodfellow氏らが 2 年前に提案した研究から生まれたものです。 ちょっと待ってください、「GAN は使用されていない」と言いませんでしたか? 著者は次のように説明しています。
この研究では主にGAN生成に注目メカニズムを追加し、SNganのアイデアをジェネレータに導入します。 解決する必要があるのは、従来の GAN 自体に存在する次のようないくつかの問題です。
この研究における中核となる自己注意メカニズムを下の図に示します。 このうち、f(x)、g(x)、h(x) はすべて通常の 1x1 畳み込みであり、唯一の違いは出力チャネルのサイズです。 次に、f(x)の出力を転置してg(x)の出力と乗算し、ソフトマックスで正規化してAttention Mapを取得します。 注意マップを取得した後、ピクセルごとに h(x) を掛けて、適応型注意特徴マップを取得します。 結果から判断すると、自己注意メカニズムを導入した効果は、FID と IS の 2 つのパフォーマンス指標に関して確かにより良い結果を達成しました。 ArtLine に関連する 2 番目の技術的なインスピレーションは、 NVIDIAが 2018 年に実施した調査から生まれました。 この研究では主に、敵対的ニューラル ネットワークをトレーニングするための新しい方法を提案します。 重要な考え方は、ジェネレーターとディスクリミネーターを段階的にトレーニングすることです。つまり、低解像度から始めて、トレーニングが進むにつれて徐々に新しいレイヤーを追加して詳細を改良していきます。 このアプローチはトレーニングを高速化するだけでなく、より安定し、高品質の画像を生成できます。 ArtLine に使用されている最新の技術は、2016 年にスタンフォード大学のFei-Fei Li 氏のチームが提案した研究から生まれたものです。 この研究では主に、スタイル転送の実装に時間がかかるという問題に取り組んでいます。 スタイル転送部分は主に上記のネットワーク モデルを使用し、左側の画像変換ネットワークと右側の損失ネットワークの 2 つの部分に分けられます。 超解像再構成も上記のネットワークモデルを使用しますが、具体的な内部画像変換ネットワーク部分が若干異なります。 以前の研究と比較すると、このネットワークは同等レベルの結果を達成しましたが、その速度は 100 倍、3 桁に達しました。 著者についてArtLine プロジェクトの作者は Vijish Madhavan といいます。 彼はGitHubで自分がプログラマーではないことを認め、また、500ピクセル未満のピクセルを持つ画像を処理する際の効果が不十分であるなど、ArtLineの現在の欠陥のいくつかを指摘しました。 ArtLineがオンラインでプレイできるようになりました! 興味のある読者は、下のリンクをクリックして体験してください。 コラボリンク: https://colab.research.google.com/github/vijishmadhavan/Light-Up/blob/master/ArtLine(Try_it_on_Colab).ipynb.ipynb) https://colab.research.google.com/github/vijishmadhavan/Light-Up/blob/master/ArtLine.ipynb GitHub プロジェクト アドレス: https://github.com/vijishmadhavan/ArtLine |
<<: 機械学習ではテンプレートも使用できます。オンラインでモデルとパラメータを選択し、ワンクリックでデモを生成できます。
自然言語処理 (NLP) の進歩により、データセンターの運用コストの削減や人材の維持率の向上など、デ...
ディープラーニングなどのエンドツーエンドのモデルの場合、トレーニングプロセスをどのように説明し理解す...
TSMCの生産能力不足により、Nvidiaはチップ製造をIntelに頼らざるを得なくなったのか? T...
人工知能の概念知能は知識と知性の総和です。知識はすべての知的行動の基礎であり、知能は知識を獲得し、そ...
11月5日、Wave Summit+2019 Deep Learning Developer Sum...
2008 年の金融危機後、都市計画とサービス提供に対する新しいアプローチが世界中で定着し始めました。...
ますますペースが速まるこの時代において、私たちは効率性を高め、ブレークスルーを追求し続けています。多...
[[386200]] [51CTO.com クイック翻訳] 事実によれば、ロボティックプロセスオー...
化学元素は物理世界のほぼすべてを構成しています。 2016 年現在、人類が知っている元素の数は 11...
移動ロボットは、環境認識、動的意思決定と計画、行動制御と実行などの複数の機能を統合した総合システムで...
[[314283]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...
米国のパデュー大学が最近発表した「誰の回答が優れているか? ChatGPT と Stack Over...
ChatGPTはリリースされてから9か月が経ちました。この 9 か月間、この驚異的なアプリケーショ...