この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 画像生成アルゴリズムといえば、皆さんもよくご存知でしょう。 ただし、ほとんどのアルゴリズムはラスター画像、つまりビットマップを対象としており、ベクター画像はサポートしていません。 ベクター グラフィックスを生成するアルゴリズムはいくつかありますが、教師ありトレーニングにおけるベクター グラフィックス データセットの品質とサイズが限られているため制限があります。 この目的のために、ロンドン大学ユニバーシティ・カレッジとAdobe Researchの研究者らは、間接的な監視のためにラスタートレーニング画像のみを使用して複雑なベクターグラフィックを生成できる新しい方法、 Im2Vecを提案しました。 △Im2Vec補間効果 原則的なアーキテクチャベクター監視なしでベクター グラフィックス生成モデルを構築するために、研究者は、生成されたベクター シェイプをレンダリングし、ラスター キャンバス上に合成できる微分可能なラスター化パイプラインを使用しました。 △ アーキテクチャ概要 1 具体的には、まず、エンドツーエンドの変分オートエンコーダをベクターグラフィックスデコーダーとしてトレーニングし、ラスターイメージを潜在コード z にエンコードし、次にそれを順序付けられた閉じたベクターパスのセットにデコードします。 複数のコンポーネントを持つグラフの場合、モデルは RNN を使用して各パスの潜在コードを生成します。 これらのパスは、DiffVG を使用してラスタライズされ、DiffComp を使用して結合され、ラスタライズされたベクター グラフィック出力が得られます。 最後に、ラスタライズされたベクター グラフィックスを元のベクター グラフィックスと比較し、両者の間の損失、つまりマルチ解像度ラスター損失を計算します。誤差逆伝播法と勾配降下法を使用してモデルをトレーニングします。 エンコードのプロセスは次のとおりです。 △ アーキテクチャ概要 2 パス デコーダーを使用して、パス コードが閉じたベジェ パスにデコードされ、パスの閉じを保証するためにパス制御ポイントが単位円上に均一に抽出されます。 次に、これらの制御位置は、円形境界条件を持つ 1 次元畳み込みニューラル ネットワーク (CNN) を使用して変形され、点密度の適応制御が実現されます。 制御点の均一な分布と同じ数のセグメントと比較して、適応方式はサンプリング密度を調整し、再構築の精度を向上させます。 同時に、トレーニングされた補助モデルを使用して、複雑さと忠実度のバランスを取り、最適なパス セグメントの数とパス制御ポイントの数を決定します。 △ 統合サンプリングと適応サンプリング: (a) 忠実度とフラグメント数 (b) 誤差とフラグメント数 最後に、別の 1D 円形 CNN を使用して調整ポイントを調整し、描画キャンバスの絶対座標系で最終的なパス制御ポイントを出力します。 既存技術との比較研究者らは、再構築、生成、補間という 3 つのタスクにおける Im2Vec の定量的なパフォーマンスを評価するために、ラスターベースの ImageVAE とベクターベースの SVG-VAE および DeepSVG と比較しました。 リファクタリングのパフォーマンス評価まず、さまざまな方法とデータセットの再構築損失を計算します。 SVG-VAE も DeepSVG も、ベクトル監視なしではデータセット上で実行できないことに注意してください。 同時に、研究者らは、異なるデータセットにおける各手法のグラフィックス再構築パフォーマンスの定性的な比較を実施しました。 フォント再構築の実験結果から、次のことがわかります。 Im2Vec は複雑なトポロジ構造をキャプチャし、ベクター グラフィックスを出力できます。 MNIST データセットのトレーニングの結果は次のようになります。 ラスター データのみが存在し、ベクター グラフィックスのベンチマークがないため、このデータセットでは SVG-VAE も DeepSVG もトレーニングできません。 ImageVAE と Im2Vec の場合、数字クラスに特化または条件付けしないと、ImageVAE は低解像度のラスター イメージに制限されます (図 a)。一方、Im2Vec はベクター出力を生成できるため、編集可能性とコンパクトさという関連する利点があります。また、どちらも補間の生成で良好な結果を達成します (図 b)。 Emojis および Icons データセットでモデルの再構築パフォーマンスをテストすると、Im2Vec モデルは任意の解像度でラスタライズできることがわかります。 さまざまな方法による再構築のパフォーマンスを比較した結果、研究チームは次のような結論に達しました。 ベクトルベースの方法には、正確なベクトルパラメータを再現できるという利点がありますが、ベクトルパラメータと画像の鮮明度の間に非線形関係があるという問題があります。 SVG-VAE と DeepSVG によって推定されたベクトル パラメータの一見小さなエラーでも、画像の外観に大きな変化が生じる可能性があります。 Im2Vec は、ベクトル パラメータとピクセル空間間のターゲットの不一致の影響を受けないため、再構築タスクの大幅な改善を実現します。 生成と補間性能評価△ Im2Vec補間性能のテスト結果 △Im2Vecによって生成されたランダムサンプル 実験データから、FONTS と MNIST では、Im2Vec の結果が他の方法よりも正確であり、Im2Vec によって生成されたランダム サンプルには大きなトポロジの変化があることがわかります。 制限事項ただし、Im2Vec にもいくつかの制限があります。 グリッドベースのトレーニングの性質により、Im2Vec に特定の制限がもたらされ、いくつかの微妙な機能が失われる可能性があります。この問題は、計算効率を犠牲にして解像度を上げるか、より洗練された画像空間損失を開発することで解決できます。 さらに、ベクトル監視が不足しているため、特殊なケースでは、Im2Vec は退化した特徴を含むほぼ最適な値を採用したり、意味的に無意味な部分を考慮して形状を生成したりすることがあります。 結論はIm2Vec の生成設定は、投影 (画像をベクター シーケンスに変換する)、生成 (ベクター形式で直接新しい形状を生成する)、補間 (ベクター シーケンスから別のベクター シーケンスへの変形またはトポロジの変更) をサポートし、ベクター監視を必要とする方法よりも優れた再構築忠実度を実現します。 研究チームのホームページによると、この論文はCVPR2021に選定されたとのこと。 |
<<: ディープラーニング入門: オートエンコーダから変分オートエンコーダまで
>>: 世界で最も難しい「砂の彫刻」ゲームがAIによって解読された
22 倍の加速だけでは不十分です。ここでは 46% の改善が実現され、その方法はオープンソースです。...
[[200484]]週末、OpenAI は世界最高峰の DotA 2 イベント TI7 (The I...
10 種類以上のチップが発売され、多くの合併や買収が行われています。これは、過去 500 日間の中国...
インテリジェント時代の到来とともに、テクノロジー生活は家庭システム全体を席巻しています。さまざまなス...
2021 年に向けて、より多くの組織が新しいテクノロジーを採用するにつれて、テクノロジーとサイバーセ...
[[417131]]韓国が「カメレオンソフトロボット」の開発に成功、78件のコメントがつき、ホット検...
[[201520]] Silicon Valley Data Science の研究者らは、リカレン...
クラウドの世界を探ってみましょう。ただし、単なるクラウドではなく、未来のクラウドです。具体的には、2...
この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...
世界の歴史は発明の歴史でもあります。火薬の発明は世界地図を変え、電灯の発明は夜を変え、車の発明は空間...
オンライン詐欺は長い間、継続的な問題となっています。今日ではテクノロジーはより洗練されているかもしれ...
今週の金曜日、待望の NVIDIA 奨学金の受賞者リストが発表されました。 NVIDIA 大学院フェ...
朝のラッシュアワーには交通量が多く、午後は非常に空いています。しかし、なぜ信号が変わる頻度は同じまま...
感情 AI、つまり感情コンピューティングは、AI の次の大きなトレンドになる可能性があります。企業は...