序文GitHub Hot Trends Vol.046では、HGがMicrosoftのオープンソースAIツール「Bringing-Old-Photos-Back-to-Life」を紹介しました。 傷んだ古い写真に新たな命を吹き込むことができ、今週は 3,000 個近くの星を獲得しました。 この記事は、プロジェクトチームメンバーのZiyu WanがHacker Newsに掲載したプロジェクト紹介です。お楽しみください〜 概要私たちはディープラーニングの手法を使って、劣化した古い写真を復元するつもりです。従来の教師あり学習による復元タスクとは異なり、実際の写真の経年劣化はより複雑であり、合成画像と実際の古い写真との間のドメインギャップにより、ネットワークは一般化できません。そこで、実際の写真と多数の合成画像ペアの両方を活用する、新しいトリプルドメイン翻訳ネットワークを提案します。具体的には、2 つの変分オートエンコーダ (VAE) をトレーニングして、古い写真ときれいな写真をそれぞれ 2 つの潜在空間に変換します。 ペアになったデータを合成して、2 つの潜在空間間の変換を学習します。コンパクトな潜在空間ではドメインギャップが閉じられているため、この翻訳ネットワークは実際の写真にうまく一般化できます。 さらに、古い写真に混在する複数の劣化問題に対処するために、傷やほこりなどの構造的欠陥を処理するための部分的な非ローカル ブロックを備えたグローバル ブランチと、ノイズやぼやけなどの非構造的欠陥を処理するためのローカル ブランチを設計します。 2 つのブランチは潜在空間で融合され、複数の劣化問題から古い写真を回復する能力が向上します。この方法は、写真の復元の視覚的な品質の点で既存の方法よりも優れています。 アーキテクチャの概要
比較表修復の詳細クローズアップ表示チームメンバーの Ziyu Wan が Bringing-Old-Photos-Back-to-Life の紹介を翻訳しました。興味のある方はぜひ試してみてください。プロジェクトのアドレスは次のとおりです。
|
<<: すべてのプログラマーが知っておくべきソートアルゴリズムトップ10
>>: 今後数年間の AI 求人市場はどのようになるでしょうか?
8月23日、マイクロソフトは過去1年間で人工知能の分野で大きな進歩を遂げており、同社の新製品のほぼ...
[[349478]] LRU は Least Recently Used の略で、よく使われるページ...
オープンソースの AI ディープラーニングを適用して、顔の表情の特徴に基づいて画像のキャプションを生...
ニューラルネットワークの説明不可能性は、AI の分野では常に「長年の」問題となってきました。しかし、...
ボリュームがヤバい、またまたビッグモデルが変わりました。たった今、世界で最も強力な AI モデルが一...
音声テキスト変換(STT)システムは、話した言葉をテキストに変換できる方法です。私たちがよく使うWe...
人工知能は今のところ目新しいものではありません。結局のところ、人工知能は私たちの生活のあらゆるところ...
この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...
今日では、データ サイエンティストの仕事は非常に一般的になり、機械学習もその中に完全に含まれる可能性...