現在最も興味深い AI は、実は系図会社から生まれたものなのでしょうか?

現在最も興味深い AI は、実は系図会社から生まれたものなのでしょうか?

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

ハリー・ポッターの世界では、マグルは新聞の写真を動かす魔法にますます熟達しています。

見てください、16 歳のチューリングが時空を旅しながら、あなたに向かってウインクしたり微笑んだりしています。彼の表情はとても自然です。

[[384276]]

昔の写真では寡黙だった彼女の魅力的な瞳と優しい笑顔が、今やはっきりと再び表現されている。

[[384277]]

この家族写真は過去の思い出を呼び起こすでしょうか?

[[384278]]

これは今週末、海外のソーシャルメディア上で最も人気のあるAIアプリケーションであり、人々の目の前に現れた「魔法」です。

李開復も試さずにはいられなかった…

技術的なスキルを習得する必要はありません。MyHeritageWeb サイトに古い写真をアップロードするだけです。10 ~ 20 秒後には、AI が自動的に写真に「命」を吹き込んでくれます。

彫刻でもOKです。

[[384279]]

△画像出典:twitter@FlintDibble

こうした自然な効果に、多くのネットユーザーが「まさにハリー・ポッターだ」と絶賛した。


十分に進歩した技術は魔法と区別がつかない。


驚くべきことに、これはオンライン系図サイトです…

では、この人気ブランドMyHeritageの起源は何で、なぜ突然これほど人気になったのでしょうか?

このウェブサイトをクリックすると、その主な機能が実際にはオンライン系図プラットフォームであることがわかります...

家系図を整理するのにとても役立つもの…家族一人一人の情報を入力したり、写真をアップロードしたりできます。

△はい、公式中国語版もあります

この会社の背後にある会社は2003年にイスラエルで設立されました。 2020年現在、このサイトは42の言語をサポートし、世界中に5000万人以上のユーザーを抱え、ユーザーのために約5200万の家系図を構築しています…

創業者のギラッド・ジャフェット氏は家族経営の農場でこの会社を立ち上げましたが、これまでの発展の歴史を調べてみると、MyHeritage がまさに最先端技術の先駆者であることがわかります。

[[384281]]

たとえば、2006 年に MyHeritage は、ユーザーが写真データベースから顔の特徴を識別し、個人を結び付けるのに役立つ顔認識機能を開始しました。

2016年、MyHeritageは、民族的起源を発見し、新しい親戚を見つけるのに役立つと主張する遺伝子検査サービスも開始しました。現在の価格は59ドルです。

ナショナルジオグラフィックによると、2018年にマイヘリテージは、米国とメキシコの国境で引き離された移民家族の再会を支援するために、こうしたDNA検査キットを5,000個提供した。

公開情報によると、2019年現在、MyHeritageは世界第3位のDNA検査会社となっている。

そうですね、家系図の作成から DNA 検査、AI を使用して古い写真を「復活」させるまで、この技術開発の道筋は本当に合理的です。 (手動犬頭)

高画質だけでなくダイナミック

さて、詳細を整理したので、いつものようにテクノロジーそのものの話に戻りましょう。

MyHeritage はこの人気アプリケーションの技術的な詳細については説明していませんが、一般的に言えば、古い写真を移動するには 2 つの手順が必要です。

まず、超解像度を使用して写真をより高解像度にします。

次に、モーション転送を使用して、別のビデオのキャラクターの動作を写真のキャラクターに「転送」します。

[[384284]]

まず、超解像技術があります。これは、ノイズを減らしたり、解像度を上げたりすることで写真の鮮明度を高める技術です。

ここで、GAN が役割を果たす必要があります。このモデルをトレーニングした後、その中のジェネレーターを使用して低周波画像を再構築します。

全体的に、GAN は MSE 損失関数における高周波情報の不足の問題を解決し、それによって画像内の高周波詳細のコンテンツを完成させることができます。

この方法を使用して再構築された画像では、非常に詳細な顔画像を構築でき、モザイクの顔さえも復元できます。

ただし、この方法にもいくつか問題があります。画像を復元するプロセスでは、モデルはピクセルの類似性(つまり、知覚的類似性)よりも画像スタイルの類似性に重点を置きます。

そのため、キャラクターがリアルであっても、細部では元のイメージと矛盾が生じる可能性があります。

もちろん、写真を鮮明にした後は、モーショントランスファーを使用して写真を動かす必要もあります。

この技術は、ビデオ内のタスクのキーポイントをリアルタイムで抽出し、これらのキーポイントを写真内の顔のキーポイントと一致させることができます。

このモデルは、「スケルトン」と呼ばれる技術を使用して、ビデオ内のキャラクターのキーポイントを抽出し、写真内のキャラクターの対応するキーポイントをマークします。

△モーション移行アルゴリズム TransMoMo

すると、動画内のキャラクターの動きがフレームごとに画像に「移行」されます。

この方法を使えば、たった 1 枚の写真でも、その中のキャラクターが「話す」ことができます。

それは本当に「魔法」に近いです。

感動する人もいれば、心配する人もいる

こうした技術は、「魔法」のような効果に驚かされるだけでなく、本物の感動ももたらします。

人気度2.9千人のredditでの熱い議論の中で、一部のネットユーザーは自分たちの本音を書き記した。


父の古い写真で試してみたところ、感動しました。父は私が生後数か月のときに亡くなりました。父が動いたり、瞬きしたり、笑ったりするのを見たのはこれが初めてでした。


一部のネットユーザーは、これを AR と組み合わせて博物館に設置し、写真に写っている人々が自らの人生の物語を語れるようにできたら素晴らしいだろうと提案した。

しかし、多くのネットユーザーは、このような技術が、例えば特定の短編映画の撮影などに悪用されるのではないかと懸念を表明した。

MyHeritageは、ユーザーがアップロードした写真を第三者に提供することはなく、登録が完了していない写真は自動的に削除されると強調しているが、ネットユーザーらは依然としてデータ漏洩を懸念している。

結局のところ、MyHeritage には失敗の歴史があります...

2018年6月、MyHeritageでセキュリティ侵害が発生し、9,200万人以上のユーザーのデータが漏洩したことが判明しました。

[[384285]]

このデータには、ユーザーの電子メール アドレスとパスワードが含まれます。

MyHeritageは、家系図、DNAプロファイル、クレジットカードなどのユーザー情報は別のシステムに保存されており、漏洩していないと主張していたが、脆弱性が発見された当日、ユーザーに対して2要素認証も実施していた。

しかし、2019年12月、漏洩した情報がさまざまな違法ウェブサイトに掲載され、販売されていました(販売されていた情報はメールアドレスやパスワードだけではありませんでした)。

​​


<<:  冷たい面接官は、時間をつぶすために LRU キャッシュ除去アルゴリズムを手作業で書くように私に依頼しました。

>>:  自動運転のゴールドラッシュ、このトラックの価値は少なくとも3000億ドル

ブログ    
ブログ    

推薦する

レポート:中国の人工知能産業は2022年までに300億ドル近くの価値に達する

中国の新世代人工知能産業の規模は着実に拡大している。新世代の AI アプリケーション シナリオの実装...

...

リソースインベントリ: 便利な自動データサイエンスおよび機械学習ソフトウェア

[[208290]]概要: この記事では、海外の便利な自動データ サイエンスおよび機械学習ソフトウェ...

...

...

人間は形を見るが、AIは質感を見る:コンピュータービジョン分類の失敗についての議論

[[270985]]研究者たちは、ディープラーニングの視覚アルゴリズムが、主に形状ではなくテクスチャ...

298.2億ドル規模のロボット市場がなぜこれほど不振なのか?

以前、マッキンゼー・グローバル・インスティテュートは、2030年までに約70%の企業が少なくとも1つ...

継続的な冷却を心配する必要はありません。ドローンが電力網を保護して暖かさを提供します

秋の雨が降るたびに寒さがやってきます。今年の秋は例年より遅く訪れましたが、寒さも増しています。気温の...

...

人工知能は242万件の医療記録の分析を支援した

人工知能は242万件の医療記録の分析を支援した1月26日、iFLYTEKは最前線の防疫・管理を支援す...

人工知能に適したプログラミング言語はどれですか? ——人工知能におけるPythonの役割

Google の AI が囲碁の名人に勝利したことは、人工知能の突然かつ急速な進歩を測る手段であり、...

...

問題点を突き止める - Weiang 入札および評価ビデオインテリジェントアーカイブシステム

財務省令第87号では、購入者または購入代理店は入札および入札評価プロセス全体を録画および記録しなけれ...

Google の最新のオープンソース Gemma モデルが Llma-2 を数秒で上回りました。

ジェマとはジェマ軽量で最先端のオープンモデルシリーズで、 ジェミニ同じ研究と技術をモデル化します。 ...