謎の AI 顔変更ソフトウェアが世界中のソーシャル ネットワークに侵入!マスク氏は数秒でルネサンス貴族になる

謎の AI 顔変更ソフトウェアが世界中のソーシャル ネットワークに侵入!マスク氏は数秒でルネサンス貴族になる

[[410798]]

FaceAppの人気は過ぎ去り、最近では、あなたの顔を数秒で「ディズニー」に変身させることができる別のアプリが世界中のソーシャルネットワークで人気を集めています。

「AIによる顔の変形」の効果をテストするのに、古くからの友人であるLeCunがいなくてはならなかった。

実際のテスト結果はかなり良好で、確かに「ディズニー」風味が感じられます。「ピクサー スタイル」だと考える人もいますが、ソフトウェアではこれを「3D カートゥーン」と呼んでいます。

LeCun のぼやけたクラシックな写真で 2D 漫画効果を試してみませんか?

解像度が低い場合でも、高品質の出力を生成することができ、「無料」ソフトウェアとしては非常に優れています。

「ディズニー風」のほかに、下の編集者(犬の頭)のような「ルネッサンス風」もあります。

LeCun がまた登場。効果は先ほどの 2D のものよりずっと良く、彼の気質が完璧に捉えられています。

しかし、編集者は大量の写真をテストした結果、このソフトウェアは世論が言うほど強力ではないことを発見しました。たまに、数枚の写真が許容範囲内に収まりましたが、生成された他のほとんどの写真は奇妙に見えました。

トレーニングデータのせいかどうかは分かりませんが、公式が挙げている有名人の事例がとてもすごいです。例えば、このムスクは非常にハンサムに見え、ヨーロッパの貴族の雰囲気を漂わせているようです。

次のような若い女性もかなりハマっています。彼らが同じソフトウェアを使用しているかどうか疑問に思わざるを得ません。

これらの例は、ある意味ではなぜそれほど人気が​​あるのか​​を説明しています。写真に写っている人物を見たことがある人であれば、AI 処理後に基本的に一目で認識できるからです。

Voilà AI Artist とは誰ですか?

「Voilà AI Artist」と呼ばれるこのソフトウェアは、AIアルゴリズムのサポートにより、ポートレート写真をアップロードするだけで、3D漫画(ディズニースタイル)、2D漫画、ルネッサンス絵画、漫画キャラクターの4つのフィルタースタイルの画像を取得できます。

Voilà には有名人の写真のデータベースもあります。アプリで検索して、有名人の顔を入れ替えた効果を直接確認できます。

しかし残念なことに、ユーザーは目や口、髪の毛を調整したり、色やコントラストを変更したりするなど、画像を編集することはできません。

実験室モデルと比較すると、パッケージ化されたアプリケーションは明らかに使いやすい。海外メディアは、このアプリが「ウイルス」のように急速に広がっているとさえ表現した。

VoilàのiOS版は発売から約3か月で、多くの国と地域で無料ランキング1位を獲得し、TikTok、Instagram、Snapchatなどの強力な競合アプリを打ち負かした。

Android 版では、Voilà は Google Play ストアで 1,000 万回以上ダウンロードされ、26 の国と地域で人気チャートのトップ 10 にランクインしています。

公式Facebookアカウントは6月13日、ユーザー数2000万人達成を祝うメッセージを投稿した。

謎の首謀者

「Voilà AI Artist」の親会社は「Wemagine.AI」で、今年1月に英国ロンドンで登記され、設立から2か月も経たないうちにこのアプリをリリースしたと報じられている。

しかし、この会社についてこれ以上詳しい情報はほとんどありません。しかし、フォックス・カロライナは同社に連絡を取ったと述べている。Wemagine.AIは、本社はカナダにあるが、チームは小規模で、世界各地でリモートワークをしていると述べた。

英国の企業検索サイト「Company Check」のデータによると、同社の創設者はリム・エリスカ氏とウィルソン・チョア氏である。さらに、二人ともインドネシアに住んでおり、年齢は35歳以下です。

プライバシーコレクター「Xijiayi」

FaceApp事件以降、ユーザーはこの種のソフトウェアのプライバシー条件にさらに注意を払うようになりました。残念ながら、試してみたい場合は、心の準備を整えてください。以下はそのほんの一部です。

Voilà は、アプリの最終使用から 24 ~ 48 時間後に写真を削除すると主張しており、プライバシー規約では、情報を第三者 (協力者を除く) に提供しないことを明記しています。

また、アプリが最後に使用されてから 24 ~ 48 時間以内に写真とそれに関連付けられた情報を削除するように Google Cloud Platform を構成しました。

当社は、その他の状況においてもお客様の情報を開示することがあります。

当社の子会社および関連会社へ。

当社の事業をサポートする請負業者、サービスプロバイダー、および第三者。

しかし、Voilà は、訪問したウェブサイト、クッキー、携帯電話の機種、写真などのユーザーの個人情報を収集し、協力する広告主に提供していることを認めています。

この使用データには、インターネット プロトコル アドレス (IP アドレスなど)、ブラウザーの種類、ブラウザーのバージョン、お客様がアクセスしたサービスのページ、アクセスの日時、それらのページで費やした時間、デバイス識別子、その他の診断データが含まれる場合があります。

モバイル デバイスを使用してサービスにアクセスする場合、その使用データには、使用するモバイル デバイスの種類、固有のデバイス識別子、モバイル デバイスの IP アドレス、オペレーティング システム、使用するモバイル インターネット ブラウザーの種類、固有のデバイス識別子、その他の診断データなどの情報が含まれる場合があります。

また、Google Analytics を利用して、IP アドレス、デバイス モデル、画面解像度、オペレーティング システム、セッション期間、位置情報などのデータも収集します。このデータに基づいて、お客様のニーズと興味を分析し、サービスを改善します。

アプリの無料版をご利用の場合、アプリ内に広告が表示されます。これらの広告はパートナーによって提供され、アプリの使用状況やオンライン上の他の場所でのアクティビティに基づいてターゲット設定される場合があります。

それに、広告を見たくない場合はどうすればいいでしょうか?当然ですが、会員費を支払う必要があります。 Voilà によると、メンバーシップにより写真処理が高速化され、エクスポートされた画像のアプリ内広告や透かしが削除されるという。

料金は1週間で2.49ポンド(22.3元)、1ヶ月で4.99ポンド(44.6元)、1年で25.99ポンド(232.3元)。

しかし、Appleの中国地域ではこれをまったく販売していないため、国内ユーザーはこの問題を心配する必要はないかもしれない。 Android ユーザーは APK のダウンロード体験を見つけることができます。

生成的敵対ネットワーク

2014 年に Generative Adversarial Networks がリリースされて以来、その応用シナリオはますます広範囲になり、現在では商業的にも利用できるようになりました。

GAN は、ジェネレーター ネットワークと識別器ネットワークで構成されます。

生成ネットワークは潜在空間からランダムにサンプルを入力として取得し、その出力はトレーニング セット内の実際のサンプルを可能な限り模倣する必要があります。

判別ネットワークの入力は、実際のサンプルまたは生成ネットワークの出力です。その目的は、生成ネットワークの出力を実際のサンプルと可能な限り区別することです。生成されたネットワークは、識別ネットワークを可能な限り欺く必要があります。

2 つのネットワークは互いに競合し、パラメータを絶えず調整します。最終的な目標は、判別ネットワークが生成されたネットワークの出力結果が真であるかどうかを判断できないようにすることです。

中でも、NVIDIAが発表したStyleGANが生成した画像は非常にリアルで、ネットワーク内の各レベルの入力を個別に変更することで、大まかな姿勢、顔の形から細かい髪の色まで、そのレベルの視覚的特徴をコントロールできるという。

StyleGANによって生成された顔

StyleGAN は、リアルな肖像画だけでなく、他の動物、車、さらには部屋を生成するためにも使用できます。

アップグレード版のStyleGAN2では、アーティファクトの問題が修正され、生成される画像の品質がさらに向上します。

<<:  最も暑い夏の日がやってきました。ドローンを飛ばすのに最適な時期です

>>:  科学者は機械学習を利用して結晶構造の酸化状態の謎を解明する

ブログ    
ブログ    

推薦する

アルゴリズム問題演習 - 大規模ブラックリスト IP マッチング

多くの IT 企業では、アルゴリズムは面接で非常に重要な部分を占めていますが、実際の仕事でアルゴリズ...

4分でノーベル賞の再現に成功! CMU は化学研究を覆す GPT-4 化学者、自律コーディング、ロボット制御を開発し、Nature に発表

ChatGPT モデルは今年人気となり、予想外に化学の分野全体を覆しました。まず、Google De...

...

CTR は成功と失敗の鍵です。なぜクリックスルー率はアルゴリズム エンジニアにとって悪夢となっているのでしょうか?

[[409064]]みなさんこんにちは。私は梁唐です。今日は、検索、広告、推奨アルゴリズムにおける...

量子コンピュータ、数学オリンピックのための AI... これらは 2020 年のコンピュータと数学における大きな進歩です

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

アリババクラウド南京雲奇カンファレンス:スマート製造モデルの共有と最先端技術の発表

[51CTO.comより引用] 本日、アリババクラウドカンファレンス南京サミットが正式に開催され、ま...

「怠け者の経済」は、消費者向け家電製品のインテリジェント制御を主流に促進するでしょうか?

 新たな住宅消費トレンドが出現[[342344]] 90年代以降の世代である荘さんは、仕事から帰宅...

ガートナー:2025年にはベンチャーキャピタル投資の75%がAIを活用する

報道によると、権威ある調査機関ガートナーは本日発表したホワイトペーパーで、投資家による人工知能(AI...

すべてのピクセルに教師なしラベル付け! 1時間のビデオに800時間を費やす必要はもうありません

ICLR 2022の授賞式を利用して、MIT、コーネル、Google、Microsoftが新しいSO...

...

知能ロボットは人間との交流を終わらせるのでしょうか?

[[187072]]人間同士の交流はどうなったのでしょうか? 最新のテクノロジーの流行を真剣に受け...

顔認識を使用してアバターにマスクとゴーグルを自動的に追加する方法

アバターにマスクとゴーグルを追加するプロジェクトアドレス: https://github.com/E...

Leetcode の基本アルゴリズム: スライディング ウィンドウについてお話しましょう

[[434663]]序文LeetCode を練習していると、スライディング ウィンドウ タイプの問題...

ヨーロッパは大規模な国際顔認識システムを構築中

過去15年間、欧州で犯罪者を追う警察は、指紋、DNAデータ、自動車所有者の詳細を相互に共有することが...