AIが生成したPS動画は本物と見分けがつかないほどに進化している。昨年、ミシェル・オバマに似せるために顔を移植したポルノ動画がRedditに登場して以来、偽の有名人の肖像を使った「ディープフェイク」動画がインターネット上に登場し続けている。 無料の偽ビデオソフトウェアも多数あります。画像モデルのトレーニングプロセスは、GoogleのオープンソースプロジェクトTensor Flowに依存しており、偽造コストは高くありません。匿名の開発者による FakeApp が Reddit に無料でダウンロードできるように投稿され、わずか 2 か月で 12 万回ダウンロードされました。 このソフトウェアツールは当初、悪意を持って作られたものではなかった。開発者はニューヨークタイムズ紙に対し、FakeAppはもともと創造的な実験として作られたものだが、フェイク動画が広く悪用されるのを防ぐことはできず、フェイクニュース、暴動、犯罪をめぐる論争につながったと語った。アトランティック誌の記事では、フェイク動画が現実に対する私たちの認識を破壊していると書かれている。 偽動画の中には完璧に見えるものもあるが、それでも網をすり抜けてしまうものもある。ニューヨークのアルバニー大学の研究チームが抜け穴を発見し、それを動画の識別方法として利用した。偽動画の登場人物は、呼吸、脈拍、目の動きなど、実際の人間の生理的動きを完璧に再現できないことが多いのだ。 研究チームは、瞬き認識の最新の進歩について言及した論文を発表しました。平均的な成人は 1 分間に 17 回、つまり 1 秒間に 0.283 回まばたきをします。話しているとき、人間のまばたきの回数は 1 分間に 26 回に増加し、読んでいるときは 1 分間に 4.5 回になります。 偽の動画は画像を通じてアルゴリズムをトレーニングしますが、モデルのトレーニングに使用される画像は主にインターネット上の公開画像です。たとえば、オバマの動画を偽造するには、まずオバマの顔写真を見つける必要があります。しかし、目を閉じている写真を見つけるのは難しく、その結果、ビデオ内の偽の顔には瞬きの動きが欠けているか、少なくとも不自然な瞬きが見られることになる。 「ネット上に写真を投稿する際、人々は『見た目が良い』写真、つまり通常は目が開いた写真だけを投稿するため、AIアルゴリズムは目を閉じた画像を見つけることはほとんどない」と、このプロジェクトを率いたシウェイ・リュウ氏は語った。 具体的には、リュウ氏のチームは、瞬きを自動的に認識してラベル付けするようにアルゴリズムをトレーニングしました。このプロセスには、アルゴリズムを分析および判断して、最初にビデオ内の顔を検出し、その後、ビデオ内のすべての画像を継続的に整列させ、各画像の目の領域を分析して瞬きの動作があるかどうかを判断し、これらの画像にマークを付けることが含まれます。 つまり、このアルゴリズムは、ビデオ内の点滅部分を自動的に識別し、ビデオ内の被写体が点滅したかどうか、点滅パターンが何であるかを判断して、ビデオの真正性を判別します。論文によれば、彼らのモデルは目の状態を効果的に判断し、99%の精度で偽の動画を識別することができるという。 しかし、リュウ氏の方法にも限界がある。よくできたフェイク動画にはまばたきの動きが含まれており、人間のまばたきの仕方を完全にシミュレートすることは不可能ではない。ただ、フレームごとに調整するには少し手間がかかるだけだ。 リュウ氏は、彼らの技術は少なくとも偽造者の進歩を遅らせることができる「第一防衛線」を形成すると述べた。彼らはまた、まばたきの頻度や持続時間など、より複雑な問題にも取り組んでいます。 他にもフェイク動画に対抗する方法に取り組んでいる企業がある。カリフォルニアのスタートアップ企業、Truepicもオフラインの画像・動画分析技術に投資しており、髪の毛や耳、目の反射率などの詳細からディープフェイクを検出する。 Adobe は、PS 画像に関する経験を活かして、画像内の加工の兆候を識別するモデルをトレーニングしました。論文では、機械学習を使用して偽の写真を識別する方法が紹介されています。 |
<<: 中国のAI企業は世界の資金の70%を占めているが、その巨大なブームの裏には隠れた懸念がある
>>: WeChatモーメンツを席巻しているGoogleのAI版「Draw and Guess」の原理はこうだ。
IBMは木曜日、メインフレーム開発者向けに最近発表した生成型AIコーディング機能をベースに、古いデー...
人々の生活の重要な分野として、医療産業の発展は大きな注目を集めています。現在、医師の診察の難しさや高...
今年の AI 界のトップトレンドである大規模言語モデル (LLM) は概念を組み合わせるのが得意で、...
少し前、The Register紙はIBMの内部情報筋が、ワトソン・ヘルス部門が従業員の約50%から...
「サービスとしての」配信モデルの誕生以来、SaaS と PaaS は日常的な技術用語の一部となり、企...
デジタル化とインテリジェンスの融合によってもたらされた競争の時代において、企業はサイクルを安全に乗り...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
ビッグデータ、クラウド コンピューティング、高度なアルゴリズムという 3 つの主要なトレンドのユニー...
[[286435]]カメラはどこにでもあり、顔認識は生活のほぼあらゆる場面で使用されています。どのよ...
[オリジナル記事は51CTO.comより] 2018年ロシアワールドカップはエキサイティングな決勝...
ガートナー曲線について聞いたことがあるかもしれません。新しい技術が初めて導入されたとき、誰も興味を示...