AIが生成したPS動画は本物と見分けがつかないほどに進化している。昨年、ミシェル・オバマに似せるために顔を移植したポルノ動画がRedditに登場して以来、偽の有名人の肖像を使った「ディープフェイク」動画がインターネット上に登場し続けている。 無料の偽ビデオソフトウェアも多数あります。画像モデルのトレーニングプロセスは、GoogleのオープンソースプロジェクトTensor Flowに依存しており、偽造コストは高くありません。匿名の開発者による FakeApp が Reddit に無料でダウンロードできるように投稿され、わずか 2 か月で 12 万回ダウンロードされました。 このソフトウェアツールは当初、悪意を持って作られたものではなかった。開発者はニューヨークタイムズ紙に対し、FakeAppはもともと創造的な実験として作られたものだが、フェイク動画が広く悪用されるのを防ぐことはできず、フェイクニュース、暴動、犯罪をめぐる論争につながったと語った。アトランティック誌の記事では、フェイク動画が現実に対する私たちの認識を破壊していると書かれている。 偽動画の中には完璧に見えるものもあるが、それでも網をすり抜けてしまうものもある。ニューヨークのアルバニー大学の研究チームが抜け穴を発見し、それを動画の識別方法として利用した。偽動画の登場人物は、呼吸、脈拍、目の動きなど、実際の人間の生理的動きを完璧に再現できないことが多いのだ。 研究チームは、瞬き認識の最新の進歩について言及した論文を発表しました。平均的な成人は 1 分間に 17 回、つまり 1 秒間に 0.283 回まばたきをします。話しているとき、人間のまばたきの回数は 1 分間に 26 回に増加し、読んでいるときは 1 分間に 4.5 回になります。 偽の動画は画像を通じてアルゴリズムをトレーニングしますが、モデルのトレーニングに使用される画像は主にインターネット上の公開画像です。たとえば、オバマの動画を偽造するには、まずオバマの顔写真を見つける必要があります。しかし、目を閉じている写真を見つけるのは難しく、その結果、ビデオ内の偽の顔には瞬きの動きが欠けているか、少なくとも不自然な瞬きが見られることになる。 「ネット上に写真を投稿する際、人々は『見た目が良い』写真、つまり通常は目が開いた写真だけを投稿するため、AIアルゴリズムは目を閉じた画像を見つけることはほとんどない」と、このプロジェクトを率いたシウェイ・リュウ氏は語った。 具体的には、リュウ氏のチームは、瞬きを自動的に認識してラベル付けするようにアルゴリズムをトレーニングしました。このプロセスには、アルゴリズムを分析および判断して、最初にビデオ内の顔を検出し、その後、ビデオ内のすべての画像を継続的に整列させ、各画像の目の領域を分析して瞬きの動作があるかどうかを判断し、これらの画像にマークを付けることが含まれます。 つまり、このアルゴリズムは、ビデオ内の点滅部分を自動的に識別し、ビデオ内の被写体が点滅したかどうか、点滅パターンが何であるかを判断して、ビデオの真正性を判別します。論文によれば、彼らのモデルは目の状態を効果的に判断し、99%の精度で偽の動画を識別することができるという。 しかし、リュウ氏の方法にも限界がある。よくできたフェイク動画にはまばたきの動きが含まれており、人間のまばたきの仕方を完全にシミュレートすることは不可能ではない。ただ、フレームごとに調整するには少し手間がかかるだけだ。 リュウ氏は、彼らの技術は少なくとも偽造者の進歩を遅らせることができる「第一防衛線」を形成すると述べた。彼らはまた、まばたきの頻度や持続時間など、より複雑な問題にも取り組んでいます。 他にもフェイク動画に対抗する方法に取り組んでいる企業がある。カリフォルニアのスタートアップ企業、Truepicもオフラインの画像・動画分析技術に投資しており、髪の毛や耳、目の反射率などの詳細からディープフェイクを検出する。 Adobe は、PS 画像に関する経験を活かして、画像内の加工の兆候を識別するモデルをトレーニングしました。論文では、機械学習を使用して偽の写真を識別する方法が紹介されています。 |
<<: 中国のAI企業は世界の資金の70%を占めているが、その巨大なブームの裏には隠れた懸念がある
>>: WeChatモーメンツを席巻しているGoogleのAI版「Draw and Guess」の原理はこうだ。
運転免許試験を受けるとき、2番目の科目で行き詰まっていませんか?コーチに「支配される」ことへの恐怖は...
Google の AI が囲碁の名人に勝利したことは、人工知能の突然かつ急速な進歩を測る手段であり、...
近年、人工知能がブームを迎えており、人々は合理的な分析と思考を通じて、人工知能の波をどのように利用し...
[[286412]] Facebook AI Researchの主任AI科学者であるヤン・ルカン氏...
著者: 徐潔成校正:Yun Zhao大規模なモデルを破損させるコストは本当に低すぎます。 ChatG...
高画質を追求する時代において、低画質に対する許容度はますます低くなっています。 Zhihuで「低解像...
中国・北京—2018年8月15日、ロボット産業の「ワールドカップ」であり、世界的なインテリジェントテ...
編集者注: 「水は船を運ぶこともできるが、転覆させることもできる。」この古いことわざは、誰もが知って...
2014年、日本のソフトバンクモバイルストアに新たな仲間が加わった。それは、人の表情や声のトーンを...
今日の世界では、データはお金を意味します。アプリベースの世界への移行に伴い、データは飛躍的に増加して...
この立方体の男が、目の前にいる「招かれざる客」の正体について素早く考えている様子を、注意深く見てくだ...