顔を変える技術の悪用に対抗するため、Googleはディープフェイクと戦うための大規模なデータセットを公開

顔を変える技術の悪用に対抗するため、Googleはディープフェイクと戦うための大規模なデータセットを公開

ディープフェイクの出現以来、多くの論争を引き起こし、多くの倫理的、社会的問題を引き起こしてきました。最近、FacebookやMicrosoftなどの大企業はディープフェイクの悪用と闘い始めており、ディープフェイク検出チャレンジを主催するために1,000万ドル以上を費やしている。 Google は遅れをとるつもりはない。最近、このテクノロジー大手は、ディープフェイク検出に関するコミュニティの研究をサポートするために、大規模なディープフェイク ビデオ データセットをオープン ソース化すると発表した。

ディープラーニングは、数年前には想像もできなかった多くのテクノロジーを生み出しました。一例として、超リアルな画像、音声、音楽、さらにはビデオを合成できる最新の生成モデルが挙げられます。これらのモデルは、テキストから直接人間のような音声を生成したり、医療画像研究用のトレーニング データを生成するなど、幅広い目的で広く使用されています。

他の革新的なテクノロジーと同様に、生成モデルも「ディープフェイク」などの新たな課題をもたらします。ディープフェイクは2017年後半に登場し、それ以来、多くのオープンソースのディープフェイク生成方法が登場し、合成ビデオクリップが大量に流入しました。これらのビデオの多くは面白おかしく作られていますが、ディープフェイクビデオの中には個人や社会に悪影響を及ぼすものもあります。

Google はこれらの問題を真剣に受け止めています。昨年、Google は「AI 原則」を発表し、AI の悪用や AI による危害を軽減するための AI のベストプラクティスを探求することを約束しました。昨年 1 月、Google は、高性能な偽音声検出器の開発を支援するために、ASVspoof 2019 チャレンジをサポートする合成音声データセットをリリースしました。このデータセットはコンペティション用のデータベースとして、150以上の研究機関や業界団体にダウンロードされており、現在は無料で一般公開されています。

最近、Google AI は Jigsaw (旧 Google Ideas) と共同で、ミュンヘン工科大学とナポリ フェデリコ 2 世大学 (Google が共同スポンサー) が作成した FaceForensics ベンチマークに組み込まれた大規模なビジュアル ディープフェイク データセットをリリースしました。

FaceForensics ベンチマーク データセット アドレス: https://github.com/ondyari/FaceForensics/

Google が公開したディープフェイク データセットからのビデオ例。生成プロセス中に、俳優のペアがランダムに選択され、ディープニューラルネットワークがそれらの俳優に対して顔の交換操作を実行します。

このデータセットを作成するために、Google は複数の有償および無償の俳優と協力し、過去 1 年間で数百本のビデオを撮影しました。その後、Google は、公開されているディープフェイク生成方法を使用して、これらのビデオに基づいて何千ものディープフェイク ビデオを作成しました。これらの本物の動画と偽物の動画を合わせてこのデータセットを構成しており、Google はディープフェイク検出の研究を支援するためにこのデータセットを作成しました。このデータセットは現在、FaceForensics ベンチマークの一部としてオープンソース化されており、研究コミュニティが自由に利用できるようになり、合成ビデオ検出方法の開発に役立ちます。

さまざまなシナリオで俳優たちを撮影します。上の画像は実際の俳優で、下の画像はそれに対応するディープフェイクの例です。2 つの画像の違いの度合いは、ディープフェイクの作成に使用されたもう 1 人の俳優によって異なります。

ディープフェイク技術は急速に発展しており、Googleはデータセットにデータを追加し続け、この分野で協力を続けていくと述べた。このデータセットの公開は、合成メディアの誤用によって引き起こされる潜在的な危害を軽減するために研究コミュニティを支援するという Google の取り組みにおける重要な一歩です。

<<:  あなたの顔データはどこに保存されますか?

>>:  シンプルなアルゴリズムで分散システムのパフォーマンスが瞬時に10倍以上向上

ブログ    
ブログ    

推薦する

...

人工知能を活用して社会問題を解決する方法

人工知能はデータに命を吹き込み、過去のさまざまな目録や調査から収集された膨大なデータから再利用の機会...

2022 RPA認定ランキング

ロボティック・プロセス・オートメーション (RPA) は、ビジネス プロセスの合理化に役立つ重要なテ...

マルチモーダル生成AIの深掘り

マルチモーダル生成型人工知能 (GenAI) は、汎用人工知能の実現に向けた次の大きな進歩と言えます...

Stack Overflow は独自の生成 AI ツールを公開するためにスタッフの 28% を削減

これは ChatGPT が直接引き起こした大規模なレイオフである可能性があります。世界最大のプログラ...

3分レビュー! 2021年1月の自動運転分野における重要な進展の概要

2021年に入ってから、自動運転分野の開発は着実に進展しており、今年1月には自動運転関連のさまざまな...

エンドツーエンドの自動運転までどれくらい遠いのでしょうか?

エンドツーエンドの自動運転は、システムの複雑性が高まるなどのモジュール式システムに伴う欠点を回避でき...

ファーウェイ、次世代スマート製品戦略と新+AIシリーズ製品を発表

[中国、上海、2019年9月18日] ファーウェイはHUAWEI CONNECT 2019で、Eng...

...

生成型AIの誇大宣伝の中、CIOは慎重に進めることを選択しているが、まだ完全にコミットしていない

ほとんどの CIO は、最新の情報を把握するために生成 AI の調査を開始していますが、市場に出回っ...

AI主導のサイバーセキュリティチームが人間の能力拡張に取り組む

サイバー脅威の範囲は、企業資産や選挙から健康データや物理インフラまで拡大しており、新興技術の予期せぬ...

負荷分散スケジューリングアルゴリズムを見てみましょう

[[122758]]ロード ホストは、スケジューリング メソッドまたはアルゴリズムと呼ばれる多くの負...

分散機械学習プラットフォームの比較: Spark、PMLS、TensorFlow、MXNet

[[200819]]本稿では、分散システムの観点から現在の機械学習プラットフォームのいくつかを研究...

...