最終的にAIによってモザイクが見破られたとき、私たちのプライバシーはどこに隠されるのでしょうか?

最終的にAIによってモザイクが見破られたとき、私たちのプライバシーはどこに隠されるのでしょうか?

[[239842]]

モザイクといえば、多くのオタクがそれに腹を立てていると思います。1、2時間かけてダウンロードした後、開いてみたら暗号化されていたのです... おそらくコンピューターを壊したくなるでしょう。

もちろん、オタクの気分を害することもあるが、モザイクは保護の役割を果たすこともよくある。たとえば、ホラーや流血シーン、警察官などが出てくる画像の場合、モザイクをかけることで人々に不快感を与えることを避け、公務員の安全を守ることができます。さらに、この映画の検閲はオタクの感情を傷つけることを意図したものではなく、すべて商業的な必要性のためです。一般的に、日常的な使用においてモザイクについて批判すべき重大な点は基本的に何もありません。

しかし問題は、人工知能時代の到来により、Mosaic が「解読」されるリスクに直面する可能性があることです。

うまくコードを書くためにAIは怠け者ではない

私たちは日常の写真やビデオでモザイクをよく目にしますが、その起源についてはよく知らない人も多いかもしれません。

「モザイク」とは英語の「mosaic」の音訳で、もともとはブロック状の象嵌技法の一種で、古代ギリシャに起源を持ちます。画像に部分的なぼかしを施す方法は、特定の領域の色レベルを調整し、乱れたカラーブロック効果を生み出すことです。このようなカラーブロックは小さな正方形のようなもので、モザイクに非常に似ています。そのため、この画像をぼかす処理はモザイクと呼ばれます。

[[239843]]

実は簡単に言うと、画像の解像度を下げることです。本来、顔は1000万ピクセルに分割できますが、現在は10に縮小されています。それでも認識できますか?

したがって、エンコードが重いかどうかは、解像度がどの程度低下するかだけを見て判断します。

モザイクは画像処理なので、当然ながら、写真と動画という 2 つの基本的なシナリオがあります。

写真をぼかすのは基本的に難しいことではありません。写真は静止しているので、領域を選択して直接操作するだけです。しかし、動的なビデオをコーディングする場合、技術的な困難が生じます。

ビデオは画像のフレームで構成されています。この問題を解決する最も直接的な方法は、各フレームをぼかしてから組み合わせることのようです。ビデオのぼかしは完了です。しかし、それは明らかにありそうにありません。従来の映画フィルムは 1 秒あたり 24 フレームです。5 分間のビデオを処理する場合でも、何千枚もの画像を処理する必要があります。作業が完了すると、すべてがモザイク状になるでしょう。

この目的のために、人々は多くのアイデアを思いつきました。 YouTube はかつて、ユーザーが車のナンバープレートの番号、家の番号、銀行カードなどの個人情報をぼかすことができるカスタムぼかしツールをリリースしたことがある。表面的には、技術初心者でも簡単にモザイクを追加できます。しかし、困ったことに、このツールはコーディング範囲を簡単に拡張することができます。たとえば、ナンバープレートをコーディングすると、車の前面全体がぼやけてしまう可能性があります。顔をコーディングすると、体全体がぼやけてしまう可能性があります。

Microsoft が開発したコーディング ツールでは、より正確に追跡できる可能性があります。このツールは人工知能技術に基づいており、ディープラーニングニューラルネットワークを構築することで、ビデオ内の顔を正確に検出し、追跡を実現できます。また、ビデオ内の他のキャラクターの「誤読」を避けるために、さまざまな顔を認識できます。この一連のプロセスを通じて、人工知能コーディングのパフォーマンスは非常に良好になります。

コーディングに人工知能を使用することは、コーディング技術の大きな進歩と言えます。人間が画像をフレームごとに処理する必要はなく、ビデオクリップを抽出、コピー、レンダリング、追跡するために扱いにくいビデオ処理ソフトウェアを使用する必要もありません。これにより、モザイクがターゲットの動きの速度に追いつかず、露出を引き起こす状況を大幅に回避できます。

しかし、モザイクの目的はプライバシーを保護することですが、その背後にある実際の内容について人々の好奇心を刺激しています。 AIコーディングも暇ではなく、「デコード」するグループも大忙しです。

自分の槍を使って他人の盾を攻撃する:AIは「解読」が得意のようだ

デコードロジックも非常にシンプルです。モザイクはぼやけた画像処理なので、わかりやすく説明してあげてもいいのではないでしょうか。

少し前、NVIDIA、フィンランドのアアルト大学、MITは共同で、AIを使用して数ミリ秒以内にぼやけた画像を微調整する技術を開発しました。実際、同様のぼかし画像処理技術は数多く存在します。これらは、コーディングレベルが低い一部の画像を処理する場合には役立つかもしれませんが、より複雑な画像の処理には使用しないでください。

もちろん、モザイク除去技術の研究開発に真剣に取り組んでいる人もいます。

2016年、テキサス大学は、モザイクの閉塞を効果的に貫通し、画像情報を識別できるモザイク除去方法を開発しました。技術者らは顔とテキストの認識システムを構築し、インターネット上の画像を使ってそれを訓練した。最終的に、ぼやけた動画内の顔を復元する精度は80%以上、モザイクがひどくかかった顔でも約50%の正確な復元率を達成した。

このレベルを達成できれば、検閲を軽々しく利用する人々の警戒心を喚起するのに十分であるはずだ。

昨年、Google はさらに残酷なことをしました。マイクロソフトがモバイル顔認識を発表した直後、グーグルは、新しいピクセル再帰超解像技術を採用することで、Google Brainが画像の高ピクセルと低ピクセル間の変化パターンを取得し、コード化されたコンテンツのより正確なマッチングを実現できると発表した。例えば、赤い部分が唇であることを学習した後、対応する部分を唇に復元します。

つまり、Google Brain は学習とトレーニングを通じて、モザイクに基づいて写真に写っている顔の本来の姿を「埋める」ことができるのです。

Google は Microsoft の面目を与えていないようです...

オタクの友人たちはみんな、これを試してみたいと思っているはずです。そして、何度も希望と失望の間で揺れ動くことがないように、Google がこの技術をすぐに実用化してくれることを期待しています。

しかし客観的に言えば、ぼかしは実際には画像に回復不可能な損傷を与える行為です。したがって、絵は「復元された」と言うよりも、「推測された」と言った方が正確でしょう。一般的な意味でのモザイク画像を人工知能で復元するために必要な条件は、大量の画像比較です。これはテキサス大学と Google の両方に当てはまり、元の画像素材がない場合、人工知能は元の画像に可能な限り近づくことしかできないことを意味します。

モザイクが破られても、私たちのプライバシーは安全でしょうか?

ただし、近いということは、必ずしも元の画像と同じであるとは限りませんが、非常に似ている可能性があることを意味します。この観点からすると、モザイク除去技術の出現は、間違いなく、この記事の冒頭で述べたプライバシーとセキュリティの問題に大きな脅威をもたらすでしょう。

[[239846]]

誰も見たくないこの可能性に対処するために、次のような方法が考えられます。

***、イメージを暗号化して変更します。テキサス大学は、ぼかしやコード化されたビデオの認識率は高いものの、南カリフォルニア大学が開発した P3 技術 (プライバシー保護写真共有) を使用して修正された画像の認識精度は 17% しかありません。この技術は、インターネット時代における写真配信の安全性を確保するために開発されました。同様の技術は数多く存在し、写真の詳細な特徴を変更することで人工知能の推測の方向を誤らせ、プライバシーとセキュリティを保護することができます。

次に、コーディング形式を変更します。サイモンフレーザー大学の研究者たちは、人工知能を使って、ぼかす必要のある顔を芸術的にレンダリングする方法を考案した。こうすることで、話者の感情的な特徴を示し、視覚効果をよりドライにすることができます。結局のところ、モザイクが揺れているのを常に見ているというのは、あまり良い視覚体験とは言えません。

[[239847]]

さらに、抽象画で処理された顔は、基本的に人間の顔とは無関係に見えるはずです... Google がそれでも認識したいのであれば、より複雑な抽象芸術の絵画にさらに力を入れなければならないかもしれませんし、マスターになるには少なくとも 10 年から 8 年かかるかもしれません。

3番目に、極端な「コーディング」を使用します。モザイク画像を「復元」できる理由は、一方では解像度が十分に低下していないこと、そして、コード化された画像にはまだ元の画像の特徴がある程度残っていることです。まあ、知られたくないなら、大雑把に隠せばいいだけだよ。顔に黒いバーを貼り付けたり、白い光を当てたり、大きな顔文字を使って感情を表現するという問題は、おそらく人工知能には解決方法がない。ただし、このトリックは注意して使用する必要があります。結局のところ、ビデオ内で浮かんでいる大きな黒いバーと比較すると、モザイクの方が快適です。

もちろん、モザイク除去技術に直面しても、過度に不安になったり緊張したりする必要はありません。一方、その技術はまだ成熟には程遠く、現在は顔認識の「復元」に限られており、文字や商標などはまだ含まれていない。一方、画像のぼかしと鮮明さの技術は、犯罪捜査事件の重要な写真の復元、考古学資料の鮮明さ、さらには家庭の古い写真の修復など、多くの場面で積極的な意義を持っている。

ぼやけた画像を鮮明にすることに比べると、モザイクを解読することが最も難しいステップであることは明らかです。モザイクさえ除去できれば、日常の写真や動画の高画質化も簡単です。さらに、モザイク除去技術が最終的に成熟したとしても、プライバシーが簡単に漏洩する可能性があるため、必然的に法的および道徳的制約に直面することになるだろう。

したがって、適切な制約の下で、モザイクのようなものと戦わなければなりません。

<<:  人工知能は寒い冬を迎え、自動運転車の開発は妨げられている

>>:  ニューラルネットワークの層とノードの数を設定する方法

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

人工知能の分野は大きな需要があり、金融​​人材の将来性は有望である

[[408300]]重慶ビジネスデイリー・商油新聞記者が本について語る大学入試願書を記入中です。専攻...

メタは世界最速となる可能性のあるAIスーパーコンピュータを開発

Metaによれば、AI Research SuperCluster(RSC)は企業がより優れたAI...

マイクロソフトの新しい AI テクノロジー: プロフィール写真を動かして感情を「伝える」

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

人工知能を活用して社会問題を解決する方法

人工知能はデータに命を吹き込み、過去のさまざまな目録や調査から収集された膨大なデータから再利用の機会...

IoTソリューションは、より効果的なデータ駆動型警察活動の基盤を築く

個人によって生成されるデータの量と種類が増加し続けるにつれて、警察はそれに追いつくために効果的な自動...

【ビッグネーム登場、第2話】快溝タクシーの知能進化への道

インテリジェントな注文発送システムをゼロから構築するように依頼され、1 日の注文数が 40 万件だと...

...

2021年の中国人工知能産業の市場状況と競争環境の分析

[[408951]]人工知能は未来をリードする戦略的な技術であり、国際競争の焦点にもなっています。わ...

脱ぐ!ドローンは1000億元の農薬市場の発展を加速させている

現在、農業の需要と供給の矛盾がますます顕著になる中、植物保護分野におけるドローンの導入と応用は、農業...

行列の乗算は乗算を必要とせず、100倍高速化、MITが近似アルゴリズムをオープンソース化

[[421266]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

画像とテキストの認識 - 人工知能の知恵

序文人間が世界を認識する際の約 80% は視覚によって行われます。そのため、コンピューターが人間の視...

Baidu がスマートミニプログラムをリリース: Baidu Brain 3.0 に完全に統合され、12 月にオープンソース化

7月4日、北京国家会議センターで「Baidu Create 2018」Baidu AI開発者会議が開...

AI温度測定から警備ロボットまで、インテリジェントセキュリティは新たな「ゲートキーパー」となるのでしょうか?

セキュリティシステムといえば、「監視カメラ」や「電子アクセス制御」を思い浮かべる人が多いでしょう。人...

RDA を使用してデータの問題を解決し、AIOps の実装を加速する方法

【51CTO.com クイック翻訳】ロボティックデータオートメーション (RDA) とは?ロボティッ...

アルゴリズムを超えて: 人工知能と機械学習が組織に与える影響

[[319769]]今日、デジタルサイエンスは企業にとってますます魅力的になっています。しかし、デジ...