ワンクリックでコード化からコード化なしに変更できますか? AIブラックテクノロジーは本当にモザイクを除去できるのか?

ワンクリックでコード化からコード化なしに変更できますか? AIブラックテクノロジーは本当にモザイクを除去できるのか?

モザイクは人々に嫌われており、「モザイクは人類の文明の進歩を妨げる」という諺が生まれたほどです。映画でモザイクを見ると退屈し、文書でモザイクを見ると興味を失います... 数え切れないほどの友人が、モザイクは本当に取り除くことができないのかという質問の答えを探しています。 ワンクリックでコード化されたコンテンツをコード化解除できるブラックテクノロジーはありますか?

原則として、モザイクは永久的な情報損失を表します。モザイクの原理は非常に単純です。多数の小さなピクセルを 1 つの大きなピクセルに結合し、平均色を取ってモザイクを作成します。モザイクは明らかに不可逆な操作です。平均から、どの数値の平均であるかを推測することはできません。

しかし、モザイクを復元するのは本当に不可能なのでしょうか? 一般的に言えば、モザイクを削除するには、想像力を働かせて、失われた内容を描き直す必要があります。この方法は非効率的であり、結果が安定しません。近年の AI テクノロジーの普及により、多くの驚くべきアプリケーションが誕生しました。最近、AIによるモザイク除去に関するニュースがいくつかありました。見てみましょう。

デピックス

最近注目を集めているデコードツールです。 Depix は GitHub 上のオープンソースであり、主にテキストモザイクを削除するために使用されます。開発者の場合は、以下のリンクから GitHub ページにアクセスしてプロジェクトをフォローできます。

Depix GitHub ホームページ: https://github.com/beurtschipper/Depix

まずはDepixの効果を見てみましょう。

Depix によるモザイク除去の効果。上から順に、モザイク後の文字、Depix による修復効果、元の画像です。

モザイクの完璧な復元ではありませんが、手作業では難しい、言葉では言い表せないほどの大量のものを、ある程度読みやすい文字に復元できるというのは、驚くべきことです。 Depix はどのようにしてこれを達成したのでしょうか?

Depixの原理は、実は理解するのが難しくありません。まず、Depix はテキスト テーブルを使用してテキストをモザイク化します。 Depix で使用されるテキスト テーブルは、復元される予定の文字の 2 文字の組み合わせを含む De Bruijn シーケンスを採用しています。


デ・ブリュインシーケンス

Depix の開発者は、多くのテキストがモザイク化された後、いくつかのモザイク ブロックが 2 つの文字の組み合わせになるため、この 2 つの文字が非常に重要であると考えています。たとえば、下の図では、特定のモザイク ピクセルに実際には「o」と「b」の両方が含まれており、この 2 つの文字により、より正確な一致が提供されます。


2文字マッチングにより、対応するテキストを正確に識別できます

最後に、モザイク ブロック ルックアップ テーブルが生成されます。

次に、Depix は DebBruijn シーケンスのモザイク ルックアップ テーブルを使用して、復元するモザイク テキストを照合します。モザイク テキストのブロックがルックアップ テーブルの結果と一致すると、かなり正確なテキストに復元されます。完璧ではありませんが、どのような文字であるかを認識できるほどの効果があります。

簡単に言えば、Depix の原理は、モザイクを既知のコード化されたデータと照合し、それを復元することです。この技術の出現により、モザイクでパスワードを隠すなどのシナリオに課題が生じています。しかし、Depix には明らかに限界があります。現在は主に英語の文字とアラビア数字の認識に使用されています。当面、Depix は膨大な量の漢字を処理することができません。

グーグルブレイン

Depix はテキストのデコードに希望を与え、Google Brain は画像のデコードの代表です。 Google Brain は Google が立ち上げた AI プロジェクトであり、画像モザイク除去に関する研究は非常に詳細です。

Google Brain は、多数の高解像度と低解像度のサンプリングを通じて学習し、復元結果に一致するルールを導き出す新しいピクセル再帰型超解像技術を使用します。たとえば、Google Brain は特定の黒い点がメガネのものであると学習しているため、モザイクを復元するときに、これらの黒い点を目に復元できます。テストから判断すると、その効果は実に驚異的です。


Google の画像デコード AI

このような AI 技術の用途は何でしょうか? モザイク除去は、特定の状況でのみ特定の用途に使用されます。同様のアルゴリズムは、多くの場合に役割を果たします。画像を修復する必要がある限り、役立ちます。たとえば、写真を撮るときに手が震えて、写真がピントが合わずぼやけてしまったらどうすればいいでしょうか。従来の方法は、単純で大まかなシャープニングかもしれません。しかし、写真アプリが AI 技術を採用していれば、失われたディテールやシャープネスを「補い」、できるだけ使いやすい写真に仕上げることができます。

要約する

上記以外にも、AIを利用して画像を強化する技術は数多くあります。例えば、Waif2xのインテリジェント画像拡大技術や、NVのDLSS技術などです。実は、これらはデモザイク処理のAIと似ています。これらはすべて、AIを利用して存在しない、または破損した画像情報を「埋めて」、画像の鮮明度を高めます。

今後、AIアルゴリズムの改善、機械学習の蓄積、ハードウェアの計算能力の向上により、AIデコードと画像強化はより驚くべき効果を発揮するでしょう。おそらく将来的には、モザイクはもはや視聴の障害ではなくなるでしょう。

<<:  研究者は、現在のAIトレーニングの効率が低すぎると不満を述べている

>>:  法律教育ロボット「ダニウ」が潼南で任務に就き、一般市民に無料の法律サービスを提供

ブログ    
ブログ    
ブログ    

推薦する

大規模ウェブサイトのアルゴリズムとアーキテクチャについての簡単な説明(パート 2)

順序前回の記事「大規模 Web サイトのアルゴリズムとアーキテクチャに関する簡単な説明 (パート 1...

カナダ当局はクリアビューの顔認識技術がプライバシー法に違反していることを確認した

[[380742]]カナダのプライバシー保護担当コミッショナーは水曜日、顔認識スタートアップ企業のク...

AIは生体認証のなりすまし攻撃を簡単に見分けることができる

研究論文によると、写真が実際に生きている人物を写したものか、それとも攻撃のデモンストレーションなのか...

これらの5種類の情報はAIチャットボットに決して開示されるべきではない

翻訳者 | ブガッティレビュー | Chonglou AIチャットボットの人気が急上昇しています。チ...

...

給料の心配はやめましょう。これは今後 10 年間で最も収益性の高い業界であり、横になっているときでもお金を稼ぐことができます。

小米創始者の雷軍はかつて「風の吹き口に立てば豚でも飛べる」と言った。事実は往々にしてこの通りだ。人の...

モデルデータに偏りがある場合はどうすればいいですか?機械学習における 7 種類のデータバイアスについて 1 つの記事で学ぶ

機械学習におけるデータバイアスとは、データセットの一部の要素が他の要素よりも重み付けされ、または高く...

AVFormer: ゼロショット AV-ASR のフリーズドスピーチモデルに視覚を注入

翻訳者 | 崔昊レビュー | ChonglouまとめGoogle Research の研究科学者であ...

AIがPythonの記述を手助けし、インストールはたった5ステップで完了し、自由に調整できます。

[[269874]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitA...

...

...

Web アプリケーション向けビジネス チャットボット 12 選

[[315528]] [51CTO.com クイック翻訳] ビジネスの発展を推進するために、AI(人...

絶対に対立なんかじゃない!短期的にはAIが人間に取って代わることができない5つの分野

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

2023 年の ICML カンファレンスが開催されます! Google DeepMindの最新研究を簡単に見てみよう

2023 年の国際機械学習会議 (ICML) はハワイのホノルルで開催されます。写真ICML は、国...

SLAM の新時代を切り開きましょう! NeRFと3D GS法のレビュー

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...