モザイクを使用するのは安全ですか? AIがモザイクを除去し、導入から3日間で約7,000個の星を獲得

モザイクを使用するのは安全ですか? AIがモザイクを除去し、導入から3日間で約7,000個の星を獲得

パスワードを隠すためにまだモザイクを使用していますか? 「見透かされる」ことには注意してください。

ピクセル化 (モザイクとも呼ばれる) は、次のような画像の一部領域の解像度を下げることで特定の重要な情報を隠す一般的なコーディング方法です。

例えば:

写真の中のモザイクを探してください! (見つからない場合は右の元画像をご覧ください)

しかし、情報を隠したいのに、その逆を行い、画像を元の状態に復元しようとするテクノロジーもあります。

最近、Depix と呼ばれる GitHub プロジェクトが非常に人気になり、開始からわずか 3 日間で 6.9k のスターを獲得しました。プロジェクトの作者である Sipke Mellema は情報セキュリティ コンサルタントです。

プロジェクトアドレス: https://github.com/beurtschipper/Depix

Depix は、ピクセル化された画像のスクリーンショットから元の画像に含まれるテキスト パスワードを回復できます。このプロジェクトは、リニア ボックス フィルターを使用して作成されたピクセル化された画像を扱います。下の図に示すように、プロジェクト作成者は、ピクセル化された画像、復元された効果、および元の画像の比較結果を示しています。

モザイクはかなり密でしたが、それでも Depix は隠された情報を基本的に解読することができました。

使い方

Depix を使用してピクセル化された画像のスクリーンショットからテキスト パスワードを回復することも比較的簡単です。

スクリーンショットから長方形のピクセル化されたブロックを切り取ります。

同じフォント設定(テキスト サイズ、フォント、色、hsl を含む)を持つエディターで、処理する文字の De Bruijn シーケンスを貼り付けます。

可能であれば、ピクセル化された画像に使用したのと同じスクリーンショット ツールを使用して、シーケンスのスクリーンショットを撮ります。

次のコマンドを実行します:

Depix アルゴリズムは、線形ボックス フィルターが各ブロックを個別に処理するという事実を利用します。検索画像内の各ブロックに対してピクセル化を実行し、直接一致するものを検索します。

ほとんどのピクセル化された画像の場合、Depix は単一の一致を見つけようとし、これらの一致が正しいと想定します。複数の一致するブロックを囲む結果は、ピクセル化された画像内で同じ幾何学的距離にあると見なされ、これらの一致も正しいと見なされます。このプロセスは複数回繰り返されます。

正しいブロックの幾何学的一致がなくなると、Depix はすべての正しいブロックを直接出力します。一致するブロックが複数ある場合、Depix はすべての一致の平均を出力します。

Depixのアルゴリズム

ピクセル化は、多くの場合、線形ボックス フィルターを使用して実現されます。線形ボックス フィルターは実装が簡単で、高速であり、複数のブロックを並列に処理できます。

線形ボックス フィルターは決定論的なアルゴリズムであるため、同じ値をピクセル化すると、通常は同じピクセル化されたブロックが生成されます。同じブロック位置を使用して同じテキストをピクセル化すると、同じブロック値が生成されます。一致するパターンを見つけるために、テキストをピクセル化してみることもできます。幸いなことに、これは秘密の値の一部にも機能します。各ブロックまたはブロックの組み合わせをサブ問題として考えることができます。

プロジェクトの作成者は、潜在的なフォントの参照テーブルを作成することを選択しませんでした。アルゴリズムでは、同じ背景に同じテキスト サイズと色が必要です。最新のテキスト エディターでは、色相、彩度、明度も追加されるため、使用できるフォントの数は膨大になります。

プロジェクト作成者が提示した解決策もシンプルです。処理する文字の De Bruijn シーケンスを使用し、それを同じエディターに貼り付けて、スクリーンショットを撮ります。このスクリーンショットは、類似ブロックの検索画像として使用できます。例:

de Bruijn シーケンスには、処理される文字の 2 文字の組み合わせがすべて含まれます。一部のブロックは 2 つの文字と重なるため、これは重要です。正しい一致を見つけるには、画像内で同じピクセル構成のブロックを検索する必要があります。

次のテスト画像では、Depix アルゴリズムは「o」の一部を見つけることができません。これは、検索画像では検索ブロックに次の文字(「d」)の一部も含まれていますが、元の画像ではそこにスペースがあるためです。

De Bruijn 文字列を作成するときにスペースを追加すると、明らかに同じ問題が発生します。つまり、アルゴリズムが後続の文字の適切なブロックを見つけることができないのです。スペースと文字の両方が含まれる画像では検索に時間がかかりますが、結果はより良くなります。

ほとんどのピクセル化された画像の場合、Depix はブロックに一致するものを 1 つ見つけて、それが正しいものであると想定できるようです。周囲のマルチマッチングブロックのマッチング結果は、ピクセル化された画像内で同じ幾何学的距離にあるとみなされ、これらのマッチングも正しいと想定されます。

正しいブロックに幾何学的な一致がなくなると、Depix はすべての正しいブロックを直接出力します。一致するブロックが複数ある場合、Depix はすべての一致の平均を出力します。 Depix の出力は完璧ではありませんが、かなり優れています。

次の図は、ランダムな文字を含むテスト画像のピクセル除去結果を示しています。ほとんどの文字は正しく読み取られています。

このプロジェクトに興味のある読者は、自分で試してみることができます。

スクリーンショットを撮る際に機密情報をぼかす場合、単純に「モザイク」を使うことはできなくなったようです。

<<:  将来、人工知能ロボットに置き換えられる可能性のある10の仕事

>>:  Transformerを廃止すれば、完全な畳み込みネットワークでもE2E検出を実現できる。

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

李開復氏:若者は人工知能に取って代わられない仕事を探すべきだ

AlphaGo が囲碁のゲームを解読した日、人類は自分たちの仕事が AI に置き換えられるのではない...

GC アルゴリズムをアニメーション グラフィックで説明 - ガベージ コレクションを動かしましょう。

[[425799]] Java のガベージ コレクションに関しては、私と同じように、多くの友人が、...

AIの次の目的地:リアルタイムサービス

リアルタイムサービスの波が徐々に私たちの日常生活に浸透するにつれ、コンピューティングインフラストラク...

AI および機械学習プロジェクトはどの程度安全ですか?

[[355693]]人工知能と機械学習はメリットをもたらす一方で、新たな脆弱性ももたらします。この...

...

Github を席巻: アルゴリズム ビジュアライザーはアルゴリズムを視覚化し、アルゴリズムの学習を容易にします

[[327717]] 今日はオープンソース プロジェクトを紹介します。このプロジェクトの素晴らしい...

IEEEの論文では、画像強調を実現するための放射状変換を提案している

[[202259]]最近、「少量のデータによるニューラル ネットワークのトレーニング - ドラフト」...

...

公共の安全を守るために都市に AI を導入するにはどうすればよいでしょうか?

[[347520]]今日私たちが直面している脅威の状況は絶えず変化しています。世界的に、法執行機関...

...

Redis のソースコードを読んで、キャッシュ除去アルゴリズム W-TinyLFU を学びましょう

[[433812]]この記事は董澤潤氏が執筆したWeChat公開アカウント「董澤潤の技術ノート」から...

人工知能が教育に与える影響は技術サポートだけにとどまらない

統合と国境を越えた発展が進む今日の世界において、教育が象牙の塔に留まり、自己満足に浸っているだけでは...

Didiは最初の試みで惨敗した。自動運転は本当に良い市場なのか?

道路交通は常に人々の関心事であり、テクノロジーの時代において、人々は自動運転に大きな期待を寄せていま...

未来を変える5つのAIトレンド

人工知能は、今の世代で最も話題になっているトピックです。人工知能は、20年後の世界がどのように発展す...

...