モザイクを使用するのは安全ですか? AIがモザイクを除去し、導入から3日間で約7,000個の星を獲得

パスワードを隠すためにまだモザイクを使用していますか? 「見透かされる」ことには注意してください。

ピクセル化 (モザイクとも呼ばれる) は、次のような画像の一部領域の解像度を下げることで特定の重要な情報を隠す一般的なコーディング方法です。

例えば：

写真の中のモザイクを探してください！（見つからない場合は右の元画像をご覧ください）

しかし、情報を隠したいのに、その逆を行い、画像を元の状態に復元しようとするテクノロジーもあります。

最近、Depix と呼ばれる GitHub プロジェクトが非常に人気になり、開始からわずか 3 日間で 6.9k のスターを獲得しました。プロジェクトの作者である Sipke Mellema は情報セキュリティコンサルタントです。

プロジェクトアドレス: https://github.com/beurtschipper/Depix

Depix は、ピクセル化された画像のスクリーンショットから元の画像に含まれるテキストパスワードを回復できます。このプロジェクトは、リニアボックスフィルターを使用して作成されたピクセル化された画像を扱います。下の図に示すように、プロジェクト作成者は、ピクセル化された画像、復元された効果、および元の画像の比較結果を示しています。

モザイクはかなり密でしたが、それでも Depix は隠された情報を基本的に解読することができました。

使い方

Depix を使用してピクセル化された画像のスクリーンショットからテキストパスワードを回復することも比較的簡単です。

スクリーンショットから長方形のピクセル化されたブロックを切り取ります。

同じフォント設定（テキストサイズ、フォント、色、hsl を含む）を持つエディターで、処理する文字の De Bruijn シーケンスを貼り付けます。

可能であれば、ピクセル化された画像に使用したのと同じスクリーンショットツールを使用して、シーケンスのスクリーンショットを撮ります。

次のコマンドを実行します:

Depix アルゴリズムは、線形ボックスフィルターが各ブロックを個別に処理するという事実を利用します。検索画像内の各ブロックに対してピクセル化を実行し、直接一致するものを検索します。

ほとんどのピクセル化された画像の場合、Depix は単一の一致を見つけようとし、これらの一致が正しいと想定します。複数の一致するブロックを囲む結果は、ピクセル化された画像内で同じ幾何学的距離にあると見なされ、これらの一致も正しいと見なされます。このプロセスは複数回繰り返されます。

正しいブロックの幾何学的一致がなくなると、Depix はすべての正しいブロックを直接出力します。一致するブロックが複数ある場合、Depix はすべての一致の平均を出力します。

Depixのアルゴリズム

ピクセル化は、多くの場合、線形ボックスフィルターを使用して実現されます。線形ボックスフィルターは実装が簡単で、高速であり、複数のブロックを並列に処理できます。

線形ボックスフィルターは決定論的なアルゴリズムであるため、同じ値をピクセル化すると、通常は同じピクセル化されたブロックが生成されます。同じブロック位置を使用して同じテキストをピクセル化すると、同じブロック値が生成されます。一致するパターンを見つけるために、テキストをピクセル化してみることもできます。幸いなことに、これは秘密の値の一部にも機能します。各ブロックまたはブロックの組み合わせをサブ問題として考えることができます。

プロジェクトの作成者は、潜在的なフォントの参照テーブルを作成することを選択しませんでした。アルゴリズムでは、同じ背景に同じテキストサイズと色が必要です。最新のテキストエディターでは、色相、彩度、明度も追加されるため、使用できるフォントの数は膨大になります。

プロジェクト作成者が提示した解決策もシンプルです。処理する文字の De Bruijn シーケンスを使用し、それを同じエディターに貼り付けて、スクリーンショットを撮ります。このスクリーンショットは、類似ブロックの検索画像として使用できます。例:

de Bruijn シーケンスには、処理される文字の 2 文字の組み合わせがすべて含まれます。一部のブロックは 2 つの文字と重なるため、これは重要です。正しい一致を見つけるには、画像内で同じピクセル構成のブロックを検索する必要があります。

次のテスト画像では、Depix アルゴリズムは「o」の一部を見つけることができません。これは、検索画像では検索ブロックに次の文字（「d」）の一部も含まれていますが、元の画像ではそこにスペースがあるためです。

De Bruijn 文字列を作成するときにスペースを追加すると、明らかに同じ問題が発生します。つまり、アルゴリズムが後続の文字の適切なブロックを見つけることができないのです。スペースと文字の両方が含まれる画像では検索に時間がかかりますが、結果はより良くなります。

ほとんどのピクセル化された画像の場合、Depix はブロックに一致するものを 1 つ見つけて、それが正しいものであると想定できるようです。周囲のマルチマッチングブロックのマッチング結果は、ピクセル化された画像内で同じ幾何学的距離にあるとみなされ、これらのマッチングも正しいと想定されます。

正しいブロックに幾何学的な一致がなくなると、Depix はすべての正しいブロックを直接出力します。一致するブロックが複数ある場合、Depix はすべての一致の平均を出力します。 Depix の出力は完璧ではありませんが、かなり優れています。

次の図は、ランダムな文字を含むテスト画像のピクセル除去結果を示しています。ほとんどの文字は正しく読み取られています。

このプロジェクトに興味のある読者は、自分で試してみることができます。

スクリーンショットを撮る際に機密情報をぼかす場合、単純に「モザイク」を使うことはできなくなったようです。

<<: 将来、人工知能ロボットに置き換えられる可能性のある10の仕事

>>: Transformerを廃止すれば、完全な畳み込みネットワークでもE2E検出を実現できる。

PyTorchBigGraph を使用して超大規模グラフモデルをトレーニングする方法は?

モザイクを使用するのは安全ですか? AIがモザイクを除去し、導入から3日間で約7,000個の星を獲得

PyTorchBigGraph を使用して超大規模グラフモデルをトレーニングする方法は?

CMU 中国チームは、スタンフォード大学のエビ揚げロボットに勝る高エネルギーロボットを開発するために 18 万ドルを費やしました。完全自律操作、1時間で12種類のドアを開ける方法を学習

待望のWeb顔認識ログインのフルバージョンが登場しました。気に入っています

Qualcomm CVPR 研究: ビデオ処理の計算を 78% 削減、畳み込み層に「ピクセルの選択」を教える

マスク氏がテスラFSD V12の試乗を生放送！世界初のエンドツーエンドAI自動運転、10,000台のH100でトレーニング

2代目アメカ登場！よりリアルな表情で流暢に聴衆に話しかけ、数十の言語を話すことができる

顔認識は簡単に破られるのでしょうか?虐待と闘う方法

トランスフォーマーペーパー「重要なアップデート」！ 8人全員が辞職し、Googleは『Attention Is All You Need』の著者全員のメールアドレスを削除した。

天津市が顔認証訴訟で勝利、コミュニティが顔認証を唯一のアクセス手段として使用することは違法と判断

推薦する

ディープニューラルネットワークを使用してNER固有表現抽出の問題を解決する

彼女はウルトラマンを追い出すキーパーソンなのか？ OpenAI CTOがビッグニュースを発表

次のマーク・ザッカーバーグはAIになるのか？

自然言語処理の商業的価値を示す5つの成功事例

[NCTSサミットレビュー] JD Logistics Fan Yu：配送先住所をより正確にする方法 - JD Logisticsのビッグデータアルゴリズムのテストと探索に近づく

TCP のこと 1: TCP プロトコル、アルゴリズム、原理

テクノロジーの本質: コンピューターは私たちの社会をどのように形作るのでしょうか?

クラウド AI とエッジ AI: 2022 年にはどちらがより良い選択でしょうか?

OpenAI、ChatGPTのトレーニングで何百万ものユーザー情報を盗んだとして訴訟

2024年のビッグデータの不完全な予測

AIは世界を席巻しており、すべての関係者がアプリケーションの導入に力を入れており、競争は激化している。

Apple チップは、計算精度を低下させることなく大規模なモデルを実行できます。投機的サンプリングは急速に普及しており、GPT-4 もこれを使用しています。