Github が絶賛: モザイクテキスト = 無意味、AI があなたの思考をすべて見抜く、オープンソースに

Github が絶賛: モザイクテキスト = 無意味、AI があなたの思考をすべて見抜く、オープンソースに

「この写真をフォトショップで加工しましょう!」 「いいですよ、でもこの段落は検閲しないと面倒なことになりますよ!」

もし今、「コーディング」はもはや安全ではなく、保護したい情報は「皇帝の新しい服」のようなものだと言ったら、あなたはどう思いますか?

[[358620]]

いいえ、これはセンセーショナルなことではありません。最近、Depix という GitHub プロジェクトが人気を集めています。オンラインになってからわずか 3 日で、スターの数は 7,000 に達しました。投稿時点で、このプロジェクトはすぐに 10,000 以上のスターを獲得しました。

モザイク化されたテキストを解読できるのはこの技術であり、あなたの努力のすべてが「物事をより明白にする」効果をもたらす可能性もあります。

携帯電話への落書きは「無駄」であり、素人でも簡単に隠された情報を復元できる

少し前に、携帯電話の落書きを使って写真に施した操作は、実は簡単に復元できることがインターネット上で明らかになりました。

WeChat チャットのスクリーンショットのテキスト落書きを例に挙げます。

私たちの周りには、秘密にしておきたい情報を隠すためにこの落書きの手法を使う人が多すぎるかもしれません。

安全そうですね?

実際、関心のある人の目には、あなたの操作はすぐに無駄になる可能性があります。

もう一度携帯電話の写真編集機能を使用して、露出、シャープネス、ハイライト、シャドウ、明るさなどのパラメータを +100 に調整し、コントラスト パラメータを -100 に調整すると、魔法のようなことが起こります。

専門家は、落書きと比べるとモザイクは修復したり元に戻したりできないことを知っており、これは非常に安心できることだ。

しかし、今では AI の助けを借りて、厚くコード化された画像内の隠されたコンテンツを修復することが可能です。

Depix — 太いテキストコンテンツを修正、オープンソース化

Depix の主な機能は、AI アルゴリズムを使用してモザイクからピクセル化されたテキスト コンテンツを復元することです。リニア ボックス フィルターを使用して作成されたピクセル化された画像に適しています。

その目的はモザイクを除去することではなく、テキストを復元することです。これは一部のオタクをがっかりさせるかもしれませんが、その効果は依然として強力で有意義です。

このプロジェクトは情報セキュリティ コンサルタントの Sipke Mellema によって開発され、現在は英語の文字、数字、英語の句読点のみをサポートしています。

このオープンソース プロジェクトのユーザーは誰でも、次のコマンドを使用するだけで、「スパイ」したいテキスト コンテンツを復元できます。

python depix.py -p images/testimages/testimage3_pixels.png -s images/searchimages/debruinseq_notepad_Windows10_closeAndSpaced.png -o output.png

完全な操作は次のとおりです。

スクリーンショットからピクセル化された正方形を長方形として切り取ります。

同じフォント設定 (テキスト サイズ、フォント、色、hsl) を使用して、De Bruijn シーケンスをエディターに貼り付けます。

シーケンスのスクリーンショットを作成します。可能であれば、同じスクリーンショット ツールを使用してピクセル化された画像を作成します。

python depix.py -p [ピクセル化された長方形の画像] -s [検索シーケンスの画像] -o output.png を実行します。

アルゴリズムの原理は単純です。小さなブロックを分割し、De Bruijnシーケンス文字ライブラリがピクセルマッチングを支援します。

Depix の原理は、モザイク領域の内容を多数の小さなブロックに分割し、事前に設定された文字ライブラリ (De Bruijn シーケンス) を使用して各小さなブロックに対してピクセル マッチングを実行することです。

具体的なアルゴリズムのフローは次のとおりです。

このアルゴリズムは線形ボックス フィルターを利用して、各ブロックの特性を個別に処理します。各ブロックについて、検索画像内のすべてのブロックをピクセル化して、直接一致をチェックします。

ほとんどのピクセル化された画像に対して、Depix は単一の一致を見つけることができます。これらが正しいと仮定します。次に、周囲の複数マッチング ブロックの一致が、ピクセル化された画像内の同じ距離と幾何学的に比較されます。一致も正しいとみなされます。このプロセスを数回繰り返す必要があります。

正しいブロックに幾何学的な一致がない場合は、すべての正しいブロックが直接出力されます。複数の一致ブロックの場合、すべての一致の平均を出力します。

この AI プロジェクトを開発するにあたり、Mellema は情報を盗むことではなく、ECB とプレーンテキスト攻撃パターンを使用して情報保護技術を向上させることを目的としていました。

彼の意見では、現在の保護モデルを弱体化させる方法を知らないことが、情報セキュリティにおけるよくある落とし穴です。

Depixは主にコード化されたテキストの処理に使用され、モザイクピクセルレベルの画像を修復する技術に関しては、デューク大学のAIアルゴリズムPULSEを挙げなければなりません。

オタクにとってのメリット? Duke PULSEは画質の修復に最適です

デューク大学の AI アルゴリズム PULSE (潜在空間探索による写真アップサンプリング) は、ピクセル スラグからモザイク レベルまで画像を修復できます。

このアルゴリズムは、ぼやけて認識できない顔の画像を、これまでよりも細かくリアルなディテールを持つコンピューター生成画像に変換することができます。

以前の方法によると、ぼやけたヘッドショットを鮮明にしたい場合は、写真を元の解像度の 8 倍に拡大することしかできませんでした。

PULSE は、わずか数秒で 16 x 16 ピクセルの低解像度画像を 64 倍の 1024 x 1024 ピクセルの高解像度画像に拡大できます。

この64倍のピクセル拡大は間違いなく業界初です。

低解像度の写真では見えなかった毛穴、小じわ、まつ毛、髪の毛、無精ひげなどの細部も、PULSE アルゴリズムで処理するとはっきりと見えるようになります。

実際の応用に関して、論文の共著者であるサチット・メノン氏は次のように述べています。

「これらの研究では、顔を概念実証としてのみ使用しました。

しかし、理論的には、この技術は汎用性があり、医学や顕微鏡から天文学や衛星画像まで、さまざまな分野で画像品質の向上に使用できる可能性がある。 「

これに似たのが Google のスーパーピクセル再帰ソリューションで、興味のある友人は自分で調べてみることができます。

最後に、Depix と PULSE のプロジェクト リンクを以下に示します。

Depix プロジェクト アドレス: https://github.com/beurtschipper/Depix

PULSE プロジェクト アドレス: https://github.com/adamian98/pulse

<<:  マイクロモード動的顔認識制御システムソリューション

>>:  Google の内部対立が激化!従業員が共同書簡に署名:AIマスターのジェフ・ディーン氏は謝罪すべき!

ブログ    

推薦する

教育は新世代の人工知能の発展を積極的に支援すべきである

[[250135]]習近平総書記は中国共産党中央委員会政治局第9回集団学習会で、人工知能は新たな科学...

Python が機械学習プロジェクトに最適な言語である理由は何ですか?

[[386401]] Python は安定性とメンテナンスのしやすさから、常に優れたパフォーマンス...

人工知能は認知と表現のギャップを埋めている

人工知能により、認知能力は高いが表現能力が限られている人でも、自分の考えを表現したり、物語を創作した...

リアルタイム6自由度オブジェクトトラッキングを実現するDeepACが登場

本記事では、国立国防科技大学の劉宇教授チームと浙江大学-SenseTime合同研究室の周暁偉教授チー...

ファーウェイ、2020年に向けて次世代マシンビジョンカメラと新製品を発表

【中国杭州、2020年5月25日】本日、「クリエイティブビジョン | インテリジェントな世界への目を...

Aスターアルゴリズムの実装手順のJavaバージョン

スターアルゴリズムの手順: 1. 最初に、オープン リストに開始点を追加します。 2. オープンリス...

8 月の Github のトップ 10 ディープラーニング プロジェクト、あなたはどれを選びますか?

ビッグデータダイジェスト制作編集者: CoolBoyみなさん、こんにちは! 先月のトップ 10 の機...

UCLA Chineseが新しい自動演奏メカニズムを提案しました! LLMは自己学習し、その効果はGPT-4の専門家の指導よりも優れている

合成データは、大規模言語モデルの進化において最も重要な基礎となっています。昨年末、一部のネットユーザ...

3Dを理解する言語モデルが登場! UCLA、上海交通大学、MITなどが共同で3D-LLMを提案:パフォーマンスが9%向上

大規模言語モデル (LLM) と視覚言語モデル (VLM) は、画像からの発話や常識的な推論の実行な...

...

AIを活用して都市の建物の特性を識別し、地震などの災害に対するリスクを予測する

ビッグデータダイジェスト制作出典: サイエンスデイリー編集者: ジェーン人工知能は、ビジネスから工業...

...

救世主か、それとも公敵か? 人工知能の現在と未来を説明する記事

囲碁チャンピオンのイ・セドルを破ったロボット「アルファ碁」から、卓球ができるKUKAロボット、遠隔手...

2023年に人工知能とデータサイエンスについて知っておくべきこと

人工知能とデータサイエンスは、2023 年に最もエキサイティングで影響力のある 2 つのテクノロジー...

国産初のオープンソースMoE大型モデルが登場!パフォーマンスはLlama 2-7Bに匹敵し、計算量は60%削減されます。

オープンソースのMoEモデルがついに国内初のプレイヤーを迎えます!そのパフォーマンスは高密度の Ll...