厚いコードが入ったチャットのスクリーンショットも安全ではありません。マスターは数分で復元するアルゴリズムを作成しました

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

怖い話をしてください。

今朝、同僚とWeChatでチャットをしていて、女性の同僚の最近の変化について話しました。

その結果、彼はテキストをモザイク処理し、スクリーンショットを撮ってグループに投稿しました。

私はさらにもう一撃加えました:

@XXX、彼はあなたについて悪いことを言いました〜

予想外に、この同僚は積極的に近づいてきて、「秘密のテキスト」の内容を直に指摘しました。

当時の私はこんな感じでした。

これを見た先生はこう付け加えた。

いつの時代ですか？ぼかしたら判別できなくなると思いますか？数分で復元できます!

…

好奇心が湧いたので、私はすぐにこの技術についての「調査」を始めました。

（追記：元のチャット画像は記事の最後に掲載しています）

モザイク化されたテキストを復元するにはどうすればいいですか?

さらに、外資系企業の主任研究員であるダン・ペトロ氏（以下、ダン）が、この2日間でこんな投稿をした。

彼はすぐに本題に入った。

モザイク化（ピクセル化）は非常に悪質かつ危険な方法であり、機密データが漏洩する可能性があります。

ダンは彼の主張を裏付けるために、 編集解除 ツール。

次に、このツールを使ってモザイクテキストを少しずつ復元する方法を実演しました。

上記の例から、元のテキストが厚いモザイク層で覆われていても、このツールの前では「裸」のように見えることは難しくありません。

おそらく、この装置の操作は複雑だと言うでしょう?

いやいやいや。

とても簡単です。たった 2 つのステップです。

npm installで依存関係をインストールする
npm startで開始する

モザイク画も復元されている

しかし、非常に現実的な問題は、Depix によって復元されたテキストは視覚効果の点であまり良くないということです。

Depix で復元したテキストは、まだところどころぼやけています。

そこで、Jumpsec Lab の研究者がこの件を指摘し、興味深い課題も提示しました。

パスワードを解読してしまった場合は、ご連絡ください。

この課題は Dan に大きな関心を呼び起こし、Unredacter を開発するに至りました。

そこで、Unredacter の助けを借りて、Dan はこの課題を無事に克服しました。

その後、ダンは研究者に連絡を取り、研究者は電子メールで返信し、ダンの結果が正しいことを確認しました。

それだけでなく、ダンは、スミアリングによって作成されたモザイクの場合、GiMP、Photoshop、その他のエディターのいずれでも結果が同じになることも紹介しました。

したがって、彼のクラッキング方法はある程度の普遍性を持っているはずです。

もちろん、私たちは生活の中である程度「コーディング」する必要があります。モザイクは安全ではないので、もっと良い方法はあるのでしょうか?

これに対するダンの返答は次のとおりです。

黒いバーを使用してブロックします。

モザイク画も復元されている

実際、AIコミュニティでは「モザイクの復元」という問題を長らく研究してきました。

例えばデューク大学は PLUSEもその1つで、CVPRでもトップになりました。

ただし、修復されるのはテキストではなく、ポートレートです。例:

原理的な観点から見ると、それは本質的に生成的敵対ネットワークです。 （GAN）。

PLUSE は主に、ぼやけたモザイクピクセルに基づいて存在しない新しい顔を「描画」し、それをモザイク状態に圧縮して元の画像と比較し、類似したバージョンを表示します。

もちろん、この技術は完璧ではなく、失敗することもあります。

例えば、ネットユーザーがマリオで試してみたところ、結果は…

うーん…この「味」は普通じゃない。

もう一つ

最後に、冒頭の物語の答えを明らかにしましょう。

これは本当に痛い教訓です...

プロジェクトアドレス:

https://github.com/bishopfox/unredacter

<<: ハイパーオートメーション — AIの新時代における自動化

>>: 陳丹奇と清華大学特別賞受賞学生が新たな成果を発表：Google BERTが提案したトレーニングルールを破る

ブログ

データサイエンティストが最もよく使用するアルゴリズム10選

ブログ

AIによる決定をどのように説明するのでしょうか?この記事では、アルゴリズムの適用シナリオと解釈可能性を整理します。

ブログ

PyTorch エクスペリエンスガイド: ヒントと落とし穴

ブログ

2020年東京五輪の秘密兵器が暴露される：AIは計時を担当するだけでなく、審判員の職を失わせる

ブログ

ロボット「シェフ」がニューヨークに登場、1時間で300個の巻き寿司を作れる！

ブログ

厚いコードが入ったチャットのスクリーンショットも安全ではありません。マスターは数分で復元するアルゴリズムを作成しました

モザイク化されたテキストを復元するにはどうすればいいですか?

モザイク画も復元されている

モザイク画も復元されている

もう一つ

データサイエンティストが最もよく使用するアルゴリズム10選

AIによる決定をどのように説明するのでしょうか?この記事では、アルゴリズムの適用シナリオと解釈可能性を整理します。

PyTorch エクスペリエンスガイド: ヒントと落とし穴

2020年東京五輪の秘密兵器が暴露される：AIは計時を担当するだけでなく、審判員の職を失わせる

ロボット「シェフ」がニューヨークに登場、1時間で300個の巻き寿司を作れる！

推薦する

この論文は最初のICLRで却下され、コードは最適化されすぎていた。word2vecの作者であるTomas Mikolov氏がその裏話を語った。

Google の請負業者が組合結成に投票: 権利の保護を希望

K近傍教師あり学習マシンアルゴリズムの詳細な分析

有名人の「ペイント肌」顔変更技術を悪用したいたずら合成AI動画の調査

モノのインターネットはスマートな衛生設備を創り出し、都市環境の衛生を細かく管理します

このスタートアップは、アイドル状態のGPUを分散ネットワークに接続することで、AIモデルのトレーニングコストを90%削減できると主張している。

ChatGPT がデビューしてから 1 年が経ちましたが、GenAI は CISO にとって恩恵となるのでしょうか、それとも災いとなるのでしょうか?

Apple: 画像モデルの事前トレーニングに言語モデルの自己回帰アプローチを使用する

サイバーセキュリティの専門家は、悪意のあるAIが広がり始めると述べている

いくつかの典型的なアルゴリズム面接の質問に対する Java ソリューション

日常アルゴリズムのパスの合計について話す

ディープラーニングとディープクローニング: チャットボットにとってより優れたソリューションはどちらでしょうか?

ビッグデータとリアルタイム分析のためのアルゴリズム分類