厚いコードが入ったチャットのスクリーンショットも安全ではありません。マスターは数分で復元するアルゴリズムを作成しました

厚いコードが入ったチャットのスクリーンショットも安全ではありません。マスターは数分で復元するアルゴリズムを作成しました

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

怖い話をしてください。

今朝、同僚とWeChatでチャットをしていて、女性の同僚の最近の変化について話しました。

その結果、彼はテキストをモザイク処理し、スクリーンショットを撮ってグループに投稿しました。

私はさらにもう一撃加えました:

@XXX、彼はあなたについて悪いことを言いました〜

予想外に、この同僚は積極的に近づいてきて、「秘密のテキスト」の内容を直に指摘しました。

当時の私はこんな感じでした。

これを見た先生はこう付け加えた。

いつの時代ですか?ぼかしたら判別できなくなると思いますか?数分で復元できます!

好奇心が湧いたので、私はすぐにこの技術についての「調査」を始めました。

(追記:元のチャット画像は記事の最後に掲載しています)

モザイク化されたテキストを復元するにはどうすればいいですか?

さらに、外資系企業の主任研究員であるダン・ペトロ氏(以下、ダン)が、この2日間でこんな投稿をした。

彼はすぐに本題に入った。

モザイク化(ピクセル化)は非常に悪質かつ危険な方法であり、機密データが漏洩する可能性があります。

ダンは彼の主張を裏付けるために、  編集解除 ツール。

次に、このツールを使ってモザイクテキストを少しずつ復元する方法を実演しました。

上記の例から、元のテキストが厚いモザイク層で覆われていても、このツールの前では「裸」のように見えることは難しくありません。

おそらく、この装置の操作は複雑だと言うでしょう?

いやいやいや。

とても簡単です。たった 2 つのステップです。

  • npm installで依存関係をインストールする
  • npm startで開始する

モザイク画も復元されている

しかし、非常に現実的な問題は、Depix によって復元されたテキストは視覚効果の点であまり良くないということです。

Depix で復元したテキストは、まだところどころぼやけています。

そこで、Jumpsec Lab の研究者がこの件を指摘し、興味深い課題も提示しました。

パスワードを解読してしまった場合は、ご連絡ください。

この課題は Dan に大きな関心を呼び起こし、Unredacter を開発するに至りました。

そこで、Unredacter の助けを借りて、Dan はこの課題を無事に克服しました。

その後、ダンは研究者に連絡を取り、研究者は電子メールで返信し、ダンの結果が正しいことを確認しました。

それだけでなく、ダンは、スミアリングによって作成されたモザイクの場合、GiMP、Photoshop、その他のエディターのいずれでも結果が同じになることも紹介しました。

したがって、彼のクラッキング方法はある程度の普遍性を持っているはずです。

もちろん、私たちは生活の中である程度「コーディング」する必要があります。モザイクは安全ではないので、もっと良い方法はあるのでしょうか?

これに対するダンの返答は次のとおりです。

黒いバーを使用してブロックします。

モザイク画も復元されている

実際、AIコミュニティでは「モザイクの復元」という問題を長らく研究してきました。

例えばデューク大学  PLUSEもその1つで、CVPRでもトップになりました。

ただし、修復されるのはテキストではなく、ポートレートです。例:

原理的な観点から見ると、それは本質的に生成的敵対ネットワークです。   (GAN)

PLUSE は主に、ぼやけたモザイク ピクセルに基づいて存在しない新しい顔を「描画」し、それをモザイク状態に圧縮して元の画像と比較し、類似したバージョンを表示します。

もちろん、この技術は完璧ではなく、失敗することもあります。

例えば、ネットユーザーがマリオで試してみたところ、結果は…

うーん…この「味」は普通じゃない。

もう一つ

最後に、冒頭の物語の答えを明らかにしましょう。

これは本当に痛い教訓です...

プロジェクトアドレス:

https://github.com/bishopfox/unredacter

<<:  ハイパーオートメーション — AIの新時代における自動化

>>:  陳丹奇と清華大学特別賞受賞学生が新たな成果を発表:Google BERTが提案したトレーニングルールを破る

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

Google の請負業者が組合結成に投票: 権利の保護を希望

2018年11月1日、職場の問題に対する世界的な抗議活動の一環として、一部の従業員がGoogleの英...

K近傍教師あり学習マシンアルゴリズムの詳細な分析

翻訳者 | 朱 仙中校正 | 梁哲、孫淑娟K 近傍法 (KNN) は、機械学習アルゴリズムにおける回...

有名人の「ペイント肌」顔変更技術を悪用したいたずら合成AI動画の調査

[[265249]]新華社、上海、5月13日。AI技術の発展により、動画の顔を変える技術的ハードルが...

モノのインターネットはスマートな衛生設備を創り出し、都市環境の衛生を細かく管理します

旅行のピーク時に都市環境衛生がより大きな圧力に耐えられるか?清掃車両と清掃作業員をより適切に管理する...

このスタートアップは、アイドル状態のGPUを分散ネットワークに接続することで、AIモデルのトレーニングコストを90%削減できると主張している。

モンスターAPIは、採掘機器などのGPUコンピューティングパワーを使用してAIモデルをトレーニングし...

Apple: 画像モデルの事前トレーニングに言語モデルの自己回帰アプローチを使用する

1. 背景GPTなどの大規模モデルの登場後、言語モデルのTransformer +自己回帰モデリング...

...

サイバーセキュリティの専門家は、悪意のあるAIが広がり始めると述べている

調査レポートによると、26%の人が、既知のサイバーセキュリティ対策のほとんどを回避できる悪意のあるA...

いくつかの典型的なアルゴリズム面接の質問に対する Java ソリューション

質問1:公共クラスtestClockwiseOutput { //行列を時計回りに印刷する @テスト...

日常アルゴリズムのパスの合計について話す

[[426794]]この記事はWeChatの公開アカウント「3分でフロントエンドを学ぶ」から転載した...

ディープラーニングとディープクローニング: チャットボットにとってより優れたソリューションはどちらでしょうか?

[[200112]]編集者注: チャットボットは目新しいものではありません。Facebook や ...

...

ビッグデータとリアルタイム分析のためのアルゴリズム分類

今日、ビッグデータ技術の発展と進歩により、大量のデータを収集および送信するための新しい、より効率的な...