人工知能は非常に人気があります。PULSE は低品質のモザイク画像を保存し、数秒で高解像度の画像に変換できます。

人工知能は非常に人気があります。PULSE は低品質のモザイク画像を保存し、数秒で高解像度の画像に変換できます。

[51CTO.com オリジナル記事] モザイクとはどういう意味ですか?従来のモザイクは、主に映画やテレビのメディアで重要な領域をカバーしたり、ぼかし処理を行ったりするために使用されます。例えば、動画では、人物の顔やその他の部分が露出すると不都合な場合、モザイクという芸術的な加工技術を使って隠します。

1950年代以降、世界的な映画産業の発展に伴い、映画には流血シーンやポルノシーンが頻繁に登場するようになり、18歳以下の鑑賞に適さないシーンにはモザイク処理を施すよう求める声も出始めた。それ以来、モザイクには新たな役割が加わった。オリジナルのハイビジョン画像の一部が太い小さな四角で覆われ、破ることのできない禁断の領域が形成されたのだ。これにより、数え切れないほどの情熱的な若者たちが頭を悩ませ、モザイクで覆われた奇跡を見るために必死にそれを破る方法を探した。

人々がどれだけ努力しても、モザイクを破る方法を見つけることはできません。しかし、技術の発達により、モザイクを破ることが現実のものとなりました。米国のデューク大学の研究者数名は、PULSE AIアルゴリズムを使用してモザイクを完全に除去し、モザイク前のピクセル効果を実現しました。

[[384230]]

では、モザイクレベルの画像を数秒で高解像度に変換するにはどうすればよいでしょうか? PULSE アルゴリズムは、わずか数秒で 16 x 16 ピクセルの低解像度画像を 64 倍の 1024 x 1024 ピクセルの高解像度画像に拡大し、元々存在しなかった特徴を「想像」することができます。アルゴリズムで処理すると、毛穴、小じわ、まつげ、無精ひげなど、元の LR 写真では確認できない細部もはっきりと確認できます。ただし、PULSE システムは、低解像度の画像を取得した後、ゆっくりと新しい詳細を追加するのではなく、AI によって生成された高解像度の画像を反復処理し、これらの高解像度の画像に対応する低解像度の画像を元の画像と比較し、最も近い画像を見つけます。たとえば、モザイク顔画像は PULSE アルゴリズムを使用して撮影され、最初に鼻、口、目などの顔の詳細を追加してからモザイクを追加します。次に、モザイク画像を元の画像と比較および調整し、元のモザイク画像と一致するまでアルゴリズムを継続的に繰り返します。つまり、「謎の」画像がデコードされます。

[[384231]]

元の LR 画像と、PULSE によって復元されてダウンスケールされた LR 画像は、それらに最も近い HR 画像と一致し、これが復元された HR 画像になります。

しかし、この技術には欠点もあり、取得した画像のデコード部分はソフトウェアによって想像されたものであり、必ずしも元の外観とは限らないため、違いが生じる可能性があります。したがって、この写真はぼやけた瞬間から別の写真となり、元の美しさに戻ることは決してできませんでした。

実際、この技術の登場には長所と短所の両方がある。例えば、画像の鮮明さの点では、考古学的なデータの信頼性が高まる可能性がある。あるいは、刑事映画のように、刑事警察がモザイク映像で容疑者をはっきりと見ることができない場合、容疑者の最も近い姿を生成し、大群衆の中で容疑者を逮捕するための強力なサポートを提供することができる。例えば、法廷番組では犯罪容疑者の顔が覆われていたり、映画やテレビ番組ではブランドロゴがぼやけたマットで描かれていたりしている。認識精度がますます向上しているGoogleマップでは、多くの場所がぼかされ、特別にモザイク処理されて、一部の軍事機密が隠されている。つまり、「コードを解読する」技術と能力があるなら、「コードを持つ」という安定性と権利も大切にしなければならないのです。

私たち全員が今も将来もモザイクを必要としていることは間違いありません。それは様々な形で現れますが、決して消えることはありません。 AIなどの技術の進歩により、検閲されたコンテンツはますます現実に近づくかもしれませんが、それが現実を実現するために必要かどうかは私たちが決めることができます。あるいは、本当に有益なところでは、愛情深く与え合えるかどうかを検討してください。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  機械学習とディープラーニングの5つの主な違い

>>:  人工知能開発の動向

ブログ    
ブログ    
ブログ    

推薦する

...

Alibaba Cloud が Tongyi Qianwen 2.0 をリリース、パフォーマンスが加速して GPT-4 に追いつく

2023年杭州雲奇大会において、アリババクラウド最高技術責任者の周景仁氏は、数千億のパラメータを持つ...

AI + eコマース: あなたのショッピング体験の責任者は誰ですか?

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...

2018年のAI革命で何が起こったか、何が起こらなかったか

[[253051]] 2018 年を振り返ると、人工知能はデジタル分野で急速な成長を続け、あらゆる業...

2018 年の人工知能の 8 つの主要トレンド!

[[251877]]計算の観点から見ると、ビッグデータ分析のトレンドは流れ星のように消えることはあ...

...

Face-api.jsフレームワークに基づいて、顔認識はフロントエンドで完了します

[[271667]]この記事では、ブラウザ上で動作する顔認識フレームワーク、Face-api.js ...

アルゴリズムの品質を評価するにはどうすればよいでしょうか?

序文アルゴリズムの品質を評価するには、そのアルゴリズムが問題を解決できるかどうかを確認することが重要...

99.9%の精度!小園口算は算数の問題をAIで訂正しており、誤り率は小学校教師の10分の1に過ぎない。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

人工知能とビッグデータがビジネス環境をどう変えるのか

人々がビジネスを行うようになって以来、ビジネスを強化するためにテクノロジーが活用されてきました。 1...

機械学習の応用シナリオは数多くありますが、金融分野での違いは何でしょうか?

[[241804]]ビッグデータダイジェスト制作編纂者:大迪、彭耀慧、茶曦、唐元、夏亜偉金融の世界...

...

危険が迫っています!マスク氏、AIが5年以内に人間を超える可能性があると警告

[[335742]]メディアの報道によると、7月30日、マスク氏はニューヨークタイムズ紙との独占イン...

NVIDIA の最も強力な汎用大型モデル Nemotron-4 が登場! 15Bが62Bに勝ち、ターゲットはA100/H100です。

最近、NVIDIA チームは、8T トークンでトレーニングされた 150 億のパラメータを持つ新しい...

カオスに基づくデジタル画像暗号化アルゴリズム

概要: 現在、カオスシステムと暗号化技術の組み合わせは、最もホットなトピックの 1 つです。多数の暗...