Google、ファイルサイズを35%削減できる新しいJPEGアルゴリズムをオープンソース化

Google、ファイルサイズを35%削減できる新しいJPEGアルゴリズムをオープンソース化

海外メディアの報道によると、Googleはファイルサイズを約35%削減、あるいはファイルサイズを変えずに画質を大幅に向上させることができる新しいJPEGアルゴリズムを開発し、オープンソース化したという。

重要なのは、WebP や WebM などの他の画像圧縮方法とは異なり、Google の新しい JPEG アルゴリズムは、既存のブラウザ、デバイス、写真、編集アプリケーション、および JPEG 標準と完全に互換性があることです。

[[185931]]

この新しい JPEG エンコーダーは Guetzli と呼ばれます。 Guetzli はスイスドイツ語で「クッキー」を意味する。おそらくこのプロジェクトがチューリッヒにある同社の研究開発部門である Google Research によって開発されたためだろう。

JPEG 画像の品質とファイル サイズを調整する方法は多数ありますが、Guetzli は圧縮の階層段階に重点を置いています。簡単に言えば、階層化とは、大量の順序付けられていないデータ (圧縮が難しい) を順序付けられたデータ (圧縮が非常に簡単なデータ) に変換しようとするプロセスです。 JPEG エンコード処理中、ソフト カラー グラデーションは通常、単一のカラー ブロックに簡略化され、その中の細かい詳細は完全に削除されます。

このプロセスの難しさは、詳細の削除とファイル サイズの縮小の間のバランスを見つけることです。この時点で、各非可逆エンコーダー (libjpeg、x264、lame など) はそれぞれ異なる方法で処理を行います。

Google Research によると、Guetzli 氏は新しい心理視覚モデル (Butteraugli と呼ばれる) を使用して、どの色と詳細を残し、どれを削除するかを決定しました。この文脈における心理視覚とは、人間の視覚処理システムに基づいていることを意味します。 Butteraugli の正確な詳細は、色知覚と視覚マスキングのおおよそのモデルを生成する数百の高精度定数に隠されています。

ただし、Google Research がこれらの高精度の定数をどのように計算したかはわかりません。これらの定数はコンピューターで生成されたか、少なくともコンピューターで最適化されたようです。

Guetzli は主にファイル サイズを縮小するために使用されますが、Google Research では、同じファイル サイズを維持しながら JPEG 画像の品質を向上させるためにも使用できると考えています。研究者が Guetzli でエンコードされた画像と libjpeg (人気のオープンソース エンコーダー) でエンコードされた画像を評価したところ、参加者の 75 パーセントが Guetzli を好みました。

Guetzli は Github から無料でダウンロードできます。 Web エンジニア、グラフィック デザイナー、写真家など、どなたでもぜひお試しください。 Guetzli ではより多くの階層化プロセスが実行されるため、Guetzli を使用した画像圧縮は libjpeg を使用した画像処理よりも遅くなることに注意してください。

<<:  ニューラルネットワークの不気味な評判

>>:  音声認識データベースが人工知能の中核となる

ブログ    

推薦する

「中関村スマートAIパートナープログラム」の登録受付が開始

「中関村スマート人工知能パートナープログラム」(以下、プログラム)の登録は2021年3月1日に正式に...

...

Kingsoft Cloudは、スマートシティ構築のパートナーとなり、人間中心のスマートシティエコシステムを構築することを目指しています。

スマートシティはデジタル中国とスマート社会の中核を担うものとして国家戦略のレベルにまで高まり、現在中...

産業オペレーションの深化が人工知能コンピューティングセンター構築の鍵

新たな科学技術革命と産業革命の到来とともに、デジタル経済は第四次産業革命の重要な礎となり、新たな組織...

...

清華大学の学生が強化学習プラットフォーム「TianShou」を開発:数千行のコードが完成、オープンソース化

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

ニューヨーク・タイムズは、自社のニュース記事をAIモデルの訓練に利用することを禁止し、OpenAIを訴えることを検討している。

NPRによると、OpenAIは、自社の人工知能(AI)モデルのトレーニングにニューヨーク・タイムズ...

自動運転車は複雑な相互作用の問題をどのように解決するのでしょうか?清華大学とMITが共同でM2Iソリューションを提案

自動運転車が公道を走るようになると、必然的に道路上の「暗黙のルール」のいくつかを学習する必要が出てき...

人工知能のビジネス価値を最大限に引き出すための10の重要な役割

あらゆる業界でますます多くの企業が、ビジネス プロセスを変革するために AI を導入しています。しか...

労働者は大きなモデルに遭遇します。外の世界はすでにこのように機能しているのでしょうか?

オフィスのシナリオでは、PPT の作成は最も一般的なタスクの 1 つです。業務報告、製品発表、イベン...

Tencent TRS: 産業実践におけるメタ学習とクロスドメイン推奨

1. メタ学習1. パーソナライズモデリングの問題点推奨シナリオでは、データの 80% 分布の問題に...

人工知能アルゴリズムが構造生物学の難問を解決

新しい人工知能アルゴリズムは、RNA 分子の正しい 3 次元構造を間違ったものから選び出すことができ...

...