Google、ファイルサイズを35%削減できる新しいJPEGアルゴリズムをオープンソース化

Google、ファイルサイズを35%削減できる新しいJPEGアルゴリズムをオープンソース化

海外メディアの報道によると、Googleはファイルサイズを約35%削減、あるいはファイルサイズを変えずに画質を大幅に向上させることができる新しいJPEGアルゴリズムを開発し、オープンソース化したという。

重要なのは、WebP や WebM などの他の画像圧縮方法とは異なり、Google の新しい JPEG アルゴリズムは、既存のブラウザ、デバイス、写真、編集アプリケーション、および JPEG 標準と完全に互換性があることです。

[[185931]]

この新しい JPEG エンコーダーは Guetzli と呼ばれます。 Guetzli はスイスドイツ語で「クッキー」を意味する。おそらくこのプロジェクトがチューリッヒにある同社の研究開発部門である Google Research によって開発されたためだろう。

JPEG 画像の品質とファイル サイズを調整する方法は多数ありますが、Guetzli は圧縮の階層段階に重点を置いています。簡単に言えば、階層化とは、大量の順序付けられていないデータ (圧縮が難しい) を順序付けられたデータ (圧縮が非常に簡単なデータ) に変換しようとするプロセスです。 JPEG エンコード処理中、ソフト カラー グラデーションは通常、単一のカラー ブロックに簡略化され、その中の細かい詳細は完全に削除されます。

このプロセスの難しさは、詳細の削除とファイル サイズの縮小の間のバランスを見つけることです。この時点で、各非可逆エンコーダー (libjpeg、x264、lame など) はそれぞれ異なる方法で処理を行います。

Google Research によると、Guetzli 氏は新しい心理視覚モデル (Butteraugli と呼ばれる) を使用して、どの色と詳細を残し、どれを削除するかを決定しました。この文脈における心理視覚とは、人間の視覚処理システムに基づいていることを意味します。 Butteraugli の正確な詳細は、色知覚と視覚マスキングのおおよそのモデルを生成する数百の高精度定数に隠されています。

ただし、Google Research がこれらの高精度の定数をどのように計算したかはわかりません。これらの定数はコンピューターで生成されたか、少なくともコンピューターで最適化されたようです。

Guetzli は主にファイル サイズを縮小するために使用されますが、Google Research では、同じファイル サイズを維持しながら JPEG 画像の品質を向上させるためにも使用できると考えています。研究者が Guetzli でエンコードされた画像と libjpeg (人気のオープンソース エンコーダー) でエンコードされた画像を評価したところ、参加者の 75 パーセントが Guetzli を好みました。

Guetzli は Github から無料でダウンロードできます。 Web エンジニア、グラフィック デザイナー、写真家など、どなたでもぜひお試しください。 Guetzli ではより多くの階層化プロセスが実行されるため、Guetzli を使用した画像圧縮は libjpeg を使用した画像処理よりも遅くなることに注意してください。

<<:  ニューラルネットワークの不気味な評判

>>:  音声認識データベースが人工知能の中核となる

ブログ    

推薦する

生成 AI、その開発は持続可能か?

シャム・ナンダン・ウパディヤイノアが編集制作:51CTO テクノロジースタック(WeChat ID:...

コーディング能力はGPT-4を超え、このモデルはBig Codeランキングでトップとなり、YC創設者も賞賛している

GPT-4を上回るコーディング能力を持つと主張するモデルが、多くのネットユーザーの注目を集めている。...

インテリジェントオートメーション: コンピュータビジョン、AI、ARが統合されるとき

インテリジェント オートメーションは、業界がまだビジネスに統合していない、かなり新しい概念です。この...

...

...

人間の脳神経を模倣してAIを開発!ケンブリッジ大学の最新研究がネイチャー誌に掲載:人工脳がAIの新たな方向性となる

地球上で最も複雑な知能の担い手である人間の脳の最大の特徴の 1 つは、高いエネルギー効率で知能を生み...

ニューラル放射線フィールドは「神経」を取り除き、3D効果の品質を低下させることなくトレーニング速度を100倍以上向上させます。

2020年、カリフォルニア大学バークレー校、Google、カリフォルニア大学サンディエゴ校の研究者...

...

...

ロボット工学が産業界のデジタル革命を推進

近年、自動化プロセスの導入は世界中で加速しています。生産効率の大幅な向上により、低技能労働者の代わり...

Appleのアプリランキングアルゴリズム調整の裏側:ランキング管理企業が一夜にして沈黙

4月1日早朝のニュース:3月初旬から、AppleはAppランキングアルゴリズムを徐々に調整し、ランキ...

GPT-4 パラメータに関する最新の情報! 1.76兆個のパラメータ、8220億個のMoEモデル、PyTorchの創設者は確信している

皆さん、GPT-4 のパラメータは 1 兆を超える可能性があります。最近、アメリカの有名なハッカーで...

ビジュアル Transformer アーキテクチャの進歩を整理した記事: CNN と比較して、ViT が勝っているのはどこでしょうか?

注意ベースのエンコーダー/デコーダー アーキテクチャである Transformer は、自然言語処理...

6つの新しいことに焦点を当て、新境地を開拓し、プロジェクトは変革を促進するための王様です。2020年中国(太原)人工知能会議が開催されました

2002年から2012年までの石炭の「黄金の10年」を経験した後、「古い工業基地」である山西省太原市...

クレジットカード詐欺を防ぐために、機械学習アルゴリズムがあなたの身元を認識します

クレジットカード詐欺のリスクは、世界中の銀行のクレジットカード部門を悩ませている問題の一つとなってい...