データは1/5000に縮小されたが、モデルの精度は2倍に。Googleの新しい「蒸留法」が人気に

データは1/5000に縮小されたが、モデルの精度は2倍に。Googleの新しい「蒸留法」が人気に

[[441258]]

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

錬金術のプロセスでは、トレーニングに必要なリソースを削減するために、ML 担当者は、圧縮前と同じ結果を確保しながら、大規模で複雑なモデルを小さなモデルに「蒸留」することがあります。

これは知識蒸留、つまりモデルの圧縮/トレーニング方法です。

しかし、技術の発展に伴い、蒸留の対象は徐々にデータセットへと拡大してきました。

Google は最近、データセット抽出の新しい方法を 2 つ提案しました。これは Twitter で大きな話題となり、600 回以上閲覧されました。

このように、50,000枚の注釈付き画像のCIFAR-10データセットをそのサイズの1/5000に「蒸留」し、 10個の合成データポイントのみでトレーニングすることで、モデルの精度は依然として51%近くになります。

△上: 元のデータセット 下: 蒸留後

「蒸留データセット」が 500 枚の画像 (元のデータセットの 1% のサイズ) で構成されている場合、その精度は 80% に達します。

2 つのデータセット蒸留方法は、それぞれ ICLR 2021 と NeurIPS 2021 の 2 つの論文から得たものです。

2段階ループによる最適化

では、データセットをどのように「抽出」できるのでしょうか?

実際、これは 2 段階の最適化プロセスに相当します。

  1. 学習データでモデルをトレーニングするために使用される「内部ループ」
  2. 「外側のループ」は、自然データに対する学習データのパフォーマンスを最適化するために使用されます。

内側のループを通じてカーネル リッジ回帰 (KRR) 関数を取得し、外側のループで元の画像注釈とカーネル リッジ回帰関数で予測された注釈の間の平均二乗誤差 (MSE) を計算します。

現時点では、Google が提案する 2 つの方法には、処理ルートが異なります。

1.ラベルの説明(LS)

このアプローチは、KRR 損失関数を最小化するサポート ラベルのセットを直接解釈し、各サポート イメージに対して一意の高密度注釈ベクトルを生成します。

△ 青: オリジナルのワンホットアノテーション オレンジ: LSによって生成された密なアノテーション

2.カーネル誘導ポイント(KIP)

このアプローチは、勾配ベースの方法を通じて KRR 損失関数を最小化することにより、画像と生成される可能性のあるデータを最適化します。

MNIST を例にとると、下の図の上、中、下の画像はそれぞれ、元の MNIST データセット、固定注釈付きの KIP 蒸留画像、最適化された注釈付きの KIP 蒸留画像です。

データセットを精製する際に、注釈を最適化することで最良の効果が得られることがわかります。

既存の DC (データセット凝縮) 方式と DSP (微分可能な Siamese Augmentation によるデータセット凝縮) 方式を比較すると、次のことがわかります。

カテゴリごとに 1 つの画像のみ、つまり最終的に 10 枚の画像のみを含む蒸留データセットを使用する場合、KIP メソッドのテスト セットの精度は、DC メソッドや DSP メソッドよりも一般的に高くなります。

CIFAR-10 分類タスクでも、LS は従来の方法よりも優れており、KIP ではパフォーマンスが 2 倍になることさえあります。

これに対してGoogleは次のように答えた。

これは、場合によっては、100 倍小さい「蒸留データセット」の方が元のデータセットよりもパフォーマンスが優れていることを示しています。

2人の中国人作家

プロジェクト全体は、Lechao Xiao、Zhourong Chen、Roman Novak によって完成されました。

そのうち、シャオ・レチャオ氏は LS 法に関する論文の著者の一人です。浙江大学応用数学科を卒業し、イリノイ大学アーバナ・シャンペーン校 (UIUC) で博士号を取得しました。現在は Google Brain チームの科学者です。

彼の主な研究対象は数学、機械学習、ディープラーニングです。

[[441260]]

もう一人の中国人科学者、Zhourong Chen 氏も KIP 法に関する論文の著者の一人です。彼は中山大学で学士号を取得し、香港科技大学でコンピュータサイエンスとエンジニアリングの博士号を取得しました。現在は Google Research のソフトウェア エンジニアです。

紙:
[1] https://openreview.net/forum?id=l-PrrQrK0QR
[2] https://openreview.net/forum?id=hXWPpJedrVP

オープンソースアドレス:
https://github.com/google-research/google-research/tree/master/kip

<<:  MITの新しい研究により、物体間の潜在的な関係性を理解し、AIが人間のように世界を「見る」ことが可能になった。

>>:  美団下華夏:「無人配達」は技術的に難しいことではない

ブログ    

推薦する

2019年、小売業界はこれら10のテクノロジーによって革命を起こすでしょう。

[[252097]] 2013年から2018年にかけて、AI + 小売業の新興企業は374件の取引...

女性の労働はAIに置き換えられやすいのか?

最近の多くの研究では、主に人工知能や自動化における技術の進歩が、男性よりも女性の雇用に大きな影響を与...

Gonex CEO ウェン・メンフェイ氏との独占インタビュー: アプリケーションの分野では、モデル自体よりも意図の認識の方が重要です。

ゲスト | ウェン・メンフェイインタビュー&執筆 | Yun Zhao潮が満ちると、何千もの船が動き...

AIユニコーンがIPOに群がり、資本市場を刺激。シナリオアプリケーションは複数の場所で爆発的に増加する可能性がある

美景記者:李紹廷 美景編集者:温多2020年を振り返ると、新型コロナウイルス感染症の突然の流行は間違...

無料の Python 機械学習コース 8: 精度と再現率

機械学習における偏ったデータセットの扱い方偏ったデータセットで効果的な機械学習アルゴリズムを開発する...

ヘルスケアにおける人工知能の課題にどう対処するか

[[384554]]人工知能は、人類がより早く、より効果的に病気と闘い、より健康的な生活を送るのに役...

...

...

ビッグデータは古い顧客を殺しています。消費者が権利を守るのは困難です。アルゴリズムの不公平な適用をどのように規制すべきでしょうか?

プラットフォーム経済の急速な発展に伴い、オンラインショッピング、交通、旅行宿泊、食品配達、オンライン...

監督が消えた! Midjourney+Miaoyaカメラ+Gen2の新ゲームプレイ:10元でMuskユニバースを作成し、ワンクリックでビデオを作成します

生成 AI の爆発的な増加により、無限の可能性がもたらされました。最近、国内ではミャオヤカメラがイン...

IBM TRIRIGA統合ワークプレイス管理システムに新機能が追加

IBMは、人工知能とほぼリアルタイムの洞察を活用して組織が安全で効率的かつ生産性の高い職場を構築でき...

学生の未来を照らすSquirrel AIは、すべての子供にAIスーパー教師を授けます

[51CTO.com からのオリジナル記事] 人工知能技術のさらなる進歩により、教師が本来行わなけれ...

...