「概念のドリフト」問題と闘おう! Google が新しい時間認識フレームワークをリリース: 画像認識精度が 15% 向上

「概念のドリフト」問題と闘おう! Google が新しい時間認識フレームワークをリリース: 画像認識精度が 15% 向上

機械学習の分野では、コンセプトドリフトという問題が長い間研究者を悩ませてきました。つまり、データの分布が時間の経過とともに変化し、モデルの有効性を維持することが困難になるのです。

注目すべき例としては、CLEAR 非定常学習ベンチマークからの画像の表示があり、物体の視覚的特徴が 10 年間で大きく変化したことが明らかになっています。

この現象は「スローコンセプトドリフト」と呼ばれ、オブジェクト分類モデルにとって深刻な課題となります。物体の外観や特性が時間の経過とともに変化する場合、モデルがそのような変化に適応し、正確に分類し続けることができるようにする方法が研究者の焦点となっています。

最近、この課題に応えて、Google AI の研究者は最適化主導型の手法 MUSCATEL (Multi-Scale Temporal Learning) を提案しました。これにより、大規模で動的なデータセットにおけるモデルのパフォーマンスが大幅に向上しました。この作品はAAAI2024に掲載されました。

論文アドレス: https://arxiv.org/abs/2212.05908

現在、確率ドリフトに対する主流のアプローチは、オンライン学習と継続学習です。

これらの方法の中心的な考え方は、最新のデータに適応するためにモデルを継続的に更新することで、モデルを最新の状態に保つことです。しかし、このアプローチには 2 つの根本的な問題があります。

まず、最新のデータのみに焦点を当てる傾向があり、過去のデータに含まれる貴重な情報が無視されてしまいます。第二に、これらの方法では、すべてのデータインスタンスの寄与が時間の経過とともに均一に減少すると想定していますが、これは現実世界の実際の状況と一致しません。

MUSCATEL メソッドはこれらの問題を効果的に解決できます。トレーニング インスタンスに重要度スコアを割り当て、将来のインスタンスでモデルのパフォーマンスを最適化します。

この目的のために、研究者らは、インスタンスとその年齢を組み合わせてスコアを生成する補助モデルを導入しました。補助モデルとメインモデルは協力して学習し、2 つの主要な問題を解決します。

この方法は実際のアプリケーションで優れたパフォーマンスを発揮します。9 年間にわたる 3,900 万枚の写真の大規模な実世界データセットを対象とした実験では、他の定常学習ベースライン方法と比較して精度が 15% 向上しました。

同時に、2 つの非定常学習データセットと継続的な学習環境においても、SOTA 手法よりも優れた結果を示しています。

教師あり学習におけるコンセプトドリフトの課題

教師あり学習におけるコンセプトドリフトの課題を研究するために、研究者らは、過去 10 年間のソーシャル メディアの写真約 3,900 万枚を使用して、写真分類タスクにおけるオフライン トレーニングと継続的トレーニングを比較しました。

下の図に示すように、オフライン トレーニング モデルは初期パフォーマンスは高いものの、壊滅的な忘却により時間の経過とともに精度が低下し、初期データの理解が低下します。

対照的に、継続的にトレーニングされたモデルは、初期のパフォーマンスは低くなりますが、古いデータへの依存度が低く、テスト中により速く劣化します。

これは、データが時間の経過とともに進化するにつれて、2 つのモデルの適用性が低下することを示しています。コンセプトドリフトは教師あり学習にとって課題となるため、データの変化に適応するためにモデルを継続的に更新する必要があります。

マスカット

MUSCATEL は、ゆっくりとしたコンセプトドリフトの課題に対処するために設計された革新的なアプローチです。オフライン学習と継続学習の利点を巧みに組み合わせることで、将来的にモデルのパフォーマンス低下を軽減することを目指しています。

膨大な量のトレーニングデータに対して、MUSCATEL は独自の魅力を発揮しました。従来のオフライン学習に依存するだけでなく、これに基づいて過去のデータの影響を慎重に調整および最適化し、モデルの将来のパフォーマンスのための強固な基盤を築きます。

新しいデータに対するメイン モデルのパフォーマンスをさらに向上させるために、MUSCATEL は補助モデルを導入します。

下の図の最適化目標に従って、トレーニング補助モデルは、各データ ポイントの内容と年齢に基づいて重みを割り当てます。この設計により、モデルは将来のデータ変更に適応しやすくなり、継続的な学習機能を維持できるようになります。

補助モデルをメインモデルと共進化させるために、MUSCATEL はメタ学習戦略も採用しています。

この戦略の鍵となるのは、下の図に示すように、複数の固定減衰時間スケールを組み合わせることで、サンプル インスタンスの寄与を年齢とセットの重みから効果的に分離することです。

さらに、MUSCATEL は、より正確な学習のために、各インスタンスを最も適切な時間スケールに「割り当てる」ことを学習します。

インスタンスの重み付けスコアリング

下の図に示すように、CLEAR オブジェクト認識チャレンジでは、学習した補助モデルがオブジェクトの重みを正常に調整し、新しい外観のオブジェクトの重みが増加し、古い外観のオブジェクトの重みが減少しました。

勾配ベースの特徴重要度評価により、補助モデルは背景やインスタンスの年齢とは無関係な特徴ではなく、画像内の被写体に焦点を当てていることが判明し、その有効性が実証されました。

大規模な写真分類タスクにおける大きな進歩

大規模写真分類タスク (PCAT) は、YFCC100M データセットで研究され、最初の 5 年間のデータがトレーニング セットとして、最後の 5 年間のデータがテスト セットとして使用されます。

重み付けされていないベースラインやその他の堅牢な学習手法と比較すると、MUSCATEL メソッドには明らかな利点があります。

特に、MUSCATEL アプローチでは、テスト中のパフォーマンスの大幅な向上と引き換えに、遠い過去のデータに対する精度を意図的に調整します。この戦略は、将来のデータに対するモデルの適応性を最適化するだけでなく、テスト中の劣化も低減します。

データセット全体にわたる広範な適用性の検証

非定常学習チャレンジのデータセットは、写真、衛星画像、ソーシャル メディアのテキスト、医療記録、センサーの読み取り値、表形式のデータなど、さまざまなデータ ソースとモードをカバーしており、データ サイズは 1 万インスタンスから 3,900 万インスタンスに及びます。各データセットの以前の最良の方法には異なる利点がある可能性があることに注意してください。ただし、下の図に示すように、データと方法の両方の多様性の文脈では、MUSCATEL メソッドは大きなゲイン効果を示しています。この結果は、MUSCATEL の幅広い適用性を十分に実証しています。

大規模データ処理の課題に対処するための継続学習アルゴリズムの拡張

膨大な大規模データに直面すると、従来のオフライン学習方法では圧倒されてしまうかもしれません。

この問題を念頭に置いて、研究チームは継続的学習にヒントを得た手法を巧みに改良し、大規模データの処理に簡単に適応できるようにしました。

この方法は非常にシンプルで、データの各バッチに時間重みを追加し、モデルを順番に更新します。

モデルの更新は最新のデータに基づいてのみ行われるなど、これには若干の制限がありますが、その効果は驚くほど良好です。

以下に示す写真分類ベンチマーク テストでは、この方法は従来の継続学習アルゴリズムやその他のさまざまなアルゴリズムよりも優れたパフォーマンスを発揮します。

さらに、その考え方は多くの既存の方法と互換性があるため、他の方法と組み合わせることでさらに驚くべき効果が期待できます。

全体として、研究チームはオフライン学習と継続学習をうまく組み合わせて、業界を長年悩ませてきたデータドリフトの問題を解決することに成功しました。

この革新的な戦略は、モデルの「破滅的な忘却」現象を大幅に緩和するだけでなく、大規模データの継続的な学習の将来の発展に新たな道を開き、機械学習の分野全体に新たな活力を注入します。

<<:  AI 生成ビデオにもう一つ大きな爆弾があるのでしょうか?アリ・エモはレオがラップし、ガオ・チチアンが法律を広めるなど、素晴らしいデビューを果たした。

>>:  生画像の新しい「マルチモーダル」AIテキストレンダリングはMidjourney + DALL·E 3に勝る!Karpathyが5億元の資金調達に投資

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

機械学習は自動化を成功させる鍵となるのでしょうか?

機械学習 (ML) は情報技術 (IT) の柱の 1 つであり、人工知能のサブセットとして定義できま...

...

...

12の性能項目で1位を獲得、GPT-4に最も近い中国最大級のモデルが登場!いよいよ本格的に営業開始です!

中国はいつになったら、極めて強力な一般化能力を持つさまざまな知的存在を創造し、人類の真の助手となるこ...

人工知能に基づく顔認識技術と評価システムの研究

[[428633]] 0 はじめに人工知能と光学画像デバイスの急速な発展に伴い、高度なハードウェア基...

人工知能がインダストリー4.0における製造業に革命をもたらす

人工知能 (AI) という用語は、流行語の地位を超え、業界全体にわたる技術革新の基礎となっています。...

DxRアルゴリズムのアイデアに基づいて設計されたルーティングアイテム配置構造の図

まず、タイトルには、検索構造ではなく、ルーティング項目の配置構造と書かれています。つまり、この構造を...

中国のAI特許申請数が米国を上回った!我が国の最新の5Gの成果:世界をリードする技術

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

...

...

...

人工知能による雇用促進

[[347833]]近年、人工知能は急速に発展し、新たな科学技術革命と産業変革を主導する中核的な原動...

データ処理を簡単にしますか? Baidu EasyDataが初の高度なインテリジェントデータクリーニング機能をリリース

AI モデルを開発する場合、データの量と品質がモデルの有効性に直接影響します。現場でデータを収集した...

在庫: 2020 年の最もクールな AI チップ スタートアップ 10 社

AIチップをめぐる争いはインテルやエヌビディアなどの半導体大手の間で激化しているが、多くの中小企業も...

なぜ一部の数学研究者はディープラーニングを嫌ったり軽蔑したりするのでしょうか?

[[190844]] DL の難しさは、問題をどのような視点から見るかによって決まります。数学を勉...