「概念のドリフト」問題と闘おう! Google が新しい時間認識フレームワークをリリース: 画像認識精度が 15% 向上

「概念のドリフト」問題と闘おう! Google が新しい時間認識フレームワークをリリース: 画像認識精度が 15% 向上

機械学習の分野では、コンセプトドリフトという問題が長い間研究者を悩ませてきました。つまり、データの分布が時間の経過とともに変化し、モデルの有効性を維持することが困難になるのです。

注目すべき例としては、CLEAR 非定常学習ベンチマークからの画像の表示があり、物体の視覚的特徴が 10 年間で大きく変化したことが明らかになっています。

この現象は「スローコンセプトドリフト」と呼ばれ、オブジェクト分類モデルにとって深刻な課題となります。物体の外観や特性が時間の経過とともに変化する場合、モデルがそのような変化に適応し、正確に分類し続けることができるようにする方法が研究者の焦点となっています。

最近、この課題に応えて、Google AI の研究者は最適化主導型の手法 MUSCATEL (Multi-Scale Temporal Learning) を提案しました。これにより、大規模で動的なデータセットにおけるモデルのパフォーマンスが大幅に向上しました。この作品はAAAI2024に掲載されました。

論文アドレス: https://arxiv.org/abs/2212.05908

現在、確率ドリフトに対する主流のアプローチは、オンライン学習と継続学習です。

これらの方法の中心的な考え方は、最新のデータに適応するためにモデルを継続的に更新することで、モデルを最新の状態に保つことです。しかし、このアプローチには 2 つの根本的な問題があります。

まず、最新のデータのみに焦点を当てる傾向があり、過去のデータに含まれる貴重な情報が無視されてしまいます。第二に、これらの方法では、すべてのデータインスタンスの寄与が時間の経過とともに均一に減少すると想定していますが、これは現実世界の実際の状況と一致しません。

MUSCATEL メソッドはこれらの問題を効果的に解決できます。トレーニング インスタンスに重要度スコアを割り当て、将来のインスタンスでモデルのパフォーマンスを最適化します。

この目的のために、研究者らは、インスタンスとその年齢を組み合わせてスコアを生成する補助モデルを導入しました。補助モデルとメインモデルは協力して学習し、2 つの主要な問題を解決します。

この方法は実際のアプリケーションで優れたパフォーマンスを発揮します。9 年間にわたる 3,900 万枚の写真の大規模な実世界データセットを対象とした実験では、他の定常学習ベースライン方法と比較して精度が 15% 向上しました。

同時に、2 つの非定常学習データセットと継続的な学習環境においても、SOTA 手法よりも優れた結果を示しています。

教師あり学習におけるコンセプトドリフトの課題

教師あり学習におけるコンセプトドリフトの課題を研究するために、研究者らは、過去 10 年間のソーシャル メディアの写真約 3,900 万枚を使用して、写真分類タスクにおけるオフライン トレーニングと継続的トレーニングを比較しました。

下の図に示すように、オフライン トレーニング モデルは初期パフォーマンスは高いものの、壊滅的な忘却により時間の経過とともに精度が低下し、初期データの理解が低下します。

対照的に、継続的にトレーニングされたモデルは、初期のパフォーマンスは低くなりますが、古いデータへの依存度が低く、テスト中により速く劣化します。

これは、データが時間の経過とともに進化するにつれて、2 つのモデルの適用性が低下することを示しています。コンセプトドリフトは教師あり学習にとって課題となるため、データの変化に適応するためにモデルを継続的に更新する必要があります。

マスカット

MUSCATEL は、ゆっくりとしたコンセプトドリフトの課題に対処するために設計された革新的なアプローチです。オフライン学習と継続学習の利点を巧みに組み合わせることで、将来的にモデルのパフォーマンス低下を軽減することを目指しています。

膨大な量のトレーニングデータに対して、MUSCATEL は独自の魅力を発揮しました。従来のオフライン学習に依存するだけでなく、これに基づいて過去のデータの影響を慎重に調整および最適化し、モデルの将来のパフォーマンスのための強固な基盤を築きます。

新しいデータに対するメイン モデルのパフォーマンスをさらに向上させるために、MUSCATEL は補助モデルを導入します。

下の図の最適化目標に従って、トレーニング補助モデルは、各データ ポイントの内容と年齢に基づいて重みを割り当てます。この設計により、モデルは将来のデータ変更に適応しやすくなり、継続的な学習機能を維持できるようになります。

補助モデルをメインモデルと共進化させるために、MUSCATEL はメタ学習戦略も採用しています。

この戦略の鍵となるのは、下の図に示すように、複数の固定減衰時間スケールを組み合わせることで、サンプル インスタンスの寄与を年齢とセットの重みから効果的に分離することです。

さらに、MUSCATEL は、より正確な学習のために、各インスタンスを最も適切な時間スケールに「割り当てる」ことを学習します。

インスタンスの重み付けスコアリング

下の図に示すように、CLEAR オブジェクト認識チャレンジでは、学習した補助モデルがオブジェクトの重みを正常に調整し、新しい外観のオブジェクトの重みが増加し、古い外観のオブジェクトの重みが減少しました。

勾配ベースの特徴重要度評価により、補助モデルは背景やインスタンスの年齢とは無関係な特徴ではなく、画像内の被写体に焦点を当てていることが判明し、その有効性が実証されました。

大規模な写真分類タスクにおける大きな進歩

大規模写真分類タスク (PCAT) は、YFCC100M データセットで研究され、最初の 5 年間のデータがトレーニング セットとして、最後の 5 年間のデータがテスト セットとして使用されます。

重み付けされていないベースラインやその他の堅牢な学習手法と比較すると、MUSCATEL メソッドには明らかな利点があります。

特に、MUSCATEL アプローチでは、テスト中のパフォーマンスの大幅な向上と引き換えに、遠い過去のデータに対する精度を意図的に調整します。この戦略は、将来のデータに対するモデルの適応性を最適化するだけでなく、テスト中の劣化も低減します。

データセット全体にわたる広範な適用性の検証

非定常学習チャレンジのデータセットは、写真、衛星画像、ソーシャル メディアのテキスト、医療記録、センサーの読み取り値、表形式のデータなど、さまざまなデータ ソースとモードをカバーしており、データ サイズは 1 万インスタンスから 3,900 万インスタンスに及びます。各データセットの以前の最良の方法には異なる利点がある可能性があることに注意してください。ただし、下の図に示すように、データと方法の両方の多様性の文脈では、MUSCATEL メソッドは大きなゲイン効果を示しています。この結果は、MUSCATEL の幅広い適用性を十分に実証しています。

大規模データ処理の課題に対処するための継続学習アルゴリズムの拡張

膨大な大規模データに直面すると、従来のオフライン学習方法では圧倒されてしまうかもしれません。

この問題を念頭に置いて、研究チームは継続的学習にヒントを得た手法を巧みに改良し、大規模データの処理に簡単に適応できるようにしました。

この方法は非常にシンプルで、データの各バッチに時間重みを追加し、モデルを順番に更新します。

モデルの更新は最新のデータに基づいてのみ行われるなど、これには若干の制限がありますが、その効果は驚くほど良好です。

以下に示す写真分類ベンチマーク テストでは、この方法は従来の継続学習アルゴリズムやその他のさまざまなアルゴリズムよりも優れたパフォーマンスを発揮します。

さらに、その考え方は多くの既存の方法と互換性があるため、他の方法と組み合わせることでさらに驚くべき効果が期待できます。

全体として、研究チームはオフライン学習と継続学習をうまく組み合わせて、業界を長年悩ませてきたデータドリフトの問題を解決することに成功しました。

この革新的な戦略は、モデルの「破滅的な忘却」現象を大幅に緩和するだけでなく、大規模データの継続的な学習の将来の発展に新たな道を開き、機械学習の分野全体に新たな活力を注入します。

<<:  AI 生成ビデオにもう一つ大きな爆弾があるのでしょうか?アリ・エモはレオがラップし、ガオ・チチアンが法律を広めるなど、素晴らしいデビューを果たした。

>>:  生画像の新しい「マルチモーダル」AIテキストレンダリングはMidjourney + DALL·E 3に勝る!Karpathyが5億元の資金調達に投資

ブログ    
ブログ    

推薦する

DeepMindは、オートエンコーダに「自己修正」を教える「SUNDAE」と呼ばれる言語モデルを提案している。

[[440946]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitA...

ソラがビデオ世代を爆発させたとき、Metaは中国の著者の主導で、エージェントを使用してビデオを自動的に編集し始めました。

最近、AIビデオの分野は非常に活発になっており、OpenAIが立ち上げた大規模なビデオ生成モデルであ...

ガートナー: 高等教育における人工知能

人工知能 (AI) は高等教育に大きな進歩を遂げており、何らかの形で AI を導入した教育機関は、学...

AIの世界は「データ」から「知識」へと移行している

人工知能(AI)革命は半世紀以上前に始まりました。過去 10 年間で、人工知能は学術科学の領域から私...

IoTと機械学習がビジネスを加速させる5つの方法

モノのインターネットと機械学習は、今日のビジネスにおいて最も破壊的なテクノロジーの 2 つです。さら...

AIはインフルエンサーマーケティングにどのような影響を与えているのでしょうか?

2017年10月、ケンブリッジ・アナリティカのスキャンダルが発覚した直後、FacebookはIns...

...

統計と機械学習の違いは何ですか?

[[263249]]ビッグデータダイジェスト制作出典: medium編纂者:周嘉楽、郭小白、蒋宝尚...

コストを 95% 削減した ChatGPT の代替品を作成しましょう! OpenAIのハードコアアップデートが来月リリースされ、ビジュアルAPIが登場

世界中の開発者は長い間、OpenAI モデルの価格に悩まされてきました。ロイター通信は、11月6日に...

AI を活用したハイパーオートメーションがビジネス効率を向上させる方法

AI とハイパーオートメーションに期待するのには十分な理由があります。AI には、人間の思考や関連す...

...

世界の半導体サプライチェーンにおけるリスクを排除するにはどうすればよいでしょうか?

過去数年間、テクノロジー業界は半導体サプライチェーンにおける前例のない混乱の影響を感じてきました。研...

AIとデート:機械はどうやって私たちを出会わせてくれるのか?

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

プログラマーから見たChatGPT

著者 |ブライト・リャオ私はもともとAI技術に興味があったソフトウェア開発エンジニアで、ディープラー...

...