新しいアプローチにより、機械学習モデルはタスクを学習する際により多くのデータに焦点を当てるようになり、より信頼性の高い予測が可能になります。 Uber のドライバーが近道をとれば、目的地に早く到着できるかもしれません。しかし、機械学習モデルが近道をとると、予期せぬ形で目的を台無しにする可能性があります。
機械学習では、モデルがデータの真の性質を学習するのではなく、データセットの単純な特徴に依存して決定を下すとショートカットが発生し、不正確な予測につながる可能性があります。たとえば、モデルは、牛のより複雑な形や模様ではなく、写真に写っている緑の草に焦点を当てて、牛の画像を認識することを学習する場合があります。 MIT の研究者による新しい研究では、一般的な機械学習手法における近道の問題を調査し、モデルが決定を行う際により多くのデータを使用するように強制することで AI が近道をとることを防ぐことができる解決策を提案しています。 モデルが焦点を当てていたより単純な特徴を削除することで、研究者はモデルが考慮していなかったデータのより複雑な特徴に焦点を合わせるように強制した。次に、モデルに同じタスクを 2 つの方法で解決するように指示しました。つまり、1 回目はより単純な特徴を使用し、2 回目は認識することを学習した複雑な特徴も使用して、近道する解決策の傾向を減らし、モデルのパフォーマンスを向上させました。 MIT の研究者たちは、モデルがこれまで考慮していなかったデータ内の特徴に強制的に焦点を合わせることで、対照学習モデルが近道を取る傾向を減らす手法を開発した。 この研究の潜在的な応用例の 1 つは、医療画像内の病気を識別するために使用される機械学習モデルの有効性を向上させることです。このような状況で近道的な解決策をとると、誤った診断につながり、患者にとって危険な結果を招く可能性があります。 ショートカットを理解するための長い道のり研究者たちは、自己教師型機械学習の強力な形態である対照学習に研究の焦点を当てました。自己教師型機械学習では、人間によるラベル付けされた説明のない生データを使用してモデルがトレーニングされます。したがって、より幅広い種類のデータに効果的に使用できます。 自己教師学習モデルは、画像分類などのさまざまなタスクの入力として使用されるデータの有用な表現を学習します。しかし、モデルが近道をして重要な情報を取得できない場合、タスクもその情報を利用できなくなります。 たとえば、自己教師あり学習モデルが、多数の病院のレントゲン写真で肺炎を分類するようにトレーニングされているが、スキャンが特定の病院からのものであることを識別するラベルに基づいて予測を行うように学習している場合(一部の病院では他の病院よりも肺炎の症例が多いため)、新しい病院のデータが与えられたときにモデルはうまく機能しません。 対照学習モデルでは、類似の入力ペアと非類似の入力ペアを区別するようにエンコーダー アルゴリズムがトレーニングされます。このプロセスは、画像などの豊富で複雑なデータを、対照学習モデルで解釈できる方法でエンコードします。 研究者たちは、さまざまな画像に対してコントラスト学習エンコーダーをテストし、このトレーニングプロセス中に、エンコーダーも近道的な解決策に陥ることを発見しました。エンコーダーは、画像内の最も単純な特徴に焦点を当てて、どの入力ペアが類似していて、どの入力ペアが類似していないかを判断する傾向があります。理想的には、エンコーダーは意思決定を行う際に、データのすべての有用な機能に注意を払う必要があります。 そこで研究チームは、類似したデータ ペアと類似しないデータ ペアの区別を難しくしたところ、エンコーダーが決定を下す際に考慮する特徴が変化することが分かりました。 類似したアイテムと類似しないアイテムを区別するタスクをますます困難にすると、システムは学習せずにタスクを解決できないため、データ内のより意味のある情報を学習する必要が生じます。ただし、この難易度を上げるとトレードオフが発生します。エンコーダーは、データの一部の機能に焦点を合わせる能力は向上しますが、他の機能に焦点を合わせる能力は低下し、より簡単な機能をほとんど忘れてしまうようです。 このトレードオフを回避するために、研究者らはエンコーダーに、元の方法でより単純な特徴を使用し、すでに学習した情報を削除した後でこれらのペアを区別するように依頼しました。タスクを 2 つの方法で同時に解決すると、すべての機能にわたってエンコーダーが改善されました。 彼らのアプローチは暗黙的特徴変更と呼ばれ、サンプルを適応的に変更して、エンコーダーがペアを区別するために使用するより単純な特徴を削除します。この技術は人間の入力に依存しません。これは、現実世界のデータセットには何百もの異なる特徴があり、それらが複雑に組み合わされる可能性があるため重要です。 解決できる問題は自動車からCOPDまで多岐にわたる研究者たちは車両の画像を使って自分たちのアプローチをテストした。暗黙的な特徴変更を使用して色、向き、車両の種類を調整し、エンコーダーが類似した画像ペアと類似しない画像ペアを区別しにくくします。エンコーダーは、テクスチャ、形状、色という 3 つの特徴すべてにおいて同時に精度を向上させました。 この方法がより複雑なデータにも耐えられるかどうかを確認するために、研究者らは慢性閉塞性肺疾患(COPD)の医療画像データベースのサンプルでもテストした。同様に、このアプローチにより、評価したすべての特性が同時に改善されました。 この研究は、近道となる解決策の原因を理解し、それに対処するための重要な一歩を踏み出したが、研究者らは、これらの方法をさらに改良し、他の種類の自己教師学習に適用することが将来の進歩の鍵となるだろうと述べている。 |
>>: あらゆる場所でのAI実現へ: 人工知能分野におけるインテルの躍進
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
データ構造はソフトウェア開発の最も基本的な部分であり、プログラミングの内部的な強さを反映しています。...
[[259612]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...
[[349302]]今日、職場での学習は課題に直面しています。高度な分析、人工知能、ロボットが職場...
GPT-4のアップデート機能により、AIを使って歴史をシミュレートすることは、単なる「テキストロール...
[[426135]]チップ不足と疫病の影響により、今年初めから自動運転産業の発展は減速を余儀なくされ...
[51CTO.com からのオリジナル記事] ご存知のとおり、AI は医療から旅行まで、あらゆる分...
企業のデジタル変革が深まるにつれ、人工知能技術はますます成熟し、ロボットによる顧客サービスは数千の業...
最近、修士号を取得して卒業しようとしているネットユーザーがネットユーザーに助けを求めました。「強化学...
あらゆるシーンのあらゆるもの: フォトリアリスティックなビデオオブジェクト挿入論文リンク: http...
現在、人工知能の発展レベルは、都市の競争力と将来の発展の可能性を測る新たな指標となっている。その結果...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...