新しいアプローチにより、機械学習モデルはタスクを学習する際により多くのデータに焦点を当てるようになり、より信頼性の高い予測が可能になります。 Uber のドライバーが近道をとれば、目的地に早く到着できるかもしれません。しかし、機械学習モデルが近道をとると、予期せぬ形で目的を台無しにする可能性があります。
機械学習では、モデルがデータの真の性質を学習するのではなく、データセットの単純な特徴に依存して決定を下すとショートカットが発生し、不正確な予測につながる可能性があります。たとえば、モデルは、牛のより複雑な形や模様ではなく、写真に写っている緑の草に焦点を当てて、牛の画像を認識することを学習する場合があります。 MIT の研究者による新しい研究では、一般的な機械学習手法における近道の問題を調査し、モデルが決定を行う際により多くのデータを使用するように強制することで AI が近道をとることを防ぐことができる解決策を提案しています。 モデルが焦点を当てていたより単純な特徴を削除することで、研究者はモデルが考慮していなかったデータのより複雑な特徴に焦点を合わせるように強制した。次に、モデルに同じタスクを 2 つの方法で解決するように指示しました。つまり、1 回目はより単純な特徴を使用し、2 回目は認識することを学習した複雑な特徴も使用して、近道する解決策の傾向を減らし、モデルのパフォーマンスを向上させました。 MIT の研究者たちは、モデルがこれまで考慮していなかったデータ内の特徴に強制的に焦点を合わせることで、対照学習モデルが近道を取る傾向を減らす手法を開発した。 この研究の潜在的な応用例の 1 つは、医療画像内の病気を識別するために使用される機械学習モデルの有効性を向上させることです。このような状況で近道的な解決策をとると、誤った診断につながり、患者にとって危険な結果を招く可能性があります。 ショートカットを理解するための長い道のり研究者たちは、自己教師型機械学習の強力な形態である対照学習に研究の焦点を当てました。自己教師型機械学習では、人間によるラベル付けされた説明のない生データを使用してモデルがトレーニングされます。したがって、より幅広い種類のデータに効果的に使用できます。 自己教師学習モデルは、画像分類などのさまざまなタスクの入力として使用されるデータの有用な表現を学習します。しかし、モデルが近道をして重要な情報を取得できない場合、タスクもその情報を利用できなくなります。 たとえば、自己教師あり学習モデルが、多数の病院のレントゲン写真で肺炎を分類するようにトレーニングされているが、スキャンが特定の病院からのものであることを識別するラベルに基づいて予測を行うように学習している場合(一部の病院では他の病院よりも肺炎の症例が多いため)、新しい病院のデータが与えられたときにモデルはうまく機能しません。 対照学習モデルでは、類似の入力ペアと非類似の入力ペアを区別するようにエンコーダー アルゴリズムがトレーニングされます。このプロセスは、画像などの豊富で複雑なデータを、対照学習モデルで解釈できる方法でエンコードします。 研究者たちは、さまざまな画像に対してコントラスト学習エンコーダーをテストし、このトレーニングプロセス中に、エンコーダーも近道的な解決策に陥ることを発見しました。エンコーダーは、画像内の最も単純な特徴に焦点を当てて、どの入力ペアが類似していて、どの入力ペアが類似していないかを判断する傾向があります。理想的には、エンコーダーは意思決定を行う際に、データのすべての有用な機能に注意を払う必要があります。 そこで研究チームは、類似したデータ ペアと類似しないデータ ペアの区別を難しくしたところ、エンコーダーが決定を下す際に考慮する特徴が変化することが分かりました。 類似したアイテムと類似しないアイテムを区別するタスクをますます困難にすると、システムは学習せずにタスクを解決できないため、データ内のより意味のある情報を学習する必要が生じます。ただし、この難易度を上げるとトレードオフが発生します。エンコーダーは、データの一部の機能に焦点を合わせる能力は向上しますが、他の機能に焦点を合わせる能力は低下し、より簡単な機能をほとんど忘れてしまうようです。 このトレードオフを回避するために、研究者らはエンコーダーに、元の方法でより単純な特徴を使用し、すでに学習した情報を削除した後でこれらのペアを区別するように依頼しました。タスクを 2 つの方法で同時に解決すると、すべての機能にわたってエンコーダーが改善されました。 彼らのアプローチは暗黙的特徴変更と呼ばれ、サンプルを適応的に変更して、エンコーダーがペアを区別するために使用するより単純な特徴を削除します。この技術は人間の入力に依存しません。これは、現実世界のデータセットには何百もの異なる特徴があり、それらが複雑に組み合わされる可能性があるため重要です。 解決できる問題は自動車からCOPDまで多岐にわたる研究者たちは車両の画像を使って自分たちのアプローチをテストした。暗黙的な特徴変更を使用して色、向き、車両の種類を調整し、エンコーダーが類似した画像ペアと類似しない画像ペアを区別しにくくします。エンコーダーは、テクスチャ、形状、色という 3 つの特徴すべてにおいて同時に精度を向上させました。 この方法がより複雑なデータにも耐えられるかどうかを確認するために、研究者らは慢性閉塞性肺疾患(COPD)の医療画像データベースのサンプルでもテストした。同様に、このアプローチにより、評価したすべての特性が同時に改善されました。 この研究は、近道となる解決策の原因を理解し、それに対処するための重要な一歩を踏み出したが、研究者らは、これらの方法をさらに改良し、他の種類の自己教師学習に適用することが将来の進歩の鍵となるだろうと述べている。 |
>>: あらゆる場所でのAI実現へ: 人工知能分野におけるインテルの躍進
人工知能(AI)ソフトウェアは中国企業にとって投資と注目の的となっている。中国のAIソフトウェア市場...
8月29日、国家発展改革委員会、科学技術部、工業情報化部、中国サイバースペース管理局、中国科学院、...
[[434146]]ビジネス インテリジェンス テクノロジーが推進する市場において、人工知能は企業に...
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...
Apple Carはまた失敗するのでしょうか?最近、著名なアナリストのミンチー・クオ氏が自身のツイッ...
強化学習では、報酬と罰のメカニズムを使用してエージェントをトレーニングします。エージェントは正しい行...
ニューラル ネットワークの基本的な考え方は、コンピューターの「脳」内の複数の相互接続されたセルをシミ...
テンセントテクノロジーニュース、1月29日、海外メディアの報道によると、グーグルCEOサンダー・ピチ...
背景LinkedHashMap は HashMap を継承し、内部的に removeEldestEn...
人工知能はビジネス環境を一新し、競争環境を変え、仕事の本質を変革しています。しかし、人間の創造性も ...
[51CTO.com からのオリジナル記事] 音声認識は自動音声認識とも呼ばれ、人間の音声に含まれ...
私たちが日常生活で使用する推奨システム、インテリジェントな画像美化アプリケーション、チャットボットな...