科学者たちは、より信頼性の高い予測を達成するために人工知能が「近道」をすることを避ける方法を研究している。

新しいアプローチにより、機械学習モデルはタスクを学習する際により多くのデータに焦点を当てるようになり、より信頼性の高い予測が可能になります。 Uber のドライバーが近道をとれば、目的地に早く到着できるかもしれません。しかし、機械学習モデルが近道をとると、予期せぬ形で目的を台無しにする可能性があります。

[[432930]]

機械学習では、モデルがデータの真の性質を学習するのではなく、データセットの単純な特徴に依存して決定を下すとショートカットが発生し、不正確な予測につながる可能性があります。たとえば、モデルは、牛のより複雑な形や模様ではなく、写真に写っている緑の草に焦点を当てて、牛の画像を認識することを学習する場合があります。

MIT の研究者による新しい研究では、一般的な機械学習手法における近道の問題を調査し、モデルが決定を行う際により多くのデータを使用するように強制することで AI が近道をとることを防ぐことができる解決策を提案しています。

モデルが焦点を当てていたより単純な特徴を削除することで、研究者はモデルが考慮していなかったデータのより複雑な特徴に焦点を合わせるように強制した。次に、モデルに同じタスクを 2 つの方法で解決するように指示しました。つまり、1 回目はより単純な特徴を使用し、2 回目は認識することを学習した複雑な特徴も使用して、近道する解決策の傾向を減らし、モデルのパフォーマンスを向上させました。

MIT の研究者たちは、モデルがこれまで考慮していなかったデータ内の特徴に強制的に焦点を合わせることで、対照学習モデルが近道を取る傾向を減らす手法を開発した。

この研究の潜在的な応用例の 1 つは、医療画像内の病気を識別するために使用される機械学習モデルの有効性を向上させることです。このような状況で近道的な解決策をとると、誤った診断につながり、患者にとって危険な結果を招く可能性があります。

ショートカットを理解するための長い道のり

研究者たちは、自己教師型機械学習の強力な形態である対照学習に研究の焦点を当てました。自己教師型機械学習では、人間によるラベル付けされた説明のない生データを使用してモデルがトレーニングされます。したがって、より幅広い種類のデータに効果的に使用できます。

自己教師学習モデルは、画像分類などのさまざまなタスクの入力として使用されるデータの有用な表現を学習します。しかし、モデルが近道をして重要な情報を取得できない場合、タスクもその情報を利用できなくなります。

たとえば、自己教師あり学習モデルが、多数の病院のレントゲン写真で肺炎を分類するようにトレーニングされているが、スキャンが特定の病院からのものであることを識別するラベルに基づいて予測を行うように学習している場合（一部の病院では他の病院よりも肺炎の症例が多いため）、新しい病院のデータが与えられたときにモデルはうまく機能しません。

対照学習モデルでは、類似の入力ペアと非類似の入力ペアを区別するようにエンコーダーアルゴリズムがトレーニングされます。このプロセスは、画像などの豊富で複雑なデータを、対照学習モデルで解釈できる方法でエンコードします。

研究者たちは、さまざまな画像に対してコントラスト学習エンコーダーをテストし、このトレーニングプロセス中に、エンコーダーも近道的な解決策に陥ることを発見しました。エンコーダーは、画像内の最も単純な特徴に焦点を当てて、どの入力ペアが類似していて、どの入力ペアが類似していないかを判断する傾向があります。理想的には、エンコーダーは意思決定を行う際に、データのすべての有用な機能に注意を払う必要があります。

そこで研究チームは、類似したデータペアと類似しないデータペアの区別を難しくしたところ、エンコーダーが決定を下す際に考慮する特徴が変化することが分かりました。

類似したアイテムと類似しないアイテムを区別するタスクをますます困難にすると、システムは学習せずにタスクを解決できないため、データ内のより意味のある情報を学習する必要が生じます。ただし、この難易度を上げるとトレードオフが発生します。エンコーダーは、データの一部の機能に焦点を合わせる能力は向上しますが、他の機能に焦点を合わせる能力は低下し、より簡単な機能をほとんど忘れてしまうようです。

このトレードオフを回避するために、研究者らはエンコーダーに、元の方法でより単純な特徴を使用し、すでに学習した情報を削除した後でこれらのペアを区別するように依頼しました。タスクを 2 つの方法で同時に解決すると、すべての機能にわたってエンコーダーが改善されました。

彼らのアプローチは暗黙的特徴変更と呼ばれ、サンプルを適応的に変更して、エンコーダーがペアを区別するために使用するより単純な特徴を削除します。この技術は人間の入力に依存しません。これは、現実世界のデータセットには何百もの異なる特徴があり、それらが複雑に組み合わされる可能性があるため重要です。

解決できる問題は自動車からCOPDまで多岐にわたる

研究者たちは車両の画像を使って自分たちのアプローチをテストした。暗黙的な特徴変更を使用して色、向き、車両の種類を調整し、エンコーダーが類似した画像ペアと類似しない画像ペアを区別しにくくします。エンコーダーは、テクスチャ、形状、色という 3 つの特徴すべてにおいて同時に精度を向上させました。

この方法がより複雑なデータにも耐えられるかどうかを確認するために、研究者らは慢性閉塞性肺疾患（COPD）の医療画像データベースのサンプルでもテストした。同様に、このアプローチにより、評価したすべての特性が同時に改善されました。

この研究は、近道となる解決策の原因を理解し、それに対処するための重要な一歩を踏み出したが、研究者らは、これらの方法をさらに改良し、他の種類の自己教師学習に適用することが将来の進歩の鍵となるだろうと述べている。

<<: ロボットの時代、トラクターの背後にある1兆ドル市場

>>: あらゆる場所でのAI実現へ: 人工知能分野におけるインテルの躍進

説明可能なAI: 機械が自らを説明できるようにし、アルゴリズムによって生成されるバイアスを減らす

科学者たちは、より信頼性の高い予測を達成するために人工知能が「近道」をすることを避ける方法を研究している。

ショートカットを理解するための長い道のり

解決できる問題は自動車からCOPDまで多岐にわたる

説明可能なAI: 機械が自らを説明できるようにし、アルゴリズムによって生成されるバイアスを減らす

NTU Yu Yangによる徹底分析：「世界モデル」とは何か？

洪水の知らせを聞いたらすぐに行動を起こしましょう！ロボットは風と波の守護者となることを目指す

自動運転のセキュリティ確保 - 主流のミドルウェア設計について

ドローンのインターネット: IoT がさまざまな業界のユースケースをサポートする方法

3D多言語AIレポーターが登場。プレッシャーを感じることなく文章を書いたり翻訳したりできるだけでなく、国際的なスポーツイベントのレポートもできます。

データベース設計: MySQL フィールド名がキーワードと衝突するのを防ぎ、データの整合性を保護します。

1 つのバグが原因で 200 億ドルの損失が発生しました。ビジネス異常検出システムを構築するにはどうすればよいでしょうか?

推薦する

業界の洞察 | スマートシティと省エネ通信インフラ

多くの企業が自社のサービスはAIだと主張しているが、実際はAIのふりをしている人間である。

少し手を加えるだけで、GPT-3 の精度が 61% 向上します。グーグルと東京大学の研究は皆を驚かせた

ChatGPTは来週Androidでリリースされ、事前登録が開始されました

緑の希望を守るため、人工知能が森林火災防止ネットワークを構築

現在最も興味深い AI は、実は系図会社から生まれたものなのでしょうか?

ロボットは人間と機械の協働チームの「リーダー」になれるでしょうか?どのように機能しますか?

米空軍、戦闘機で人工知能をテスト

テクノロジー市場: エッジデバイスで利用可能なエッジAIソリューション

李開復氏は、AIが今後20年間で5つの主要産業に大きな影響を与えると予測している。

2021年のスマートシティの変革と再構築のトレンド

ついに、人工知能の3つの重要な機能を説明する人がいた。

IoTとAIのトレンドが今日のビジネスに及ぼす影響

初期の携帯電話で使用されていたGPRS暗号化アルゴリズムが意図的に弱められていたことが明らかになった。