MITチームの新しいテストはAIの推論と人間の思考を比較する

MITチームの新しいテストはAIの推論と人間の思考を比較する

AI が洞察を導き出し、意思決定を行う方法は謎に包まれていることが多く、機械学習の信頼性について懸念が生じています。現在、新たな研究で、研究者らは、人工知能ソフトウェアの推論が人間の推論とどの程度一致しているかを比較し、その動作を迅速に分析するための新たな方法を明らかにした。

機械学習が現実世界でますます使用されるようになるにつれて、機械学習がどのように結論に達するのか、そしてそれが正しいかどうかを理解することが重要になります。たとえば、AI プログラムは皮膚病変が癌であると正確に予測しているように見えるかもしれませんが、臨床画像のコンテキストでは無関係な特徴に焦点を当てて予測している可能性があります。

「機械学習モデルは理解するのが非常に難しいことで有名です」と、MITのコンピューターサイエンス研究者で、AIの信頼性に関する新しい研究の主執筆者であるアンジー・ボガスト氏は言う。「モデルが何を決定したかを知るのは簡単ですが、モデルがなぜその決定を下したかを知るのは難しいのです。」

文献リンク: http://shared-interest.csail.mit.edu/

AI の推論を理解するための一般的な戦略は、プログラムが決定を下すために焦点を当てるデータ (画像や文章など) の特徴を調べることです。ただし、このようないわゆる顕著性手法では、通常、一度に 1 つの決定に対する洞察しか生成できず、各決定を手動で検査する必要があります。 AI ソフトウェアは通常、何百万ものデータ インスタンスを使用してトレーニングされるため、人間が十分な決定を分析して正しい動作または間違った動作のパターンを識別することはほぼ不可能です。

「機械学習モデルを調査および理解するためのツールを人間のユーザーに提供することは、機械学習モデルを現実世界に安全に展開するために不可欠です。」—アンジー・ボガスト

現在、MITとIBMリサーチの科学者たちは、AIの決定に対する説明を収集して調査する方法を考案し、AIの行動を迅速に分析できるようにした。 「Shared Interest」と呼ばれるこの新しい技術は、AI の決定の顕著性分析を人間が注釈を付けたデータベースと比較します。

たとえば、画像認識プログラムは写真を犬の写真として分類し、顕著性アプローチでは、プログラムが決定を下すために犬の頭と体のピクセルを強調表示したことを示す場合があります。対照的に、共通の関心に基づくアプローチでは、これらの顕著性手法の結果を、写真のどの部分が犬の一部であるかを人々が注釈付けした画像のデータベースと比較する可能性があります。

これらの比較に基づいて、共通関心アプローチでは、AI の決定と人間の推論の一貫性を計算し、8 ​​つのパターンのいずれかに分類する必要があります。一方では、プログラムが正しい予測を行い、人間と同じようにデータ内の同じ特徴を強調することで、AI が完全に人間のようなものであることが示されるかもしれません。一方、AIは完全に気を散らされ、誤った予測を行い、人間が強調した特徴を何も強調しませんでした。

AI の決定が陥る可能性のあるその他のパタ​​ーンは、機械学習モデルがデータの詳細を正しくまたは誤って解釈する方法を強調します。たとえば、共通の関心によって、AI は人間のように車両全体を識別するのではなく、タイヤなどトラクターの一部分だけに基づいて画像内のトラクターを正しく識別できることや、写真にスノーモービルが写っている場合にのみ AI が画像内のスノーモービルのヘルメットを識別できることが発見されるかもしれません。

実験では、共通の関心事は AI プログラムがどのように機能し、信頼できるかどうかを明らかにするのに役立ちます。たとえば、Shared Interest は、皮膚科医が皮膚病変の写真から癌の診断に関するプログラムの正しい予測と誤った予測の例をすぐに確認するのに役立ちます。結局、皮膚科医は、実際の病変ではなく無関係な詳細に基づいて予測をしすぎたため、プログラムを信頼できないと判断しました。

別の実験では、機械学習の研究者が Shared Interest を使用して、BeerAdvocate データセットに適用した顕著性手法をテストし、従来の手動の方法に必要な時間のほんの一部で、何千もの正しい決定と間違った決定を分析することができました。共通の関心は、顕著性手法が一般的にうまく機能することを示すのに役立ちますが、レビュー内の特定の単語を過大評価して誤った予測につながるなど、これまで知られていなかった欠陥も明らかにします。

「機械学習モデルを調査および理解するためのツールを人間のユーザーに提供することは、機械学習モデルを現実世界で安全に展開するために重要です」とボガスト氏は述べた。

研究者らは、共通の関心は彼らが採用する顕著性手法と同じくらいしか役に立たないと警告している。 Boggust 氏は、それぞれの顕著性手法には独自の制限があり、Shared Interest はこれらの制限を継承していると指摘しています。

将来、科学者たちは、医療記録で使用される表形式のデータなど、より多くの種類のデータに共通の関心を適用したいと考えています。ボガスト氏は、もう一つの潜在的な研究分野として、AIの結果の不確実性を自動的に推定する可能性があると付け加えた。

科学者たちは共通の利益のためにソースコードを公開した。

ソースコード: https://github.com/mitvis/shared-interest

関連レポート: https://spectrum.ieee.org/-2657216063

<<:  建設技術におけるAIは潜在性があるが、まだ現実にはなっていない

>>:  周志華:「データ、アルゴリズム、計算力」は人工知能の3つの要素であり、今後は「知識」が加わる必要があります。

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

なぜ2G/3GとAIは火花を散らすことができないのでしょうか?この論文で答えが分かります

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

機械学習とディープラーニング、この2つの違いは何でしょうか?

[51CTO.com クイック翻訳] 機械学習とディープラーニング - 両者の類似点と相違点。人工...

ビッグデータと人工知能の時代において、監査人は依然としてアイデアを持つ必要があるのでしょうか?

誰もが考えを持っており、監査人もそれぞれ心の中にさまざまな考えを持っています。表面的には、監査スキル...

これらの不気味な「偽人間」は人工知能の新時代の到来を告げる

[51CTO.com クイック翻訳]唇の無精ひげ、額のしわ、皮膚の斑点がはっきりと見えますが、「彼」...

マイクロソフトはAIを活用して新しい電池材料を選別し、電池のリチウムの70%をナトリウムに置き換える

1 月 10 日、マイクロソフトの量子コンピューティング チームは、米国エネルギー省傘下のパシフィッ...

人間が世界を理解するのに近づく:研究者はAIに「想像力」を与える

オレンジ色の猫を想像してください。次に、その猫の毛が黒だけであることを想像してください。そして、万里...

リチウム電池の防爆結果がネイチャー誌の表紙に登場、UCLAの中国チームが制作

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

自動運転分野における機械学習アルゴリズムの応用に関する包括的なレビュー

機械学習は、車内外のセンサーからのデータを融合して、運転者の状態を評価し、運転シナリオを分類するため...

エンタープライズ AI プラットフォーム選択ガイド

翻訳者 | 陳俊現在、人工知能(AI)はさまざまな企業や業界で広く利用されています。それは産業のトレ...

ソフトウェアテストに AI を統合する 9 つのメリット

[[390945]] [51CTO.com 速訳]人工知能の普及は人々に大きな期待をもたらしました。...

AIに取り組んでいる学部生がオンラインでクラッシュ:GitHubモデルの実行に3か月かかり、難しすぎる

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

CTR は成功と失敗の鍵です。なぜクリックスルー率はアルゴリズム エンジニアにとって悪夢となっているのでしょうか?

[[409064]]みなさんこんにちは。私は梁唐です。今日は、検索、広告、推奨アルゴリズムにおける...

Facebook は、自社の成功の要因となったアルゴリズムをどうやって修正できるのでしょうか?

[[428596]]専門家はCNNに対し、フェイスブックのアルゴリズムは改善できる可能性があると語...

...

Python 機械学習でプログラミングスキルを向上させる方法

この記事では、Packt の『Python Machine Learning, 3rd Editio...