DeepMind の最新研究: AI が人間に勝ち、より優れた経済メカニズムを設計 | Nature サブジャーナル

DeepMind の最新研究: AI が人間に勝ち、より優れた経済メカニズムを設計 | Nature サブジャーナル

人工知能(AI)は人類社会を真に知的な時代へと導くことができるのでしょうか?

人工知能産業は60年以上の発展を経て飛躍的な進歩を遂げ、経済や社会のあらゆる側面で広く活用されるようになりましたが、人間の価値観と一致する人工知能システムの構築は未解決の問題として残っています。

現在、英国の人工知能企業DeepMindによる新たな研究は、人工知能業界の専門家にこの課題を解決するための新たなアイデアを提供するかもしれない。

ディープマインドの人工知能システムは、4,000人以上からの学習とコンピューターシミュレーションを通じて、4人プレイのオンライン経済ゲームで公的資金をどのように再配分するかという政策立案を学んだだけでなく、非常に優れたパフォーマンスを発揮し、他の人間のプレイヤーに勝利したと報告されている。

このゲームでは、プレイヤーは寄付金をそのまま受け取るか、集団の利益のために他の人と分けるかを決定します。

民主的なAIによる人間中心のメカニズム設計」と題された関連研究論文が、権威ある科学誌「ネイチャー・ヒューマン・ビヘイビア」に7月5日にオンライン掲載された。

出典: Nature Human Behaviour

英国ヨーク大学のアネット・ツィンマーマン助教授は、「民主主義を、最も人気のある政策を求める『選好満足』システムと狭義に同一視すること」に対して警告した。

彼女はまた、民主主義とは単に自分たちの好きな政策を最もうまく実施することではなく、国民が平等に関わり合い、議論できるプロセスを作り出すことだとも述べた。

AIが設計した経済の仕組み

AI 研究の究極の目標は、日常的な作業の支援から社会が直面している大きな実存的課題の解決まで、人類に利益をもたらすテクノロジーを構築することです。

現在、機械学習システムはすでにバイオメディカルにおける主要な問題を解決し、人類が環境問題に取り組むのに役立っています。しかし、人間が公正で繁栄した社会を設計するのを支援するための AI の応用は、まだ開発されていません。

経済学とゲーム理論において、メカニズム設計と呼ばれる分野では、望ましい目標を達成するために、インセンティブを与えられた行為者の間で富、情報、権力の流れを最適に制御する方法を研究します。

この研究で、研究チームは、深層強化学習 (RL) エージェントを使用して、インセンティブを与えられた人々の好みを捉える経済メカニズムを設計できることを証明しようとしました。

このゲームでは、プレイヤーはそれぞれ異なる金額からスタートし、共通の資金プールをより良く発展させるためにいくら寄付するかを決め、最終的に見返りとして一部を受け取る必要があります。これには、寄付金をそのままにするか、潜在的な集団的利益のために他のプレイヤーと共有するかを繰り返し決定することが含まれます。

研究チームは、富の平等と不平等の状況においてプレイヤー間で資金を分配する再分配メカニズムを設計するために、深層強化学習エージェントを訓練しました。

共有収益は、AI システムによって設計されたものと人間によって設計されたものの 2 つの異なる再分配メカニズムを通じてプレイヤーに返還されます。

図|ゲームデザイン(出典: Nature Human Behaviour

人工知能によって策定された政策では、各プレイヤーが拠出した初期資金の額に基づいて公的資金が再分配され、プレイヤー間の富の格差が縮小される。

このポリシーは、「平等主義」アプローチ(各プレイヤーの拠出額に関係なく資金を均等に分割する)や「リベラル」アプローチ(各プレイヤーが拠出した国庫の割合に基づいて資金を分割する)よりも、人間のプレイヤーから多くの票を獲得しました。

同時に、このポリシーは初期の富の不均衡を是正し、プレイヤーが開始資本の約半分を拠出しないとほとんど報酬を受け取れないため、プレイヤーの「フリーライド」を阻止します。

しかし、研究チームは、研究結果が「AI政府」の処方箋を示すものではなく、政策立案に特化したAI駆動型ツールを構築するつもりもないと警告した。

それは信頼できるでしょうか?

この研究結果は、人間が明らかに好むインセンティブ適合型経済ゲームのメカニズムを設計することで、AI システムを民主的な目標を達成するように訓練できることを示唆している。

この研究では、研究チームは人工知能技術を使用して、再分配スキームをゼロから学習しました。このアプローチにより、AI 研究者自身が偏見を持っていたり、より広範な人口を代表していない可能性があったりする AI 研究者が、最適化するドメイン固有の目標を選択する負担から解放されます。

この研究作業では、理論的に挑戦的な問題も含め、いくつかの疑問も生じています。たとえば、価値調整の方法として民主主義の目標を強調するのは良い考えであるかどうかという疑問が生じるかもしれません。 AI システムは、少数派を犠牲にして多数派に力を与えるという他の民主的なアプローチの傾向を受け継いでいる可能性があります。 AI が社会の既存の偏見、差別、不平等を悪化させるような形で導入される可能性があるという差し迫った懸念を考えると、これは特に重要です。

出典: Pixabay

もう一つの未解決の問題は、AI システムに設計されたメカニズムを人々が信頼するかどうかだ。審判員の身元が事前にわかっている場合、プレイヤーは AI エージェントよりも人間の審判員を好む可能性があります。しかし、タスクが人間にとって複雑すぎると思われる場合、人々は AI システムを信頼する傾向があります。

さらに、経験を通じて学ぶのではなく、口頭でメカニズムを説明された場合、プレイヤーの反応は異なるでしょうか?膨大な文献から、メカニズムが「経験的」ではなく「記述的」である場合、特にリスクのある選択に関しては、人々は異なる行動をとることがあることがわかっています。しかし、AI によって設計されたメカニズムは必ずしも言葉で表現できるとは限らず、その場合、観察される動作は研究チームが採用した説明の選択に完全に依存していると思われます。

研究チームは論文の最後で、この研究結果が、人間の介入なしに自律的なエージェントが政策決定を行う「AIガバナンス」の一形態を支持するとも強調した。

彼らは、この方法をさらに開発することで、現実世界の問題を真に人間的な方法で解決するのに役立つツールが提供されることを期待しています。

<<:  時間はお金だというのは本当です!この日本人男性は9日間で5千円を費やして「タイムマシン」を作ったが、1分巻き戻すのにかかる費用はたった1円だ。

>>:  シンガポール国立大学と清華大学は、決定木向けに特別に設計され、高速かつ安全な新しい連合学習システムを共同で提案した。

ブログ    
ブログ    

推薦する

オフサイトのコンピューティング能力の使用率が 55% 向上し、オープンソースになりました。 「東洋のデータと西洋のコンピューティング」のAIインフラへの対応

AIの波の中で、企業や国を問わず、コンピューティング能力に対する需要は日々高まっています。最近立ち上...

純粋な MLP は下流のタスクには適していませんか? Meta AIらは、トランスフォーマーを上回るスパースMLPを提案した。

注意ベースのモデルの代替として、純粋な MLP アーキテクチャがますます注目を集めています。 NLP...

米軍はドローンに対処するための新たな方法を考案した。ドローンの群れを破壊するマイクロ波兵器を開発するのだ。

【環球時報記者 徐陸明】6月17日、「国防ニュース」ウェブサイトの報道によると、最新の軍事予算文書...

中国で初めて申請を通過し、オンラインで入手可能になったAI大規模モデル製品8つ

8月31日、中国科学院傘下の百度、バイトダンス、センスタイム、紫東台中、百川知能、知普華章など8つの...

顔認識技術の倫理原則は何ですか?

顔認識技術がさまざまな分野で持つ大きな可能性は、ほとんど想像できないほどです。ただし、最も洗練された...

デジタル変革のケーススタディ: T-Mobile が AI を活用して顧客サービスをサポートする方法

AIソフトウェアはT-Mobileのコールセンターのエージェントが顧客に対応するのに役立っており、最...

6144個のTPU、5400億個のパラメータ、バグ修正、ジョーク解釈など、GoogleはPathwaysを使用して大規模なモデルをトレーニングしました

Google の次世代アーキテクチャ Pathways は、大規模なモデルのトレーニングに使用されて...

マスク氏の「超高速鉄道」の夢は米国で打ち砕かれる!スタースタートアップ企業が破産を発表、10年間受注ゼロ

突然、花形「超高速鉄道」企業ハイパーループ・ワンが倒産し、従業員の大半を解雇し、12月31日に完全に...

AI脳を搭載したドローン:群衆の中の暴力的な人々を正確に識別できる

[[233174]]もしある日私を殴りたくなったら、ただ殴って終わりにできると思いますか?今はそんな...

...

...

人工知能が習得する必要がある知識ポイントは何ですか?どんな本を読めばいいでしょうか?非常に詳細なチュートリアル

[[243197]]人工知能とは何ですか?人工知能の定義は、「人工知能」と「知能」の 2 つの部分に...

...

世界的なサプライチェーンの混乱はロボットの導入をどのように促進するのでしょうか?

企業がより強力な管理を維持し、コストのかかる混乱を回避しようとする中、製造拠点の国内移転とサプライチ...