史上初! Google AI プレイヤーが StarCraft II で人間に勝利

史上初! Google AI プレイヤーが StarCraft II で人間に勝利

[[256388]]

この試合はイギリス・ロンドンにあるDeepMind本社からライブ配信された。

GoogleのDeepMindが開発した人工知能ソフトウェアプレイヤーが、ゲーム「スタークラフトII」で人間のプレイヤーに勝利した。これは人工知能としては初めてのことだ。

YouTube と Twitch で放送された一連のゲーム マッチで、AI プレイヤーが人間のプレイヤーを 10 回連続で破りました。決勝戦では、プロゲーマーのGrzegorz "MaNa" Kominczが人類に勝利をもたらしました。

ディープマインド研究部長のデビッド・シルバー氏は、大会後に次のように語った。「さまざまなゲーム大会でAIが達成した結果は、人工知能の発展における重要なマイルストーンです。まだやるべきことはありますが、未来の人々が今日を振り返り、これがAIシステムの潜在能力におけるもう一つの重要な前進であると認識してくれることを願っています。」

ビデオゲームで人間に勝つことは、人工知能の開発における副次的なことのように思えるかもしれないが、実際には大きな研究課題である。 StarCraft II のようなゲームは、チェスや囲碁のようなボードゲームよりもはるかに難しいです。ビデオゲームでは、AI ソフトウェア エンティティは各駒の動きを観察して次の動きを計算することはできず、リアルタイムで反応する必要があります。

[[256389]]

昨年 12 月の AlphaStar 対 TLO のスクリーンショット。

これらの要因は、DeepMind の人工知能ゲームプレイ システム (AlphaStar) にとって大きな障害にはならないようです。まず、プロプレイヤーの Dario "TLO" Wünsch を破り、その後 Komintz に挑戦しました。この一連の試合はもともと昨年12月にDeepMindのロンドン本社で行われたが、Komintzとの決勝戦が本日ライブ配信され、プロゲーマーが人類に勝利をもたらした。

プロのスタークラフト解説者は、アルファスターのパフォーマンスを「並外れた」かつ「超人的」と評した。

StarCraft II では、同じマップ上のさまざまな場所からスタートし、基地を建設し、軍隊を訓練し、敵の領土に侵攻します。 AlphaStar は、戦場で部隊を迅速かつ決定的に制御する能力、いわゆるマイクロマネジメントに特に優れています。

人間のプレイヤーはより強力な軍隊を訓練できることもありましたが、AlphaZero は接近戦では人間に勝つことができました。あるゲームでは、AlphaStar は動きの速い「ストーカー」を使ってマナを集めました。解説者のケビン・「ロッテルダム」・ファン・デル・キュー氏は、この試合を「通常では見られないレベルの、並外れた部隊統制」の達成と評した。

「もし私が人間の相手と対戦していたら、このレベルでストーカーを細かく管理することはできないだろう」とコミンツは試合後に語った。

この事件は、他の高度な AI ゲーム プレイヤーに見られた行動と一致しています。

昨年、OpenAI の AI プレイヤーが Dota 2 トーナメントに出場した際、最終的に人間のプレイヤーに敗れました。しかし、業界の専門家は当時、AIソフトウェアプレーヤーは優れた明瞭性と正確性を示し、迅速かつ正確な判断を下すことができ、これも人工知能プレーヤーの利点であるとコメントしました。

専門家たちはゲームを分析し、アルファスターが不当な優位性を得たかどうかについて議論し始めた。 AI プレーヤー (ソフトウェア エンティティ) のパフォーマンスは、いくつかの面で劣っています。たとえば、AI プレーヤーが実行できる 1 分あたりのクリック数は制限されています。ただし、人間のプレイヤーとは異なり、手動で移動するのではなく、マップ全体を一度に表示できます。

DeepMindの研究者らは、AIプレイヤーは一度にマップの一部にしか焦点を当てていなかったため、実際には実質的な優位性を獲得していなかったと述べた。しかし、ゲームプレイが示すように、これによって AlphaStar が 3 つの異なるエリアで同時に巧みに部隊を制御することが阻止されることはありません。解説者は、これは人間のプレイヤーには不可能だと述べた。注目すべきは、Komintz がライブ マッチで AlphaStar に勝ったとき、AI が制限されたカメラ ビュー モードを使用していたことです。

また、この人工知能プレイヤーとの決闘の相手はプロのプレイヤーではあるが、世界チャンピオンレベルではないことも指摘しておくべきだろう。 TLO コンテストに参加するプレイヤーは、自分がよく知らない StarCraft II のゲームもクリアする必要があります。

AlphaStar のゲーム処理を示すグラフィック。システムはマップ全体を上から下まで見て、どのアクションが勝利につながるかを予測します。

その議論はさておき、専門家たちはこのコンテストは人工知能にとって大きな前進だと述べている。スタークラフトのAIシーンに長年関わってきた研究者デイブ・チャーチル氏は、イギリスの新聞ガーディアン紙に次のように語った。「AIゲームソフトウェア企業が実証した能力は大きな成果であり、AI研究者の間で私が聞いた最も楽観的な推測よりも少なくとも1年は進んでいると思う。」

しかし、チャーチル氏は、ディープマインドがこの研究についてまだ研究論文を発表していないため、アルファスターが技術的な飛躍を達成したかどうかを判断するのは難しいと付け加えた。 「私はブログ記事を読んでいないし、判断を下すための文書や技術的な詳細も見ていない」とチャーチル氏は述べた。

ジョージア工科大学の人工知能准教授マーク・リードル氏は、このゲームの結果には驚いておらず、人工知能が人間のプレイヤーに勝つのは「時間の問題」だと語った。

リーデル氏は、この試合はスタークラフト II が AI プレイヤーによって本当に征服されたことを示したものではないと付け加えた。同氏は、過去のライブゲームでは、AlphaStar はウィンドウに制限されていたため、AI の利点の一部が失われていたが、「しかし、私たちが見ているより大きな問題は、AI が学習した戦略が脆弱であり、プロのプレイヤーが AI プレイヤーを快適な領域から押し出すと、AI が機能しなくなることです」と述べた。

実際、ビデオゲームで AI プレイヤーが人間に勝てるようにする最終的な目標は、AI のトレーニング方法を改善し、特に StarCraft のような複雑な仮想環境で動作できる AI システムを作成することです。

AlphaStar をトレーニングするために、DeepMind の研究者は強化学習と呼ばれる手法を使用しました。 AI ソフトウェア エンティティは基本的に、何らかの目標 (勝利や単に生き残ることなど) を達成するために試行錯誤しながらこのゲームをプレイします。彼らはまず人間のプレイヤーを真似して学習し、その後は競争的なゲーム試合で互いから学びました。さまざまな AI ソフトウェア エンティティの中で、強いものが生き残り、弱いものが見捨てられます。 DeepMind は、各 AlphaStar ソフトウェア インスタンスがこのようにして約 200 年のプレイ時間を蓄積していると推定しており、プレイが蓄積されるにつれて、ゲームのプレイ速度はますます速くなります。

DeepMind はこの作業を実行する目的を明確にしています。 「ディープマインドの使命は、何よりもまず、汎用AIシステムを構築することだ」と、アルファスター・プロジェクトを率いたオリオール・ヴィニャルズ氏は述べ、人間が行えるあらゆる知的作業を実行できるAIソフトウェアの構築に言及した。 「これを実現するには、さまざまなタスクにわたって AI ソフトウェア エンティティのパフォーマンスをベンチマークして比較することが重要です。」

<<:  ガートナー:2021年までに70%の組織が従業員の生産性向上にAIを活用する

>>:  2019年のテクノロジートレンド予測: 5Gが爆発的に普及し、人工知能も勢いを増す

ブログ    
ブログ    
ブログ    

推薦する

2020年の人工知能市場の現状と発展の見通し

最近、教育部、国家発展改革委員会、財政部は共同で「『双一流』建設大学における人工知能分野の学科統合の...

...

...

...

看護師の負担を軽減し、病院の効率化を実現します!医療物流ロボットが「新たな人気」に

[[399194]]ロボット産業は、我が国のインテリジェント製造業の発展における重要なリンクであり、...

AI人工知能は研究室から生産現場へと進出したが、依然として大きな課題に直面している。

国内企業におけるAI導入の現状アクセンチュアが世界各国の企業幹部を対象に実施した「中国企業はどのよう...

4Paradigm が分子特性予測のための生成型 3D 事前トレーニング済みモデルを開発

論文タイトル: 分子特性予測のための自動 3D 事前トレーニング論文リンク: https://arx...

製造および産業環境監視アプリケーション向けの AI 搭載マシンビジョン

従来の産業および製造現場では、作業者の安全の監視、オペレーターの効率性の向上、品質検査の改善はすべて...

Google の請負業者が組合結成に投票: 権利の保護を希望

2018年11月1日、職場の問題に対する世界的な抗議活動の一環として、一部の従業員がGoogleの英...

複数のAI企業の人事担当者/面接官が明かす:機械学習エンジニアの採用方法

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

セキュリティにおける AI の必要性: 機械学習から機械の作成まで

セキュリティ専門家は、自分の仕事が人工知能に置き換えられることを心配する必要があるのでしょうか?警備...

MITの科学者が数時間でロボットヒトデを作る新システムを設計

水中の海洋生物を研究する場合、動物たちにとって不自然に見えて怖がらせないような装置を使うと役に立つで...

卒業後すぐに年収56万は貰えるんですか?右! Twitterの機械学習の専門家が書いた上級マニュアルをご覧ください

[[210651]]年収10万?プログラマーにとっては、これで十分です。国家統計局が今年上半期に発表...

...