ディープマインドの主任研究科学者であり、ロンドン大学ユニバーシティ・カレッジのコンピューターサイエンス教授であるデビッド・シルバー氏にとって、ゲームは特に AI にとって創造性を刺激する鍵となる。 シルバーは子供の頃にスクラブルの全国大会に出場し、その後ケンブリッジ大学に進学してビデオゲーム会社の共同設立者となった。 その後、人工知能の博士号を取得した後、囲碁の世界チャンピオンを破った最初の AI プログラムである AlphaGo を開発した DeepMind チームを率いました。 シルバー氏にとって、ゲームは人間と人工の脳が目標を達成するためにどのように自ら学習できるかを理解するためのテストの場です。 囲碁AI「AlphaGo」の場合、さまざまな局面での人間の判断に関する情報をプログラムに提供し、AIにそれを模倣させることを「教師あり学習」と呼びます。自らゲームをプレイしながら学習するAIプログラムを実装する手法を「強化学習」と呼びます。 そして、アルファ碁と世界チャンピオンとの重要な対局の最中に、シルバーはこう思いついた。機械の意思決定は人間によってまったく影響されるべきではないのかもしれない。 このアイデアは、最終的に、人間の知識を一切受け取らずに強化学習のみに頼ってゲームのルールに基づいて囲碁を上手にプレイする方法を学習した、AlphaGo の後継である AlphaGo Zero の始まりとなりました。 その後、AlphaGo ZeroはAlphaGoと100試合を戦い、その「兄貴分」を3対0で破った。 2020 年 4 月、David Silver 氏は「コンピューター ゲームにおける画期的な進歩」により 2019 ACM コンピューティング賞を受賞しました。 授賞式で、当時の ACM 会長 Cherri M. Pancake 氏は次のように述べました。 「デビッド・シルバーほど AI 界を盛り上げた研究者は他にほとんどいません。彼の深層強化学習に関する洞察は、ゲームだけにとどまらず、電力網の効率改善、データセンターの電力消費削減、欧州宇宙機関の宇宙探査機の軌道計画など、多岐にわたる分野に広がっています。」 さらに、シルバー氏は英国王立協会のフェローであり、AI 分野で初めてメンサ財団の最優秀科学発見賞を受賞した科学者でもあります。 シルバーのスター性は、彼の静かで控えめな性格と対照的です。このインタビューで、シルバー氏はゲーム、創造性の意味、そして気候変動、病原体、大規模な貧困、環境災害の防止に役立つ AI の可能性について語ります。 以下はインタビューの記録です。 子どもの頃、他の子どもとは違った方法でゲームをしていましたか? 私は昔、全国学校スクラブル大会に参加しましたが、面白い瞬間がいくつかありました。 一度、最後のゲームの終わりに、私は対戦相手に「本当にこの単語を綴りますか?もっと得点の高い単語を綴ってみませんか?」と尋ねました。相手は綴りを変えてゲームに勝ち、優勝しました。私はとても嬉しかったです。 私は試合に勝つことよりも、良い試合をすることの意味にこだわっています。 ゲームへの愛情をどうやって本物の仕事に変えたのですか? その後、私はチェスに出会い、DeepMind の共同創設者であるデミス・ハサビスと出会いました。当時、彼は同年齢の 10 代のチェスプレイヤーとしては世界最強でした。 彼はお小遣いが足りないときは、私の町に来てコンテストに参加し、50ポンドの賞金を獲得して家に帰りました。その後、私たちはケンブリッジで出会い、一緒にゲーム会社 Elixir を設立し、現在は一緒に DeepMind に戻っています。 ゲームへの執着は、問題解決について何を教えてくれましたか? 一方で、私たちはAIアルゴリズムにはない「創造性」という特別な能力を持っていると信じています。実のところ、これは誤りです。 AIにおける創造性の兆候はすでに見られています。 2016年のAlphaGoとイ・セドルの第2局では、黒番のAlphaGoの37手目が囲碁界で非常に創造的であり、当時の人間のプロ棋士の理解を超えていたと評価された。これは、AI が確かに過去とは異なる新しいことを試みていることを示しています。 しかし、人間はこの幅広い創造性をゲームだけでなく何にでも応用できるのでしょうか? 自分で解決策を考え出そうとしたり、AI に考え出させたりするなど、試行錯誤しながら学習するプロセス全体が創造的なプロセスです。 AIは最初から何も知りません。すると、以前よりも目標達成に役立つ新しいもの、創造的な飛躍、新しいパターン、新しいアイデアが発見されます。 ゲームをプレイしたり、パズルを解いたり、人々と交流したりするための新しい方法ができました。このプロセスは、実際には何千もの小さな発見が次々に積み重なっていくものです。これが創造性の真髄です。 AI アルゴリズムに創造性がなければ、問題が生じます。 AI には、人間が教えてくれなかった新しいアイデアを自ら試す能力が必要です。これは、自己実験を通じて「新しいアイデア」を生み出すようシステムを継続的に推進するための将来の研究の方向性となるはずです。 多くの人は、コンピューターは人間のアマチュアレベルまでしか囲碁をプレイできないと信じています。自分の向上能力を疑ったことはありますか? 2016年のアルファ碁トーナメントのために韓国に到着したとき、カメラの列を見て、2億人以上がオンラインで観戦していると聞いて、「ちょっと待って、これは本当にうまくいくの?」と思いました。 対戦相手のイ・セドルは、AIプログラムを通常は起こりえない奇妙な状況に陥れるためにあらゆる手を尽くす才能ある世界チャンピオンです。 私たちがその試練を乗り越えられたことはとても幸運だったと思います。その後、私は自分自身に問いかけました。「一歩下がって基本に立ち返り、システムが真に自ら学習するとはどういうことかを理解できるだろうか?」より純粋なものを見つけるために、私たちはAIモデルにおける人間の知識を捨て、AlphaZeroを開発しました。 何千年もの間、人類は囲碁のゲームのためのよく知られた戦略を開発してきました。 AlphaZero がこれらの有利な戦略をすぐに発見して拒否したとき、どう思いましたか? オリジナルの AlphaGo がミスを犯したポジションを設定しました (人間のプロプレイヤーと比較して)。 AIが自ら正しい場所を見つけられる新しいバージョンが見つかれば成功だと考えました。最初は大きな進歩を遂げましたが、その後は停滞しているように見えました。 AIが自力で正しい20~30ロットのポジションを見つけられなかったのではないかと考えています。 私たちが一緒に仕事をしたプロ選手のファン・フイは、これらの動きを何時間も研究しました。結局、プロのプレイヤーが間違った動きをし、AlphaZero が正しかったと彼は語った。 AIは、当初「間違っている」とされていた動きを再評価し、解決策を見つけました。人間が常識だと思っていることを覆す力を持っていることに気づきました。 その後、StarCraft 2 をプレイできる AI である AlphaStar の開発を主導されました。なぜ囲碁からビデオゲームに転向したのですか? 囲碁は比較的小さな分野です。囲碁から人間の脳の能力にまで拡張するには、多くのステップが必要です。私たちは、人間は得意でも AI は苦手な、より複雑な次元に挑戦します。 AlphaGo から AlphaStar へは、実は自然な発展です。人間と同様に、AI システムも地図の一部しか見ることができません。これは、自分の駒と相手の駒がすべて見える囲碁やチェスのようなものではありません。このゲームでは、制御対象物の近くの情報しか見ることができないため、情報を得るには偵察する必要があります。これは現実世界で起こっていることに近いです。 最終的な目標は何ですか? AI エージェントの能力は人間の脳と同じくらい幅広いと私は信じています。脳の機能を完全に実現する方法はまだわかっていませんが、人間の脳の中にその存在の証拠はあります。 人間の脳を完全にクローン化?本当にこれが現実的だと思いますか? 私は脳に関する魔法的、神秘的な説明を信じていません。 ある意味で、人間の脳は、入力を受け取り、強力かつ多用途な方法で出力を生成するアルゴリズムです。 AI を理解し構築する私たちの能力には限界がありますが、その理解は急速に高まっています。今日では、囲碁のような狭い分野を解読できる AI があり、自然言語を理解して生成できるモデルもあります。 では、人間の AI の能力には限界がないと思われますか? 今、私たちは始まったばかりです。もし私たちがさらに40億年の進化を遂げていたら、どのような姿になっていただろうと想像してみてください。おそらく私たちは、より優れた能力を持つ、より洗練された知能を持つようになるでしょう。 AI はこれに少し似ています。世界は本質的に無限に複雑なので、このプロセスには制限がありません。 それで、上限はあるのでしょうか?ある時点で物理的な限界が存在するので、境界がないわけではありません。最終的には、コンピューティング デバイスを構築するためのエネルギーと宇宙のすべての原子が枯渇することになります。しかし、現在と比較すると、それは実際には無限であると見なすことができます。人間の知能を超えると、この範囲は非常に広くなります。 スティーブン・ホーキングは、機械知能が予期せぬ悲惨な結果をもたらす可能性があると懸念している。あなたも同じような懸念を抱いていますか? 私は、気候変動、病原体、大規模な貧困、環境災害など、人間の知性がもたらす予期せぬ結果について、より懸念しています。 AI の追求は、新しいテクノロジー、より深い理解、より賢明な意思決定につながるはずです。 AIは将来、このような災害を回避するための最良のツールとなるかもしれません。しかし、私たちは慎重に進め、自律型兵器の開発を禁止するなど、AIの容認できない応用を禁止する明確なルールを確立する必要があります。 さて、ゲームの AI でこれらの大きな課題にうまく対処しましたが、がっかりしたことはありますか? そうですね、教師あり学習は主流に大きな影響を与えました。 Google から提供される大規模アプリケーションのほとんどは、システムのどこかで教師あり学習を使用しています。 現時点で私が残念に思っていることの一つは、強化学習による自己学習システムにこのレベルの影響が見られなかったことです。将来的には、私たちの目標を真に達成できるような方法で仮想世界で人々と対話できる自己学習システムが登場することを期待しています。たとえば、目標を達成するための最善の方法を自ら学習するデジタル アシスタントなどです。それは素晴らしい成果となるでしょう。 仕事に関して個人的な目標はありますか? AlphaGo対イ・セドル戦の試合中、私は試合会場の外へ出てみると、泣いている囲碁プレイヤーがいた。彼は悲しんでいると思ったが、そうではなかった。 全身全霊を傾けたこの領域で、AlphaGo はこれまで気づかなかったようなゲームを展開している。これにより、彼は深い美的感覚を身につけました。 私の囲碁のレベルでは、これを十分に理解できるほど十分ではありません。しかし、私たちは感知できるあらゆる場所で同様の知性を構築するよう努めるべきです。 AI 知能は、AI が何をするか、AI がどれだけの助けになるかではなく、知能そのものが素晴らしいものであるため、このように開発されるべきだと私は考えています。 |
<<: 強力な提携:ソーシャルロボット企業Furhatがロボット企業Misty Roboticsを買収
推奨システムは、協調フィルタリングを使用して、ユーザーの好み情報を収集し、特定のユーザーの興味を予測...
今年、AI大規模モデルの応用は爆発的な成長を遂げました。その中でも、LangChainやHaysta...
機械学習向けにデータ機能を最適化する機能エンジニアリングのスキルは、データサイエンスそのものと同じく...
人間は、脳内の神経系が外部環境の変化に継続的に適応するためにその構造を変える能力を持っていることを証...
データ センターは、世界中の何十億もの人々が毎日使用するアプリケーション、Web サイト、サービスに...
全世界を置き換えると叫んだ人工知能は、ついに失業という苦境に陥った。スウェーデンのオンライン銀行であ...
[[315351]]少し前、グーグルの元CEOであるシュミット氏は下院科学宇宙技術委員会の公聴会で...
[[253678]] [51CTO.com クイック翻訳] 機械学習 (ML) は、パターンを識別...
北京大学とテンセントがマルチモーダル15角形の戦士を制作しました!言語を中心に据えて、ビデオ、オーデ...
金庸の武侠小説には両手で戦うという武術が登場します。これは周伯同が桃花島の洞窟で10年以上の厳しい修...