スタンフォード大学の「バーチャルタウン」がオープンソース化:25人のAIエージェントが「ウエストワールド」に登場

スタンフォード大学の「バーチャルタウン」がオープンソース化:25人のAIエージェントが「ウエストワールド」に登場

「ウエストワールド」を見たことがある友人は、このドラマの舞台が未来の世界、巨大なハイテクな大人向けテーマパークで、人間のように行動し、見たものや言ったことを記憶できる生きているような機械が存在することを知っている。ロボットは毎日リセットされ、核となるストーリーラインに戻る。

これまでは、このようなシーンは映画やドラマの中だけでしか登場しませんでしたが、スタンフォード大学の論文「Generative Agents: Interactive Simulacra of Human Behavior」の発表により、このシーンがAIによって再現されました。

ヤング・スーパーマンの概要

  • 論文アドレス: https://arxiv.org/pdf/2304.03442v1.pdf
  • プロジェクトアドレス: https://github.com/joonspk-research/generative_agents

研究者たちは、25 人の AI エージェントが住む Smallville という「仮想の町」の構築に成功しました。エージェントたちは仕事をし、噂話をし、社交活動を組織し、新しい友達を作り、バレンタイン デーのパーティーを開くことさえあります。それぞれの「町の住人」には、独自の性格と背景ストーリーがあります。

「町の住人」をよりリアルに表現するため、スモールビルにはカフェ、バー、公園、学校、寮、住宅、お店など、公共のシーンも数多く用意されています。 「町の住人」はスモールビル内を移動したり、場所に入ったり出たり、他の「町の住人」に挨拶したりすることもできます。

「町民」が自由に行き来できる光景

「町の住人」はどれほど人間的でしょうか?たとえば、朝食が燃えているのに気づいたら、彼らは近づいてストーブを消します。トイレに誰かがいるのを見たら、外で待ちます。話をしたい人に出会ったら、立ち止まっておしゃべりします...

残念ながら、当時この研究はオープンソースではなかったため、誰もが公開された論文でしかより多くの情報を掘り出すことができませんでした。しかし、時が経つにつれ、研究者たちはこの研究をオープンソースにしました。

スタンフォード大学の博士課程の学生であり、論文の著者の一人であるジュン・ソン・パーク氏もこのニュースを認めた。

ネットユーザーの予想通り、このプロジェクトがオープンソース化されると、より多くの分野、特にゲーム業界に影響を及ぼすことになるだろう。将来のコンピューター ゲームには仮想都市の住民が存在し、誰もが独自の生活、仕事、趣味を持ち、実際の人々と同じように彼らと交流できると想像してみてください。

「この研究は AGI の始まりだと信じています。まだやるべきことはたくさんありますが、これは正しい道です。ついにオープンソースになりました!」

ネットユーザーの中には、この研究をビデオゲーム「ザ・シムズ」に移植することを楽しみにしている人もいる。

しかし、これについて懸念を表明する人もいます。AIインテリジェントエンティティの構築は、大規模モデルのサポートと切り離せないことは誰もが知っています。しかし、LLMは人間によって静かに「飼いならされている」ため、実際の人間の感情や行動を完全に反映できず、人間が良いと考える行動しか実行できないという問題も考慮する必要があります。たとえば、怒り、犯罪、不平等、嫉妬、暴力などはほとんどなくなります。したがって、AI エージェントが実際の人間の生活を再現することは困難です。

いずれにせよ、Smallville のオープン ソースについては誰もが非常に興奮しています。

スタンフォード大学のオープンソース Smallville に加えて、他の AI エージェントをいくつか紹介します。

スタートアップ企業のFableは、AIエージェントを使って「サウスパーク」のエピソードを直接撮影し、脚本、アニメーション、監督、編集など、制作プロセス全体をAIが完了させました。

NvidiaのAIエージェントVoyagerはGPT-4に接続されており、人間の介入なしに「Minecraft」をプレイできる。

SenseTime、清華大学などが開発した汎用 AI エージェント「Ghost in the Minecraft (GITM)」は、Minecraft のこれまでのエージェントよりもパフォーマンスが優れているだけでなく、トレーニングへの投資も大幅に削減します。

他にも多くの研究がありますが、ここでは一つ一つ挙げていません。スタンフォード バーチャル タウンがオープン ソースになったことで、さらに多くの企業や機関がこの仲間入りを果たすようになると信じています。

<<:  原子力 + AI: 原子力技術の未来を創造するのか?

>>: 

ブログ    
ブログ    
ブログ    

推薦する

ツールの選択からチームのコミュニケーションまで、ML エンジニアが実稼働レベルの機械学習を段階的に構築する様子をご覧ください。

機械学習がユーザーに真の価値をもたらすためには、それを本番システムに導入する必要があります。 AI ...

...

顔認識は道徳的および倫理的な懸念を引き起こします。あなたの顔は監視されていますか?

顔認識システムは私たちの都市に多くの利便性をもたらしました。しかし、多くの国では顔認識に対する抵抗が...

ニューヨーク州が顔認識を「禁止」する法律を制定。なぜキャンパス内で AI が頻繁に「失敗」するのか?

アメリカは顔認識技術と全面的に戦っている。米ニューヨーク州は最近、2022年まで学校での顔認識やその...

ペンシルバニア大学の最新研究:AI はアイデア生成において人間よりも 7 倍効率的であり、GPT の創造力は人間の 99% を上回ります。

囲碁からゲームのプレイ、さまざまな反復作業の完了まで、AI の能力は多くの面で人間をはるかに上回って...

DAMOアカデミー物流ロボットQA

1. 物流ロボットとは?物流ロボット「Xiaomanlu」は、ターミナル物流シナリオ向けに設計され...

2024 年の CIO の 14 の優先事項とトレンド

GenAI は 2024 年の最大のテクノロジー トレンドとなり、新しいツールのレビュー、インフラス...

フォレスター:生成型AIと会話型AIが2023年のトップ10新興テクノロジーを独占

分析会社フォレスターは7月24日、2023年のトップ10新興テクノロジーレポートを発表しました。生成...

人工知能が金融を変える5つの方法

人工知能 (AI)、機械学習 (ML)、ディープニューラルネットワーク (DNN) は、金融業界のビ...

製造業の未来:AIGCとその他の先進技術

製造業とメタバースMetaverse テクノロジーを製造業に統合すると、企業の運営方法に革命をもたら...

TensorFlow2020: Tensorflow.js を使用してコンピューター ビジョン アプリケーションを実行する方法は?

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...

ディープラーニング/コンピュータービジョンでよくある8つの間違いとその回避方法

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

2023年の生成AIの包括的なレビュー

2023年には、生成AIが開発者のアプリケーション構築支援において飛躍的な進歩を遂げ、大手ツールベン...