プログラミングの達人セスブリングがマリオカートで勝つためのAIソフトウェアを開発

プログラミングの達人セスブリングがマリオカートで勝つためのAIソフトウェアを開発

海外のゲームプログラミングの達人、SethBling氏が新しいガジェットをリリースした。同氏は以前、「Minecraft」で一連のMODを開発し、MCでAtari 2600エミュレーターを起動し、「ドンキーコング」や「スペースインベーダー」などのゲームを実行できるようにしたほか、「スーパーマリオワールド」に「ピクセルバード」のコードを移植した。現在、彼はニューラルネットワークを訓練してオリジナルのマリオカートをプレイさせ、15時間分のゲームプレイ映像で訓練していくつかの動作を改良した後、AIシステムはついにゲームのトロフィーイベントで金メダルを獲得した。

MariFlow というシステムは、人間のプレイヤーの行動を学習し、手動で重み付けされた修正を加えることで動作を改善することでトレーニングされます。MariFlow はリカレント ニューラル ネットワークを使用しているため、過去の情報を記録できます。レーシング ゲームで発生する緊急事態ははるかに複雑で、MariFlow が壁にぶつかってその場で回転することもあります。この場合、SethBling は手動で介入し、コンピューターが応答を修正できるように支援します。リカレントニューラルネットワークを通じて、私たちは経験から学び、同様の間違いが再び起こるのを防ぎます。

一連のトレーニングを経て、マリフローは「マリオカート」のグランプリモードで、キノコカップとフラワーカップで金メダル、スターカップで銀メダルを獲得しましたが、これらはすべて難易度の低い50ccグループでの達成でした。

<<:  劉強東:AIは今後20年間ですべての産業を変革する中核的な力となる

>>:  神経科学者の探求:機械が意識を獲得する方法

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

最も偽のGANモデル! Facebook、史上最強の移行機能を備えたIC-GANをリリース

[[425904]] GAN モデルは優れていますが、トレーニング データに対する要件が高すぎるため...

RPAを成功させる方法

ロボティック プロセス オートメーション (RPA) は、ルールベースのプロセスを使用して、人間より...

企業の4分の1以上が従業員による生成AIの使用を禁止している

シスコの 2024 年データ プライバシー ベンチマーク調査によると、プライバシーとデータ セキュリ...

AIが高度な数学の問題を生成し、新たな難易度に到達:MITは問題を生成し、質問に答え、採点できるアルゴリズムモデルを提案

少し前に、DeepMind による研究が Nature の表紙を飾り、直感を導くことで 2 つの主要...

エヌビディアのCEOが主権的AIインフラの必要性を訴える

人工知能(AI)ブームにより、Nvidiaの株価は史上最高値に達した。 Nvidia の GPU は...

...

スーパーパートナー:IoT、AI、クラウドが強力な同盟を形成

大ヒット映画とモノのインターネット(IoT)にはどのような関係があるのでしょうか?あなたが思っている...

機械学習エンジニアが知っておくべきアルゴリズムトップ10

機械学習/人工知能のサブフィールドがここ数年で人気が高まってきたことは間違いありません。ビッグデータ...

機械学習における興味深いアルゴリズム 10 選

この記事を通じて、ML でよく使用されるアルゴリズムについて常識的に理解することができます。コードや...

...

...

...

Java ソートアルゴリズムの概要 (V): マージソート

マージソートとは、2つ(またはそれ以上)の順序付きリストを新しい順序付きリストにマージすることです。...