AIカーゴのロープロファイルバージョン？ネットユーザーがCNN1台を使って「ニード・フォー・スピード9」でレース

最近、Redditユーザーが、2005年にリリースされたクラシックゲーム「ニード・フォー・スピード9 モスト・ウォンテッド」でAIが運転できるようにCNNモデルを構築しました。

1,700 件を超える「いいね！」があり、現時点で機械学習サブフォーラムで最も人気のある投稿となっています。

効果はというと…

広い道路では、AIはかなりスムーズに運転しましたが、時々「蛇行」することがありました...

幸いなことに、速度は適切に制御されており、「警察」の注意を引くことは容易ではなかった。

これはゲームの仕組みの一部ではあるが、追いかけてくるパトカーを追い払うために手動でゲームを操作しようとするたびに、プレイヤーは疲れを感じ、指が痛くなるだろう。

特に追跡レベルが上がると、古いパトカーではなく、大型SUVやヘリコプターに遭遇することになり、逃走の難易度が急激に上がります。

おそらくトレーニングデータのおかげで、AI が道路上で障害物に遭遇したとき、それは人間のプレイヤーとまったく同じように動作します。

AIの辞書には「隠す」という言葉は存在しません。

一番いい方法は、ハンドルを軽く回してルートを微調整し、狙いを定めて突っ込むことです。

道路標識からコーンまで、どれも見逃せません。

プロジェクトは非常にシンプルですが、データが不十分です

「Deep For Speed」は Python 3.9 と Pytorch 1.10 をベースにしており、Numpy ライブラリと Matplotlib ライブラリをインストールするだけで済みます。

作者は、このプロジェクトのアイデアは NVIDIA プロジェクトからインスピレーションを得たと述べています。

論文では、Nvidia は多数の複雑なアルゴリズムではなく、単一の畳み込みニューラルネットワークのみを使用して自動運転車を作成したと述べられています。

インフラストラクチャー

著者は、彼のプロジェクトのワークフローは非常にシンプルだと述べました。

プログラムはまず、ゲーム内のスピードダッシュボード、小さなマップ、直感的な路面を記録し、それらを numpy 配列として保存し、次に np.load() 関数を呼び出して処理します。

モデル内の play.py 関数と play_util.py 関数は、実際にはキーボード入力シミュレーターであり、AI の自動運転の結果を物理的なキーボード入力にシミュレートしてゲームを制御します。

ただし、参照プロジェクトが比較的古いためか、ここではゲームを 800x600 の解像度に調整し、画面の左上隅で実行することしかできません。

データの作成と処理

モデルの使用

プロジェクトの作者は、モデルの実用的なプロトタイプを作成するのに 2 週間、他のユーザーも使用できるようにモデルを修正するのにさらに 2 週間かかったと述べています。プロジェクトに費やされた合計時間は約 1 か月でした。

その中でも、トレーニングデータセットの収集は最も難しい部分と言えます。

著者は、20時間のゲームプレイ中に収集したデータのうち、モデル変更の頻度と規模により、最終的に利用できるのは2時間分のデータのみだったと述べています。

プロジェクトのオープンソース部分は、トレーニングデータセットを拡張する必要があったためでもあります。データパッケージを拡張したかったのですが、自分ではできませんでした。

しかし、全員が一緒にプレイできれば、誰かがより大きなトレーニングデータセットを作成し、独自のモデルをトレーニングして、それを彼と共有するかもしれません。

そのため、作者は、元のゲーム「Most Wanted」の名前を模倣して、プロジェクトに「DeepForSpeed: Data Wanted」というニックネームも付けました。

最終的な目標として、プロジェクト作成者は、CNN プロジェクトを複数のアーキテクチャを試すことができる汎用プラットフォーム/インターフェースにしたいと考えています。

これにより、プレイヤーはシミュレーターのエンターテイメントを体験しながら、作成した他のニューラルネットワークを試すこともできます。

ニード・フォー・スピード：モスト・ウォンテッド

『ニード・フォー・スピードモスト・ウォンテッド』は、ゲーム業界ではおなじみのメーカー、エレクトロニック・アーツ（EA）が発売した「ニード・フォー・スピードシリーズ」の第9作目のレーシングゲームです。2005年11月15日に米国で発売されました。

当時、私はストーリーの冒頭で愛車のBMW M3 GTRを失くさなければならず、長い間本当に不快な思いをしていました。

特に最も基本的な自動車から始めなければならないので、「バイクを自転車に変える」という教科書的な例です...

このゲームは、サンドボックスのオープンワールド、警官と強盗の逃走追跡モード、バレットタイムの視覚効果、プレイヤーが改造した車両などの機能を組み合わせています。

これらの機能は、ほぼすべての大手ゲームメーカーがまだ参加型ムービータイプのゲームプロジェクトに取り組んでいた当時のトレンドの最先端でした。

このゲームには、Windows バージョンに加えて、GameCube、GBA、NDS、PlayStation 2、PSP、Xbox、Xbox 360 などの複数のゲームコンソールプラットフォームに対応したバージョンもあります。

2009年末までに、このゲームはすべてのプラットフォームで1,600万本を売り上げ、ニード・フォー・スピードシリーズ全体で最も売れたタイトルとなり、当時世界中で非独占プラットフォーム上で最も売れた単一のレーシングゲームにもなりました。

このゲームのヒロインの声優は、2000年代にスーパーモデルから女優に転向した超イケメンおばさんのジョシー・マラン。人気が出ずにコスメブランドに転向し、ついに成功した。

同年、ゲームメディアのウェブサイトでも広く賞賛されました。 Metacritic と Game Rankings の両方で、82 (100 点満点) という高いスコアが付けられました。

Eurogamer はこれを「グラフィックが素晴らしい」と評し、GameSpot は 10 点満点中 8.4 点を付けて、ゲームの「鮮明なグラフィック」と「優れたサウンド」を称賛したが、ゲームの AI が最初は簡単すぎるが、後半は難しすぎると批判した。

国内のプレイヤーの中には、子供の頃を思い出したくて、掘り出してもう一度プレイした人もいました。評価は「スピード感は相変わらず一流で、黄色くぼやけた光と影、粒子効果が多くのシーンのシンプルさをカバーしています。やはりかなり楽しいです」でした。

ただし、このゲームのグラフィック品質は平均的ですが、ゲームオペレーティングシステムは優れており、機械学習モデルの個々の開発者の要件をちょうど満たしています。

画質は平均的で、ハードウェア要件は低く、個人でも購入できる価格であるため、ゲームは依然として楽しいので、AI モデルをトレーニングしてプレイさせることは依然として価値があります。

2016年の論文に触発されて

なお、アイデアの元となったNVIDIAの論文も非常に古いものですが、その効果は今でも抜群です。

論文リンク: https://arxiv.org/abs/1604.07316

論文では、著者らは畳み込みニューラルネットワーク (CNN) をトレーニングして、単一の前面カメラの生のピクセルをステアリングコマンドに直接マッピングしました。

人間のデータがほとんどなくても、AI は、標識のない場所や視覚的なガイダンスが不明瞭な場所でも車の運転を学習できます。

著者らは、道路の境界を検出するように AI をトレーニングする代わりに、人間のステアリング角度をトレーニング信号として使用して有用な道路特徴を検出し、AI が内部表現を学習できるようにしました。

車線マーキングの検出、経路計画、制御などの問題を明示的に分解するのに比べて、Nvidia が提案するエンドツーエンドのシステムでは、すべての処理ステップが同時に最適化されます。

著者らは、このアプローチによりパフォーマンスが向上し、システムが小型化されると考えています。その中で、車線検出など人間が選択した中間基準を最適化するのではなく、内部自己最適化によりシステム全体のパフォーマンスを最大化することができます。

トレーニングプロセスでは、まず画像が CNN ネットワークに入力され、次にステアリング指示が計算されます。

その後、この指示は画像の予想される指示と比較され、CNN の出力が予想される出力に近づくように CNN の重みが調整されます。このうち、重み調整はバックプロパゲーションによって完了します。

一度トレーニングされると、ニューラルネットワークはビデオ画像から正しいステアリングコマンドを生成できるようになります。

ネットユーザー：FSDに似ていますね！

「ゲーム内のAI運転パフォーマンスは、カリフォルニアのほとんどの道路で人間のドライバーよりも優れています」

「ゲーム内のAI運転はテスラのFSDとほぼ同じです！とても良いです！」

ネットユーザー：「素晴らしい仕事だよ。マリオカートバージョンを作ってくれないか？金払ってもいいよ。」

プロジェクト作成者: 「わかりました。マリオカートをプレイしながら画面を録画できれば、うまくいくかもしれません。」

「これをソフトウェアアップグレードとしてテスラに販売しないでください」

<<: AlphaFold2 は大きな貢献をしました!清華大学チームがディープラーニングでCOVID-19抗体を強化し、AIの画期的な成果を生み出す

>>: ByteDance、最大6.9倍のパフォーマンス向上を実現した大規模モデルトレーニングフレームワークveGiantModelをオープンソース化

AIカーゴのロープロファイルバージョン？ネットユーザーがCNN1台を使って「ニード・フォー・スピード9」でレース

プロジェクトは非常にシンプルですが、データが不十分です

インフラストラクチャー

ニード・フォー・スピード：モスト・ウォンテッド

2016年の論文に触発されて

ネットユーザー：FSDに似ていますね！

ガートナー：ディープフェイクと生成AIがゼロトラストの世界へ

グーグル、規制当局の措置を受けてEUでのチャットボット「バード」のリリースを一時停止

AIの最高峰：自然言語処理

「ブラックミラー」に匹敵する-AI技術が母親に亡くなった娘の姿を見せた

ChatGPTがチップ設計に力強く参加します！専門的なハードウェア記述言語を学ぶ必要はなく、人間の言語を話すだけでよい

「生成型人工知能サービスの基本セキュリティ要件」は、一般からのコメントを受け付けています。個人情報を含むコーパスの使用には、該当する主体からの許可が必要です。

クローズドループへ！ DriveMLM: LLM と自動運転行動計画の完璧な組み合わせ!

【文字列処理アルゴリズム】回文判定のアルゴリズム設計とCコード実装

AIは自己反復と最適化が可能で、わずか26秒で歩行ロボットを設計できる

推薦する

AutoXの完全無人タクシーが試験運用のため正式に一般公開

JD Search EE リンクの進化

AI の透明性とは何ですか? また、なぜそれが必要なのですか?

「翼竜」が飛び立ち、その威力を発揮。固定翼ドローンについて、あなたはどのくらい知っていますか？

GPT-4 は愚かになる!新しい質問に答えるパフォーマンスが低すぎます。レベルを維持したい場合は、新しいモデルをトレーニングし続けるしかありません。

それは単なるアルゴリズムとモデルですか?これらのポイントによりAIを徹底的に理解できる

1行のコードでデバッグと印刷を排除し、アルゴリズムの学習を支援

ディープラーニングに基づく画像マッチング技術の概要

パフォーマンスが20%向上しました! USTCの「状態シーケンス周波数領域予測」手法：学習サンプル効率の最大化の特徴

アルゴリズムエンジニアのメリット: 超実践的技術ロードマップ

「編集神ヴィム」の父が死去。ネットユーザー「彼は多くの人の人生を変えた」

金融ロボアドバイザーは3つのトレンドによって増加傾向にある

2040枚の画像で訓練されたViTの精度は96.7%で、移行パフォーマンスも驚異的だ

最もわかりやすいAIチップレポート！才能とテクノロジーのトレンドがすべてここにあります