AIはセルオートマトンを通じてMinecraftで家を建てることを学ぶ

AIはセルオートマトンを通じてMinecraftで家を建てることを学ぶ

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

「MineCraft」というゲームに詳しい読者なら、この絵はお馴染みのはずです。

△画像出典:サイエンスマガジン

しかし、もしその家が人間ではなく AIによって建てられたらどうなるでしょうか?

これは、コペンハーゲンIT大学、ヨーク大学、上海大学の学者が3Dニューラルセルラーオートマトン(NCA)を使用して行った新しい研究です。

静的な構造物も生成できます。もちろんアパートだけでなく、木や城も生成できます。

△画像出典:サイエンスマガジン

這う毛虫などの機能的な機械も生成できます。

△画像出典:サイエンスマガジン

二つに切ると再生魔法も発動し、分裂に成功します…

(え~絵のセンスあるよ)

これはどうやって行うのですか?

ニューロンセルオートマトン応用

研究者たちは実際に「ライフゲーム」のセルオートマトン (CA)にインスピレーションを受け、2D をベースにした3D ニューラルセルオートマトン (NCA)を開発しました。

「ライフゲーム」はセルオートマトン原理に基づいており、セルオートマトンをデモンストレーションしたものとも言えます。

これは1970年にイギリスの数学者ジョン・コンウェイによって発明されました。グリッドでは、各四角形にセルが存在し、その状態は周囲の 8 つのセルによって決定され、黒はセルの生存を表します。

その後、多くの研究で、ニューロンセルオートマトン (NCA)として知られる、より複雑なニューラルネットワークルールが採用されました。ただし、そのアプリケーションは主に 2D 構造に限定されており、単純な 3D 構造しか生成できません。

NCA の実用化における汎用性を向上させるために、研究チームは3D NCAを開発しました。

3D 畳み込みを利用して、より多くの周囲のセルをキャプチャし、より多くの種類の構築ユニットを持つ複雑な3D 構造を生成します。

△3Dニューロンセルオートマトン更新ルール

研究者らは、教師あり学習を使用して再構築損失を最適化し、NCA を使用して単一の生きた細胞からターゲットエンティティを生成しようとしました。

さらに、「Minecraft」内のエンティティは 3D グリッド内のセルとして扱われ、その状態ベクトルにはブロック タイプ、生存ステータス、非表示ステータスが含まれます。

しかし、各ユニットは単一のブロックタイプであるため、構造再構築タスクをマルチクラス分類問題として定式化し、特定のユニットのタイプを予測します。

Pytorch が提供する LogSoftmax および NLLLoss メソッドの組み合わせは、ターゲット セル構造と予測セル構造間のクロス エントロピー損失を最小化するために使用されます。

この損失によりパフォーマンスが不安定になり、モデルは「空気」ブロックを優先するようになります。

トレーニング中、通常、「空気」ブロックは選択された構造の大部分を占めるため、トレーニング データが不均衡であると、モデルが過剰予測する可能性があります。

この問題に対処するため、研究者らは損失計算を「空気」ブロックとして分類されるかどうかに基づいて 2 つの部分に分割し、非空気ブロックとエンティティ間の絶対差を測定するための交差オーバーラップ (IOU) コストを追加して精度を向上させました。

パフォーマンスはどうですか?

研究者らは、静的構造と動的機能機械の再構築におけるモデルのパフォーマンスを評価し、さまざまなパラメータを記録しました。

結果は、NCA の再構築能力が堅牢であることを示しています。

△正規化IOU/構造損失

△正規化総損失

ただし、NCA では、モデルが局所的最小値に陥り、トレーニングに時間がかかることが多いため、より大きなエンティティ (教会など) をモデル化するのは依然として困難です。

大聖堂モデルは一部のエンティティよりも損失が低いですが、ランダムに生成された構造が多く、他のエンティティほど自然ではありません。ターゲット構造と生成された効果の比較:

さらに、自然界に見られるランダムなエンティティ(オークの木など)を生成するのはより困難です。

前述のように、NCA は静的な構造を生成することができ、個々のブロックタイプの数を増やすのに適しており、アパートの建物の内部のような多様で複雑な内部を生成します。

驚いたことに、ジャングル寺院では NCA が矢の罠さえも生成しました。

研究者たちは、機能的な機械を生成する際に、異なる構造が異なるパターンを生成することを発見しました。

いくつかの構造は小さな細胞から徐々に最終形態に成長しますが、一方、幼虫は急速に構築し、その後細胞を除去して最終構造を形成します。

△画像出典:サイエンスマガジン

さらに、NCA の再生特性も注目すべき点です。単一細胞から複雑な構造を成長させることに加えて、これらの局所的な更新ルールにより、損傷の再生または修復も可能になります。

トレーニングを行わなくても、木などの特定の損傷した構造物を回復できます。

しかし、比較テストを行った結果、研究者らは次のことを発見しました。

再生トレーニングを行わない場合、モデルの再生成率はわずか 30% でしたが、再生トレーニングを行った後、生成率は 99% に達しました。

3D NCA はネットユーザーから広く注目を集めており、Reddit の一部ネットユーザーは次のように述べています。

NCA の物理学への応用も検討する価値があります。たとえば、結晶形成をシミュレートするために使用できます。

<<:  機械学習に基づく自動脆弱性修復分析法

>>:  AI、機械学習、ディープラーニングの解放

ブログ    
ブログ    
ブログ    

推薦する

ChatGPTプラグインがもたらすセキュリティ上の課題

OpenAI の ChatGPT は人工知能言語モデルにおいて重要な進歩を遂げ、人間が特定のテキスト...

AI の創造性を解き放つ: Replicate プラットフォーム上のトップ AI プロジェクト!

Replicate は、ユーザーがさまざまな人工知能タスクを達成できるようにすることを目的として、...

ロボティック プロセス オートメーションについて知っておくべき 10 のこと

[[381496]]ロボティック プロセス オートメーションにより、ワークフローが合理化され、レガシ...

顔認識技術とは何ですか?適用シナリオは何ですか?

顔認識機能は、店舗への入店時、サービスプロセス中、チェックアウト前など、小売業者が顧客の身元(Ope...

論文と新しいビデオはこちら、サウスイースト大学が「室温超伝導体」LK-99の奇妙な抵抗挙動を説明

最近、各国の科学者らが韓国の「常温超伝導」物質LK-99に関する研究を発表し、悲観的な見方をする人が...

知らないうちに個人のプライバシーを人工知能に「提供」しないでください

[[260334]] BBCによると、IBMは最近、顔認識アルゴリズムの訓練のため、ユーザーの同意を...

Google の最新 AI モデル「Gemini」について知っておくべきことすべて

Google Geminiとは何ですか? Gemini は、テキストだけでなく画像、ビデオ、オーディ...

自然言語処理 (NLP) とは何ですか?

[[399636]] 【51CTO.com クイック翻訳】自然言語処理 (NLP) の定義自然言語...

テンセントが自動運転車市場に参入、百度セキュリティが共同で「OASESスマート端末セキュリティエコロジカルアライアンス」を設立

テンセントは自動運転システムを開発し、無人運転市場への参入も狙っている。百度セキュリティはファーウェ...

...

...

...

トレンド | AIを学ぶには、まず2018年の人工知能に関する13の予測を理解する必要があります

[[214541]] 2017 年は、ウォール ストリート ジャーナル、フォーブス、フォーチュンなど...

Jetson - Nano Opencv の基本的な使用方法

序文:前回のJetson Nanoの記事では、学習のためのアイデアや教材を紹介しました。今日は、引き...

国境を越えた大企業よ、安易に「自社開発チップ」を主張しないでほしい

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...