私の世界では、ステーションBのUPホストが世界初の純粋なレッドストーンニューラルネットワークを構築し、チューリング賞を受賞したヤン・ルカンがいいねを転送しました。

私の世界では、ステーションBのUPホストが世界初の純粋なレッドストーンニューラルネットワークを構築し、チューリング賞を受賞したヤン・ルカンがいいねを転送しました。

Minecraft では、レッドストーンは非常に重要なアイテムです。これはゲーム内のユニークな素材です。スイッチ、レッドストーントーチ、レッドストーンブロックは、ワイヤーやオブジェクトに電流のようなエネルギーを提供できます。

レッドストーン回路を使用すると、他のメカニズムを制御またはアクティブ化する構造を構築できます。レッドストーン回路は、プレイヤーによる手動のアクティブ化に応答するように設計することも、信号を繰り返し出力したり、クリーチャーの移動、アイテムのドロップ、植物の成長、昼夜の変化など、プレイヤー以外の原因による変化に応答するように設計することもできます。

そのため、私の世界では、自動ドア、電灯スイッチ、ストロボ電源などの単純な機械から、大型エレベーター、自動農場、小型ゲームプラットフォーム、さらにはゲーム内の内蔵コンピューターに至るまで、レッドストーンで制御できる多種多様な機械が存在します。

最近、BステーションUPの司会者@辰占敖头らがMinecraftで真の「レッドストーン人工知能」を実現しました。彼らは6か月かけて、15×15の手書き数字を認識するという世界初の純粋なレッドストーンニューラルネットワークを構築しました。

著者らは、ニューラルネットワークを実装するために、従来とは異なる計算方法であるランダムコンピューティングを使用したと述べています。これは、従来のフル精度コンピューティングよりも設計とレイアウトがはるかに単純で、1回の理論的な認識時間はわずか5分です。

この純粋なレッドストーン ニューラル ネットワークは、機械学習の分野で一般的な画像認識タスクである手書き数字の認識を、80% の精度で完了します (MNIST データセットでシミュレーション)。

実装のプロセスにおいて、著者が使用したさまざまな要素には次のものが含まれます。

1 つのニューロンは複数の入力を受け取り、 1 つの出力を生成します。

乱数と単一の論理ゲートのみを使用して分数の乗算を実行するための「乗算器」を追加します。

ニューロンアレイは認識結果を出力するか、次の層に渡します。

各数値の信頼度レベル。

畳み込み層はストロークの特徴を抽出するために使用されます。

完全に接続された第 1 層: 情報を圧縮して分類します。

活性化関数の配列: データを高次元の特徴空間に非線形にマッピングします。

完全に接続された第 2 層と第 3 層: 認識結果をさらに分類して出力します。

著者らは、ネットワークで使用されるアーキテクチャは、精度が 80% の圧縮された LeNet-5 であると述べています。

ただし、Minecraft の計算能力の制限により、実際の認識時間は 20 分を超えます。それでも、これはレッドストーン デジタル エレクトロニクスの分野における大きな進歩であり、実際のハードウェア ニューラル ネットワークにも影響を与える可能性があります。

現在、この動画は再生回数が80万回を超え、B局ランキングで39位にランクインしており、ネットユーザーを驚かせている。チューリング賞受賞者のヤン・ルカン氏もこの動画を Facebook に再投稿し、「非常に忍耐強く粘り強い人がレッドストーンを使って私の世界に LeNet-5 を実装した」とコメントしています。ルカン氏は LeNet アーキテクチャの考案者です。

【Minecraft】世界初の純粋なレッドストーンニューラルネットワーク!リアルレッドストーン人工知能(中国語/英語)[Minecraft] レッドストーン畳み込みニューラルネットワーク - 原理

その背後にある原理

別のビデオ「[Minecraft] Redstone Convolutional Neural Network - Principle」では、著者がRedstone Convolutional Neural Networkの原理を詳しく説明しています。

一般的に、彼らは圧縮された LeNet-5 畳み込みニューラル ネットワークを使用しました。畳み込みはネットワークの最初のステップであり、重み付けされたウィンドウ (畳み込みカーネル) を使用して画像を 1 つずつスキャンし、ストロークの特徴を抽出します。

これらのストロークの特徴は、分類と認識のためにディープ ニューラル ネットワーク (完全接続層) に送られます。

Minecraft でレッドストーン ニューラル ネットワークを実装する

著者はまず、シングルパルス圧力プレートスタイラスと 15×15 座標スクリーンを含む入力デバイスをリストします。手書きタブレットは毎回 2 ティックの座標信号を生成し、それが画面に描画されます。

次に、手書きの数字は畳み込み層に入り、畳み込みカーネルのマスクされた部分を累積して結果を次の層に出力する計算方法が採用されます。さらに、非線形性を保証するために、出力は ReLU 関数も通過します。

畳み込みカーネルは 3×3 のみであるため、著者は電気モジュラー演算を直接使用し、出力で ReLU を自動的に実行します。

また、畳み込みはアニメーションのように移動できないため、直接積み重ねられ、タブレット入力にハードワイヤードされます。

完全接続層では、各層は複数のニューラル ネットワークで構成されます。各ニューロンは複数の入力に接続され、 1 つの出力を生成します。ニューロンは各入力を受け取り、それを加重合計として加算し、それを活性化関数に送り込んで出力を生成します。加重合計は「線形セグメンテーション」ですが、次元を増やすには活性化関数は非線形でなければならないことに注意してください。著者は活性化関数として tanh (双曲正接) を使用しました。

これは、下の図に示すように、実際のニューロン回路に反映されます。

同時に、重量はスローワー(アイテムの比率を調整して異なる周波数のランダムな文字列を生成するために使用)に保存され、入力は重量で乗算され、アナログ電子機器を通じて蓄積されます。

最終的な回路実装

回路の実装に関しては、最初にアナログ電子機器を介して加算が実行され、次にデジタル電気信号に変換されます。

アキュムレータは、オーバーフローしないように別のアップ マスターによって提供される、修正された 2 ティック パイプライン加算器です。

ニューロンは積み重ねられ、完全に接続された層を形成します。

最後のレイヤーの出力とレイヤー間バッファには、5Hz 文字列内の「1」の数をカウントでき、容量が 1024 の次のアナログ カウンターが使用されます。

最後に、出力レベルでは、カウンターの上位 4 ビットがカウント ボードに接続され、回路は最大値を選択して出力パネルに表示します。

ビデオの最後に、著者は下の図に示すように最終的なネットワーク構造を示しています。重みの範囲は[-1, 1]、ランダム文字列の長さは1024、MNISTデータセットの精度は約80%です。ただし、文字列の長さが 256 の場合、精度は 62% にしかなりません。

<<:  ディープマインドAIは人間に対して84%の勝率を誇り、ウエスタンアーミーチェスで初めて人間の専門家のレベルに到達した。

>>:  権限の取得方法についての簡単な説明: ファイルのアップロード

ブログ    
ブログ    

推薦する

データサイエンスに必須の Python パッケージ 10 個

[51CTO.com クイック翻訳] データサイエンスに対する人々の関心は過去 5 年間で大幅に高ま...

COVID-19患者のどの症状が悪化するかを予測する新しいアルゴリズム

[[373238]]ミシガン大学の研究者らは、COVID-19患者約400人のデータを分析し、時間の...

パラメータ数はわずか1/700で、性能はGPT-3.5を超えます! CMU+Tsinghua オープンソース Prompt2Model フレームワーク

大規模言語モデル (LLM) に基づいて、開発者やユーザーは、タスクを記述し、いくつかの例を示して自...

...

Python による顔認識 (ソースコード付き)

Python は画像やビデオから顔を検出して認識できます。顔の検出と認識は、コンピューター ビジョ...

...

マスク氏とクック氏は秘密協定を結んだのか?アップルは「アップル税」でテスラに数百万ドルの節約をもたらす

ビッグデータダイジェスト制作著者: カレブ周知のとおり、Apple の App Store のポリシ...

あらゆる角度から監視されることへの不安:AI はプライバシー侵害にどう対抗できるか?

インテリジェント時代では、アルゴリズムと計算能力の継続的な進歩により、AI 技術が急速に発展しました...

LLM ウィザード、コードの事前トレーニングは魔法の杖です! UIUC中国チームがコードデータの3つの利点を明らかに

大規模モデルの時代における言語モデル (LLM) は、サイズが大きくなるだけでなく、トレーニング デ...

顔認識アクセス制御システムの登場により、私たちのプライバシーを誰が守るのでしょうか?

最近は「顔カード」、つまり「顔を売る」という言葉をよく耳にしますが、あなたの「顔」が身分証明書や電話...

人工知能のジレンマ:人々の疑問を払拭できない

[[255964]]人工知能(AI)の急速な進歩と発展により、その二重用途やセキュリティリスクについ...

...

マイクロソフトはAIを活用して新しい電池材料を選別し、電池のリチウムの70%をナトリウムに置き換える

1 月 10 日、マイクロソフトの量子コンピューティング チームは、米国エネルギー省傘下のパシフィッ...