AI Punk が MNIST に敬意を表す: Python と開発ボードのみを使用して、決して繰り返されない時計を作成

AI Punk が MNIST に敬意を表す: Python と開発ボードのみを使用して、決して繰り返されない時計を作成

はい、この時計があれば、MNIST 手書きデータセットなしでは生きていけません。

私たちは古代の真空管で作られた時計を見慣れています。 AI時代に、もっとオシャレに時間を表示する方法はあるのでしょうか?はい、データセットを時計にすることもできます。毎朝、MNIST の手書きの数字でその日の記憶を呼び覚ましましょう。

[[318049]]

MNIST は、コンピューター ビジョンにおける不朽の名作です。第一世代の畳み込みニューラル ネットワークがこの手書き数字データセットで輝かしい成果をあげたとき、それは歴史に残る運命でした。

コンピューター ビジョンは MNIST データセットの時代をはるかに超えて進化していますが、1,000 万枚を超える画像を持つ ImageNet でさえ、もはや非常に大きな画像データセットではありません。しかし、MNIST は依然として無視できるものではありません。これはディープラーニングを始めるための最初のデータセットであり、アルゴリズムを検証するための最初の実験です。 Hinton氏もCapsuleのアイデアを検証するためにデータセットでそれを使用しました。

このようなデータセットの「先駆者」に敬意を表したい場合、どのようなアプローチをとりますか? GitHub で、Machine Heart は興味深い小さなプロジェクトを見つけました。作者の Dheera Venkatraman は時計を作りましたが、その中の数字はすべて MNIST データ セットからサンプリングされたものでした。

プロジェクトアドレス: https://github.com/dheera/mnist-clock

つまり、毎日重複することなく、24 時間以内に 10,000 個の異なる手書きの数字がランダムに選択されます。結果的に得られる効果は次のようになります。

このような電子時計に必要なのは、シンプルな回路基板と 4 つの電子インク スクリーンだけです。裏側から見ると次のようになります。

ハードウェア

このプロジェクトでは、多数の GPIO ピン、4MB のフラッシュ、Wi-Fi などを備えたコンパクトな ESP32 ボードである TinyPICO 開発ボードを使用します。 TinyPICO は、ESP32-PICO-D4 をベースにした世界最小の開発ボードと言えます。240 MHz 32 ビット デュアルコア プロセッサは、計算を完了するのに十分です。

4 つの e-link デジタル ディスプレイ。e-link を選択した理由は、手書きの数字のコンセプトに適合し、どのような照明条件でも適切に機能し、誰にも邪魔にならないためです。 Waveshare の e-link ディスプレイは主に SPI ですが、いくつか追加のピンもあります。ほとんどの人は SPI と CS ピンのみを含むボードを望みますが、より多くのリンクが必要です。以下は ESP32 の接続図です。これに従って配線を巻き上げます。

著者は、TinyPICO で 2 つの 10 ピン JST-EH コネクタを使用しています。JST-EH は JST-XH よりも低いプロファイルを使用しており、挿入に適しており、標準ピンよりも短く安全です。

TinyPICOに接続されたJST-EHコネクタ

次に、3D プリントされたハウジングにハードウェアを固定すれば完了です。

読者がハードウェアに詳しくない場合でも心配はいりません。プロジェクト作成者が提供したハードウェアに従って組み立てるだけです。後ほど、すべての「装備」の価格と、著者が提供した設計図を紹介します。

ソフトウェア

プロジェクト作者の Dheera Venkatraman 氏は、普段は C++ または C で書いているが、MicroPython に非常に興味があるため、このプロジェクトでは MicroPython を使用したと述べています。

プロジェクトの著者は、MNIST 手書き数字を表現するために、ピクセルあたり 2 ビットのグレースケール深度を使用しました。このビット深度では、28 x 28 ピクセルの画像に必要なバイト数は 196 バイトのみなので、4 MB のフラッシュ メモリで MNIST 検証セット全体を収容できます。データセット全体を収めたい場合は、フラッシュメモリをより多く搭載したマイクロコントローラを入手するか、1 ビット深度の画像を使用するか、圧縮方法などを使用する必要があります。

すべてのファイルを TinyPICO のルート ディレクトリの /code に配置します。正しいファイルは次のようになります。

さらに、Wi-Fi 用の .wifi という名前のファイルを作成し、その間に yourssid と yourpassword を記述する必要があります。WIFI 設定を読み取るための具体的なコードは次のとおりです。

プロジェクトの作者である Dheera Venkatraman は、すべてのコード ファイルを GitHub で提供しており、時計の数字を印刷するためのコードも非常に読みやすいです。さらにわかりやすいのは、著者のコードには非常に完全なコメントが提供されており、すべての基本的な重要なステートメントが説明されていることです。

現実的に考えてみましょう。1 つの作品を作るのにどれくらいの費用がかかりますか?

ハードウェアを見ると、主なコストは TinyPICO 開発ボードと 4 つの電子インク スクリーンのようです。まず、TinyPICOはTaobaoや海外のウェブサイトで購入できます。海外では20ドルで販売されていますが、Taobaoでの価格は235元で、送料を含めてもほぼ同じです。さらに、読者は特別な部品モールを選択することもできます。ここでの価格も約200元です。

第二に、電子インクスクリーンの価格は24ドルほどです。タオバオでは見つかりませんが、国内の部品モールでは1個あたり92元ほどとかなり安くなっています。おそらく、ラズベリーパイの方が需要が高いのでしょう。

その他のコストは比較的小さく、時計用の配線、コネクタ、外装は比較的入手しやすく、国内の部品モールで一括購入することができます。読者が外装を 3D プリントしたい場合のために、著者は具体的な印刷パラメータも提供しています。したがって、一般的に、生産コストは650元未満になるはずであり、開発ボードと電子スクリーンは他のプロジェクトで再利用できます。

おそらく、このプロジェクトの作者の実装を改善し、大きなインク画面にデジタル時計を実装し、より一般的に使用されているRaspberry Piをメインボードとして直接使用し(消費電力はTinyPICOよりもはるかに高い)、バックグラウンドとしてCIFAR-10のリアルタイムサンプリングなどのより多くの機能を実装することもできます。つまり、MNIST デジタル時計にはまだまだやるべきことがたくさんあります。

最後に、すべてのハードウェアとソフトウェアの詳細は、元のプロジェクトで入手できます。さらに、ディーラ・ベンカトラマンが非常に興味深い若者であることも特筆に値します。彼は人類史上最長の人工河川に沿って杭州から北京まで1,600キロを自転車で走りました。

最後になりましたが、重要なことです

MNISTが表舞台に立っていた時代は過ぎ去ったのは事実ですが、その役割を無視することはできません。今でも、MNISTを改良・改修し、独自の貢献をしている研究者は数多くいます。

2017 年、ドイツのファッション テクノロジー企業 Zalando が Fashion MNIST データセットを提供しました。このデータセットのサイズ、形式、トレーニング セット/テスト セットの区分は、元の MNIST とまったく同じです。MNIST からこのデータセットに移行する場合、コードを変更する必要はありません。

[[318053]]

昨年 6 月、NYU と Facebook の研究者は MNIST データセットを再構築および拡張し、テスト セットに 50,000 個の新しいサンプルを追加して、テスト セットを 60,000 個のサンプルに増やしました。 MNIST の著者の 1 人である Yann LeCun 氏は、「元の MNIST テスト セットを何度も使用すると、モデルがテスト セットに過剰適合する可能性があります。新しいサンプルで試してみる必要があります。」と述べています。

MNISTを日常生活の中で美しく楽しいプロジェクトにしたり、データセット自体の機能を改善したりすることで、MNISTは常に生きた歴史になります〜

<<:  オペレーティング システムのプロセス スケジューリング アルゴリズム (CPU 仮想化)

>>:  5Gは19の業界に浸透?これらの5つの分野はもっと注目に値する

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

公開鍵暗号を解読することは可能ですか?

Q: 正しくインストールされ、操作されていれば、公開鍵インフラストラクチャ (PKI) は破られな...

強化学習の起源:迷路を歩くネズミから人間に勝つAlphaGoまで

強化学習となると、多くの研究者のアドレナリンが抑えきれないほど湧き上がります!これは、ゲーム AI ...

テレンス・タオは数学の問題を解くために大規模なモデルを使用しています。コードの生成とLaTeXの数式の編集は非常に便利です。

過去数か月間、数学者のテレンス・タオ氏は、ChatGPT を使用して数学の問題を解くのに何度も試み、...

MetaGPT AIモデルオープンソース:ソフトウェア会社の開発プロセスをシミュレートし、高品質のコードを生成できます

7月4日、コード生成に重点を置いたAIモデルとしてMetaGPTが発表された。名前は似ているが、Me...

...

Apple、たった1文で写真をレタッチできる新AIモデルMGIEを披露

2月8日、マイクロソフトの急速な発展と比較すると、AppleのAI分野における展開ははるかに控えめで...

...

...

...

メタは世界最速となる可能性のあるAIスーパーコンピュータを開発

Metaによれば、AI Research SuperCluster(RSC)は企業がより優れたAI...

デジタルツインがディープラーニングのデータ格差を埋める

企業がデータを活用するディープラーニング (DL) プロジェクトに着手する場合、そのデータを保護する...

IEEE年末AIレビュー:ネットユーザーがGPT-3に悪態をつくよう教える、DeepMindが再びロボットを作る

[[442763]] 2021年、「人工知能の奇跡」はもはや単なる物語ではありません!年末が近づく中...

...