AI Punk が MNIST に敬意を表す: Python と開発ボードのみを使用して、決して繰り返されない時計を作成

AI Punk が MNIST に敬意を表す: Python と開発ボードのみを使用して、決して繰り返されない時計を作成

はい、この時計があれば、MNIST 手書きデータセットなしでは生きていけません。

私たちは古代の真空管で作られた時計を見慣れています。 AI時代に、もっとオシャレに時間を表示する方法はあるのでしょうか?はい、データセットを時計にすることもできます。毎朝、MNIST の手書きの数字でその日の記憶を呼び覚ましましょう。

[[318049]]

MNIST は、コンピューター ビジョンにおける不朽の名作です。第一世代の畳み込みニューラル ネットワークがこの手書き数字データセットで輝かしい成果をあげたとき、それは歴史に残る運命でした。

コンピューター ビジョンは MNIST データセットの時代をはるかに超えて進化していますが、1,000 万枚を超える画像を持つ ImageNet でさえ、もはや非常に大きな画像データセットではありません。しかし、MNIST は依然として無視できるものではありません。これはディープラーニングを始めるための最初のデータセットであり、アルゴリズムを検証するための最初の実験です。 Hinton氏もCapsuleのアイデアを検証するためにデータセットでそれを使用しました。

このようなデータセットの「先駆者」に敬意を表したい場合、どのようなアプローチをとりますか? GitHub で、Machine Heart は興味深い小さなプロジェクトを見つけました。作者の Dheera Venkatraman は時計を作りましたが、その中の数字はすべて MNIST データ セットからサンプリングされたものでした。

プロジェクトアドレス: https://github.com/dheera/mnist-clock

つまり、毎日重複することなく、24 時間以内に 10,000 個の異なる手書きの数字がランダムに選択されます。結果的に得られる効果は次のようになります。

このような電子時計に必要なのは、シンプルな回路基板と 4 つの電子インク スクリーンだけです。裏側から見ると次のようになります。

ハードウェア

このプロジェクトでは、多数の GPIO ピン、4MB のフラッシュ、Wi-Fi などを備えたコンパクトな ESP32 ボードである TinyPICO 開発ボードを使用します。 TinyPICO は、ESP32-PICO-D4 をベースにした世界最小の開発ボードと言えます。240 MHz 32 ビット デュアルコア プロセッサは、計算を完了するのに十分です。

4 つの e-link デジタル ディスプレイ。e-link を選択した理由は、手書きの数字のコンセプトに適合し、どのような照明条件でも適切に機能し、誰にも邪魔にならないためです。 Waveshare の e-link ディスプレイは主に SPI ですが、いくつか追加のピンもあります。ほとんどの人は SPI と CS ピンのみを含むボードを望みますが、より多くのリンクが必要です。以下は ESP32 の接続図です。これに従って配線を巻き上げます。

著者は、TinyPICO で 2 つの 10 ピン JST-EH コネクタを使用しています。JST-EH は JST-XH よりも低いプロファイルを使用しており、挿入に適しており、標準ピンよりも短く安全です。

TinyPICOに接続されたJST-EHコネクタ

次に、3D プリントされたハウジングにハードウェアを固定すれば完了です。

読者がハードウェアに詳しくない場合でも心配はいりません。プロジェクト作成者が提供したハードウェアに従って組み立てるだけです。後ほど、すべての「装備」の価格と、著者が提供した設計図を紹介します。

ソフトウェア

プロジェクト作者の Dheera Venkatraman 氏は、普段は C++ または C で書いているが、MicroPython に非常に興味があるため、このプロジェクトでは MicroPython を使用したと述べています。

プロジェクトの著者は、MNIST 手書き数字を表現するために、ピクセルあたり 2 ビットのグレースケール深度を使用しました。このビット深度では、28 x 28 ピクセルの画像に必要なバイト数は 196 バイトのみなので、4 MB のフラッシュ メモリで MNIST 検証セット全体を収容できます。データセット全体を収めたい場合は、フラッシュメモリをより多く搭載したマイクロコントローラを入手するか、1 ビット深度の画像を使用するか、圧縮方法などを使用する必要があります。

すべてのファイルを TinyPICO のルート ディレクトリの /code に配置します。正しいファイルは次のようになります。

さらに、Wi-Fi 用の .wifi という名前のファイルを作成し、その間に yourssid と yourpassword を記述する必要があります。WIFI 設定を読み取るための具体的なコードは次のとおりです。

プロジェクトの作者である Dheera Venkatraman は、すべてのコード ファイルを GitHub で提供しており、時計の数字を印刷するためのコードも非常に読みやすいです。さらにわかりやすいのは、著者のコードには非常に完全なコメントが提供されており、すべての基本的な重要なステートメントが説明されていることです。

現実的に考えてみましょう。1 つの作品を作るのにどれくらいの費用がかかりますか?

ハードウェアを見ると、主なコストは TinyPICO 開発ボードと 4 つの電子インク スクリーンのようです。まず、TinyPICOはTaobaoや海外のウェブサイトで購入できます。海外では20ドルで販売されていますが、Taobaoでの価格は235元で、送料を含めてもほぼ同じです。さらに、読者は特別な部品モールを選択することもできます。ここでの価格も約200元です。

第二に、電子インクスクリーンの価格は24ドルほどです。タオバオでは見つかりませんが、国内の部品モールでは1個あたり92元ほどとかなり安くなっています。おそらく、ラズベリーパイの方が需要が高いのでしょう。

その他のコストは比較的小さく、時計用の配線、コネクタ、外装は比較的入手しやすく、国内の部品モールで一括購入することができます。読者が外装を 3D プリントしたい場合のために、著者は具体的な印刷パラメータも提供しています。したがって、一般的に、生産コストは650元未満になるはずであり、開発ボードと電子スクリーンは他のプロジェクトで再利用できます。

おそらく、このプロジェクトの作者の実装を改善し、大きなインク画面にデジタル時計を実装し、より一般的に使用されているRaspberry Piをメインボードとして直接使用し(消費電力はTinyPICOよりもはるかに高い)、バックグラウンドとしてCIFAR-10のリアルタイムサンプリングなどのより多くの機能を実装することもできます。つまり、MNIST デジタル時計にはまだまだやるべきことがたくさんあります。

最後に、すべてのハードウェアとソフトウェアの詳細は、元のプロジェクトで入手できます。さらに、ディーラ・ベンカトラマンが非常に興味深い若者であることも特筆に値します。彼は人類史上最長の人工河川に沿って杭州から北京まで1,600キロを自転車で走りました。

最後になりましたが、重要なことです

MNISTが表舞台に立っていた時代は過ぎ去ったのは事実ですが、その役割を無視することはできません。今でも、MNISTを改良・改修し、独自の貢献をしている研究者は数多くいます。

2017 年、ドイツのファッション テクノロジー企業 Zalando が Fashion MNIST データセットを提供しました。このデータセットのサイズ、形式、トレーニング セット/テスト セットの区分は、元の MNIST とまったく同じです。MNIST からこのデータセットに移行する場合、コードを変更する必要はありません。

[[318053]]

昨年 6 月、NYU と Facebook の研究者は MNIST データセットを再構築および拡張し、テスト セットに 50,000 個の新しいサンプルを追加して、テスト セットを 60,000 個のサンプルに増やしました。 MNIST の著者の 1 人である Yann LeCun 氏は、「元の MNIST テスト セットを何度も使用すると、モデルがテスト セットに過剰適合する可能性があります。新しいサンプルで試してみる必要があります。」と述べています。

MNISTを日常生活の中で美しく楽しいプロジェクトにしたり、データセット自体の機能を改善したりすることで、MNISTは常に生きた歴史になります〜

<<:  オペレーティング システムのプロセス スケジューリング アルゴリズム (CPU 仮想化)

>>:  5Gは19の業界に浸透?これらの5つの分野はもっと注目に値する

ブログ    

推薦する

コンピュータアーキテクチャにおける機械学習

[[428279]]機械学習 (ML) の最近の進歩に大きく貢献したものの 1 つは、Google ...

...

ブロックチェーンと機械学習はどのようにして最も強力な人工知能を生み出すのでしょうか?

ブロックチェーン市場のデータに基づいて機械学習モデルをトレーニングすることで、世界で最も影響力のある...

人工知能 (AI): 2022 年に注目すべき 7 つのトレンド

2022年は人工知能が実験段階から基礎段階へと移行する年となるでしょう。成熟した技術の重要な指標につ...

...

エッジにAIを導入する3つのメリット

AIワークロードをエッジで実行することで、経済性の向上、意思決定の迅速化、自動化が可能になります。誇...

ツイッターがマスク氏の買収を阻止:15%以上の株式を保有する者は割引価格で発行される

イーロン・マスクによるツイッター買収のドラマもついにこの回まで来た。ツイッターは現地時間4月15日、...

人工知能は爆発的に発展しないので、バブルには注意が必要

2016年頃から、中国では人工知能への注目が高まり続けた。インターネット大手のテンセントは同年にAI...

沈興陽博士:30年間の科学研究で私が遭遇した落とし穴

先日開催されたX-Talkでは、米国工学アカデミーの外国人会員であり、XiaoIce会長でもあるハリ...

...

...

人工知能におけるGNNとは何ですか?

グラフディープラーニング(GDL)は有望な研究分野であり、グラフデータに基づいた学習や分析は非常に有...

中国チームが超伝導において新たな大きな進歩を遂げました! LK-99のような物質は、再現性と検証性を備えた超伝導性を示す。

室温超伝導に新たな進歩はありますか?華南理工大学、中南大学、中国電子科技大学の研究者らは12月19日...

CV退化!心理学者が顔認識を学び、世界中の表情を区別するために600万本のビデオを訓練

世界中の人々は笑ったり悲しんだりするときに同じ表情をしますか? [[402741]]人々の表情が一貫...