AI Punk が MNIST に敬意を表す: Python と開発ボードのみを使用して、決して繰り返されない時計を作成

AI Punk が MNIST に敬意を表す: Python と開発ボードのみを使用して、決して繰り返されない時計を作成

はい、この時計があれば、MNIST 手書きデータセットなしでは生きていけません。

私たちは古代の真空管で作られた時計を見慣れています。 AI時代に、もっとオシャレに時間を表示する方法はあるのでしょうか?はい、データセットを時計にすることもできます。毎朝、MNIST の手書きの数字でその日の記憶を呼び覚ましましょう。

[[318049]]

MNIST は、コンピューター ビジョンにおける不朽の名作です。第一世代の畳み込みニューラル ネットワークがこの手書き数字データセットで輝かしい成果をあげたとき、それは歴史に残る運命でした。

コンピューター ビジョンは MNIST データセットの時代をはるかに超えて進化していますが、1,000 万枚を超える画像を持つ ImageNet でさえ、もはや非常に大きな画像データセットではありません。しかし、MNIST は依然として無視できるものではありません。これはディープラーニングを始めるための最初のデータセットであり、アルゴリズムを検証するための最初の実験です。 Hinton氏もCapsuleのアイデアを検証するためにデータセットでそれを使用しました。

このようなデータセットの「先駆者」に敬意を表したい場合、どのようなアプローチをとりますか? GitHub で、Machine Heart は興味深い小さなプロジェクトを見つけました。作者の Dheera Venkatraman は時計を作りましたが、その中の数字はすべて MNIST データ セットからサンプリングされたものでした。

プロジェクトアドレス: https://github.com/dheera/mnist-clock

つまり、毎日重複することなく、24 時間以内に 10,000 個の異なる手書きの数字がランダムに選択されます。結果的に得られる効果は次のようになります。

このような電子時計に必要なのは、シンプルな回路基板と 4 つの電子インク スクリーンだけです。裏側から見ると次のようになります。

ハードウェア

このプロジェクトでは、多数の GPIO ピン、4MB のフラッシュ、Wi-Fi などを備えたコンパクトな ESP32 ボードである TinyPICO 開発ボードを使用します。 TinyPICO は、ESP32-PICO-D4 をベースにした世界最小の開発ボードと言えます。240 MHz 32 ビット デュアルコア プロセッサは、計算を完了するのに十分です。

4 つの e-link デジタル ディスプレイ。e-link を選択した理由は、手書きの数字のコンセプトに適合し、どのような照明条件でも適切に機能し、誰にも邪魔にならないためです。 Waveshare の e-link ディスプレイは主に SPI ですが、いくつか追加のピンもあります。ほとんどの人は SPI と CS ピンのみを含むボードを望みますが、より多くのリンクが必要です。以下は ESP32 の接続図です。これに従って配線を巻き上げます。

著者は、TinyPICO で 2 つの 10 ピン JST-EH コネクタを使用しています。JST-EH は JST-XH よりも低いプロファイルを使用しており、挿入に適しており、標準ピンよりも短く安全です。

TinyPICOに接続されたJST-EHコネクタ

次に、3D プリントされたハウジングにハードウェアを固定すれば完了です。

読者がハードウェアに詳しくない場合でも心配はいりません。プロジェクト作成者が提供したハードウェアに従って組み立てるだけです。後ほど、すべての「装備」の価格と、著者が提供した設計図を紹介します。

ソフトウェア

プロジェクト作者の Dheera Venkatraman 氏は、普段は C++ または C で書いているが、MicroPython に非常に興味があるため、このプロジェクトでは MicroPython を使用したと述べています。

プロジェクトの著者は、MNIST 手書き数字を表現するために、ピクセルあたり 2 ビットのグレースケール深度を使用しました。このビット深度では、28 x 28 ピクセルの画像に必要なバイト数は 196 バイトのみなので、4 MB のフラッシュ メモリで MNIST 検証セット全体を収容できます。データセット全体を収めたい場合は、フラッシュメモリをより多く搭載したマイクロコントローラを入手するか、1 ビット深度の画像を使用するか、圧縮方法などを使用する必要があります。

すべてのファイルを TinyPICO のルート ディレクトリの /code に配置します。正しいファイルは次のようになります。

さらに、Wi-Fi 用の .wifi という名前のファイルを作成し、その間に yourssid と yourpassword を記述する必要があります。WIFI 設定を読み取るための具体的なコードは次のとおりです。

プロジェクトの作者である Dheera Venkatraman は、すべてのコード ファイルを GitHub で提供しており、時計の数字を印刷するためのコードも非常に読みやすいです。さらにわかりやすいのは、著者のコードには非常に完全なコメントが提供されており、すべての基本的な重要なステートメントが説明されていることです。

現実的に考えてみましょう。1 つの作品を作るのにどれくらいの費用がかかりますか?

ハードウェアを見ると、主なコストは TinyPICO 開発ボードと 4 つの電子インク スクリーンのようです。まず、TinyPICOはTaobaoや海外のウェブサイトで購入できます。海外では20ドルで販売されていますが、Taobaoでの価格は235元で、送料を含めてもほぼ同じです。さらに、読者は特別な部品モールを選択することもできます。ここでの価格も約200元です。

第二に、電子インクスクリーンの価格は24ドルほどです。タオバオでは見つかりませんが、国内の部品モールでは1個あたり92元ほどとかなり安くなっています。おそらく、ラズベリーパイの方が需要が高いのでしょう。

その他のコストは比較的小さく、時計用の配線、コネクタ、外装は比較的入手しやすく、国内の部品モールで一括購入することができます。読者が外装を 3D プリントしたい場合のために、著者は具体的な印刷パラメータも提供しています。したがって、一般的に、生産コストは650元未満になるはずであり、開発ボードと電子スクリーンは他のプロジェクトで再利用できます。

おそらく、このプロジェクトの作者の実装を改善し、大きなインク画面にデジタル時計を実装し、より一般的に使用されているRaspberry Piをメインボードとして直接使用し(消費電力はTinyPICOよりもはるかに高い)、バックグラウンドとしてCIFAR-10のリアルタイムサンプリングなどのより多くの機能を実装することもできます。つまり、MNIST デジタル時計にはまだまだやるべきことがたくさんあります。

最後に、すべてのハードウェアとソフトウェアの詳細は、元のプロジェクトで入手できます。さらに、ディーラ・ベンカトラマンが非常に興味深い若者であることも特筆に値します。彼は人類史上最長の人工河川に沿って杭州から北京まで1,600キロを自転車で走りました。

最後になりましたが、重要なことです

MNISTが表舞台に立っていた時代は過ぎ去ったのは事実ですが、その役割を無視することはできません。今でも、MNISTを改良・改修し、独自の貢献をしている研究者は数多くいます。

2017 年、ドイツのファッション テクノロジー企業 Zalando が Fashion MNIST データセットを提供しました。このデータセットのサイズ、形式、トレーニング セット/テスト セットの区分は、元の MNIST とまったく同じです。MNIST からこのデータセットに移行する場合、コードを変更する必要はありません。

[[318053]]

昨年 6 月、NYU と Facebook の研究者は MNIST データセットを再構築および拡張し、テスト セットに 50,000 個の新しいサンプルを追加して、テスト セットを 60,000 個のサンプルに増やしました。 MNIST の著者の 1 人である Yann LeCun 氏は、「元の MNIST テスト セットを何度も使用すると、モデルがテスト セットに過剰適合する可能性があります。新しいサンプルで試してみる必要があります。」と述べています。

MNISTを日常生活の中で美しく楽しいプロジェクトにしたり、データセット自体の機能を改善したりすることで、MNISTは常に生きた歴史になります〜

<<:  オペレーティング システムのプロセス スケジューリング アルゴリズム (CPU 仮想化)

>>:  5Gは19の業界に浸透?これらの5つの分野はもっと注目に値する

ブログ    
ブログ    
ブログ    

推薦する

...

...

なぜ誰もディープラーニングの本質を明らかにしないのでしょうか? !

[[213484]]人類はゆっくりと世界の本質に近づいています。物質は単に情報パターンの担い手にす...

高校生のアルゴリズム「y-cruncher」が円周率の精度の世界記録を更新した

最近、スイスのグラウビュンデン応用科学大学のチームが、円周率の62.8兆桁の計算を101日と9時間で...

...

...

...

...

...

...

「より深く」「より鮮明に」見る - 超高精細画像におけるディープラーニングの応用

毎日肖像画を模写する練習を続けた結果、この芸術家はいくつかの重要な特徴だけを描いた人間の顔を完全に描...

ワンクリックで漫画に変身!流行のDouyin特殊効果の背後にある技術

昨日、李栄浩は目が小さいことで再び注目を集めた。 「特殊効果では李容浩の目は大きくできない」というト...

JWT: どの署名アルゴリズムを使用すればよいですか?

[[421048]]この記事は、Scott Brady が執筆した WeChat パブリック アカ...

「世界AI人材追跡調査」:米国の上級AI研究者の29%は中国出身。人材を追放することは自らの道を断つことに等しい

中国は世界最大の人工知能研究者の供給国となった。米国の人工知能分野のトップ研究者のほぼ3分の1は中国...

テキストからキーワードを抽出するにはどうすればいいですか? Daguan Dataが使用する3つのアルゴリズムから始めましょう

導入自然言語処理の分野では、膨大なテキストファイルを処理する上で、ユーザーが最も関心を持っている問題...