AI Punk が MNIST に敬意を表す: Python と開発ボードのみを使用して、決して繰り返されない時計を作成

AI Punk が MNIST に敬意を表す: Python と開発ボードのみを使用して、決して繰り返されない時計を作成

はい、この時計があれば、MNIST 手書きデータセットなしでは生きていけません。

私たちは古代の真空管で作られた時計を見慣れています。 AI時代に、もっとオシャレに時間を表示する方法はあるのでしょうか?はい、データセットを時計にすることもできます。毎朝、MNIST の手書きの数字でその日の記憶を呼び覚ましましょう。

[[318049]]

MNIST は、コンピューター ビジョンにおける不朽の名作です。第一世代の畳み込みニューラル ネットワークがこの手書き数字データセットで輝かしい成果をあげたとき、それは歴史に残る運命でした。

コンピューター ビジョンは MNIST データセットの時代をはるかに超えて進化していますが、1,000 万枚を超える画像を持つ ImageNet でさえ、もはや非常に大きな画像データセットではありません。しかし、MNIST は依然として無視できるものではありません。これはディープラーニングを始めるための最初のデータセットであり、アルゴリズムを検証するための最初の実験です。 Hinton氏もCapsuleのアイデアを検証するためにデータセットでそれを使用しました。

このようなデータセットの「先駆者」に敬意を表したい場合、どのようなアプローチをとりますか? GitHub で、Machine Heart は興味深い小さなプロジェクトを見つけました。作者の Dheera Venkatraman は時計を作りましたが、その中の数字はすべて MNIST データ セットからサンプリングされたものでした。

プロジェクトアドレス: https://github.com/dheera/mnist-clock

つまり、毎日重複することなく、24 時間以内に 10,000 個の異なる手書きの数字がランダムに選択されます。結果的に得られる効果は次のようになります。

このような電子時計に必要なのは、シンプルな回路基板と 4 つの電子インク スクリーンだけです。裏側から見ると次のようになります。

ハードウェア

このプロジェクトでは、多数の GPIO ピン、4MB のフラッシュ、Wi-Fi などを備えたコンパクトな ESP32 ボードである TinyPICO 開発ボードを使用します。 TinyPICO は、ESP32-PICO-D4 をベースにした世界最小の開発ボードと言えます。240 MHz 32 ビット デュアルコア プロセッサは、計算を完了するのに十分です。

4 つの e-link デジタル ディスプレイ。e-link を選択した理由は、手書きの数字のコンセプトに適合し、どのような照明条件でも適切に機能し、誰にも邪魔にならないためです。 Waveshare の e-link ディスプレイは主に SPI ですが、いくつか追加のピンもあります。ほとんどの人は SPI と CS ピンのみを含むボードを望みますが、より多くのリンクが必要です。以下は ESP32 の接続図です。これに従って配線を巻き上げます。

著者は、TinyPICO で 2 つの 10 ピン JST-EH コネクタを使用しています。JST-EH は JST-XH よりも低いプロファイルを使用しており、挿入に適しており、標準ピンよりも短く安全です。

TinyPICOに接続されたJST-EHコネクタ

次に、3D プリントされたハウジングにハードウェアを固定すれば完了です。

読者がハードウェアに詳しくない場合でも心配はいりません。プロジェクト作成者が提供したハードウェアに従って組み立てるだけです。後ほど、すべての「装備」の価格と、著者が提供した設計図を紹介します。

ソフトウェア

プロジェクト作者の Dheera Venkatraman 氏は、普段は C++ または C で書いているが、MicroPython に非常に興味があるため、このプロジェクトでは MicroPython を使用したと述べています。

プロジェクトの著者は、MNIST 手書き数字を表現するために、ピクセルあたり 2 ビットのグレースケール深度を使用しました。このビット深度では、28 x 28 ピクセルの画像に必要なバイト数は 196 バイトのみなので、4 MB のフラッシュ メモリで MNIST 検証セット全体を収容できます。データセット全体を収めたい場合は、フラッシュメモリをより多く搭載したマイクロコントローラを入手するか、1 ビット深度の画像を使用するか、圧縮方法などを使用する必要があります。

すべてのファイルを TinyPICO のルート ディレクトリの /code に配置します。正しいファイルは次のようになります。

さらに、Wi-Fi 用の .wifi という名前のファイルを作成し、その間に yourssid と yourpassword を記述する必要があります。WIFI 設定を読み取るための具体的なコードは次のとおりです。

プロジェクトの作者である Dheera Venkatraman は、すべてのコード ファイルを GitHub で提供しており、時計の数字を印刷するためのコードも非常に読みやすいです。さらにわかりやすいのは、著者のコードには非常に完全なコメントが提供されており、すべての基本的な重要なステートメントが説明されていることです。

現実的に考えてみましょう。1 つの作品を作るのにどれくらいの費用がかかりますか?

ハードウェアを見ると、主なコストは TinyPICO 開発ボードと 4 つの電子インク スクリーンのようです。まず、TinyPICOはTaobaoや海外のウェブサイトで購入できます。海外では20ドルで販売されていますが、Taobaoでの価格は235元で、送料を含めてもほぼ同じです。さらに、読者は特別な部品モールを選択することもできます。ここでの価格も約200元です。

第二に、電子インクスクリーンの価格は24ドルほどです。タオバオでは見つかりませんが、国内の部品モールでは1個あたり92元ほどとかなり安くなっています。おそらく、ラズベリーパイの方が需要が高いのでしょう。

その他のコストは比較的小さく、時計用の配線、コネクタ、外装は比較的入手しやすく、国内の部品モールで一括購入することができます。読者が外装を 3D プリントしたい場合のために、著者は具体的な印刷パラメータも提供しています。したがって、一般的に、生産コストは650元未満になるはずであり、開発ボードと電子スクリーンは他のプロジェクトで再利用できます。

おそらく、このプロジェクトの作者の実装を改善し、大きなインク画面にデジタル時計を実装し、より一般的に使用されているRaspberry Piをメインボードとして直接使用し(消費電力はTinyPICOよりもはるかに高い)、バックグラウンドとしてCIFAR-10のリアルタイムサンプリングなどのより多くの機能を実装することもできます。つまり、MNIST デジタル時計にはまだまだやるべきことがたくさんあります。

最後に、すべてのハードウェアとソフトウェアの詳細は、元のプロジェクトで入手できます。さらに、ディーラ・ベンカトラマンが非常に興味深い若者であることも特筆に値します。彼は人類史上最長の人工河川に沿って杭州から北京まで1,600キロを自転車で走りました。

最後になりましたが、重要なことです

MNISTが表舞台に立っていた時代は過ぎ去ったのは事実ですが、その役割を無視することはできません。今でも、MNISTを改良・改修し、独自の貢献をしている研究者は数多くいます。

2017 年、ドイツのファッション テクノロジー企業 Zalando が Fashion MNIST データセットを提供しました。このデータセットのサイズ、形式、トレーニング セット/テスト セットの区分は、元の MNIST とまったく同じです。MNIST からこのデータセットに移行する場合、コードを変更する必要はありません。

[[318053]]

昨年 6 月、NYU と Facebook の研究者は MNIST データセットを再構築および拡張し、テスト セットに 50,000 個の新しいサンプルを追加して、テスト セットを 60,000 個のサンプルに増やしました。 MNIST の著者の 1 人である Yann LeCun 氏は、「元の MNIST テスト セットを何度も使用すると、モデルがテスト セットに過剰適合する可能性があります。新しいサンプルで試してみる必要があります。」と述べています。

MNISTを日常生活の中で美しく楽しいプロジェクトにしたり、データセット自体の機能を改善したりすることで、MNISTは常に生きた歴史になります〜

<<:  オペレーティング システムのプロセス スケジューリング アルゴリズム (CPU 仮想化)

>>:  5Gは19の業界に浸透?これらの5つの分野はもっと注目に値する

ブログ    
ブログ    

推薦する

人工知能は、マルチドメイン畳み込みニューラルネットワークを通じて、JPEG二重圧縮画像内の偽造領域を特定します。

人工知能がマルチドメイン畳み込みニューラル ネットワークを介して JPEG 二重圧縮画像の偽造領域を...

...

「AIGC+」|新たなマーケティングパラダイム:AIGCは海外進出企業にとって「新たな武器」となり得るか?

わずか 1 年で、AIGC がもたらした業界を変革するアプリケーションは、徐々に人々の生活の隅々に浸...

機械学習の問題を解決する一般的な方法があります!これを読んでください

編集者注: この記事は、WeChat パブリック アカウント「Big Data Digest」(ID...

スマートビルと建築技術の未来

[[436407]]私たちの世界は、テクノロジーの進歩により急速な変化を経験し続けています。 テクノ...

...

「AI+教育」が人気を集めているが、次の巨人は誰になるのか?

人工知能という学問分野が1956年に正式に提唱されて以来、会議やフォーラムでの華やかな「ホットワード...

あなたのリモート従業員は本当に彼自身でしょうか? FBI、ディープフェイクを悪用する求職者を明らかに

ディープフェイクの世界では、真実と虚偽を区別することが難しい場合があります。 AIアルゴリズム「ディ...

趙傑:面接では(純粋な)アルゴリズムの質問が見られる

今朝、外出中に、タブレットでZuo Erduo Haoziの新しい記事「純粋アルゴリズムの面接の質問...

現代の分散ストレージシステムをサポートするアルゴリズム

アプリケーションによって処理されるデータの量が増え続けるにつれて、ストレージの拡張はますます困難にな...

Microsoft の 38 TB の内部データが漏洩!秘密鍵と3万件以上の仕事上の会話が漏洩、その背後にある理由は衝撃的

何か大きなことが起こりました!数か月前、マイクロソフトの AI 研究チームは、大量のオープンソースの...

サイバーセキュリティにおけるAIの新たな機会を見つける方法

[[383159]]新しいテクノロジーの適用には、多くの場合、プラスの影響とマイナスの影響の両方が伴...

予測分野における人工知能技術の応用

社会の発展と科学技術の進歩に伴い、人工知能技術が人類に与える影響は日々増大しており、その応用分野は拡...

ガウス混合モデルを用いた多峰性分布の分離

この記事では、ガウス混合モデルを使用して 1 次元の多峰性分布を複数の分布に分割する方法を説明します...