このBステーションアップマスターはハードコアすぎる!手作りAIテレビ:ハードウェアを自分ではんだ付けし、自分でコードを書く

このBステーションアップマスターはハードコアすぎる!手作りAIテレビ:ハードウェアを自分ではんだ付けし、自分でコードを書く

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

地味な AI 開発者が、Bilibili のトップページに登場し、動画が 100 万回再生され、素人と専門家の両方から賞賛されるなんて、どうしたら可能なのでしょうか?

それは、ハードコアで純粋な手作りの作品、つまり小さな「入れ子人形」テレビに依存しています。

そして、これはおそらく史上最もハードコアな「入れ子人形」です。B ステーションの小型テレビが、完全に手作りのテレビで正常に再生されました。

ステーション B のビデオしか再生できない開発ボード + ディスプレイだと思ったら間違いです。

これはゼロから構築された「Jarvis」と呼ばれる AI アシスタントです。

音声アシスタントとして機能するだけでなく、リアルタイム画像を処理したり、Web サーバーとしても機能します。 。 。

アップローダーはアイアンマンのように自分でデザインを描き、手作業で溶接を行っています。ちょうどアイアンマンが洞窟の中で第一世代の戦闘スーツを作ったときのように。

チップを除いて、この小型テレビはほぼすべてアップホスト自身によって設計されました。アップマスターは、小型テレビが正常に起動するのを見て、洞窟から飛び出すスタークのような気持ちになったのだろうか。

このマスコットテレビを作ったアップマスター「志慧君」は、実は彭志慧という名前で、現在はOPPOのAIエンジニアです。

[[319515]]

志慧君はこれまでもビリビリで多くのDIYハードウェア動画を投稿してきたが、ハードコアではあったものの、あまり人気が出なかった。自作の小型テレビが登場して初めて、彼の作品はビリビリのおすすめホームページに取り上げられ、100万回以上の視聴回数を獲得した。

諺にあるように、素人は興奮に注目し、専門家は細部に注目します。彼の動画の何がすごいのでしょうか?あるプロのネットユーザーはこう語った。

実際、部外者にとっては非常にクールに見えるものがいくつかありますが、実際のところ、私のような内部者にとっては、それらはやはり非常にクールです。

手描きのPCBからC++コードの作成まで

志慧君は3分間の短いビデオを使って「ビリビリ小型テレビ」の製作過程全体を説明しました。

まず紙にスケッチを描きます。

開発ボードはありませんか?大丈夫、志輝は自分で作れる。

回路基板の作り方は? Altium Designerを使用して PCB ボードを描画し、万能の Taobao に助けを求めて、スチールメッシュを印刷および製造する業者を探します。

次に、PCB にハンダペーストを塗布し、チップ、抵抗器、コンデンサなどの部品を 1 つずつ貼り付け、ホットエアガンを使用して加熱し、リフローはんだ付けを完了します。

シェルについては、Zhihui 氏はRhinocerosを使用して小型テレビのシェルの 3D モデルを描き、独自の 3D プリンターでそれを作成しました。

購入した液晶パネルで小型テレビのハードウェア部分が完成しました。

ハードウェア生産の完了は始まりに過ぎません。次のステップはソフトウェア開発であり、これが Zhihuijun の原動力となっています。

これは彼自身が設計した完全なボードであるため、uboot/カーネル構成、デバイス ドライバー、アプリケーション レイヤー アプリ開発、アルゴリズム モデルの展開など、ソフトウェアもゼロから開発する必要があり、これらはすべて C++ で 1 行ずつ入力したコードです。

ビデオでは、コードが 1 行ずつ素早く実行されている様子が見られますが、実際には、Zhihuijun 氏は神経をすり減らしながら何晩も徹夜し、回路基板の再設計まで行いました。

最後に、Zhihui は小さなテレビに Linux Xfce デスクトップ環境をインストールしました。画面が小さくても問題なければ、マウスを接続して操作しても問題ありません。VNC と RDP 経由でリモート アクセスすることもできます。

Linux なら TensorFlow をインストールして、カメラを接続して画像認識を実現したり、マイクを接続して音声認識を実現したり、小型テレビを自分のブログの Web サーバーとして利用したりすることができます。

小型テレビは自動再生も可能で、「入れ子人形」ビデオを作成することもできます。

技術専門家の知識体系

上記の一連のクールな操作に驚かされましたか?

技術専門家の統計によると、Zhihuijun には次のスキルがあります。

電子工学の基礎、電子部品の選択、回路図設計、高速回路 PCB 設計、電子部品の溶接技術、回路基板のデバッグ、ブートプログラム UBOOT の切断と移植、Linux カーネルの切断と移植、ファイルシステム、低レベルドライバー (C 言語、ARM アーキテクチャアセンブリ、Linux カーネルアーキテクチャ)、上位レベルアプリケーション (C++、Qt、JAVA、Python など、ディープラーニング、機械学習、OpenCV、ニューラルネットワーク、自然言語処理)、静​​的ブログサーバーの構築、高度な数学、線形代数、確率論、離散数学、3D モデリング、3D プリント、彫刻機、ビデオ撮影ポストプロダクション、脱毛防止技術。

その中でも一番難しいのは最後の技です。

志慧君も同意した。開発プロセス全体で最も困難な問題は何かと尋ねると、彼は「髪の毛を失うことなく、夜更かしして多くのことを学び続ける方法」だと答えた。

今では、抜け毛を防ぐ技術を習得しました。その秘密を教えて頂けませんか。

心配しないでください。Zhihui 氏は、今後一連の詳細なチュートリアルを公開する予定だと言っています。皆さんが彼のスペースと最新の開発に注目してくれることを願っています。

他に何を言うべきでしょうか? すでにコインを投入したことは明らかにしていますし、今回は間違いなく3倍の支援をするつもりです。

ソフトウェアとハ​​ードウェアの両方に精通

最後に、大ボスについて厳粛に知っておきましょう。

Zhihuijun 氏は中国電子科技大学を卒業し、現在は OPPO 上海研究所に勤務しています。

彼は2015年から技術ブログを更新しており、継続的に執筆を続けています。当初、彼はビリビリを自分の動画保存サーバーとしてのみ使用していましたが、予想外に安定したファン層を獲得したため、アップホストに転身し始めました。予想外に、わずか半年で有名になりました。

Zhihuijun 氏はハードウェアとソフトウェアの両方の才能を持つ人物です。OPPO での面接では、ハードウェア職とアルゴリズム職の 2 つのスーパースペシャルオファーを受け取りました。

しかし、彼は会社で同時に2つの給料をもらっているわけではなく、あくまでAIアルゴリズムエンジニアであると強調した。

Zhihui さんは Arduino 中国コミュニティのモデレーターでもあり、ギターとハーモニカに興味を持っています。

このハードコアな手作り製品が人気を博した後、私たちは Zhihuijun にも連絡を取り、彼の開発経験を共有してもらいました。

QBit: 大学では生物学を専攻していたのに、後にコンピューターサイエンスを選んだと聞きました。なぜですか?

Zhihuijun:はい、学部では生体医工学を専攻し、大学院では情報通信システムを専攻したので、実はコンピューターサイエンスを専攻しているわけではありません。私がこの専攻を選んだ理由は、いくつかの偶然が重なった結果です。簡単に言うと、生物学専攻には私が想像していたほど女子学生がいなかったということが後から分かったんです(笑)。

私にとって、CS は英語と同じように基礎スキルです。問題を「いかに効率よく解くか」を学ぶ科目であり、他の科目と組み合わせやすい科目です。そのため、生物学を勉強していたときに、実は独学でコンピュータサイエンスを学び始めたのです。

同じ状況は電気工学にも当てはまります。なぜなら、この小型テレビのような仕事にかかわる専門的な側面は、大学のどの専攻でも完全にはカバーできないことがわかるからです。問題解決型学習と呼ばれる学習方法の分野があり、これは問題指向型の学習であり、自習を通じて問題の解決策と答えを見つけます。

QuantumBit: 組み込みシステムと AI に興味を持ったのはいつですか?

Zhihuijun:私が組み込みシステムに興味を持ったのは、子供の頃に家電製品の分解を学んだときです。大学でアナログおよびデジタルエレクトロニクス、シングルチップマイクロコンピュータ、Linux、自動制御の原理などの入門コースを受講した後、私は自由に生きるようになりました。

AIへの関心は、ここ数年のディープラーニングの復活に端を発している。「運転できるAIドライバーを作れば、運転できるドライバーは無数に生まれる。」このアイデアは私にとって非常に魅力的です。

QuantumBit: 組み込み開発の学習に興味のあるソフトウェア エンジニアにアドバイスはありますか?

Zhihuijun:組み込み開発を行う場合、目の前にある小さな技術だけに集中してはいけません。そうしないと、良い結果を得るのは難しくなります。 RTOS を学び、RISC-V を学び、ヘテロジニアスを学びましょう... 完全に準備された才能は決して存在しないので、若いときは戦いながら学ばなければなりません。

知識が多すぎると、すべてを網羅することは困難です。重要なポイントを見極める方法を学び、残りの知識は必要なときに参考書で調べる必要があります。優れたエンジニアとは、多くの文法基準やマニュアル資料を暗記できる人ではなく、グローバルな視点を持ちながら核心的な問題を解決する能力を持つ人です。知識には 2 種類あります。それは、何を知っているかということと、どこでそれを見つけるかを知っていることです。

エッジ コンピューティング、組み込み AI、モノのインターネット、エンド クラウド統合など、組み込みと最先端分野の交差点についてさらに詳しく学び、考えてみましょう。

QuantumBit:Bステーションミニテレビプロジェクトを作ろうと思ったきっかけは何ですか?

知慧君:高度な趣味を捨てれば、砂の彫刻のさまざまなプロジェクトに熟達できるようになります(笑)。私の楽しみは、週末に家にいて、役に立たないけれど役に立つものをいじくることなのです。

この小型テレビ プロジェクトを行おうとした当初の意図は、以前投稿したビデオで触れたとおりです。実際、現在市販されている小型パーソナル サーバーには満足していませんでした。いくつか問題点があったため、自分で構築することにしました。

もう 1 つの理由は、ある程度の新しい知識とスキルを蓄積した後、その知識をすべて活用して提示するプロジェクトを個人的に考案することを好むからです。この方法は、一方では学習効果をタイムリーに強化することができ、他方では、「学んだことを応用する」ことが技術開発の永遠の目的です。

皆さんも楽しみにしてください。私も最近、余暇に高度なロボット制御と最適化の理論を学んでおり、将来的には興味深いプロジェクトをいくつか共有できるかもしれません。

QuantumBit: 趣味と仕事のバランスをどのように取っていますか?

知慧君:幸いなことに、私の趣味は仕事でもあります。

私が考える理想的な働き方は、自分の意志で仕事が生まれ、毎日好きなことをして経験を積み、適度なプレッシャーのもとで積極的にイノベーションを起こし、大きな報酬を得ながら成長していくことです。簡単に言えば、個人の趣味と会社の価値観、そして時代の潮流が一体となったときです。まだ学ぶべきことはたくさんありますが、その方向で作業が進んでいると思います。

私のモットーは、「10年間氷を飲んでも血は冷えない」です。

QuantumBit: 現在の仕事において、日々の業務からどのようなインスピレーションを得ていますか?

志慧軍:先ほど「問題解決型学習」について触れましたが、これは問題解決志向の学習です。これからは生涯学習の時代です。大学を卒業したら学習をやめるということはありません。

人工知能についても同じことが言えます。それは学習プロセスです。実践的なエンジニアリング経験を持つ人工知能の専門家に尋ねると、アルゴリズムについて話す前に、ほとんどの人が次の 2 つの基本的な質問をします。

まず、どのような問題を解決したいですか? 次に、この問題に対応する学習に利用できるデータはありますか?

さらに、知識は一般的に相互に関連しており、異なる分野間の転移学習は半分の労力で2倍の結果をもたらすことができます。たとえば、ソフトウェア設計における高凝集性と低結合性のモジュール再利用の概念は、回路設計にも適用できます。たとえば、組み込み開発の経験は、ディープラーニングモデルの推論実装の最適化に予想外の助けとなります。

ポータル

志輝の個人ホームページ: http://www.pengzhihui.xyz

志慧君のBステーション: https://space.bilibili.com/20259914

<<:  2020 年の AI と機械学習の重要なトレンドは何ですか?

>>:  機械学習が近い将来教育を変える5つの方法

ブログ    

推薦する

...

このGitHubの8000スターAIリアルタイム顔変換プロジェクトにはアプリがある

人間のロールプレイングへの熱意は決して衰えることがなく、だからこそ AI による顔の変形が人気を博し...

Google、ブラウザで動作するプログラミング不要のAIトレーニングツールをアップデート

Google は人工知能トレーニング ツール「Teachable Machine」をアップグレードし...

Python で KNN アルゴリズムを使用して欠損データを処理する

欠損データの処理は簡単な作業ではありません。 方法は、単純な平均補完や観察結果の完全な削除から、MI...

人間と機械の翻訳対決は韓国で行われる。人工知能の未来は過小評価できない

韓国のソウルで人間の翻訳者と人工知能(AI)翻訳機の対決が行われる。人間の翻訳者が明らかに有利である...

...

2023 年の人工知能エンジニアリングの 5 つの新しい方向性

LLMの大幅な増加に加え、AI開発ツールも拡大しています。今年の AI 開発における 5 つの主要な...

近年の人工知能の発展を理解する

近年、AIの波が押し寄せ、各界ではAIが人間の仕事に取って代わるドラマが相次いで上演されています。A...

メッシのサッカーの試合とリーグ・オブ・レジェンドについての解説:OpenAI GPT-4ビジュアルAPIは開発者が新しい方法を作成するために使用されています

記事の冒頭では、サッカーの試合解説ビデオを見てみましょう。それは正しいように聞こえませんか?あなたの...

トランスフォーマーベースの効率的で低遅延のストリーミング音声認識モデル

シナリオの観点から、音声認識はストリーミング音声認識と非ストリーミング音声認識に分けられます。非スト...

バンク・オブ・アメリカ証券:ChatGPT iOSクライアントのダウンロード数は6月に38%減少

7月6日、バンク・オブ・アメリカ証券の最新調査レポートによると、人工知能はテクノロジー業界で最もホッ...

クラウドがチャットボットの体験をどのように変えるか

チャットボットの無限ループや同じ質問の繰り返しにイライラしていませんか? これは顧客にとってよくある...

OpenAIの取締役会が数秒で後悔!ウルトラマン、CEOに復帰要請

たった1日で、OpenAIの取締役会は劇的に変化しました。最新のニュースによると、ウルトラマンがCE...

異常分析のための技術的ソリューション - 異常帰属の指標分析

著者 | イー・リアン1. はじめに唯一不変なのは変化です。変化を受け入れる前に、調査し、属性を特定...

Aurora の 1 億ドルの買収の背後にあるもの: RISC-V の創始者が「中国製チップ」を開発するという野望

2月27日、米国の著名な自動運転企業であるAuroraは、ライダーチップ企業OURSを1億ドルで買収...