HuaweiとXiaomiの携帯電話を使ったDIY自律ナビゲーションロボット:わずか300元、チュートリアルはオープンソースで誰でも始められる

HuaweiとXiaomiの携帯電話を使ったDIY自律ナビゲーションロボット:わずか300元、チュートリアルはオープンソースで誰でも始められる

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。

ロボットを作るとなると、多くの人は無意識のうちに「自分に代わって世界中の主要な囲碁大会に出場し、もっと賞金を獲得できる AlphaGo を作りたい!」と考えるでしょう。あるいは、ボストン ダイナミクスのロボット「アトラス」を手に入れましょう。這ったり、ジャンプしたり、宙返りしたりできます。また、重いものを持ち上げたり、肩をマッサージしたりすることもできます... とても素敵です! とても素敵です!

さて、ここで疑問が湧いてきます。このような強力なロボットを作るには、強力な技術、完全な設備、十分な人員が必要です。さらに、プロセスは複雑で、3~5年かかり、費用もかかります...なぜわざわざ?(手を広げて)

しかしつい最近、インテルの研究者であるマティアス・ミュラー氏とヴラドレン・コルトゥン氏は、わずか50ドル(約350元)を費やし、わずか数時間でロボットを製作しました。

このロボットはいったい何者なのでしょうか?次の図をご覧ください。

このロボットはかなり速く歩くんですか?彼女はかわいい女の子のように見えますか?

ああ、読み間違えました。青いミニ車輪付きマシンです。

なぜ「ロボット」と呼ばれるのでしょうか?賢い脳を持っているから、何が起こると思いますか?

私たちが手に持っていたのが携帯電話だとは思いもしませんでした!

また、OpenBot というかっこいい名前もあります。私たちは、愛情を込めて Bobo/「Bobo」というニックネームを付けます。以下のAI技術レビューでは、Boboの本当の姿を紹介しています。Leifeng.com

1. 奇跡の誕生

ロボット工学の分野には常に 2 つの大きな課題があります。1 つはアクセシビリティ、もう 1 つはスケーラビリティです。製造コストが高く、製造工程が煩雑なため、ロボットを一般大衆に普及させることは困難です。 Muller 氏と Koltun 氏は、ロボット技術におけるこれら 2 つの「障害」を解決するために OpenBot を研究しました。

彼らが共同で発表した論文「OpenBot: スマートフォンをロボットに変える」では、スマートフォンをロボットの頭脳として利用してロボットに電力を供給し、シンプルな3Dプリントシャーシで組み立てることで、わずか50ドルで、人を追跡し、リアルタイムの自律ナビゲーションを実行できるロボットを構築できると述べています。

OpenBot を構築するプロセスは複雑ではありません。ロボットにセンサー、コンピューティング機器、通信機器を装備し、オープン ソフトウェア エコシステムへのアクセスを提供するだけです。

上記のように、総コストは次のとおりです。3D プリントされたベース: 5 ドル、車輪 4 つ: 3.5 ドル、バッテリー 3 つ: 7 ドル、速度センサー 2 つ: 2 ドル、モーター ドライバー: 3 ドル、マイクロコントローラー: 8 ドル。

Bobo の頭脳として携帯電話が使用されている理由は、スマートフォンがますます高性能になり、カメラの品質やプロセッサの速度などの側面が継続的に向上しているためです。市販の携帯電話にも、慣性測定装置、GPS、Wi-Fi、Bluetooth、セルラーモデム、AI ニューラルネットワークモデルの推論用の専用チップが搭載されています。一部の携帯電話アクセサリはデスクトップ プロセッサよりも強力です。

研究者らは、主にセンシング、データ融合、コンピューティングに使用される電気機械本体にスマートフォンを挿入した。さらに、シャーシには最大 4 つのモーターを搭載でき、コントローラー、マイクロコントローラー、LED ライト、スマートフォン マウント、USB データ ケーブルを取り付けるためのスペースも残っています。

充電するには、バッテリー パックを専用の充電ポートに接続してモーターに電力を供給し、Andruino Nano ボード (使いやすいハードウェアとソフトウェアに基づくオープン ソースの電子プラットフォーム) を USB 経由でスマートフォンとペアリングして、シリアル通信リンクとロボットへの電力を供給します。

ロボットの2つの前輪には、距離測定信号を送信できるセンサーと、速度と方向をリアルタイムで調整するためのモーターに接続されたピンも装備されています。

Bobo のソフトウェア スタックも比較的シンプルで、シリアル リンクを介して通信する 2 つのコンポーネントのみで構成されています。オペレーターはスマートフォンに Android アプリをインストールし、アプリのインターフェースを使用して、より高度な認識および制御ワークロードを実行しながらデータセットを収集できます。さらに、Arduino上で動作するプログラムでは、簡単な運転や走行距離計、バッテリー電圧の測定なども行えます。

Android アプリをインストールすると、既存の Bluetooth 対応 PS4、Xbox、Switch、その他のゲーム コントローラーを通じて OpenBot を制御することもできます。コントローラーのボタンを機能するように設定でき、経路探索モデルでデータが収集および交換されます。これらのモデルには、ロボットの視界内にいる人を検知して追跡できる、使いやすい自律ナビゲーション モデルが含まれています。

組み立てプロセス全体も非常に簡単です。テーブルの前に座って「手を動かす」だけです。それほど器用でなくても、パズルを解く忍耐力があれば、おそらく完成できるでしょう。

こんな単純なロボットの効果は何でしょうか?


研究者らは、ミッドレンジのXiaomi Note 8、Huawei P30 Lite、Xiaomi Poco F1デバイスを使用してシステムをテストしました。上の図に示すように、これらのスマートフォンには専用のAIアクセラレータが搭載されているため、10フレーム/秒以上の速度で人間の活動を追跡できます。最も構成が劣る Nokia 2.2 でも、テスト時間の約半分の間、対象の人物を検出し、対象のオブジェクトを追跡することができました。

自律ナビゲーションタスク中、オフィスの廊下にある鉢植えを巧みに避けることもできました。

2. ステップバイステップのチュートリアルがオープンソースになりました

前述のように、携帯電話を除いたロボット全体のコストは50米ドル(350人民元)未満です。ロボットの本体は3Dプリントされた部品とスマートフォン(中古の携帯電話でも可)で作られています。

上の写真は筆者の車5台の部品の卸売価格を示している。

このロボットの背後にある技術は論文として公開されており、作者は製作手順もGitHubでオープンソース化している。関連部品の購入チャネルも提供しています。 3Dプリントの図面も公開され、3Dプリンターのパラメータ設定までもが示されました。


GitHub アドレス: https://github.com/intel-isl/OpenBot/tree/master/body

論文アドレス: https://arxiv.org/pdf/2008.10631.pdf

同時に、インストール プロセスに関する 20 の注意事項が示されており、これは、必要に応じてモーターにワイヤを接続する、速度センサーと超音波センサーを 5V と GND に接続する、など、良心的なステップ バイ ステップのチュートリアルと言えます。

この論文では、スマートフォンを使用する理由も紹介されており、スマートフォンの利点はハードウェア機能が急速に向上しているだけでなく、活気のあるソフトウェアエコシステムを備えていることであるとしている。

スマートフォンはカメラの品質とプロセッサの速度が向上し続けており、GPS、Wi-Fi、Bluetooth、セルラーモデム、AI推論用の専用チップが搭載されており、その一部はデスクトッププロセッサを上回る性能を発揮します。

小型電気自動車(ロボット)全体は2つの部分に分かれています。1つ目はハードウェアで、50ドルで作れる部品です。2つ目はソフトウェアスタックで、スマートフォンが自動車を車体として使用し、リアルタイムの認識と計算によるモバイルナビゲーションを実現する機能です。

ハードウェア構造には、機械設計と回路設計の 2 つの部分が含まれます。機械設計を下図に示します。

回路設計を下図に示します。上部にはバッテリー、モーター コントローラー、マイクロ コントローラー、速度センサー、インジケーター LED、スマートフォンが含まれ、下部には配線を減らすためのオプションのカスタム PCB が含まれます。

ソフトウェア スタックも、Android アプリケーションと Arduino プログラムの 2 つの部分で構成されます。その中で、Android アプリケーションはスマートフォン上で実行され、操作インターフェースの提供、データセットの収集、高度な認識および制御タスクの実行が可能です。 Arduino プログラムは、車輪の走行距離の測定やバッテリー電圧の監視など、低レベルの駆動と測定を担当します。

ソフトウェアとハ​​ードウェアが完成した後、インテルの研究者は、歩行者の追跡と自律ナビゲーションという 2 つのタスクを完了することを目指してロボットをトレーニングしました。

歩行者追跡タスクでは、研究者らは事前にトレーニングされた MobileNet バックボーンを備えた SSD オブジェクト検出器を使用しました。さらに、推論時間の影響を調査するために、著者らは MobileNet の 2 つの異なるバージョン、オリジナルの MobileNetV1 と最新の MobileNetV3 を使用しました。さらに、両方のモデルは COCO データセットでトレーニングされています。

運転戦略トレーニングプロセス

研究者らは、自律ナビゲーションタスクのために、条件付き模倣学習のコマンド入力版に似たニューラルネットワークを使用して、ほとんどのスマートフォンでリアルタイムに実行できる運転ポリシーをトレーニングしました。さらに、研究者らはこれを既存の運転ポリシーと比較し、必要なパラメータが約 1 桁少ない状態でベースラインと同様のパフォーマンスを達成しました。

OpenBot の登場により、世界中に数千台の低コストロボットが導入され、ロボット教育や大規模学習に新たな機会がもたらされると期待されています。

<<:  「万能AI」GPT-3の中国版を作る方法

>>:  ドローン技術はスマートシティの発展をどのように促進できるのでしょうか?

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

マイクロソフトがニュースルーム向けのAI支援プログラムを開始:ジャーナリストはAIを最大限に活用する方法を学ぶための無料コースを受講できる

マイクロソフトは2月6日、現地時間5日にプレスリリースを発行し、複数の報道機関と生成AIベースのコラ...

AIは音楽業界をどのように変えているのでしょうか?

[[269995]]音楽業界では、他の業界と同様に、AI テクノロジーによってサービスを自動化し、...

注意メカニズムにバグがあり、ソフトマックスが犯人であり、すべてのトランスフォーマーに影響を与えている

「私は、8年間誰も発見できなかった注目度の式のバグを発見しました。GPTやLLaMAを含むすべてのT...

...

...

業界: 過去数か月で、古い AI チップの価格が下がり、大規模モデルのトレーニングのコストが 60% 低下しました。

1月24日のニュースでは、大規模言語モデル(LLM)の開発にはコストがかかることがよく知られていま...

RPAとAIの違いを理解する

CIO は自動化と AI の導入を加速し、これらのテクノロジーが提供するスピードとコスト削減の利点を...

AR のヒント | 説明する時間はありません。今すぐ保存してください。

[51CTO.com からのオリジナル記事] 近年、AR は常に資本追求の焦点となってきました。 ...

クラウド コンピューティングに必要な 5 つの機械学習スキル

機械学習と人工知能は、IT サービス分野に浸透し続け、ソフトウェア エンジニアが開発したアプリケーシ...

AIを活用したスト​​レージ施設は、企業がデータを最大限に活用するのに役立ちます

AI を活用したスト​​レージにより、企業はデータを迅速かつインテリジェントに分析し、ほぼ瞬時に洞察...

来年1月1日からAIフェイク動画は自由に公開できなくなる

新しいルールが登場します。 今回公布された「オンライン音声・動画情報サービス管理規則」では、ディープ...

機械学習における 5 つの現実的な問題とビジネスへの影響

今日、多くの企業は大量のデータを迅速に処理する必要があります。同時に、競争環境は急速に進化しているた...

Python 機械学習チュートリアル

この機械学習チュートリアルでは、機械学習の基本および中級の概念について説明します。初心者の学生と働く...

...