HuaweiとXiaomiの携帯電話を使ったDIY自律ナビゲーションロボット:わずか300元、チュートリアルはオープンソースで誰でも始められる

HuaweiとXiaomiの携帯電話を使ったDIY自律ナビゲーションロボット:わずか300元、チュートリアルはオープンソースで誰でも始められる

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。

ロボットを作るとなると、多くの人は無意識のうちに「自分に代わって世界中の主要な囲碁大会に出場し、もっと賞金を獲得できる AlphaGo を作りたい!」と考えるでしょう。あるいは、ボストン ダイナミクスのロボット「アトラス」を手に入れましょう。這ったり、ジャンプしたり、宙返りしたりできます。また、重いものを持ち上げたり、肩をマッサージしたりすることもできます... とても素敵です! とても素敵です!

さて、ここで疑問が湧いてきます。このような強力なロボットを作るには、強力な技術、完全な設備、十分な人員が必要です。さらに、プロセスは複雑で、3~5年かかり、費用もかかります...なぜわざわざ?(手を広げて)

しかしつい最近、インテルの研究者であるマティアス・ミュラー氏とヴラドレン・コルトゥン氏は、わずか50ドル(約350元)を費やし、わずか数時間でロボットを製作しました。

このロボットはいったい何者なのでしょうか?次の図をご覧ください。

このロボットはかなり速く歩くんですか?彼女はかわいい女の子のように見えますか?

ああ、読み間違えました。青いミニ車輪付きマシンです。

なぜ「ロボット」と呼ばれるのでしょうか?賢い脳を持っているから、何が起こると思いますか?

私たちが手に持っていたのが携帯電話だとは思いもしませんでした!

また、OpenBot というかっこいい名前もあります。私たちは、愛情を込めて Bobo/「Bobo」というニックネームを付けます。以下のAI技術レビューでは、Boboの本当の姿を紹介しています。Leifeng.com

1. 奇跡の誕生

ロボット工学の分野には常に 2 つの大きな課題があります。1 つはアクセシビリティ、もう 1 つはスケーラビリティです。製造コストが高く、製造工程が煩雑なため、ロボットを一般大衆に普及させることは困難です。 Muller 氏と Koltun 氏は、ロボット技術におけるこれら 2 つの「障害」を解決するために OpenBot を研究しました。

彼らが共同で発表した論文「OpenBot: スマートフォンをロボットに変える」では、スマートフォンをロボットの頭脳として利用してロボットに電力を供給し、シンプルな3Dプリントシャーシで組み立てることで、わずか50ドルで、人を追跡し、リアルタイムの自律ナビゲーションを実行できるロボットを構築できると述べています。

OpenBot を構築するプロセスは複雑ではありません。ロボットにセンサー、コンピューティング機器、通信機器を装備し、オープン ソフトウェア エコシステムへのアクセスを提供するだけです。

上記のように、総コストは次のとおりです。3D プリントされたベース: 5 ドル、車輪 4 つ: 3.5 ドル、バッテリー 3 つ: 7 ドル、速度センサー 2 つ: 2 ドル、モーター ドライバー: 3 ドル、マイクロコントローラー: 8 ドル。

Bobo の頭脳として携帯電話が使用されている理由は、スマートフォンがますます高性能になり、カメラの品質やプロセッサの速度などの側面が継続的に向上しているためです。市販の携帯電話にも、慣性測定装置、GPS、Wi-Fi、Bluetooth、セルラーモデム、AI ニューラルネットワークモデルの推論用の専用チップが搭載されています。一部の携帯電話アクセサリはデスクトップ プロセッサよりも強力です。

研究者らは、主にセンシング、データ融合、コンピューティングに使用される電気機械本体にスマートフォンを挿入した。さらに、シャーシには最大 4 つのモーターを搭載でき、コントローラー、マイクロコントローラー、LED ライト、スマートフォン マウント、USB データ ケーブルを取り付けるためのスペースも残っています。

充電するには、バッテリー パックを専用の充電ポートに接続してモーターに電力を供給し、Andruino Nano ボード (使いやすいハードウェアとソフトウェアに基づくオープン ソースの電子プラットフォーム) を USB 経由でスマートフォンとペアリングして、シリアル通信リンクとロボットへの電力を供給します。

ロボットの2つの前輪には、距離測定信号を送信できるセンサーと、速度と方向をリアルタイムで調整するためのモーターに接続されたピンも装備されています。

Bobo のソフトウェア スタックも比較的シンプルで、シリアル リンクを介して通信する 2 つのコンポーネントのみで構成されています。オペレーターはスマートフォンに Android アプリをインストールし、アプリのインターフェースを使用して、より高度な認識および制御ワークロードを実行しながらデータセットを収集できます。さらに、Arduino上で動作するプログラムでは、簡単な運転や走行距離計、バッテリー電圧の測定なども行えます。

Android アプリをインストールすると、既存の Bluetooth 対応 PS4、Xbox、Switch、その他のゲーム コントローラーを通じて OpenBot を制御することもできます。コントローラーのボタンを機能するように設定でき、経路探索モデルでデータが収集および交換されます。これらのモデルには、ロボットの視界内にいる人を検知して追跡できる、使いやすい自律ナビゲーション モデルが含まれています。

組み立てプロセス全体も非常に簡単です。テーブルの前に座って「手を動かす」だけです。それほど器用でなくても、パズルを解く忍耐力があれば、おそらく完成できるでしょう。

こんな単純なロボットの効果は何でしょうか?


研究者らは、ミッドレンジのXiaomi Note 8、Huawei P30 Lite、Xiaomi Poco F1デバイスを使用してシステムをテストしました。上の図に示すように、これらのスマートフォンには専用のAIアクセラレータが搭載されているため、10フレーム/秒以上の速度で人間の活動を追跡できます。最も構成が劣る Nokia 2.2 でも、テスト時間の約半分の間、対象の人物を検出し、対象のオブジェクトを追跡することができました。

自律ナビゲーションタスク中、オフィスの廊下にある鉢植えを巧みに避けることもできました。

2. ステップバイステップのチュートリアルがオープンソースになりました

前述のように、携帯電話を除いたロボット全体のコストは50米ドル(350人民元)未満です。ロボットの本体は3Dプリントされた部品とスマートフォン(中古の携帯電話でも可)で作られています。

上の写真は筆者の車5台の部品の卸売価格を示している。

このロボットの背後にある技術は論文として公開されており、作者は製作手順もGitHubでオープンソース化している。関連部品の購入チャネルも提供しています。 3Dプリントの図面も公開され、3Dプリンターのパラメータ設定までもが示されました。


GitHub アドレス: https://github.com/intel-isl/OpenBot/tree/master/body

論文アドレス: https://arxiv.org/pdf/2008.10631.pdf

同時に、インストール プロセスに関する 20 の注意事項が示されており、これは、必要に応じてモーターにワイヤを接続する、速度センサーと超音波センサーを 5V と GND に接続する、など、良心的なステップ バイ ステップのチュートリアルと言えます。

この論文では、スマートフォンを使用する理由も紹介されており、スマートフォンの利点はハードウェア機能が急速に向上しているだけでなく、活気のあるソフトウェアエコシステムを備えていることであるとしている。

スマートフォンはカメラの品質とプロセッサの速度が向上し続けており、GPS、Wi-Fi、Bluetooth、セルラーモデム、AI推論用の専用チップが搭載されており、その一部はデスクトッププロセッサを上回る性能を発揮します。

小型電気自動車(ロボット)全体は2つの部分に分かれています。1つ目はハードウェアで、50ドルで作れる部品です。2つ目はソフトウェアスタックで、スマートフォンが自動車を車体として使用し、リアルタイムの認識と計算によるモバイルナビゲーションを実現する機能です。

ハードウェア構造には、機械設計と回路設計の 2 つの部分が含まれます。機械設計を下図に示します。

回路設計を下図に示します。上部にはバッテリー、モーター コントローラー、マイクロ コントローラー、速度センサー、インジケーター LED、スマートフォンが含まれ、下部には配線を減らすためのオプションのカスタム PCB が含まれます。

ソフトウェア スタックも、Android アプリケーションと Arduino プログラムの 2 つの部分で構成されます。その中で、Android アプリケーションはスマートフォン上で実行され、操作インターフェースの提供、データセットの収集、高度な認識および制御タスクの実行が可能です。 Arduino プログラムは、車輪の走行距離の測定やバッテリー電圧の監視など、低レベルの駆動と測定を担当します。

ソフトウェアとハ​​ードウェアが完成した後、インテルの研究者は、歩行者の追跡と自律ナビゲーションという 2 つのタスクを完了することを目指してロボットをトレーニングしました。

歩行者追跡タスクでは、研究者らは事前にトレーニングされた MobileNet バックボーンを備えた SSD オブジェクト検出器を使用しました。さらに、推論時間の影響を調査するために、著者らは MobileNet の 2 つの異なるバージョン、オリジナルの MobileNetV1 と最新の MobileNetV3 を使用しました。さらに、両方のモデルは COCO データセットでトレーニングされています。

運転戦略トレーニングプロセス

研究者らは、自律ナビゲーションタスクのために、条件付き模倣学習のコマンド入力版に似たニューラルネットワークを使用して、ほとんどのスマートフォンでリアルタイムに実行できる運転ポリシーをトレーニングしました。さらに、研究者らはこれを既存の運転ポリシーと比較し、必要なパラメータが約 1 桁少ない状態でベースラインと同様のパフォーマンスを達成しました。

OpenBot の登場により、世界中に数千台の低コストロボットが導入され、ロボット教育や大規模学習に新たな機会がもたらされると期待されています。

<<:  「万能AI」GPT-3の中国版を作る方法

>>:  ドローン技術はスマートシティの発展をどのように促進できるのでしょうか?

推薦する

...

楊振:ビッグデータとAI技術の発展の観点から、クロスチェーン技術は必要かつ不可避である

著者: 楊振、上級ソフトウェアエンジニア、アーキテクト、独立講師。ソフトウェア開発経験18年。『Et...

人工知能を活用するメリットと課題

人工知能 (AI) は、世界中の家庭や企業において、未来の夢から現代の現実へと変化しました。 AI ...

勾配降下法はAI専門家やネットユーザーの間で白熱した議論を巻き起こす:全員の答えは読む価値がある

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

海外メディア:GoogleはマーケティングのためにGeminiをリリースしたが、依然としてGPT-4に遅れをとっている

12月8日のニュース、今週の水曜日、Googleは最新の人工知能モデルGeminiをリリースしました...

中国語で最も強力なオープンソース モデルがここにあります! 130億のパラメータ、商用利用の閾値0、Kunlun Wanweiより

最も徹底したオープンソース モデルがここにあります - 130 億のパラメーター、申請なしで商用利用...

新しい脳のようなコンピューティングデバイスは人間の学習をシミュレートできる:この論文はNature Communications誌に掲載された。

「シナプストランジスタ」は、脳の可塑性を模倣して、データの処理と保存を同時に行うことができます。 ...

LianjiaのFeng Yang氏:不動産業界でデータと機械学習が輝く

[51CTO.comより引用] 2017年12月1日~2日、51CTO主催のWOTDグローバルソフト...

2枚の写真から動画が作れます! Googleが提案したFLIMフレーム補間モデル

フレーム補間は、コンピューター ビジョンの分野における重要なタスクです。モデルは、指定された 2 つ...

指紋認証は本当に安全ですか?答えはそうではないかもしれない

科学技術の継続的な発展に伴い、ますます多くのブラックテクノロジーが私たちの生活に浸透し始めており、そ...

...

自動運転時代の前夜、ACCクルーズテクノロジーが台頭

自動車が発明された日から、自動運転機能への要望は、何世代にもわたるエンジニアたちの焦点となってきまし...

...

ディープラーニングを実践するための7つのステップ

私たちの仕事では、「ディープラーニングの学習はどこから始めればよいですか?」という質問をよく受けます...

北京市海淀区に世界初のAIパークがオープン、自宅のすぐそばで自動運転車を体験できる

自動運転車に乗って公園を訪れ、休憩中にパビリオンとおしゃべりし、ランニング後に顔をスキャンして運動デ...