ボストンダイナミクスは、ChatGPTなどの大規模モデルトレーニングを使用して、スポットロボット犬を「話すツアーガイド」に変えました。

ボストンダイナミクスは、ChatGPTなどの大規模モデルトレーニングを使用して、スポットロボット犬を「話すツアーガイド」に変えました。

▲ 画像出典: ボストンダイナミクス YouTube 動画のスクリーンショット

ボストン・ダイナミクスは10月27日、数時間前に公式YouTubeチャンネルに、ボストン・ダイナミクスのロボット犬の「言語能力」を実演する動画をアップロードした。このビデオでは、ボストン・ダイナミクスのロボット犬が「ツアーガイド」として機能し、スタッフを同社のさまざまな施設に案内している。

このロボット犬は現在、質問に答えることができ、音を発すると同時に「口」を開けることもできる。ボストンのロボット犬が現在話せるようになったのは、エンジニアがChatGPTのAPIとオープンソースの大規模言語モデルを使用してトレーニングしたためだと報じられています。同時に、エンジニアたちはロボット犬にスピーカーを搭載し、テキスト読み上げ機能も追加した。動画に出てくるロボット犬は「イギリス訛り」で従業員に旅を始めてもよいか尋ね、これから訪れる充電ステーションを紹介している。

ボストン・ダイナミクスの主任ソフトウェアエンジニア、マット・クリンゲンスミス氏によると、前述の「ツアーガイド」機能を実現するために、チームはロボット犬に、同社の施設内のすべての部屋に関する情報を含んだ非常に短いスクリプトを提供したという。次に、ロボット犬はスクリプトを体に搭載したカメラなどのハードウェアからの画像と組み合わせ、反応する前に見たものに関する詳細な情報を取得できるようにします。

ボストンのロボット犬の今回の能力は、単に「ツアーガイド」になるだけではありません。 「発電機は、私の魂のように、喜びのない部屋でブンブンと鳴っている」といった詩を朗読することもできます。かつて、スタッフがロボット犬の「両親」は誰なのかと尋ねると、ロボット犬はオフィスに展示されていた古いロボット犬を指さした。

IT Homeによる以前の報道によると、ボストン・ダイナミクスのロボット犬は、タンブリングダンス、インテリジェントなルート再計画、パルクール、ビール注ぎなど、さまざまなスキルを披露したという。 2020年12月、現代自動車はボストン・ダイナミクスを10億ドルで買収し、同社の親会社となると発表した。

<<:  検索拡張生成による AI 幻覚問題の解決

>>:  GraphAlign: グラフマッチングによるマルチモーダル 3D オブジェクト検出のための正確な特徴アライメント

ブログ    

推薦する

自動運転のための多視点視覚認識の理解

出力次元の観点から、視覚センサーに基づく知覚方法は、2D知覚と3D知覚に分けられます。視覚システムは...

教師なし学習アルゴリズム: 異常検出

外れ値とは何でしょうか? Hawkins (1980) は外れ値の基本的な定義を与えました: 外れ値...

EasyDLが新しくアップグレードされ、ERNIEの3つの機能によりエンタープライズレベルのNLPモデルを迅速にカスタマイズできるようになりました。

最近、百度文心は3つの主要機能をリリースし、カスタマイズされたマルチラベルテキスト分類、感情傾向分析...

ディープラーニング入門 - TensorFlow を使ってモデルをトレーニングする方法を教えます

[[206688]]導入Tensorflow はバージョン 1.0 へのアップデート後に多くの新機能...

顔認識技術の応用リスクと法的規制

顔認識技術は、顔の特徴に基づいて人物を識別する高度な認識技術です。非感度、利便性、正確性から広く利用...

...

AIが建設現場の安全性を向上させる10の方法

国家設備登録局が発表したデータによると、建設現場での盗難による損失は年間10億ドルを超えることが多い...

私の国の医薬品人工知能市場は急速な成長期に入っている

3月23日から26日まで、2021年重大健康産業(重慶)博覧会と第6回双品会が重慶で開催されました。...

XML暗号化アルゴリズムが解読され、W3C標準が改訂される

シカゴで開催された ACM コンピュータおよび通信セキュリティ会議で、2 人のドイツ人研究者が、ワー...

...

ザッカーバーグはオープンソース AGI に全力を注ぐ: Llama 3 をトレーニング、35 万台の H100 を年末までに提供開始

ザッカーバーグ氏は新たな目標「すべてをオープンソースの AGI に」を発表しました。そう、ザッカーバ...

デューク大学は、低品質のモザイクを数秒で高解像度の画像に変換するAIアルゴリズムを提案

高画質を追求する時代において、低画質に対する許容度はますます低くなっています。 Zhihuで「低解像...

旅行業界における人工知能の未来

人工知能 (AI) は、スピード、効率、安全性、正確性を向上させることで旅行業界に大きな変化をもたら...

百度研究所が新しいAIツールを発表:10分以内に記事を自動的に動画に変換可能

[[322859]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...