▲ 画像出典: ボストンダイナミクス YouTube 動画のスクリーンショット ボストン・ダイナミクスは10月27日、数時間前に公式YouTubeチャンネルに、ボストン・ダイナミクスのロボット犬の「言語能力」を実演する動画をアップロードした。このビデオでは、ボストン・ダイナミクスのロボット犬が「ツアーガイド」として機能し、スタッフを同社のさまざまな施設に案内している。 このロボット犬は現在、質問に答えることができ、音を発すると同時に「口」を開けることもできる。ボストンのロボット犬が現在話せるようになったのは、エンジニアがChatGPTのAPIとオープンソースの大規模言語モデルを使用してトレーニングしたためだと報じられています。同時に、エンジニアたちはロボット犬にスピーカーを搭載し、テキスト読み上げ機能も追加した。動画に出てくるロボット犬は「イギリス訛り」で従業員に旅を始めてもよいか尋ね、これから訪れる充電ステーションを紹介している。 ボストン・ダイナミクスの主任ソフトウェアエンジニア、マット・クリンゲンスミス氏によると、前述の「ツアーガイド」機能を実現するために、チームはロボット犬に、同社の施設内のすべての部屋に関する情報を含んだ非常に短いスクリプトを提供したという。次に、ロボット犬はスクリプトを体に搭載したカメラなどのハードウェアからの画像と組み合わせ、反応する前に見たものに関する詳細な情報を取得できるようにします。 ボストンのロボット犬の今回の能力は、単に「ツアーガイド」になるだけではありません。 「発電機は、私の魂のように、喜びのない部屋でブンブンと鳴っている」といった詩を朗読することもできます。かつて、スタッフがロボット犬の「両親」は誰なのかと尋ねると、ロボット犬はオフィスに展示されていた古いロボット犬を指さした。 IT Homeによる以前の報道によると、ボストン・ダイナミクスのロボット犬は、タンブリングダンス、インテリジェントなルート再計画、パルクール、ビール注ぎなど、さまざまなスキルを披露したという。 2020年12月、現代自動車はボストン・ダイナミクスを10億ドルで買収し、同社の親会社となると発表した。 |
>>: GraphAlign: グラフマッチングによるマルチモーダル 3D オブジェクト検出のための正確な特徴アライメント
出力次元の観点から、視覚センサーに基づく知覚方法は、2D知覚と3D知覚に分けられます。視覚システムは...
外れ値とは何でしょうか? Hawkins (1980) は外れ値の基本的な定義を与えました: 外れ値...
最近、百度文心は3つの主要機能をリリースし、カスタマイズされたマルチラベルテキスト分類、感情傾向分析...
[[206688]]導入Tensorflow はバージョン 1.0 へのアップデート後に多くの新機能...
顔認識技術は、顔の特徴に基づいて人物を識別する高度な認識技術です。非感度、利便性、正確性から広く利用...
潜在的整合性モデルは、生成速度を主な特徴とする画像生成アーキテクチャです。複数の反復ステップを必要と...
国家設備登録局が発表したデータによると、建設現場での盗難による損失は年間10億ドルを超えることが多い...
3月23日から26日まで、2021年重大健康産業(重慶)博覧会と第6回双品会が重慶で開催されました。...
シカゴで開催された ACM コンピュータおよび通信セキュリティ会議で、2 人のドイツ人研究者が、ワー...
ザッカーバーグ氏は新たな目標「すべてをオープンソースの AGI に」を発表しました。そう、ザッカーバ...
高画質を追求する時代において、低画質に対する許容度はますます低くなっています。 Zhihuで「低解像...
人工知能 (AI) は、スピード、効率、安全性、正確性を向上させることで旅行業界に大きな変化をもたら...
[[322859]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...