すごいですね、ボストン・ダイナミクスのロボット犬が直接話せるようになりました。 そして、Siriの「人工知能」とは異なり、ChatGPTを搭載した犬は、チャット中に非常に機知に富んだことができます。 たとえば、「喉が渇いた」と気軽に言ってみましょう。 コーヒーカウンターに直接案内され、次のような回答が得られます。 ここにはスナックバーとコーヒーマシンがあります。ここは、私たち人間の同僚がエネルギーの秘薬を探す場所です。ベースステーションのロボットと同じように、お気軽に水分補給やエネルギー補給を行ってください。 写真 その声はとても魅力的に聞こえます。 ボストン・ダイナミクスのショールームで、Spot V1 の親に会いに連れて行ってほしいと頼めば、Spot V1 を案内してくれることさえある。 写真 これらの機能の実装には特定のコードを記述する必要はありませんが、主に ChatGPT の「洞察力」とビジュアル質問応答 (VQA) モデル、Whisper などの AI モデルに依存して完了を支援します。 写真 これはネットユーザーを本当に驚かせた。 写真 おしゃべりロボット犬の作り方具体的には、ボストン・ダイナミクスの研究者がロボット犬に提供したのは、単純なスクリプトだけだった。 提供される情報は主に、会社で利用可能な部屋や設備などです。各部屋と施設には、ロボットが充電する場所である「充電ステーション」など、対応する一文の説明があります。 写真 次に、Spot ロボット犬を歩き回らせ、カメラ自体を通して会社の環境を観察させ、VQA と ChatGPT の機能を使用して観察したオブジェクトに「ラベル」を付け、この情報をスクリプトに追加しました。 このような: 写真 このような訓練を終えると、ロボット犬の「ツアーガイド」は正式にその任務に就くことができるようになる。 観光客と冗談を言うことができます: △「ロボット犬に遅れないように気をつけてくださいね」 彼はまた、真剣な科学的知識を広める能力にも優れています。 研究者らは、ロボット犬は「犬の設定」を自由に変更できるとも述べた。必要なのは、スクリプトに次のような文を追加することだけです。「あなたは 1920 年代の考古学者です。」 この「詩人」スポットのように、彼は次のような詩を作曲することができます。 発電機が陰鬱な部屋の中で低い音を立てた。私の魂と全く同じです。喜びのない部屋で発電機が低くブンブンと鳴る。まるで私の魂のように。 写真 さらに、Spot 3.3バージョンの動く物体を自動的に検出する機能に基づいて、ロボット犬の「ツアーガイド」は、最も近い人がどの方向にいるかを感知し、ロボットアームを回転させて「アイコンタクト」コミュニケーションを実現します。 研究者らは、生成された音声をローパスフィルターで処理し、それをロボットアームの動作軌跡に変換することで、ロボット犬の動きをより機敏にしました。 しかし、研究者らは、ChatGPTを搭載したロボット犬は時々意味不明なことを話すこともあるが、「ツアーガイド」としては大した問題ではないとも述べている。 彼らは次のように信じている。
参考リンク: [1] https://www.youtube.com/watch?v=djzOBZUFzTw [2] https://bostondynamics.com/blog/robots-that-can-chat/ |
<<: クラウド上でのインテリジェント運転の 3D 再構築のベスト プラクティス
会話型 AI ソリューションを実装する際によくある 7 つの間違いを見てみましょう。適切な戦略と計画...
会社は厳しい時期を迎えている。私はパンデミックや株式市場の変動について話しているのではない。時代は不...
[[207884]]序文:最近、アンサンブル学習における持続可能性に関する研究に関する非常に興味深い...
マイクロソフトのCEOに就任して以来、サティア・ナデラ氏はマイクロソフトを改革した英雄とみなされてき...
同研究機関はAIインフラの需要について徹底的な調査を実施し、AIシステムに必要なエネルギーは本格導入...
[[410798]] FaceAppの人気は過ぎ去り、最近では、あなたの顔を数秒で「ディズニー」に変...
人工知能はデジタル経済の高品質な発展の原動力であり、新たな科学技術革命と産業変革の重要な原動力です。...