ロボットは人工知能技術に基づいて人間の表情を作る

ロボットは人工知能技術に基づいて人間の表情を作る

信頼関係を築く上で、私たちの表情が果たす役割は非常に大きいにもかかわらず、ほとんどのロボットの顔はプロのポーカー プレイヤーと同じように無表情で静止したままです。ロボットと人間が密接に連携する必要がある場所でロボットの使用が増えるにつれて、より速い反応とよりリアルな顔を持つロボットの必要性が高まっています。

[[403081]]

5月31日、海外メディアの報道によると、コロンビア工科大学クリエイティブマシン研究所の研究者らは、ロボットと人間の相互作用に興味を持っている。彼らは5年かけて、近くにいる人間の表情に反応できる柔らかく表情豊かな顔を持つ新しい自律型ロボット、EVAを開発した。この研究は2021年5月30日のICRAカンファレンスで発表され、ロボットの設計図はHardware-X(2021年4月)でオープンソース化される予定です。

研究者らは、EVA を開発する上で最大の課題は、人間の頭蓋骨の範囲内に収まるほどコンパクトでありながら、多様な表情を生み出せるほど機能的なシステムを設計することだったと指摘している。

この課題を克服するために、チームは 3D プリント技術を大いに活用して、EVA 頭蓋骨とシームレスかつ効率的に統合する複雑な形状のコンポーネントを作成しました。数週間にわたってケーブルを引っ張ってEVAを笑わせたり、しかめ面をしたり、怒った表情をさせたりした結果、研究チームはEVAの青い、肉体のない顔が研究仲間から感情的な反応を引き出すことができることに気づいた。

チームが EVA に満足すると、プロジェクトの第 2 の主要フェーズである、EVA の顔の動きをガイドする人工知能のプログラミングに進みました。本物そっくりのアニマトロニクスはテーマパークや映画スタジオで何年も前から使われてきたが、この新しい装置を開発したチームは2つの技術的進歩を遂げた。 EVA はディープラーニングを使用して、近くにいる人間の表情を模倣します。さらに、EVA がさまざまな人間の表情を真似る能力は、自身のビデオを見て試行錯誤することで習得されました。

研究者らは、EVAは単なる実験であり、単に真似することと、人間が顔の表情を使って行う複雑な方法でコミュニケーションすることの間には大きな隔たりがあると指摘している。しかし、この実現技術は、いつか実世界で有益な応用が期待できるかもしれません。例えば、人間のさまざまなボディランゲージに反応できるロボットは、職場、病院、学校、家庭などで役立つでしょう。

<<:  この世界規模の問題に対して、ドローンはどれほどの助けとなるのでしょうか?

>>:  3分レビュー! 2021年5月の人工知能分野における重要な進展の概要

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

起業180日で評価額20億ドルを達成! OpenAIの欧州版は人気があり、Llamaの開発者は独自の会社を設立し、Nvidiaが投資している

「欧州版OpenAI」の最新評価額は20億ドルに近づいています!パリを拠点とする大手モデルスタートア...

GPT-2を使ってGPT-4を監督し、AIが人類を滅ぼすのを防ぐ?OpenAI Ilya Super Alignmentチームの最初の論文が発表される

たった今、OpenAI のチーフサイエンティスト Ilya が率いるスーパーアライメントチームが設立...

マスク氏、ロボット「オプティマスプライム」が服を畳む動画を公開、動きはゆっくりだが自然

テスラのイーロン・マスク最高経営責任者(CEO)は現地時間1月16日、ソーシャルメディアXに同社の人...

...

AR乾物、説明する時間がない、早く保存する

[51CTO.com からのオリジナル記事] 近年、AR は常に資本追求の焦点となってきました。 2...

NetEase Cloud Musicのリアルタイムデータウェアハウスガバナンス最適化の実践

1. 現状と問題点1. 現状と問題点Cloud Music データ ウェアハウス プラットフォームは...

...

データのラベル付けは不要、「3D理解」によるマルチモーダル事前トレーニングの時代へ! ULIPシリーズは完全にオープンソースで、SOTAをリフレッシュします

3D 形状、2D 画像、および対応する言語記述を整合させることにより、マルチモーダル事前トレーニング...

C# の敏感な単語フィルタリング アルゴリズムの実装

この記事はWeChatの公開アカウント「UP Technology Control」から転載したもの...

王の英雄を見極める – PM の機械学習初心者の旅

[[204836]]基本概念先月、私は機械学習を原理レベルから理解し始め、オンライン電子書籍「ニュー...

人間を超えた最初の専門家! OpenAIが混乱に陥る中、Googleのマルチモーダル大規模モデルGeminiがそれを打ち負かす

OpenAIが混乱に陥っている間、Googleは「全員を殺す」準備をしている。ちょうど昨夜、Goog...

...

5Gネットワ​​ーク構築80%:5Gロボットが新たな転換点を迎えようとしている

最近、CCTVニュースによると、中国は2月末までに計画通り5Gネットワ​​ーク構築の80%を完了した...

すべてのオープンソースモデルを超え、クロードとバードを破り、プログラミングタスク専用の大規模モデルが登場

最近、大規模言語モデル(LLM)の継続的なリリースにより、LLMランキング競争が熱を帯びてきており、...