人工知能とVRを融合し、多様な体験を実現

人工知能とVRを融合し、多様な体験を実現

人工知能サービス - Microsoft Cognitive Services には当初、視覚、音声、言語、知識、検索の 5 つのカテゴリに 21 個の API が含まれていました。これらの API を使用するシステムは、自然なコミュニケーションを通じて、私たちのニーズを見て、聞いて、話し、理解し、解釈することができます。現在、Microsoft 認知サービス全体のうち 8 つが一般に公開されており、17 つが指定された開発者向けにプレビューとして公開されています。 Microsoft は、オリジナルの API をベースに、新しい API を追加し、既存の API を更新し続けます。

[[183508]]

最近、Microsoft は Microsoft Cognitive Services に Custom Speech Service を追加することを発表しました。 Custom Speech Service は、Custom Intelligent Speech Recognition Service (CRIS) と Language Understanding Intelligent Service (LUIS) という 2 つの最先端テクノロジを組み合わせた、柔軟性の高い音声テキスト変換プログラムです。

CRIS は、騒がしい公共の場などの複雑な環境にも適用でき、音声認識をより便利にカスタマイズするのに役立ちます。また、アプリケーションが非ネイティブスピーカーや障害のある人などをよりよく理解できるようにするためにも使用できます。

LUIS は、コンピュータが私たちの言葉の背後にある真意を理解するのに役立ちます。現在の音声コマンドでは、システムが応答する前に、開発者が 1 つ以上の特定の単語またはフレーズを設定する必要があることがよくあります。実際の例を挙げると、システムがマップ アプリケーションを開いて近くのコーヒー ショップを検索する指示を受け取る前に、ユーザーは「コーヒーを探して」または「コーヒーを探しに連れて行って」と言う必要があります。しかし、LUIS を使用すると、ユーザーは「眠くて目を開けられない。リフレッシュしたい」と言うだけで、システムがユーザーの真のニーズを理解します。

現在、バーチャルリアリティコンテンツスタジオのHuman Interactは、Microsoftのカスタム音声サービスとVRを組み合わせようと試みている。

Starship Commander は音声対話型 VR 体験です。プレイヤーは宇宙船のパイロットの役割を担い、スーパーコンピューターやホログラフィック司令官と協力してミッションを完了します。ゲーム中、プレイヤーは音声通信を通じて仮想世界を探索します。 CRIS と LUIS のおかげで、両方のゲーム キャラクターは宇宙船やエイリアンに関する言葉を正しく理解し、応答できるようになりました。通常の VR ゲームと比較すると、Starship Commander はインタラクティブな映画のようなものです。

人工知能と VR 技術の発展により、将来的にはプレイヤーと NPC 間のやりとりがより自然で没入感のあるものになるでしょう。

[[183509]]

<<:  Googleの人工知能学習により低ピクセル画像も鮮明に

>>:  マシンビジョンについて知っておくべきこと

ブログ    
ブログ    

推薦する

ChatGPTにはファイル分析や自動検索などの新機能がある。スタートアップ企業の製品は置き換えられるのだろうか?

最近、OpenAIはChatGPT Plusメンバー向けに新しいベータ機能を開始しました。これには主...

アリババ副社長でDAMOアカデミーの自動運転部門責任者の王剛氏が辞任し、自身のビジネスを立ち上げる予定

マシンハートは、アリババの副社長であり、DAMOアカデミーの自動運転研究所の所長である王剛氏が最近辞...

買い物客の4分の3がレジなし店舗を試してみたいと考えている

[[418996]]画像ソース: https://pixabay.com/images/id-391...

アコーディオン: HBase メモリ圧縮アルゴリズム

最近では、HBase ベースの製品の読み取り速度と書き込み速度に対する要件がますます高まっています。...

ベンチマーク: 14 のソートアルゴリズムと PHP 配列

この記事では、PHP で記述されたソートアルゴリズムのテストについて紹介します。ソートアルゴリズムは...

...

2040枚の画像で訓練されたViTの精度は96.7%で、移行パフォーマンスも驚異的だ

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

AIが産業変革を促進する仕組み

このように技術的に進歩した世界では、検査などの重要な産業プロセスは依然として非効率でコストがかかり、...

人工知能の時代において、「次世代」の教育はどこから始めるべきでしょうか?

[[334948]]自動運転車、音声アシスタント、その他の人工知能技術は、ほとんどの人にとって革命...

企業の75%が現在ChatGPTを無効化しているか、永久に無効化する予定である。

BlackBerry が発表した新しい調査によると、世界中の組織の 75% が現在、職場での Ch...

データサイエンスの面接で知っておくべき 10 の機械学習の概念

この記事は公式アカウント「Reading the Core」(ID: AI_Discovery)から...

360スマートブレインモデルが一般公開されました

9月5日、360 Intelligent Brainモデルが今後一般公開され、360の「ファミリーバ...

チャットボットのさまざまな種類について学ぶ

チャットボットの種類は、提供されるさまざまな機能と応答に使用する方法によって決まります。チャットボッ...

「ロボット交通警察」が登場!最先端技術が輸送業界に力を与える

現在、科学技術の継続的な進歩により、ロボットは徐々にさまざまな産業の変革のための重要なツールとなり、...

GPT-4 は P≠NP であると結論付け、Terence Tao の予測は実現しました。世界の数学の問題を解く「ソクラテス的推論」対話97ラウンド

大規模言語モデルは実際に数学の定理の研究に使用できます。最近、Microsoft Research ...