将来、音声認識はどのような商業シナリオに適用される可能性がありますか?

将来、音声認識はどのような商業シナリオに適用される可能性がありますか?

Companies and Markets の評価レポートでは、世界の音声認識市場は今後さらに多様化し、ソフトウェアの精度も大幅に向上すると述べられています。 2017 年までにこの市場は 1,330 億米ドルに達すると予測されています。

Companies and Markets の評価レポートでは、世界の音声認識市場は今後さらに多様化し、ソフトウェアの精度も大幅に向上すると述べられています。 2017 年までにこの市場は 1,330 億米ドルに達すると予測されています。映画「Her」を見た友人は、音声認識と制御のストーリーに間違いなく感銘を受けるでしょう。この技術を実現する難しさについては以前詳しく紹介しましたが、近い将来、音声認識技術はどのようなシナリオで使用されるのでしょうか。

音声認識に関して、まず頭に浮かぶのは、おそらくジョークを言うことができない Siri でしょう。 Siri の技術は、世界初の上場音声認識企業である Nuance 社が開発したものだ。数週間前、Baidu が音声アシスタント アプリケーションを強化するために Nuance を買収したいとの噂があったが、Baidu Deep Learning Laboratory (IDL) のディレクターである Yu Kai 氏はこれを否定した。昨年11月、サムスンがニュアンスとの買収交渉を行ったが、6カ月連続の赤字に怯んで断念したとの報道があった。一方、AppleはNuanceの技術に依存し続けることを望まず、一連の自主的な取り組みを実施し、これもNuanceに新たな販路を模索するきっかけとなった。

[[186259]]

直接的なキャッシュフローをほとんど生み出さない事業である音声認識は、Nuance に多大な問題を引き起こしました。同社の全体的な状況は楽観的ではありませんが、Nuance がさまざまな分野で事業化に取り組んでいることがわかります。

医療分野

少し前に、Nuance は公式ブログで医療分野に注力すると発表しました。スマートウォッチを通じて運動状況や心拍数を追跡するだけの単純なものではなく、適切なレストランや食事など、その人の身体状況に応じて対応するサービスを直接マッチングさせるものでもあります。もちろん、これらのほとんどはウェアラブルデバイスに基づいています。さらに、緊急時の音声支援、医師と患者の会話のアーカイブ化、コールセンターの会話のディクテーションなど、さらに多くのシナリオも検討しました。

医療分野の語彙データベースは専門性が高く、進化も少ないため、完全なデータベースが構築されていれば、病名や薬品名の比較的正確な識別が可能になります。 Medical Record FolderやZhenlipaiなどの既存の国内アプリケーションは、医療記録を安全に保存し、症例検索を容易にし、音声検索機能をサポートするクラウドスペースを医師に提供します。

スマートカー

運転の安全性の問題は常に大きな注目を集めています。昨年、タッチスクリーンを操作する際にドライバーが過度に気を取られる問題を解決するために、簡単な複数指のジェスチャーを使用できる車のスクリーンを設計した人がいました。実際、Nuance はすでに Dragon Drive と呼ばれるカスタマイズされた自動車グレードの音声プラットフォームを持っており、2015 CES イノベーション アワードを受賞しています。 Nuance は車載プラットフォームを携帯電話に接続することで、ユーザーが GPS ナビゲーション、メッセージの送受信、通話の発信と受信、ソーシャル ネットワークの更新などの音声制御を実現できるよう支援します。

スマートウェアラブル

北京の冬はますます寒くなってきました。携帯電話を使う必要があるのに、手に取りたくないと思うことが何度もあります。電話をかけたり、WeChatメッセージを送信したり、ルートを確認したり、タクシーを呼んだりすることが、すべてウェアラブルデバイスの音声制御によって可能になれば素晴らしいでしょう。現在、Mobvoiチームは、音声でDidiタクシーを直接制御できるMoto 360用のスマートウォッチオペレーティングシステムであるTicwearを開発しました。

[[186260]]

インテルは1年前に、耳に装着して携帯電話に接続し、所有者の指示を理解して音声フィードバックを返す、Siriに似たパーソナル音声アシスタントとして機能するウェアラブルデバイスのプロトタイプJarvisを開発しました。これは「her」のシーンではないでしょうか?

スマートホーム

以前、当社はさまざまなスマートホームを統合しながら、新たな方法でより多くの人体データを収集することを目指したスマートベッドカバー「Luna」を紹介しました。特にベッドに横になっていて画面をまったく見たくないときには、音声認識が最も適した統合方法かもしれません。さらに、Nuance はすでにテレビや携帯電話を音声で制御できる技術を開発しています。

「インターネットの考え方を使って自宅のバスルームを変革できる人はいますか? 毎回スピーカーを持ち歩くのは非常に面倒です。それに、曲を変えたり緊急電話に出たりするのは、単に非人道的です。」スマートホームバスルームはまだ聞いたことがありませんが、音声で制御できるスマートスピーカーはすでに利用可能です。

教育

先ほど、音声認識の難しさの 1 つは、多くの言語や方言の多様性にあると述べました。これは、教育の分野にも応用できます。データベースに標準を提供させることで、口頭評価をよりシンプルかつ効率的に行うことができます。

[[186261]]

学習支援という点では、1年前の「紫東通訳」というクラウド認識に基づく中国語と英語の同時翻訳アプリケーションを思い出します。音声翻訳、音声認識、音声合成の技術を統合しています。翻訳したい文章を携帯電話に話すだけで、中国語と英語の音声読み上げ結果と視覚的なテキスト結果が表示されます。連続音声入力をサポートし、声のトーンに基づいて句読点を自動的に追加することもできます。

つまり、話すことは人間にとって最も自然なコミュニケーション方法です。人工知能は疑似知能であり、機械が人間のように生きることは決してありませんが、機械はますます理解力を高めることができると言えます。

<<:  ディープラーニングにも欠陥があり、同質のAIスタートアップ間の競争は熾烈になるだろう

>>:  将来、仮想現実、人工知能、そして人体はどのように融合するのでしょうか?

ブログ    

推薦する

...

人工知能とクラウドコンピューティングの組み合わせは、企業ビジネスの飛躍的成長をどのように促進するのでしょうか?

Statistaの最近のレポートによると、「AI市場の世界的価値は2025年までに年間890億ドル...

...

マーケティングにおける人工知能の 4 つの実際の応用

人工知能 (AI) は誕生以来長い道のりを歩み、大きな進歩を遂げています。これは、Amazon や ...

...

ウナギの下半身は切り落とされた後もまだ動きます。ロボット: 受け取ってください。

[[418811]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitA...

AIとビッグデータに焦点を当て、インテルとToutiaoが技術革新研究所を設立

[原文は51CTO.comより] 8月22日、インテルとToutiaoの共同戦略協力記者会見と「デー...

マイクロソフトは言語モデルをより調和のとれたものにするために複数のツールとデータセットをオープンソース化

Microsoft は最近、AI 駆動型コンテンツ モデレーション システムを監査し、AI モデルの...

LK-99の完全懸架映像が初めて物議を醸した。ネットユーザー:本当なら画期的

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

コンピュータマスターのジレンマ!試験に合格するのは難しく、仕事を見つけるのも難しい

3年前、ディープラーニングを専攻し、2019年度に入学したばかりのコンピューターマスターが知乎に質問...

疫病流行中の人間の行動にAIが混乱!データ変更による作業の「異常」は手動での制御が必要

[[327938]]ビッグデータダイジェスト制作著者: 劉俊環半年前に Taobao をオープンした...

...

...

人工知能は理想的なサイバー防御手段か?

企業や政府がサイバーセキュリティに対する意識を高め、毎年数十億ドルがこの分野に投資されるようになると...

...