音声アシスタント業界はどこへ向かうのでしょうか?

音声アシスタント業界はどこへ向かうのでしょうか?

プログレス・パートナーズの創設者兼シニアマネージングディレクターのニック・マクシェーン氏は、「今後数年間で、既存の企業の能力を超える音声アシスタントの新たな市場、新たなアプリケーション、新たなプラットフォームが登場するだろう」と語った。 Progress Partners は、新興テクノロジー企業やメディア企業に M&A、資金調達、SPAC アドバイザリーを提供するマーチャント バンクです。

TechTalks とのインタビューで、MacShane 氏は音声アシスタント業界の展望と、この拡大する市場で革新的なスタートアップ企業がいかにして存在感を発揮できるかについて語りました。

音声アシスタントの大量導入

音声アシスタントは何十年も前から存在しています。しかし、Apple が Siri を導入した 2011 年までは、広く使用されることはありませんでした。それ以来、市場は急速に成長してきました。 Microsoft と Amazon はそれぞれ 2014 年に Cortana と Alexa をリリースしました。 Google は 2016 年にアシスタントをリリースしました。サムスンは2017年にBixbyをリリースしました。すべてが同じように成功したわけではありませんが、デバイスの使用方法に文化的な変化をもたらしました。

現在、アメリカの世帯の50%以上がスマートスピーカーを所有しています。米国では推定1億2,800万人が音声アシスタントを使用しています。音声はオンライン検索の大部分を占めており、ローカルビジネス検索の 50% 以上も占めています。音声アシスタントの使用は、車内や、ユーザーが画面を見たり操作したりすることを好まないその他の環境で増加しています。

さらに、これらの数字はすべて年々増加しており、デバイスやアプリケーションにおける音声機能の受容と期待が高まっていることを示しています。音声アシスタント市場の成長は、機械学習とディープラーニングの進歩により、音声テキスト変換技術の精度が向上したなど、いくつかの要因によるものです。自然言語処理 (NLP) と大規模言語モデルの進歩により、より複雑なコマンドを実行できるようになりました。 TinyML は音声推論をクラウドからエッジに移動しました。ユビキタスコンピューティングとインターネット接続により、音声アシスタントが私たちのポケット、手首、リビングルームにまで浸透しました。

現在の音声アシスタントの限界

しかし、音声アシスタント市場の拡大により、既存企業のいくつかの欠点も浮き彫りになってきました。

「音声アシスタントはこれまでで最も急速に成長している消費者向けテクノロジーの1つだが、現在の使用例は音楽を聴いたりタイマーを設定したりといった比較的単純なものだ」とマクシェーン氏は語った。 「時間の経過とともに、ユーザーが音声テクノロジーとやり取りする方法はより洗練されていくと予想しています。」

ユーザーが音声テクノロジーに慣れてくると、期待も高まります。ユーザーは、複数のやり取りや専門分野の知識を必要とするタスクを音声アシスタントに支援してもらいたいと考えています。例えば、ユーザーはテレビに、画面上で俳優が着ているシャツを買うように頼んだり、運転中にショッピングカートに商品を追加したりしたいかもしれない、とマクシェーン氏は述べた。この場合、アシスタントは音声コマンドをアクションにマッピングするだけでなく、複数のソースから情報を収集できる必要があります。

「音声分野で見られる技術の進歩により、人々は音声アシスタントをより活用できるようになり、会話をあるスマートスピーカーから別のスマートスピーカーに移すことができるようになる」とマクシェーン氏は語った。

プラットフォームに依存しない音声アシスタント

現在の音声アシスタントのもう 1 つの問題は、クロスプラットフォーム サポートが不足していることです。 Alexa は Amazon に、Siri は Apple に、そして Assistant は Google に関連付けられています。このため、開発者がユーザーが所有するさまざまなデバイスで動作する音声アプリケーションを作成することは困難です。

「現在、市場では音声アシスタントの多様性が増しつつある。新製品が人気を集めるにつれ、最大の市場シェアを持つリーダーとしてのアマゾンの地位は低下している」とマクシェーン氏は語った。 「現在、Amazon の市場シェアは 50% 未満であり、すべてのプラットフォームでサービスを提供するためにサードパーティのサポートの必要性がこれまで以上に高まっています。」

基本的に、これは、アプリを開発する場合、あらゆる種類の音声アシスタントでアプリを動作させる方法を考えなければならないことを意味します。 Alexa または Siri へのサポートを制限すると、一部のアプリ ユーザーは音声機能の利便性を失ってしまいます。これは、さまざまなオペレーティング システムで動作する、プラットフォームに依存しない音声アシスタントが埋めることができるギャップです。

「ブランドは、たった 1 つのスマート デバイスで広告や販売、消費者とのやり取りを行いたいとは思っていません。エコシステム全体に参加したいと考えており、それを可能にするのがサードパーティのテクノロジー プロバイダーです」とマクシェーン氏は語った。 「サードパーティのテクノロジープロバイダーを活用することで、ブランドは多様な音声アシスタントのポートフォリオを通じてメッセージを届けることができるようになります。音声テクノロジー市場において、インフラ、収益化、商取引、データと分析を優先することで、新たな機会が生まれます。」

今後注目すべき音声アシスタントプラットフォーム

「私たちは、コマース、広告、コネクテッドTVという3つの主要分野で音声サポートの将来にチャンスがあると確信しています」とマクシェーン氏は語った。

Progress Partners の投資部門である Progress Ventures は最近、音声アシスタントの未来を担うと MacShane 氏が考える音声技術の新興企業数社に投資した。

その1つが、2022年までに400億ドルに達すると見込まれる急成長産業である音声コマース向けのクラウドベースプラットフォームであるBlutagです。 Blutag は、ほとんどの主要な e コマース プラットフォームに対してコード不要の音声サポートと、カスタム統合のための豊富な API を提供します。オンライン ストアの所有者は、購入、クーポン、FAQ など、さまざまな音声対応機能を追加できます。このプラットフォームは、さまざまなデバイスタイプとマルチモーダルエクスペリエンスをサポートします。したがって、たとえば、ユーザーがディスプレイ付きのデバイス(スマートテレビやスマートフォンなど)を使用する場合、音声アシスタントは、ユーザーの音声データやディスプレイに表示されるコンテンツなど、さまざまなソースから情報を取得できるようになります。デバイス画面。 Blutag は音声コマース向けに設計されているため、複数ステップの購入やコンテキスト データの使用など、汎用の音声アシスタントでは対応できない複雑なオンライン ショッピングの問題を処理できます。

Progress Ventures の別のポートフォリオ企業である Instreamatic は、音声広告を提供しています。 Instreamatic を使用すると、企業はユーザーに話しかける会話型広告を配信できます。 Instreamatic の目標は、静的な広告から、ユーザーにパーソナライズされたエクスペリエンスを提供する動的な広告に移行することです。

Progress Ventures が投資した 3 番目の企業である Disruptel は、画面のコンテンツを理解して対話できる AI 音声アシスタントを提供しています。たとえば、映画を見ているときに、アシスタントに似た映画や、画面に映っている俳優、俳優が着ているジャケットなどの特定のアイテムに関する情報を尋ねることができます。スポーツの試合を観戦している場合は、お気に入りの賭けプラットフォームを通じて賭けをするようにアシスタントに指示できます。

これは音声体験の拡大のほんの始まりに過ぎず、MacShane 氏は今後数年間でさらに多くの便利なアプリケーションが開発されると考えています。

「音声は今後もモダリティとして成長し続けると私たちは考えています。あらゆる年齢層、人口統計、地域で音声アシスタントの利用が増加しています」と同氏は語った。 「音声アシスタントの利用が増え続け、テクノロジーも進化し続けているので、音声テクノロジーの分野に携わるのはとてもエキサイティングな時期です。」


<<:  人工知能の発展の特徴とその3つのタイプの現れについての簡単な分析

>>:  純粋な MLP は下流のタスクには適していませんか? Meta AIらは、トランスフォーマーを上回るスパースMLPを提案した。

ブログ    

推薦する

この「PhD Study Simulator」はとてもリアルです。何回諦めるように説得されるか試してみてください。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

人工知能とビッグデータが私たちの生活に何をもたらすかご存知ですか?

「ビッグデータ」と「人工知能」はテクノロジー業界で最も価値のある分野となっている。Apple、Go...

データから診断へ: 緑内障検出のためのディープラーニング手法

緑内障は、世界中の無数の人々に回復不可能な失​​明を引き起こす障害の主な原因です。緑内障自体は、眼と...

...

自然言語処理(NLP)の歴史と方向性

自然言語処理の歴史は紆余曲折に満ちた物語です。それは無駄な研究から始まり、何年にもわたる実りある研究...

なぜ多くの大学や大富豪が協力して AI 技術制御の研究を進めているのでしょうか?

[[268857]]最近、億万長者でブラックストーン・グループの共同創設者であるスティーブン・シュ...

自動運転車が将来の都市生活に及ぼす影響

倫理的配慮無人運転車の問題は、自動運転車の倫理性の問題として要約できます。この問題の典型的なバージョ...

...

1 つの記事で理解する: 「コンピューター ビジョン」とは一体何でしょうか?

[[183558]]誰かがあなたにボールを投げてきたら、どうしますか? もちろん、すぐにキャッチす...

「犬とロボットのふれあい」がここにあります!犬は誰の言うことを聞くでしょうか?ロボットかロボット犬か?

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

...

...

Google mBERT の秘密を解明: ディープラーニングは人間の言語をどのように処理するのか?

[[384615]]言語機能を備えたディープラーニングシステムは、人々の生活の中で広く利用されてき...

...