[51CTO.com クイック翻訳] 音声アシスト技術は非常に人気があり、すでに25億台のデバイスが使用されており、この数は2023年までに3倍の80億台になると予想されています。主流の音声アシスト技術にはプライバシーとセキュリティの脆弱性があるにもかかわらず、この成長は止められないようです。 1 つは「開いている窓」の脆弱性です。たとえば、悪意のある人物が開いている窓の前を通り過ぎ、「おい、ドアを開けろ!」と叫んで家に入る可能性があります。研究者らはまた、AlexaとGoogle Assistantに何千もの誤検知ウェイクワードがあり、悪意のあるコマンドを挿入するための潜在的な攻撃ベクトルであることも発見した。テレビを通じて亜音速の指令を送信することのリスクを指摘する人もいる。 Amazonはすでに、Alexaがコマーシャル中に起動しないように周波数を操作している。また、インターネットに接続されたあらゆるコンピューティング デバイスと同様に、バックドアやその他の一般的な脆弱性が存在する可能性があります。 プライバシーとセキュリティのためのオープンソーステクノロジー Mycroft AI のようなオープンソースの音声アシスタントは、意図的にセキュリティとプライバシーへの道を提供します。オープンソース ソフトウェアでは、その性質上、脆弱性が明らかになるようにコードのレビューが推奨されます。 私が勤務する会社であるマイクロフトは、音声アシスト技術は安全であるという概念を推進しています。当社には、共通脆弱性識別子 (CVE) 開示を処理するためのプロセスがあります。開発ツールとして、私たちは SSH などのシステムに大きく依存しており、セットアップ ウィザード内のパスワードも含め、デバイスのデフォルト パスワードを変更することを常に推奨しています。また、意図解析、スキル、テキスト読み上げ (TTS) などの機能をデバイスに移行します。これは、他の大企業がクラウドで実行できる機能です。技術に精通したホーム ユーザー向けに、ファイアウォールの背後でエクスペリエンス全体を実行するために必要なコンポーネントを近日中にリリースする予定です。私たちは、ユーザーがソフトウェアを可能な限り制御できるようにしたいと考えています。 音声プリントにより、AI は声で人を区別できるようになり、ユーザーはロック、購入、その他の機密機能の権限を特定の人に割り当てることができるため、「ウィンドウイング」や誤検知のウェイクアップワードの脆弱性が軽減されます。これらには、ワンタイム音声パスワードまたはより高度な音声生体認証を使用した 2 要素認証を追加できます。 Google と Amazon はすでにアシスタントに何らかの音声プリントを導入しており、私たちはこの分野で大きな可能性を秘めたいくつかの企業と連携しています。ウェイクワード認識の改善により、使用可能な誤検知ウェイクワードのリストが制限されます。適切に設計されたフィードバック ループでは、Mycroft の Precise フラグ ツールなどのテクノロジを使用して誤検知がフラグ付けされるため、誤検知が効果的である可能性は低くなります。 オープンソースイノベーション かつては、実験を奨励する方法はオープンソースを通じてでした。これが真のイノベーションが生まれ、新しいテクノロジーが構築される方法です。 私たちは、イノベーターたちに、より少ない文字列で音声アシスタント技術を試す機会を提供します。オープンソースはソフトウェアをコミュニティの努力で実現します。たとえば、Mycroft には、数名の技術メンバーを含む 16 人のチームではなく、フィードバックを提供し、新機能を開発し、コア ソフトウェアに貢献する何千人もの開発者がいます。当社のライセンス モデルに基づいて、イノベーターは新しい革新的な実装からビジネスを簡単に構築できます。 もっと深く言えば、オープンとは、テクノロジーが、それを提供する企業だけでなく、ユーザーを完全に代表できることを意味します。音声アシスタントは、人々があらゆるテクノロジーと対話する方法を変える力を持っています。音声は、家庭、オフィス、モバイル デバイス、公共の場所を、これまで想像もできなかった方法で変革します。 私たちが皆さんに問いかけたいのは、「このテクノロジーが完全に自分の利益のために機能することを望みますか、それとも小売業者や検索・データ企業の利益のために機能することを望みますか?」ということです。ほとんどの人は前者を選ぶだろうと私たちは考えています。それを実現する唯一の方法は、オープンで透明性があり、コミュニティ主導であることを保証することだと私たちは知っています。 音声アシスタント機能 Mycroft は他の音声アシスタントと同じことを行いますが、やり方が異なります。ほとんどの音声アシスタントの音声システムは、デバイス側でウェイクワード認識を使用し、残りのやり取りをクラウドに送信して処理し、応答をスピーカーに送り返します。 Mycroft は、この作業の多くをソフトウェアを実行するデバイスに移行します。コマンドをリッスンするために、デバイス上のウェイクアップワード認識を使用します。ウェイクワードが検出されると、コマンドが記録され、音声からテキストへの転記のためにクラウドに送信されます。転記されると、テキスト ファイルはデバイスに送り返され、自然言語処理、スキル処理、音声合成が実行されます。 スキルはマイクロフトに能力を与えます。私たちは、社内チームとコミュニティの両方からのスキルを、新しい Mycroft スキル マーケットプレイスに着実に追加してきました。 Mycroft は、複数の音楽ソースを制御し、多数の IoT プラットフォームに接続し、Wikipedia や Wolfram|Alpha を含む 12 のソースから一般的な情報を取得し、ゲームをプレイし、サイコロを振り、物語を語り、速度テストを実行するなどの機能を備えています。 ユーザーが簡単にコンポーネントを交換できるように、Mycroft をモジュール式にしました。たとえば、現在 2 つのウェイクワードと 3 つの音声を提供しており、近日中にさらに多くの音声がサポートされる予定ですが、Mycroft では、任意のプロバイダー (クラウドまたはオンプレミス) からのカスタム ウェイクワードと TTS 音声も実行できます。 オープン AI 音声アシスタント Mycroft でプライバシーを保護する (Eric Jurgeson 著) [51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください] |
<<: GoogleとOpenAIがマシンビジョンアルゴリズムをより良く研究するための新しいツールを開発
>>: 過去1年間、世界は人工知能の倫理について次のような考えを抱いてきた。
まず、タイトルには、検索構造ではなく、ルーティング項目の配置構造と書かれています。つまり、この構造を...
近年、世界の科学技術分野で最もホットな言葉は「人工知能」です。グーグル、百度、ヤンデックス、ネイバー...
[[348542]]韓国の新人歌手ハヨンが10月8日、人工知能作曲ロボットEvoMがプロデュースし...
人工知能はもはや未来の技術ではありません。私たちの日常の作業を自動化する機械はますます賢くなり、人工...
[51CTO.com からのオリジナル記事] 人類が初めてプログラム可能なコンピューターを思いついた...
[[254687]]少し前に同時通訳者がiFlytekを「AI同時通訳詐欺」と非難し、ネット上で騒...
[[244954]]最近、上海世界博覧センターで 2 日間にわたる Google 開発者会議 (Go...
8月12日、Juliプロジェクトシリーズ活動の第21回「大規模言語モデルのトレーニングとアプリケーシ...
ビジネス インテリジェンスは、あらゆる業界のグローバル企業の従来のワークロードを変革しています。ビジ...
著者: Xiao Yanghua、復旦大学コンピュータ科学技術学院准教授、博士課程指導教員、上海イン...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
11月9日、スタンフォード大学の最近の研究で、スマートフォンは音声パターンから人が酔っているかどうか...
昨日は第4回世界トップ科学者フォーラムの2日目でした。世界トップの科学者たちがオンラインとオフライン...
[51CTO.com クイック翻訳] 増え続けるプログラミング言語ライブラリやツールの中から、機械学...
1956 年に大学の研究分野として取り入れられて以来、AI は楽観的な時期と悲観的な時期を同程度に...