オープンAI音声アシスタントMycroftでプライバシーを確​​保

オープンAI音声アシスタントMycroftでプライバシーを確​​保

[[258822]]

[51CTO.com クイック翻訳] 音声アシスト技術は非常に人気があり、すでに25億台のデバイスが使用されており、この数は2023年までに3倍の80億台になると予想されています。主流の音声アシスト技術にはプライバシーとセキュリティの脆弱性があるにもかかわらず、この成長は止められないようです。

1 つは「開いている窓」の脆弱性です。たとえば、悪意のある人物が開いている窓の前を通り過ぎ、「おい、ドアを開けろ!」と叫んで家に入る可能性があります。研究者らはまた、AlexaとGoogle Assistantに何千もの誤検知ウェイクワードがあり、悪意のあるコマンドを挿入するための潜在的な攻撃ベクトルであることも発見した。テレビを通じて亜音速の指令を送信することのリスクを指摘する人もいる。 Amazonはすでに、Alexaがコマーシャル中に起動しないように周波数を操作している。また、インターネットに接続されたあらゆるコンピューティング デバイスと同様に、バックドアやその他の一般的な脆弱性が存在する可能性があります。

プライバシーとセキュリティのためのオープンソーステクノロジー

Mycroft AI のようなオープンソースの音声アシスタントは、意図的にセキュリティとプライバシーへの道を提供します。オープンソース ソフトウェアでは、その性質上、脆弱性が明らかになるようにコードのレビューが推奨されます。

私が勤務する会社であるマイクロフトは、音声アシスト技術は安全であるという概念を推進しています。当社には、共通脆弱性識別子 (CVE) 開示を処理するためのプロセスがあります。開発ツールとして、私たちは SSH などのシステムに大きく依存しており、セットアップ ウィザード内のパスワードも含め、デバイスのデフォルト パスワードを変更することを常に推奨しています。また、意図解析、スキル、テキスト読み上げ (TTS) などの機能をデバイスに移行します。これは、他の大企業がクラウドで実行できる機能です。技術に精通したホーム ユーザー向けに、ファイアウォールの背後でエクスペリエンス全体を実行するために必要なコンポーネントを近日中にリリースする予定です。私たちは、ユーザーがソフトウェアを可能な限り制御できるようにしたいと考えています。

音声プリントにより、AI は声で人を区別できるようになり、ユーザーはロック、購入、その他の機密機能の権限を特定の人に割り当てることができるため、「ウィンドウイング」や誤検知のウェイクアップワードの脆弱性が軽減されます。これらには、ワンタイム音声パスワードまたはより高度な音声生体認証を使用した 2 要素認証を追加できます。 Google と Amazon はすでにアシスタントに何らかの音声プリントを導入しており、私たちはこの分野で大きな可能性を秘めたいくつかの企業と連携しています。ウェイクワード認識の改善により、使用可能な誤検知ウェイクワードのリストが制限されます。適切に設計されたフィードバック ループでは、Mycroft の Precise フラグ ツールなどのテクノロジを使用して誤検知がフラグ付けされるため、誤検知が効果的である可能性は低くなります。

オープンソースイノベーション

かつては、実験を奨励する方法はオープンソースを通じてでした。これが真のイノベーションが生まれ、新しいテクノロジーが構築される方法です。

私たちは、イノベーターたちに、より少ない文字列で音声アシスタント技術を試す機会を提供します。オープンソースはソフトウェアをコミュニティの努力で実現します。たとえば、Mycroft には、数名の技術メンバーを含む 16 人のチームではなく、フィードバックを提供し、新機能を開発し、コア ソフトウェアに貢献する何千人もの開発者がいます。当社のライセンス モデルに基づいて、イノベーターは新しい革新的な実装からビジネスを簡単に構築できます。

もっと深く言えば、オープンとは、テクノロジーが、それを提供する企業だけでなく、ユーザーを完全に代表できることを意味します。音声アシスタントは、人々があらゆるテクノロジーと対話する方法を変える力を持っています。音声は、家庭、オフィス、モバイル デバイス、公共の場所を、これまで想像もできなかった方法で変革します。

私たちが皆さんに問いかけたいのは、「このテクノロジーが完全に自分の利益のために機能することを望みますか、それとも小売業者や検索・データ企業の利益のために機能することを望みますか?」ということです。ほとんどの人は前者を選ぶだろうと私たちは考えています。それを実現する唯一の方法は、オープンで透明性があり、コミュニティ主導であることを保証することだと私たちは知っています。

音声アシスタント機能

Mycroft は他の音声アシスタントと同じことを行いますが、やり方が異なります。ほとんどの音声アシスタントの音声システムは、デバイス側でウェイクワード認識を使用し、残りのやり取りをクラウドに送信して処理し、応答をスピーカーに送り返します。

Mycroft は、この作業の多くをソフトウェアを実行するデバイスに移行します。コマンドをリッスンするために、デバイス上のウェイクアップワード認識を使用します。ウェイクワードが検出されると、コマンドが記録され、音声からテキストへの転記のためにクラウドに送信されます。転記されると、テキスト ファイルはデバイスに送り返され、自然言語処理、スキル処理、音声合成が実行されます。

スキルはマイクロフトに能力を与えます。私たちは、社内チームとコミュニティの両方からのスキルを、新しい Mycroft スキル マーケットプレイスに着実に追加してきました。 Mycroft は、複数の音楽ソースを制御し、多数の IoT プラットフォームに接続し、Wikipedia や Wolfram|Alpha を含む 12 のソースから一般的な情報を取得し、ゲームをプレイし、サイコロを振り、物語を語り、速度テストを実行するなどの機能を備えています。

ユーザーが簡単にコンポーネントを交換できるように、Mycroft をモジュール式にしました。たとえば、現在 2 つのウェイクワードと 3 つの音声を提供しており、近日中にさらに多くの音声がサポートされる予定ですが、Mycroft では、任意のプロバイダー (クラウドまたはオンプレミス) からのカスタム ウェイクワードと TTS 音声も実行できます。

オープン AI 音声アシスタント Mycroft でプライバシーを保護する (Eric Jurgeson 著)

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  GoogleとOpenAIがマシンビジョンアルゴリズムをより良く研究するための新しいツールを開発

>>:  過去1年間、世界は人工知能の倫理について次のような考えを抱いてきた。

ブログ    

推薦する

Java プログラミング スキル - データ構造とアルゴリズム「ヒープ ソート」

[[389058]]ヒープソートの基本ヒープソートは、ヒープデータ構造を使用して設計されたソートア...

音声認識にPythonを使用する方法を教えます

[[282998]]オンラインでいくつかの例を見つけましたが、音声をテキストに変換できる成熟したモデ...

堅牢な機械学習アルゴリズムの構築方法: ブースティングとバギング

[[211376]]機械学習とデータサイエンスの作業は、単にデータを Python ライブラリに渡し...

...

OpenAIが安全チームを設置 準備: AIのリスクを評価し、外部からの悪用を防ぐ

OpenAIは10月27日、汎用人工知能(AGI)によって引き起こされる可能性のある壊滅的なリスクを...

...

...

あなたの GPU は Llama 2 のような大規模なモデルを実行できますか?このオープンソースプロジェクトを試してみてください

コンピューティング能力が重要視される時代に、GPU は大規模モデル (LLM) をスムーズに実行でき...

2019年に解決すべき11のAI倫理的ジレンマ

ビッグデータダイジェスト制作編集者: Luan Hongye、Aileen今こそAIの倫理について議...

人工知能が診断ツールをどのように変えるのか

医療においては、新しいアイデアが常に命を救うのに役立ちます。 1895 年にウィレム・アイントホーフ...

75歳のヒントン氏が再び警告:AIが人間を支配するかもしれない!

10月9日、ヒントン氏は「60 Minutes」のインタビューを受け、人工知能が人間を支配するかも...

デジタル企業におけるロボティック・プロセス・オートメーション(RPA)技術の長所と短所

[[388106]]ロボティック プロセス オートメーション (RPA) テクノロジーは、一部の企業...

...