アレクサ、私の話を盗み聞きしてるの?
私はいつもAmazon Echoにこの質問をします。スマートで便利ですが、時にはちょっとスマートすぎて不気味になることもあります。このタイプのスマート デバイスは通常クラウドベースであるため、スマート ドアベルなどのデバイスから自宅の音声や画像をインターネットに送信することがよくあります。もちろん、これによってプライバシー侵害のリスクも生じます。Amazon や Google の下請け業者が私たちの家から送信される音声クリップを聞いていたり、ハッカーが私たちの子供たちを遠隔で監視していたりしたら、どれほど恐ろしいことになるか考えてみてください。 問題は構造的なものです。これは、今日の消費者向け AI の構築および展開方法に組み込まれています。大手テクノロジー企業は、顔や声の認識などの分野で人工知能が最も効果を発揮するには、膨大な計算能力を必要とするディープラーニングニューラルネットワークが必要だという仮定のもとに事業を展開している。これらのニューラル ネットワークは、知能を高めるために大量のデータ、つまり継続的な入力フローを必要とするため、クラウドで実行する必要があると言われています。 そうではありません。これらの見解は、複雑な消費者ニューラル ネットワークが初めて登場した 1920 年代初頭には意味をなしていました。当時、子猫を自動的に識別したい場合、Google の「世界を食い尽くす」サーバーのパワーが本当に必要でした。 しかし、ムーアの法則はムーアの法則であり、近年 AI のハードウェアとソフトウェアの両方で大きな進歩がありました。現在、安価で低電力のマイクロプロセッサ上で完全に実行でき、必要なすべての AI トリックを実行できるものの、画像や音声をクラウドに送信することのない新しい種類のニューラル ネットワーク、エッジ AI が登場しています。今後、運が良ければ、プライバシーを損なうことなく利便性を実現できると信じています。 エッジ AI 企業である Picovoice は、音声コマンドを認識できるソフトウェアを開発していますが、それがわずか数ドルの小型マイクロプロセッサで動作するだけだと想像できますか? ハードウェアは非常に安価なので、スマート音声技術は洗濯機や食器洗い機などの日常的な家庭用電化製品に応用できるかもしれません。ピコボイス社は、音声制御デバイスの開発に向け、すでに大手家電メーカーと提携していると述べた。 こんなに小さな AI はどのように動作するのでしょうか? これは実に巧妙な工学技術です。従来のニューラル ネットワークでは計算に長い数値を使用しますが、Picovoice では非常に短い数値 (バイナリの 1 と 0 も含む) を使用するため、はるかに低速のチップでも AI を実行できます。この妥協の結果、それほど野心的ではないロボットが誕生したようだ。コーヒーマシンの音声認識 AI は、コーヒーを淹れるというタスクに関連する約 200 語を認識するだけで済む。 「Alexaのように会話したり冗談を言ったりすることはできませんが、誰が気にするでしょうか?ただのコーヒーポットですから。」 コーヒーマシンと有意義な会話はしていない、とPicovoiceの創設者Alireza Kenarsari-Anhari氏は言う。 これは深い意味のある指摘であり、今日の人工知能のもうひとつの問題を示唆している。つまり、企業は、人間の言うことをほぼ何でも理解できる「スター・ウォーズ」のロボット、C-3POのように動作するようにする音声アシスタントを作り続けているのだ。これは困難であり、実現するには大量のクラウドが必要になります。しかし、日常的な物体はチューリングテストに合格する必要はありません。 「おやじジョーク」を言ったり、自己認識力のある電気スイッチは必要ありません。彼らが理解する必要があるのは、「オン」と「オフ」または「暗い」だけです。 ベッドで一緒に使うガジェットに関しては、それほどスマートでないほうがいいと思います。 さらに重要なのは、エッジ AI が迅速に反応することです。デバイスがアフリカ大陸の真ん中にあるAmazonのサーバー、NSAの膨大な思想犯罪データ、あるいは最終結果が何であれ、Smash Mouthの「All-Star」を再生するという音声リクエストを送信した瞬間から、パフォーマンスに一時停止はなく、1ミリ秒のロスもありません。 「エッジ処理は驚異的なスピードで進んでいる」と、エッジデバイス向けのオーディオビジュアル認識ソフトウェアを開発するセンサーズのCEO、トッド・モーザー氏は語った。彼は電子レンジ用に作成したニューラル ネットワーク コードを実演し、「ポップコーンを 2 分 36 秒間温めてください」などのコマンドは即座に認識されました。 これにより、エッジ AI のエネルギー効率も向上します。クラウド コンピューティングの必要性をなくすことで、インターネット パケットのルーティングに必要な炭素の燃焼量が削減されます。実際、最近アップル社に買収されたシアトルの企業 XNOR.ai は、小型の太陽電池で駆動できるほど軽量な画像認識ニューラル ネットワークを開発しました。 (本物の焼きそばは植物が発する微弱な電圧を利用して作られています)。 XNOR.ai の共同設立者である Ali Farhadi 氏が指摘するように、エッジ AI は環境に優しいだけでなく、プライバシーも保護します。「子供の寝室の写真をクラウドに送信するデバイスは持ちたくありません。どれだけ安全だと主張していても、1 日おきにハッキングされるようです。」 もちろん、従来の AI がなくなるわけではなく、機械知能の一部のイノベーションにはクラウド機能が必要になる可能性があります。結局のところ、歯ブラシと実際に会話したい人もいるかもしれないので、口腔衛生データをサウロンの目にフィードバックするのは楽しいかもしれません。しかし、一般の人々にとっては、ほとんどの人が、インテリジェンスが少なくプライバシーが重視されるエッジ AI を選択するだろうと私は考えています。 |
<<: COVID-19により公益事業の人工知能への移行が加速
急速な技術進歩により、私たちの知る世界は変化し続け、変革の可能性を秘めた新たな時代が到来しています。...
COVID-19の時代において、ロボット工学とテクノロジーは協力して伝染性ウイルスの拡散を防いでい...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
著者 | 崔昊レビュー | Chonglouまとめこの記事では、情報検索とテキスト生成の最新の進歩に...
言語モデルは、自然言語処理の分野における研究と実践に大きな変化をもたらしました。近年、大型モデルは多...
AI時代では、DevOpsとAIが共有結合します。 AI はビジネス ニーズに基づいてソフトウェアの...
2022 年に雇用主の間で最も人気のあるプログラミング言語はどれですか? 地域や職種によってソフトウ...
交通渋滞問題は北京、上海、広州の都市脳血栓症となっている。我々の巧妙な統治の下では、都市部の道路渋滞...
画像ソース: https://pixabay.com/images/id-1069218/ 2024...
1. はじめに自然言語処理(NLP)技術は人工知能の分野で重要な部分を占めており、その開発と応用は私...
[[346568]] 1 スケジュールされたタスクNetty、Quartz、Kafka、Linux ...