音声分析:自動運転車の鍵となる技術

音声分析:自動運転車の鍵となる技術

サプライチェーン管理、製造業務、モビリティサービス、画像およびビデオ分析、音声分析の進歩により、次世代の自律走行車は自動車消費者の認識を変えると期待されています。これらの技術が発展し続けると、自動運転車業界の世界市場規模は2030年までに600億ドル近くに達すると予想されています。

[[434781]]

自動運転車向け機械学習による音声分析には、音声分類、NLP、音声/音声、サウンド認識が含まれます。特に音声認識は自動運転車技術の不可欠な部分となり、ドライバーに強化された制御を提供します。これまで、音声認識は、効率的なアルゴリズム、信頼性の高い接続性、エッジ処理能力の欠如により、従来の自動車モデルでは課題となっていました。さらに、車内の騒音により音声分析のパフォーマンスが低下し、誤認識につながる可能性があります。

機械による音声分析は継続的な研究の対象となっています。テクノロジーが進歩するにつれ、Amazon の Alexa や Apple の Siri などの新製品が登場しています。これらのシステムは、クラウド コンピューティング テクノロジーを通じて急速に進化しており、これは他の認識システムにこれまで欠けていた戦略です。

最近では、kNN (最近傍法)、SVM (サポートベクターマシン)、EBT (アンサンブルバッグドツリー)、ディープニューラルネットワーク (DNN)、自然言語処理 (NLP) などのさまざまな機械学習アルゴリズムにより、音声分析がより効果的になり、自動運転車に付加価値を与えるための位置づけが向上しました。

オーディオ分析では、データが前処理されてノイズが除去され、その後オーディオ データからオーディオ機能が抽出されます。ここでは、MFCC (メル周波数ケプストラム係数) などのオーディオ機能と、尖度や分散などの統計機能が使用されます。 MFCC の周波数帯域はメルスケール上で等間隔に配置されており、これは人間の聴覚システムの反応に非常に近いものです。最後に、トレーニングされたモデルは、車内に設置された複数のマイクからリアルタイムのオーディオ ストリームを取得し、前処理して特徴を抽出することで推論に使用されます。抽出された特徴は、音声を正しく認識するためにトレーニング済みのモデルに渡され、自動運転車で正しい判断を下すのに役立ちます。

データ処理と機械学習モデルのトレーニング

新しいテクノロジーでは、エンドユーザーの信頼が重要であり、NLP は自動運転車に対する信頼を構築する上で大きな変化をもたらします。 NLP により、乗客はレストランでの停車のリクエスト、ルートの変更、最寄りのショッピングモールでの停車、ライトのオン/オフ、ドアの開閉など、音声コマンドを使用して車を制御できます。これにより、乗客の体験は豊かでインタラクティブなものになります。

オーディオ分析が自動運転車に役立つアプリケーションをいくつか見てみましょう。

緊急サイレン検知

救急車、消防車、パトカーなどの緊急車両のサイレンは、さまざまなディープラーニング モデルや SVM (サポート ベクター マシン) などの機械学習モデルを使用して検出できます。教師あり学習モデル - SVM は分類と回帰分析に使用されます。 SVM 分類モデルは、緊急サイレン音と非緊急音の大量のデータを使用してトレーニングされました。このモデルでは、警報音を認識し、自動運転車が危険な状況を回避するために適切な判断を下すシステムが開発されています。この検出システムを導入すれば、自動運転車は緊急車両が通過できるように路肩に寄ることを決定できるだろう。

異常エンジン音検知

エンジン故障の可能性を自動かつ早期に検出することは、自動運転車にとって不可欠な機能となる可能性がある。車のエンジンは、正常に作動しているときは特定の音を出し、何か問題が発生すると別の音を出します。 K-means クラスタリングで利用可能な多くの機械学習アルゴリズムを使用して、エンジン音の異常を検出できます。 k-means クラスタリングでは、サウンドの各データ ポイントが k 個のクラスター グループの 1 つに割り当てられます。データ ポイントは、そのクラスターの重心の周りの平均値に基づいて割り当てられます。異常なエンジン音の場合、データ ポイントは正常クラスターの外側に落ち、異常クラスターの一部になります。このモデルを使用すると、エンジンの状態を継続的に監視できます。異常な音響イベントが発生した場合、自動運転車はユーザーに警告し、危険な状況を回避するための適切な判断を下すのに役立ちます。これにより、エンジンの完全な故障を防ぐことができます。

車線変更にはクラクションを鳴らす

自動運転車が人間が運転する車と完全に同じように機能するためには、後続車が緊急追い越しの際に車線変更を要求し、クラクションを鳴らしてその旨を知らせる必要がある状況で、自動運転車が効果的に機能する必要があります。ランダム フォレストは、このタイプの分類問題に最適な機械学習アルゴリズムです。これは教師あり分類アルゴリズムです。名前が示すように、決定木のフォレストを作成し、最終的にすべての決定木をマージして正確な分類を行います。このモデルは、特定のホーンパターンを認識し、それに応じて決定を下すシステムを開発するために使用できます。

NLP (自然言語処理) は人間の言語を処理して意味を抽出し、意思決定に役立ちます。乗員は単に指示を与えるだけでなく、実際に自動運転車に話しかけることもできる。自動運転車にアドリアナのような名前を割り当てたとします。すると、車に「アドリアナ、お気に入りのコーヒーショップに連れて行って」と指示することができます。これはまだ理解しやすい簡単な文ですが、「お気に入りのコーヒーショップに連れて行って、そこに着く前にジムの家に立ち寄って彼を迎えに来て」など、より複雑な文を自動運転車に理解させることもできます。危険な状況、たとえば生命を脅かす状況などを回避するために、自動運転車は所有者の指示に盲目的に従うべきではないことに注意することが重要です。危険な状況で効果的な判断を下す、

したがって、機械学習ベースのオーディオ分析は、安全性と信頼性の向上により自動運転車の人気の高まりに起因しています。機械学習が進歩するにつれて、音声分析、NLP、音声認識などのサービスを提供し、乗客の体験、道路の安全性、自動車エンジンのタイムリーなメンテナンスを向上させる、サービスベースの製品がますます増えています。

<<:  今後 20 年間で AI はすべての業界にどれほどの影響を与えるでしょうか?営業担当者も入れ替わるのでしょうか?

>>:  Python で自然言語処理を始める

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

香水アートとAIが出会うとき

[51CTO.com 速訳] 香水は依然として人工物とみなされており、「スーパーな鼻」を持つトップマ...

エコノミスト:AI産業の急成長によりサンフランシスコの雇用は38%回復

7月7日のニュースによると、サンフランシスコのテクノロジー業界は、数か月に及ぶレイオフの後、人工知能...

パドルパドル中国ツアーは、中小企業のソフトウェアおよびハードウェア製品の革新の需要に応えるために深センに上陸しました

AI応用の時代において、人工知能技術は研究室から産業化へと移行しています。人工知能が徐々に製品応用市...

...

今年の2つのホットスポット、5Gと人工知能に冷水を浴びせる

[[256172]]最近、ファーウェイ創業者の任正非氏の1万2000語を超えるインタビュー記録がイン...

単一のGPUではGPT-3をトレーニングすることはできませんが、これを使用するとハイパーパラメータを調整できます。

偉大な科学的成果は試行錯誤だけでは達成できません。たとえば、宇宙計画におけるすべての打ち上げは、空気...

...

テスラの自動運転タクシー参入は依然として困難

[[442909]] [51CTO.com クイック翻訳]テスラは2019年4月に「Autonomy...

生成的敵対ネットワーク (GAN) の未解決の 7 つの謎

いくつかの指標によれば、生成的敵対的ネットワーク (GAN) の研究は過去 2 年間で大きな進歩を遂...

2024 年のビッグデータ業界予測 (パート 3)

ディープラーニングディープフェイクの危険性: 2024 年には、特に仮想顧客サービス環境において、消...

「翼竜」が飛び立ち、その威力を発揮。固定翼ドローンについて、あなたはどのくらい知っていますか?

空を飛ぶ龍、数千マイル離れたところから救援に駆けつける!最近、「翼龍」無人機が飛び立ち、被災地に急行...

...

...

人工知能はどのような革新と影響をもたらすのでしょうか?

現在、我が国の政策の推進と各方面の支援により、人工知能の発展は急速に進んでいます。人々が最も関心を持...