音声分析:自動運転車の鍵となる技術

音声分析:自動運転車の鍵となる技術

サプライチェーン管理、製造業務、モビリティサービス、画像およびビデオ分析、音声分析の進歩により、次世代の自律走行車は自動車消費者の認識を変えると期待されています。これらの技術が発展し続けると、自動運転車業界の世界市場規模は2030年までに600億ドル近くに達すると予想されています。

[[434781]]

自動運転車向け機械学習による音声分析には、音声分類、NLP、音声/音声、サウンド認識が含まれます。特に音声認識は自動運転車技術の不可欠な部分となり、ドライバーに強化された制御を提供します。これまで、音声認識は、効率的なアルゴリズム、信頼性の高い接続性、エッジ処理能力の欠如により、従来の自動車モデルでは課題となっていました。さらに、車内の騒音により音声分析のパフォーマンスが低下し、誤認識につながる可能性があります。

機械による音声分析は継続的な研究の対象となっています。テクノロジーが進歩するにつれ、Amazon の Alexa や Apple の Siri などの新製品が登場しています。これらのシステムは、クラウド コンピューティング テクノロジーを通じて急速に進化しており、これは他の認識システムにこれまで欠けていた戦略です。

最近では、kNN (最近傍法)、SVM (サポートベクターマシン)、EBT (アンサンブルバッグドツリー)、ディープニューラルネットワーク (DNN)、自然言語処理 (NLP) などのさまざまな機械学習アルゴリズムにより、音声分析がより効果的になり、自動運転車に付加価値を与えるための位置づけが向上しました。

オーディオ分析では、データが前処理されてノイズが除去され、その後オーディオ データからオーディオ機能が抽出されます。ここでは、MFCC (メル周波数ケプストラム係数) などのオーディオ機能と、尖度や分散などの統計機能が使用されます。 MFCC の周波数帯域はメルスケール上で等間隔に配置されており、これは人間の聴覚システムの反応に非常に近いものです。最後に、トレーニングされたモデルは、車内に設置された複数のマイクからリアルタイムのオーディオ ストリームを取得し、前処理して特徴を抽出することで推論に使用されます。抽出された特徴は、音声を正しく認識するためにトレーニング済みのモデルに渡され、自動運転車で正しい判断を下すのに役立ちます。

データ処理と機械学習モデルのトレーニング

新しいテクノロジーでは、エンドユーザーの信頼が重要であり、NLP は自動運転車に対する信頼を構築する上で大きな変化をもたらします。 NLP により、乗客はレストランでの停車のリクエスト、ルートの変更、最寄りのショッピングモールでの停車、ライトのオン/オフ、ドアの開閉など、音声コマンドを使用して車を制御できます。これにより、乗客の体験は豊かでインタラクティブなものになります。

オーディオ分析が自動運転車に役立つアプリケーションをいくつか見てみましょう。

緊急サイレン検知

救急車、消防車、パトカーなどの緊急車両のサイレンは、さまざまなディープラーニング モデルや SVM (サポート ベクター マシン) などの機械学習モデルを使用して検出できます。教師あり学習モデル - SVM は分類と回帰分析に使用されます。 SVM 分類モデルは、緊急サイレン音と非緊急音の大量のデータを使用してトレーニングされました。このモデルでは、警報音を認識し、自動運転車が危険な状況を回避するために適切な判断を下すシステムが開発されています。この検出システムを導入すれば、自動運転車は緊急車両が通過できるように路肩に寄ることを決定できるだろう。

異常エンジン音検知

エンジン故障の可能性を自動かつ早期に検出することは、自動運転車にとって不可欠な機能となる可能性がある。車のエンジンは、正常に作動しているときは特定の音を出し、何か問題が発生すると別の音を出します。 K-means クラスタリングで利用可能な多くの機械学習アルゴリズムを使用して、エンジン音の異常を検出できます。 k-means クラスタリングでは、サウンドの各データ ポイントが k 個のクラスター グループの 1 つに割り当てられます。データ ポイントは、そのクラスターの重心の周りの平均値に基づいて割り当てられます。異常なエンジン音の場合、データ ポイントは正常クラスターの外側に落ち、異常クラスターの一部になります。このモデルを使用すると、エンジンの状態を継続的に監視できます。異常な音響イベントが発生した場合、自動運転車はユーザーに警告し、危険な状況を回避するための適切な判断を下すのに役立ちます。これにより、エンジンの完全な故障を防ぐことができます。

車線変更にはクラクションを鳴らす

自動運転車が人間が運転する車と完全に同じように機能するためには、後続車が緊急追い越しの際に車線変更を要求し、クラクションを鳴らしてその旨を知らせる必要がある状況で、自動運転車が効果的に機能する必要があります。ランダム フォレストは、このタイプの分類問題に最適な機械学習アルゴリズムです。これは教師あり分類アルゴリズムです。名前が示すように、決定木のフォレストを作成し、最終的にすべての決定木をマージして正確な分類を行います。このモデルは、特定のホーンパターンを認識し、それに応じて決定を下すシステムを開発するために使用できます。

NLP (自然言語処理) は人間の言語を処理して意味を抽出し、意思決定に役立ちます。乗員は単に指示を与えるだけでなく、実際に自動運転車に話しかけることもできる。自動運転車にアドリアナのような名前を割り当てたとします。すると、車に「アドリアナ、お気に入りのコーヒーショップに連れて行って」と指示することができます。これはまだ理解しやすい簡単な文ですが、「お気に入りのコーヒーショップに連れて行って、そこに着く前にジムの家に立ち寄って彼を迎えに来て」など、より複雑な文を自動運転車に理解させることもできます。危険な状況、たとえば生命を脅かす状況などを回避するために、自動運転車は所有者の指示に盲目的に従うべきではないことに注意することが重要です。危険な状況で効果的な判断を下す、

したがって、機械学習ベースのオーディオ分析は、安全性と信頼性の向上により自動運転車の人気の高まりに起因しています。機械学習が進歩するにつれて、音声分析、NLP、音声認識などのサービスを提供し、乗客の体験、道路の安全性、自動車エンジンのタイムリーなメンテナンスを向上させる、サービスベースの製品がますます増えています。

<<:  今後 20 年間で AI はすべての業界にどれほどの影響を与えるでしょうか?営業担当者も入れ替わるのでしょうか?

>>:  Python で自然言語処理を始める

推薦する

...

AIがモノのインターネットをどう変えるのか

AI は、ネットワークとデバイスが過去の決定から学習し、将来のアクティビティを予測し、パフォーマン...

Linux 仮想化ガイド: 仮想化環境の構築

仮想化技術はコンピューティング分野で幅広い用途があり、ハードウェア リソースの利用率を向上させ、メン...

...

AIに感情を与えることは本当に重要なのでしょうか?

「合成感情」は人工知能の発展を妨げるのか?私たちは他の人とコミュニケーションをとるとき、通常は直接...

人工知能時代の罠を回避し、実装を実現する方法

つい最近、カリフォルニア大学バークレー校で活躍している、インターネットで有名な無人食品配達車「Kiw...

フードデリバリー広告向け大規模ディープラーニングモデルのエンジニアリング実践

著者: Yajie Yingliang、Chen Long 他導入美団のフードデリバリー事業が成長を...

ボストン・ダイナミクスのロボット犬の初開封ビデオ:53万ドルで何を買ったのか?

53万元の犬を箱から取り出すのはどんな感じでしょうか?ボストン・ダイナミクス初の小売ロボット「スポ...

C# 暗号化アルゴリズムの簡単な紹介

C# 暗号化アルゴリズムMD5 は Message-Digest Algorithm 5 の略で、1...

テスラは最初にこの問題の矢面に立たされ、自動運転の安全性の問題が再び話題となっている。

今日、自動運転は自動車産業の発展と変革の重要な方向性の一つとなっています。自動運転技術が成熟するにつ...

ドキュメント内の単語が増えるほど、モデルは興奮します。 KOSMOS-2.5: テキストが密集した画像を読み取るためのマルチモーダル大規模言語モデル

注目すべき傾向は、印象的な言語出力を生成できる、数百億/数千億のパラメータを備えた、より大規模で複雑...

...

東大大学の中国人博士が「心の理論」を使ってテキサスホールデムをプレイすることを GPT-4 に教えました。従来のアルゴリズムを上回り、人間の初心者を圧倒する

完全情報ゲームでは、すべてのプレイヤーがすべての情報要素を知っています。しかし、不完全情報ゲームは異...

人工知能は世界をどう変えるのか:BBCがAIのAからZまでをまとめる

今日、人工知能はもはや漠然とした研究室の技術ではなく、私たちの生活のあらゆる側面に組み込まれています...

ドローンは人気があり、3つの主要なアプリケーションが農家の役に立つ

今日は二十四節気の一つ、白露節気です。白露節気の季節には、我が国のほとんどの地域が秋の収穫期に入り、...