自動運転車の運転分類と必要な処理能力

今後 20 ～ 30 年で、自動運転車 (AV) は私たちの運転習慣や輸送業界を変え、社会全体に影響を及ぼすでしょう。自動運転車は、車を玄関先まで呼び出して、使用後に送り出すことができるようになるだけでなく、個人の自動車所有という概念に挑戦し、環境と渋滞に良い影響を与えるでしょう。市場調査会社ABIリサーチは、2030年までに路上を走る車の4分の1が自動運転車になると予測している。

業界の専門家は、自動運転の開発に5つのレベルを定義しました。各レベルは、車がドライバーからタスクと責任を引き継ぐ範囲、および車とドライバーが相互にやり取りする方法を説明します。アダプティブクルーズコントロールなどの機能は、先進運転支援システム (ADAS) の例であり、レベル 1 の機能と見なされる場合があります。現在市場に登場する新しい車両の中にはレベル 2 の機能を実現しているものもありますが、業界としては、完全な自動運転はおろか、ADAS システムの表面をほんの少しだけかじった程度にしか到達していません。

図: 自動運転の5つのレベル

自動運転のレベル

自動運転がさまざまなレベルに進むにつれて、ドライバーが「ハンドルから手を離し、ハンドルから目を離し、ハンドルから心を離す」ことができる完全自動化のビジョンを実現するには、処理能力が重要になります。このレベルでは、車内の人は単なる乗客であり、運転手がいないため、ハンドルは必要ありません。しかし、その目標を達成する前に、まず非自動運転と完全自動運転の間のさまざまなレベルを理解する必要があります。

ADAS/AV には、センシング、コンピューティング、アクチュエーションという 3 つの主要要素があります。

知覚を利用して、車両の周囲の現在の状態を捉えます。これは、レーダー（長距離および中距離）、ライダー（長距離）、カメラ（短距離/中距離）、赤外線、超音波などのセンサーの組み合わせを使用して行われます。これらの「感覚」はそれぞれ、周囲で「見る」もののバリエーションを捉えます。このビューでは、車、歩行者、道路標識、動物、道路の曲がり角など、興味深く重要なオブジェクトが特定されます。

LIDAR、レーダー、カメラから見た車の視界の図

計算段階は意思決定段階です。この段階では、さまざまな視点からの情報が統合され、車が「見ているもの」をよりよく理解できるようになります。たとえば、そのシーンでは一体何が起こっているのでしょうか? 動いている物体はどこにありますか? 期待されるアクションは何ですか?そして、車はどのような是正措置を講じるべきでしょうか? 安全を確保するために、ブレーキをかけたり、別の車線に車線変更したりする必要がありますか?

最終段階である実行では、車がこの決定を適用してアクションを実行し、場合によってはドライバーに取って代わります。それはブレーキをかけたり、加速したり、より安全な経路に向かってハンドルを切ったりすることかもしれません。ドライバーが警告に気づかず、間に合うように行動しなかったために衝突が差し迫っていたためかもしれませんし、あるいは完全な自律システムの標準的な操作かもしれません。

レベル 2 は実際には ADAS パスの出発点であり、自動緊急ブレーキ、車線逸脱警告、車線維持支援など、複数の個別の機能が安全ソリューションパッケージで実行される可能性があります。

2018年型アウディA8など、現在生産されている車の最先端技術であるレベル3は、ドライバーが一定時間「目を離す」ことはできるが、問題が発生した場合には直ちに運転を引き継ぐことができなければならないことを意味する。

レベル 4 とレベル 5 はどちらも、本質的に完全な自動運転を提供できます。両者の違いは、レベル 4 の運転は、位置をミリメートル単位の精度で把握するために道路沿いのインフラに大きく依存するため、主要高速道路やスマートシティなどの地理的に緩衝されたエリアに限定されるという点です。

レベル 5 の車両はどこでも自動運転できるようになります。このレベルでは、車にはハンドルさえ付いていない可能性があり、座席がすべて前を向いているわけではない可能性があります。

自動運転に必要な処理能力

自動運転の各レベルでは、すべてのデータを処理するために必要な処理能力が急速に増加します。経験則として、あるレベルから次のレベルに進むにつれて、データ処理が 10 倍増加すると予想されます。完全自動運転のレベル 4 および 5 では、数十テラフロップスの処理量が実現されます。

センサーの観点から見ると、以下の表は必要な量の目安を示しています。レベル 4 と 5 では最大 8 台のカメラが必要になりますが、さらに多い台数が提案されています。画像キャプチャデバイスの解像度は 2 メガピクセル、フレームレートは 1 秒あたり 30 ～ 60 フレームであるため、このすべての情報をリアルタイムで処理するのは膨大な処理タスクになります。車載レーダーについては、22GHzから77GHzまでの短距離、中距離、長距離（100m以上）のレーダーを組み合わせて使用する必要があり、その数は10個以上になる可能性がある。レベル 2 でも、カメラやレーダーから取得したデータに対してはまだ多くの処理が必要です。

図: 自動運転のさまざまなレベルとアプリケーション

処理能力については、カメラが何をする必要があるかに焦点を当てます。カメラは、前面のレーダーとともに、テスラで使用されているようなオートパイロットを動かす主要なセンサーだからです。

カメラシステムは通常、広角シングルカメラまたはステレオデュアルカメラであり、車両上で前方またはサラウンドビュー (360°) 構成で構成されます。レーダーやライダーとは異なり、カメラ検知デバイスの性能は入力を処理するソフトウェアの性能に左右されます。カメラの解像度は重要ですが、あなたが考えるほどではありません。

プロセスを簡素化するために、畳み込みニューラルネットワーク (CNN) と呼ばれる重要なアルゴリズムを使用します。 CNN は、カメラフィードから情報を抽出して区別するための高度に専門化された効率的な方法です。私たちの車の場合、カメラからの入力を受け取り、車線標示、障害物、動物などを認識します。 CNN は、レーダーや LiDAR が実行できるすべてのことに加え、交通標識の読み取り、信号機の検出、道路の構成など、さらに多くのことを行うことができます。実際、一部のティア 1 サプライヤーと自動車 OEM (Original Equipment Manufacturer) は、カメラとレーダーの組み合わせによるコスト削減を検討しています。

CNN は機械学習の要素を自動車に導入します。ニューラルネットワークの構造は、一般的に私たち自身の脳の配線構造に基づいています。まず、実装するネットワークの種類と、レイヤー数による深さを選択する必要があります。各レイヤーは、実際には前のレイヤーと次のレイヤー間の相互接続されたノードのセットです。ニューラルネットワークを実装するには、大量のインテリジェントトレーニングデータが適用されます。これは、ほとんどがオフラインで実行される、非常に計算負荷の高い操作です。道路状況の画像やビデオなどの各パスごとに、ネットワークは各レイヤー内の関連する要素を調整して学習します。トレーニングデータを渡すと、何百万ものデータ分析からこれらの関連要素を改善できます。トレーニングが完了すると、ネットワークと関連要素は、CPU または GPU コンピューティングや特定の CNN アクセラレータなどの構造にロードできるようになります。

このタイプのアルゴリズムとネットワークの利点の 1 つは、より新しい、またはより優れた関連要素で更新できるため、常に改善されることです。徹底的な比較の結果、GPU コンピューティングモードで実行される CNN は、現在のハイエンドの組み込みマルチコア CPU よりも 20 倍高速で、消費電力が大幅に少ないことがわかりました。同様に、CNN がハードウェアアクセラレーションに移行するにつれて、パフォーマンスが 20 倍向上し、電力効率も向上しています。

将来に向けて

自動運転車の未来に向かうにつれて、必要な計算能力はセンサーの数、フレームレート、解像度に応じて増大します。パフォーマンスと電力の両方の観点から、畳み込みニューラルネットワークは画像データを解釈する最も効率的な方法になりつつあります。これにより、処理能力をクラウドにオフロードして常時接続のセルラー接続に依存するのではなく、自動車の場合のように、ネットワークのエッジ、つまり車自体に、より多くの処理リソースを配置する傾向が生まれます。自動運転は大きなチャンスであり、処理能力、アルゴリズム、トレーニングデータを提供する人にとっては現実のものとなるでしょう。

イマジネーションテクノロジーズ、自動車アプリケーション担当ディレクター、ブライス・ジョンストン

<<: TF Learn: Scikit-learn と TensorFlow をベースにしたディープラーニングツール

>>: 目を覚ませ、自動運転車は皇帝の新しい服に過ぎない