不確実な環境での自動運転の軌道計画を改善するにはどうすればよいでしょうか?

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転載したものです。転載については出典元にお問い合わせください。

論文タイトル: 不確実性環境下における自動運転車両のための改良モデル予測制御ベースの軌道計画法

ジャーナル: IEEE Transactions on Intelligent Transportation Systems

発行日: 2023.04

以下は、論文を読んで私が重要だと思う部分を中心に書いた自分なりのメモです。全文翻訳ではありません。前回の記事に引き続き、この論文の実験検証部分を整理したものです。前回の記事は以下の通りです。

fhwim: 不確実な環境における自律走行車のための改良モデル予測制御に基づく軌道計画法
https://zhuanlan.zhihu.com/p/658708080

1. シミュレーション検証

（１）シミュレーション環境

共同シミュレーションツールには、Prescan、PyCharm、Matlab/Simulinkが含まれます。Prescanはシミュレートされた交通シナリオの構築に使用され、PyCharm（ニューラルネットワークとpytorchが使いやすい）は融合予測モジュールの作成に使用され、Matlab/Simulink（MPCツールボックス付き）は軌道計画モジュールの構築と車両制御の実現に使用されます。全体的なツール選択の考え方は比較的自然で合理的です。この部分の制御には、横方向の制御にはLQR、縦方向の制御にはPIDが使用され、これらも一般的に使用されている制御方法です。融合予測モジュールのLSTMエンコーダー・デコーダーはオープンソースコードを使用しています。著者は、このコードは参考文献[31] Comprehensive Review of Neural Network-Based Prediction Intervals and New Advancesから引用したと述べています。しかし、この論文は2011年に公開されており、少し古いです（LSTMエンコーダー・デコーダーは2011年にすでに利用可能でしたか？）。著者はこれを元にコードを修正したのでしょうか。

図1 シミュレーション環境の構築

（２）MRPIセットの取得

図2 MRPIサブシステムセット

（３）ケース１：静的障害物回避シナリオ

静的障害物回避シナリオは、静止した障害物車両を指します。軌道計画の結果は次のようになります。

図3 一般的なMPC法とチューブベースMPC法の比較

ここで、彼の図解に何か問題があるのではないかと疑っています。前の文章によると、最終的な参照軌道は、目的の軌道と調整軌道を追加することで得られます。同時に、結果を分析すると、チューブベースのMPCは図3（b）の領域にあるとも述べています。そして誤差が大きい。調整軌道は誤差を減らすので、図3（b）の目標軌道と参照軌道は、彼の論文の論理に従うように入れ替える必要があります。つまり、緑の線が最終的な参照軌道であり、青い線が中間の目標軌道です。下の速度曲線と水平・垂直の誤差曲線もこれに含まれますが、著者の言っている意味がわかれば問題ありません。チューブベースの MPC では、緑の曲線が最終結果、青の曲線が軌道調整なしの結果です。

図4 一般的なMPC法とチューブベースMPC法の速度変化の比較

図5 水平位置の比較

図6 水平誤差と垂直誤差の比較

筆者は、ハンドル角度の変化の滑らかさについても比較しましたが、ここでは詳しくは述べませんが、いずれにしても改善されています。同時に、著者は調整軌道を追加することの優れた効果について理論的な理由を示しています。調整軌道を追加した後、軌道誤差は常にMRPIセット内に収まります。つまり、チューブベースのMPCの追跡偏差は常にMRPIセット内にありますが、一般的なMPCの追跡偏差は不確実な環境では境界がなく、非常に大きくなる可能性があります。

（４）ケース２：動的障害物回避シナリオ

前のシーンと比較すると、障害物車は動いています。全体的な軌道、速度の変化、横方向と縦方向の誤差、ハンドルの変化の滑らかさを比較する必要があります。ここでは詳細には触れません。全体的な軌道の写真のみを示します。

図 7. 一般的な MPC 法とチューブベースの MPC 法の全体的な軌跡の比較。

（５）ケース３：実際の運転シナリオ

著者は、NGSIM データセットを使用して自分の方法を検証することにしました。まず、融合予測法を検証します。NGSIM データセットには、車両の軌跡データが含まれており、これは過去の軌跡と将来の軌跡に分割され、LSTM エンコーダー/デコーダーが学習するためのトレーニングセットを形成します。著者は 10,000 の軌跡を選択し、そのうち 7,500 をトレーニングセットとして使用し、2,500 を検証セットとして使用しました。オプティマイザーには Adam を使用し、学習率は 0.01 に設定されました。予測効果は以下のとおりです。

図8 水平および垂直軌道予測と不確実性の結果

しかし、著者はADEやFDEなど、軌道予測の分野で一般的に使用されているいくつかの指標を使用していないため、あまり説得力がないように感じます。ただし、この記事の焦点が依然としてチューブベースのMPCに基づく軌道計画にあることは理解できます。

軌道予測を検証した後、軌道予測モジュールの役割をさらに検証するために軌道計画を実行しました。ここでは 3 つのケースを比較します。

（a）障害物車両の実際の将来の軌道がすでにわかっている場合は、軌道計画を実行し、これが制御群として機能する。

(b) 障害物車両の将来の軌道がわからない場合は、まず軌道を予測し（不確実性は計算しない）、次に軌道を計画します。

（c）障害物車両の将来の軌道が分からない場合は、まず軌道予測（不確実性の計算）を行い、次に軌道計画を行います。

結果を図9に示す。(a)、(b)、(c)の結果は、それぞれ真の位置、予測結果、提案手法に対応する。

提案手法は本論文の手法で得られた結果である。提案手法の方が真の位置に近いことがわかり、この融合予測手法（特に不確実性の計算）が有効であることが分かる。

図9 軌道予測モジュールを検証する3つの方法の比較

ここで、ケース1とケース2は軌道計画部分を検証していることがわかります。一般的なMPCとチューブベースMPCの前の軌道予測部分は同じです。比較はチューブベースMPCの役割を示しています。ケース3は軌道予測モジュールを検証します。2種類の検証が実行されていることがわかります。最初のタイプ：予測軌道と実際の軌道を直接比較します。2番目のタイプ：最初に将来の軌道を知る/将来の軌道を予測する（不確実性を計算せずに）/将来の軌道を予測する（不確実性を計算）、次に軌道計画を実行します。True Positionを基準として、不確実性計算を伴う軌道予測方法と不確実性計算を伴わない軌道予測方法の効果を比較します。 2つのモジュールを検証するという考えは依然として非常に明確です。

2. 実車テスト検証

実験に使用した車両を下図に示します。

図10 実験に使用した車両

著者は、実験車両のパラメータと、実験で使用したコンピューターおよびセンサーのパラメータも示しています。

図11 コンピュータとセンサーのパラメータ

図12 実験車両のパラメータ

安全上の理由から、著者が設定した実験シナリオは、静的障害物回避シナリオであるシミュレーション実験ケース 1 と同じです。全体的な軌道、速度の変化、横方向と縦方向の誤差、およびハンドル変更の滑らかさを比較しますが、詳細は説明しません。

3. 読書の要約

まず、論文のアイデアについてお話ししましょう。論文の主な内容は、不確実性計算を備えた軌道予測モジュールと、チューブベースのMPCに基づく軌道計画モジュールです。重要なのは軌道計画モジュールです。私が最も得たのは、軌道予測を実際に軌道計画に使用し、モジュール形式で使用したことです。予測の出力は計画の入力として使用されます。計画部分は、予測モジュールの安全しきい値を決定するだけです。2つのモジュール間の結合は弱いです。言い換えれば、この予測モジュールは、障害物車両の予測軌道と不確実性が提供される結果である限り、他の方法で完全に置き換えることができます。将来的には、より高度なニューラルネットワークに置き換えて、予測の軌道と不確実性を直接与えることができます。この融合予測アルゴリズムのプロセスはまだ少し複雑です。しかし、記事全体のアイデアは依然として非常に優れており、シミュレーションと実車テストのアイデアと作業量も満足のいくものであると感じています。

2 つ目は、記事を読んでいるときに見つかったいくつかの低レベルのエラーです。例えば、LSTMエンコーダーデコーダー部分では、LSTMは未来を出力する。ステップの軌道点は式に書かれていますが、次のように書かれています。。

図13. LSTMエンコーダー・デコーダー部分のいくつかのエラー

そして、シミュレーション実験の部分では、MRPI Setを計算する際に、システム(21)、つまりエラーシステムはサブシステム(32)と(34)に分割されると書かれていますが、実際はサブシステム(30)と(32)です。これらの小さなエラーは、方法全体には影響しませんが、読者の読書体験にも影響します。

図14 MRPIシミュレーション実験の原文設定

図15 エラーシステムはサブシステム（30）と（32）に分割されます

オリジナルリンク: https://mp.weixin.qq.com/s/0DymvaPmiCc_tf3pUArRiA

<<: CMU中国人がビッグモデルのブラックボックスを破り、ラマ2の嘘が一目で見抜かれた！脳波が明らかになり、LLMマトリックスが完全に明らかになった

>>: