膨大なセンサーデータから重要データだけを抽出　自動運転の開発に必須のデータドリブン開発

データにタグ付けすれば自動選別できる

　すると次の課題は、膨大なデータの中からいかに必要なデータを選別するかである。望ましいのは、データを収集するときに、タグを付けておくことだ。

　例えば、GNSSの情報や地図情報と連動させれば、交差点付近のデータだけ、あるいは橋を渡っているとき、トンネルを走行しているときにだけ、データにタグを付けることができる。あるいは、Web上の天気予報データと地図情報を連動させておけば、雨が降っているときのデータだけ、あるいは晴れているときのデータだけにタグを付けることもできる。「トンネルや交差点のデータだけ欲しいという要望は多いです」と吉松氏は語る。ただし、地図データとの同期は遅れが伴うため、計測時ではなく後処理でGNSS情報を元にして付加する必要がある。

　もう一つのデータ選別手法は、AI（人工知能）の活用である。カメラの画像データをAIに読み込ませることで、「クルマが3台以上写っている画像」「トラックが写っている画像」「交差点で歩行者が歩いている画像」といった検索が可能である。あるいは、CAN（Controller Area Network）のデータと連動させ、ブレーキをかけたときの前後のデータ、あるいは加速度がある一定の値を超えたときのデータ、というような収集の仕方も可能だろう。

タグ付けには、天気や地図にひも付けする方法やAIによる物体認識、CANデータを活用する方法など様々な方法がある。

収集したデータからシナリオを作成

　このように、収集したデータは、自動運転システムのテストで活用できる形にデータを加工する必要がある。データを活用したテストには、リプレイテストとシナリオベーステストがある。例えば、高速道路を走行中に先行車両との間に横の車線から車両が割り込んでくるようなシーンで、実際に割り込みがあった場面の画像をそのまま再生して、カメラやレーダーが割り込み車両を認識できるかどうかを試験する手法だ。

リプレイテストの例。走行中の画像をそのまま再生して、物体を認識できるかどうかを検証する。

　これに対してシナリオベーステストは、収集した画像データから車両シミュレーションデータと共にCG（Computer Graphics）画像を生成し、この画像を使って、走行速度を変えたり、割り込み速度を変えたり、割り込んでくる車両の形状を変えたりといったように、様々なバリエーションのシナリオを生成して、カメラが認識できるか試験する手法である。

シナリオテストの例。車線維持支援機能で、自分の車両の速度や割り込み車両の速度、割り込み車両との距離、割り込んでくる速度などのパラメーターを様々に変えながら、衝突を避けられるかどうかを評価する。

　吉松氏によれば、現在はまだリプレイテストが主流のようだが、今後、シナリオベーステストが増加していくことが予測される。「一番大事なことは、どのようにデータを選ぶかですが、現在はデータを集めることは考えても、後の処理をどうするか、おろそかになってしまっているユーザーは少なくありません」と吉松氏は指摘する。

　今後、自動運転システムがレベル2からレベル3へ、さらにはレベル4へと高度化するにつれ、テストに要求される条件も厳しくなっていく。質のいいデータをいかに効率的に収集するか、その重要性はますます高まっていくだろう。

膨大なセンサーデータから重要データだけを抽出 自動運転の開発に必須のデータドリブン開発

データにタグ付けすれば自動選別できる

収集したデータからシナリオを作成

膨大なセンサーデータから
重要データだけを抽出
自動運転の開発に必須の
データドリブン開発