データ

2019年度 修士論文

物体検出における誤検出の説明と予測

機械学習、とりわけディープニューラルネットワークの精度は近年急速に向上しているが、一方でなぜそのような予測をしたのかを説明するのは難しく、予期せぬ振る舞いの危険や誤りの分析の困難がある。既存研究の多くは入力のどの要素がモデルの推論において重要かを説明するが、モデルの入力が画像の場合はピクセル単位での説明になり、必ずしもわかりやすいとはいえない。それに対し、高レベルの概念を用いた説明手法が最近提案されているが、その応用領域はまだ限られている。本研究では、人間にわかりやすい高レベルの概念を用いて、物体検出における誤検出の説明と予測を行う。具体的には、検出したい物体が持つ高レベルの概念を自動的に発見し、それに基づいて、誤検出がどのような概念によって引き起こされたものであるかを概念の貢献度を用いて説明する。さらに、この概念の貢献度を利用し、モデルの出力を修正することで誤検出の予測も行う。



 
点群ダウンサンプリング

地図点群とセンサー点郡のスキャンマッチングによる自己位置推定は、他の手法と比較して、様々な環境において利用可能であるという利点がある。そのため自動運転ではしばしばスキャンマッチングが自己位置推定として利用されている。自動運転産業界における強い需要もあり、スキャンマッチングは改善および高速化されてきた。しかしリアルタイム処理に十分な速さには至っていない。リアルタイム処理のためには、実行時間を削減するためにセンサー点群をダウンサンプリングしなければならない。近年、スキャンマッチング自体は盛んに研究されているが、このダウンサンプリングの影響については注目されていない。本研究ではこのリアルタイム処理のためのダウンサンプリングについて着目し評価を行う。Normal Distributions Transformアルゴリズムによる自己位置推定結果の相対誤差、及び実行時間について評価する。



 

2018年度 修士論文

単眼カメラと3次元地図による環境認識

自動運転システムへの関心が集まる中、安価な単眼カメラを用いた自己位置推定および多物体トラッキング手法を統合した環境認識システムの重要性が高まっている。本研究では、(1) Normal Distributions Transform (NDT)法を拡張した7自由度の自己位置推定手法(7-NDT)、(2)自己位置推定結果、カメラ幾何およびインスタンスセグメンテーション結果を統合した高速な多物体トラッキング手法(ISCG-Tracker)、を提案する。7-NDTは、6自由度のNDT法をスケールを含めた7自由度に拡張することで、スケール推定に対応したNDT法を構築する。位置精度の低下を抑制しつつ、計算量をO(N)に削減し、同時にメモリ使用量の削減も実現する。ISCG-Trackerは、自己位置推定結果から得られた画像フレーム間の移動量を考慮することで、2次元および3次元IoUマッチングの精度向上を実現する。また、画像を用いた類似度計算には、インスタンスセグメンテーション用ニューラルネットワークの特徴マップと、その結果を用いたアテンション機構を統合することで、特徴量抽出の処理コストを削減し、物体のオクルージョンに対してロバストなトラッキングシステムを構築する。



 

2019年度 学士論文

LiDAR-カメラ間キャリブレーション

自動運転システムがより身近になるにつれて、カメラやLiDARといった様々なセンサを用いて車両の周りを認識する技術が広く研究されている。こうした技術を実現するためには、センサ間の正確なキャリブレーションが必要である。本研究では、カメラ画像から推定した深度情報を基に生成した疑似点群とLiDAR点群との対応を計算することでカメラ座標とLiDAR座標との間の変換パラメータを推定する手法を提案する。自動運転システムのデータセットを用いた評価により、本手法が複雑な設定やマーカーの使用なしに、この変換パラメータを自動的に推定できることを示し、回転誤差を減らせるか検証した。



 
GPU実装によるトレードオフ解析

近年では、2次元や3次元のデータ処理れの多くはGPUで行われるようになり、高速化がなされてきた。しかし、CPUとGPU間のデータ転送による遅延が、高速化での大きな問題となる。そこで、並列化に適さない処理をGPU実装することにより、CPUとGPU間のデータ転送を減らし、処理全体を高速化できる可能性がある。本研究では、このトレードオフを評価するため、2つのGPU実装された処理の流れの速度と、CPU実装とGPU実装の処理の流れの速度を比較し、評価した



 

2018年度 学士論文

雨中における視覚ベースの自己位置推定

ORB特徴量は輝度情報を含むため、雨による光の散乱の影響を多大に受ける。故に、ORB特徴量に基づいた単眼カメラによる自己位置推定は、雨中では正確性が下がる。この論文では、雨による自己位置推定への影響を軽減する手法を提案する。前処理において、Yangらの手法を用いて入力画像から雨の除去を行い、光の散乱を軽減する。提案手法を経ORB特徴量は、雨天時の移動ロボットや自動運転の自己位置推定においてのパフォーマンスが改善されることが、Ritcherらによるデータセットを用いた実験結果から示された。



 
スパースな畳み込みによるマルチクラス物体検出

3次元物体検出は,自動運転車が現れることでより重要になっている.安全な意思決定と動作計画は3次元物体検出の結果に大きく左右される. 3次元物体検出の一般的なアプローチは,周辺環境の空間的特徴を得ることのできるLiDARとして知られている”Light Detection And Ranging”を使うことである.既存のアルゴリズムの中では, Sparsely EmbeddedConvolutional Detection (SECOND)が実際の状況向けに高い精度と高速な実行スピードを実現しているが,限られたクラスにのみ対応している.本論文では,複数のクラスに対応したSECONDのアルゴリズムを提案し,車と歩行者など, LiDARでスキャンされた3次元物体のマルチクラス検出をリアルタイムに可能にする.提案したマルチクラスに対応したSECONDのアルゴリズムが実行速度を落とすことなく, 3次元物体検出の精度がより高いことを示す。



 

2017年度 学士論文

3次元CNN

自動運転システム等のAIアプリケーションへの関心が集まる中、3次元空間の物体を検出する技術の必要性が高まっている。画像データを用いる既存の物体検出アルゴリズムに使われているニューラルネットワークでは高速かつ正確に3次元空間の物体を検出することは難しい。画像データだけでなくLiDARデータを用いるネットワークの研究も進んでいるが、速度の面では自動運転に堪えない。本研究では、3次元物体検出のための、カメラやLiDAR等の複数のセンサからの情報を用いる軽量マルチビューニューラルネットワークを提案する。自動運転システムのベンチマークを用いて評価を行い、既存の3次元物体検出アルゴリズムに対して精度を落とすことなく高速に処理を行えることを示す。

 

 

 



    

GPU SLAM

完全自動運転システムや自律移動ロボットに必要な自己位置推定の手法として、高精度3次元点群地図を用いて3D スキャンマッチングを行うNormal Distributions Transform(NDT)アルゴリズムがある。リアルタイムな環境向けには、LiDAR からの入力点群をダウンサンプリングしてこのアルゴリズムを用いることが多いが、速度と精度はトレードオフの関係にある。本研究ではNDT アルゴリズムの主要な計算過程の並列性に注目し、GPU を用いた高速なスキャンマッチング手法を提案する。評価の方法として、ダウンサンプリングの割合やGPU のアーキテクチャーを変えて実行時間を測定し、元のCPU 実装と比較を行った。この比較によって、低い圧縮率のデータに対してGPU 実装によってスキャンマッチングの高速化が行えることがわかった。

 

 

 



    

3次元メッシュ地図生成

自動運転技術において,点群の3次元メッシュ化は,ナビゲーション用の都市の地図作成において有用である.本論文では,3次元処理システムであるMeshlabにおいて実装されているボールピボティングアルゴリズムを使用して,疎でかつ逐次的な3次元メッシュを生成する方法を実装する.表面が疎であることは計算量の削減に繋がり効率が良い.さらに,表面を逐次的に構成することによって,道路の調査時間を用いて効率良くメッシュを作成出来るほか,作成しているそばから他のアプリケーションにデータを引き渡して利用することができる.評価方法としては,LiDARセンサーを用いて取得した試験フィールドのポイントクラウドデータを用いる.LiDARからの1つ1つのスキャンを正しく位置調整するためにNDTマッチングのアルゴリズムを使用した.測定結果は点群を一括で処理した場合との比較を行う.

 

 

 



    

SLAMアクセラレータ設計

3次元スキャンのマッチングは空間内での自己位置推定を行う有効な手法である。効率的な手法として知られる3D-NDTは入力点の数N に依存しO(N)でマッチングを計算できる。入力点群はレーザーレンジファインダーによるスキャンで得られ、その解像度は増加傾向にある。また、高速に移動する物体が自己位置推定を行う場合、ミリ秒オーダーのターンアラウンドタイムが要求される。自己位置推定はロボットや自動車などのモバイルデバイスに要求されることが多いが、これらは消費電力の制限が大きい。現在、CPUやGPUを用いたNDTの実装が存在するが、計算能力や消費電力を組み込み機器に適した形で導入することは難しい。本研究では、NDTのハードウェア化を目指す上で扱うデータ量を減らしても精度が保たれることを示した。将来的には、本結果がASICの生成へ応用されることが期待される。

 

 

 



    

2016年度 学士論文

3次元Visual SLAM

点群と呼ばれる多数の距離データに対する位置合わせは、自己位置推定と地図作成を同時に行うSLAMにおける主要な機能である。この地図作成においては計算コストが懸念事項の1つであり、地図作成の規模が増大するのに伴い計算コストが高くなる。先の研究では計算量をO(N)に抑えて地図の更新を行う効率的な手法が考案されている。ここでのNは入力点群数を表す。本研究では、先の研究を拡張させてより効率的な3次元地図をO(N)時間で作成するための、点群地図作成のためのインクリメンタルな地図更新手法を提案する。我々の手法では、点群地図を構成する個々のボクセルの情報に応じてその更新を不均一に行うことができる。よって、地図作成環境に応じてボクセルの更新回数を低減させることが出来る。我々は点群地図作成で広く利用されているポイントクラウドライブラリ(PCL)を用いていくつかの実験を行った。実験によって、インクリメンタルな手法の効率性を追試した。加えて、我々が提案した不均一な手法による地図生成時間に対しての効果についての検討を行った。

 

 

 



    

3次元物体検出およびトラッキング

リアルタイムで3次元物体検出およびトラッキングを行うアルゴリズムを研究している。 3次元上で障害物を検出することにより、ロボットの経路探索・判断を安全に行なうことが可能となる。 End-to-EndのDeep Neural NetworkおよびGPUを活用し、高速かつ高精度のアルゴリズムを作ることを目的としている。

フュージョン型CNN

畳み込みニューラルネットワーク(CNN)の並列化は近年多く研究されており、GPGPUやMPIによる様々な並列化実装がなされてきた。一方で、マルチコアCPUによる並列化についての研究はあまりなされていない。そこで、OpenMPとMPIによって複数のマルチコアCPUによるCNNの並列学習処理を実装し、そのスケーラビリティをスーパーコンピュータ上で評価した。複数の並列化手法と畳み込み手法を実装、比較することで、プロセッサの性能をより引き出せるよう模索した。