データ

3次元CNN

自動運転システム等のAIアプリケーションへの関心が集まる中、3次元空間の物体を検出する技術の必要性が高まっている。画像データを用いる既存の物体検出アルゴリズムに使われているニューラルネットワークでは高速かつ正確に3次元空間の物体を検出することは難しい。画像データだけでなくLiDARデータを用いるネットワークの研究も進んでいるが、速度の面では自動運転に堪えない。本研究では、3次元物体検出のための、カメラやLiDAR等の複数のセンサからの情報を用いる軽量マルチビューニューラルネットワークを提案する。自動運転システムのベンチマークを用いて評価を行い、既存の3次元物体検出アルゴリズムに対して精度を落とすことなく高速に処理を行えることを示す。




GPU SLAM

完全自動運転システムや自律移動ロボットに必要な自己位置推定の手法として、高精度3次元点群地図を用いて3D スキャンマッチングを行うNormal Distributions Transform(NDT)アルゴリズムがある。リアルタイムな環境向けには、LiDAR からの入力点群をダウンサンプリングしてこのアルゴリズムを用いることが多いが、速度と精度はトレードオフの関係にある。本研究ではNDT アルゴリズムの主要な計算過程の並列性に注目し、GPU を用いた高速なスキャンマッチング手法を提案する。評価の方法として、ダウンサンプリングの割合やGPU のアーキテクチャーを変えて実行時間を測定し、元のCPU 実装と比較を行った。この比較によって、低い圧縮率のデータに対してGPU 実装によってスキャンマッチングの高速化が行えることがわかった。




3次元メッシュ地図生成

自動運転技術において,点群の3次元メッシュ化は,ナビゲーション用の都市の地図作成において有用である.本論文では,3次元処理システムであるMeshlabにおいて実装されているボールピボティングアルゴリズムを使用して,疎でかつ逐次的な3次元メッシュを生成する方法を実装する.表面が疎であることは計算量の削減に繋がり効率が良い.さらに,表面を逐次的に構成することによって,道路の調査時間を用いて効率良くメッシュを作成出来るほか,作成しているそばから他のアプリケーションにデータを引き渡して利用することができる.評価方法としては,LiDARセンサーを用いて取得した試験フィールドのポイントクラウドデータを用いる.LiDARからの1つ1つのスキャンを正しく位置調整するためにNDTマッチングのアルゴリズムを使用した.測定結果は点群を一括で処理した場合との比較を行う.




SLAMアクセラレータ設計

3次元スキャンのマッチングは空間内での自己位置推定を行う有効な手法である。効率的な手法として知られる3D-NDTは入力点の数N に依存しO(N)でマッチングを計算できる。入力点群はレーザーレンジファインダーによるスキャンで得られ、その解像度は増加傾向にある。また、高速に移動する物体が自己位置推定を行う場合、ミリ秒オーダーのターンアラウンドタイムが要求される。自己位置推定はロボットや自動車などのモバイルデバイスに要求されることが多いが、これらは消費電力の制限が大きい。現在、CPUやGPUを用いたNDTの実装が存在するが、計算能力や消費電力を組み込み機器に適した形で導入することは難しい。本研究では、NDTのハードウェア化を目指す上で扱うデータ量を減らしても精度が保たれることを示した。将来的には、本結果がASICの生成へ応用されることが期待される。




3次元Visual SLAM

点群と呼ばれる多数の距離データに対する位置合わせは、自己位置推定と地図作成を同時に行うSLAMにおける主要な機能である。この地図作成においては計算コストが懸念事項の1つであり、地図作成の規模が増大するのに伴い計算コストが高くなる。先の研究では計算量をO(N)に抑えて地図の更新を行う効率的な手法が考案されている。ここでのNは入力点群数を表す。本研究では、先の研究を拡張させてより効率的な3次元地図をO(N)時間で作成するための、点群地図作成のためのインクリメンタルな地図更新手法を提案する。我々の手法では、点群地図を構成する個々のボクセルの情報に応じてその更新を不均一に行うことができる。よって、地図作成環境に応じてボクセルの更新回数を低減させることが出来る。我々は点群地図作成で広く利用されているポイントクラウドライブラリ(PCL)を用いていくつかの実験を行った。実験によって、インクリメンタルな手法の効率性を追試した。加えて、我々が提案した不均一な手法による地図生成時間に対しての効果についての検討を行った。




3次元物体検出およびトラッキング

リアルタイムで3次元物体検出およびトラッキングを行うアルゴリズムを研究している。 3次元上で障害物を検出することにより、ロボットの経路探索・判断を安全に行なうことが可能となる。 End-to-EndのDeep Neural NetworkおよびGPUを活用し、高速かつ高精度のアルゴリズムを作ることを目的としている。

フュージョン型CNN

畳み込みニューラルネットワーク(CNN)の並列化は近年多く研究されており、GPGPUやMPIによる様々な並列化実装がなされてきた。一方で、マルチコアCPUによる並列化についての研究はあまりなされていない。そこで、OpenMPとMPIによって複数のマルチコアCPUによるCNNの並列学習処理を実装し、そのスケーラビリティをスーパーコンピュータ上で評価した。複数の並列化手法と畳み込み手法を実装、比較することで、プロセッサの性能をより引き出せるよう模索した。