2019年12月17日,智能车实验室本科生赵晨辰的论文《Monocular Pedestrian Orientation Estimation Based on Deep 2D-3D Feedforward》被模式识别领域旗舰期刊Pattern Recognition录用并在线发表。
该论文专注于交通场景中的行人2D目标检测与朝向估计,提出了目前单目视觉朝向估计模型缺乏针对行人目标的深层次信息的普遍问题。作者将行人目标的二维信息(即其二维包围盒的尺寸信息)和三维信息(即其三维空间尺度信息)通过前馈的方式与深度神经网络中的朝向估计模块结合,以使目标的二维、三维信息与特征图共同决定目标的朝向值。
该论文提出的单目视觉行人朝向估计模型FFNet在智能车权威评测榜KITTI上进行测试,进入Object Detection and Orientation Estimation Evaluation排行榜前十名,是目前采用单目视觉模型开源代码中最佳成绩。
论文下载地址:https://www.sciencedirect.com/science/article/pii/S0031320319304820
开源代码地址:https://github.com/zcc31415926/FFNet