Fast-BEV论文解读

Paper

发布日期: 2023-02-12

文章字数: 389

阅读时长: 1 分

Fast-BEV论文解读

Fast-BEV

Fast-BEV的整体结构如图1所示

图1 Fast-BEV网络结构

Fast-BEV是在M$^2$BEV的基础上，进行了三方面的改进

为了防止过拟合，在图像空间和BEV空间都进行了有力的数据增强策略
利用时序信息的多帧融合机制
部署友好的视角转换方案

前两方面改进实际上都是比较常见的，文中主要是第三点改进能够显著提高2D图像到3D特征的视角转换速度。M$^2$BEV假设沿着光线的深度分布是均匀的。基于此，一旦得到了相机的内部/外部参数，就可以很容易地知道2D到3D投影。由于这里没有使用可学习的参数，可以很容易地计算2D特征图上的点与BEV特征图之间的对应矩阵。
投影索引是从2D图像空间到3D体素空间的映射索引。由于该方案不依赖于数据相关的深度预测或变换器，所以投影索引对于每个输入都是相同的。因此，可以预先计算固定的投影索引并存储它。在推理阶段，可以通过查询查询表获得投影索引，这在边缘设备上是非常“便宜”的操作。此外，如果从单帧扩展到多帧，也可以轻松预先计算内在和外在参数并将其预先对齐到当前帧。