kk's Blog
KAN论文与代码解读 KAN论文与代码解读
本文对KAN的论文和代码进行了解读。
2024-05-09
MapTR V2论文与代码解读 MapTR V2论文与代码解读
本文对MapTR V2的论文和代码进行了解读。 MapTR V2是在MapTR(详情可戳MapTR论文与代码解读)的基础上进行了进行了一些小改动实现了性能提升,整体框架和MapTR差距不大,其改动在于: 解耦了自注意力机制,降低了显存开销
2023-08-27
Panoptic Visual Odometry论文解读 Panoptic Visual Odometry论文解读
Panoptic Visual Odometry论文解读 PVO整体结构PVO提出了一个全景视觉里程计框架,同时处理视觉里程计和视频全景分割两项任务。视觉里程计(VO)是基于静态场景假设,通过单目图像计算相机的位姿。对于动态场景,需要过滤动
2023-08-13
Fast-BEV论文解读 Fast-BEV论文解读
Fast-BEV论文解读 Fast-BEVFast-BEV的整体结构如图1所示 图1 Fast-BEV网络结构 Fast-BEV是在M$^2$BEV的基础上,进行了三方面的改进 为了防止过拟合,在图像空间和BEV空间都进行了有力的数据增
2023-02-12
Persformer论文与代码解读 Persformer论文与代码解读
Persformer论文与代码解读 PersformerPersformer是一个针对3D车道线检测的模型,在介绍具体模型设计之前,由于3D Lane和HD Map Construction在一定程度上比较接近,顺便插播一下二者的异同同:
2023-02-03
MapTR论文与代码解读 MapTR论文与代码解读
本文对MapTR的论文和代码进行了解读。 本文主要改进的地方在于针对地图元素的数据结构进行了instance-point点集的层级式设计,模型直接预测了每个地图元素的点集,而非HDMapNet类的方法去预测分割的tensor。Nuscene
2022-12-10
PGD-Probabilistic and Geometric Depth_ Detecting Objects in Perspective PGD-Probabilistic and Geometric Depth_ Detecting Objects in Perspective
本文整理了Probabilistic and Geometric Depth_ Detecting Objects in Perspective论文主要内容 本文核心思想:利用目标之间的相对位置关系构造深度传播图以获取更准确的深度估计值。
2022-08-22
BEVFormer论文解读 BEVFormer论文解读
BEVFormer论文解读 BEVFormerBEVFormer是自顶向下的稠密BEV特征建模。文章主要是把DETR3D思想中的3D特征反投影到2D图像上以得到密集、准确的BEV特征,从而能够在此基础上更好的进行检测、分割。如果说DETR3
2022-07-27
BEVDepth论文解读 BEVDepth论文解读
BEVDepth论文解读 BEVDepth整体结构BEVDepth认为深度估计对于基于相机的3D目标检测来说至关重要,因此尝试利用显式深度监督来解决这个问题。BEVDepth实际上是在LSS的投影方法的基础上增加准确的深度估计模块和显式的深
2022-07-17
BEVDet论文解读 BEVDet论文解读
BEVDet论文解读 BEVDet整体结构BEVDet是一个比较经典的在BEV视角下进行3D目标检测的范式,这种表示方式能够给下游的路径规划等任务带来极大的便利。BEVDet主要是重用现有的模块来构建其框架,但通过构建独占数据增强策略和升级
2022-07-08
1 / 2