当前位置: 首页 > news >正文

自动驾驶 3DGS 学习笔记

SGD: Street View Synthesis with Gaussian Splatting and Diffusion Prior 

解说:

街景的新视角合成对于模拟的重要性,并介绍了目前实现此目标的主流技术是神经渲染,例如神经辐射场(NeRF)和三维高斯飞溅(3DGS)。然而,在处理街景时,当前方法在与训练视角明显偏离的视点上保持渲染质量时存在困难。为了解决这个问题,文章提出了一种新方法,通过利用扩散模型的先验以及补充的多模态数据,增强了3DGS的能力。实验结果表明,这种方法相对于当前最先进模型更有效,并展示了在渲染更广泛视角的图像方面的优势。

2.1 微调扩散模型

本节介绍了一种用于微调扩散模型的新方法,该方法专门针对驾驶数据进行微调。驾驶数据按顺序收集,因此我们可以轻松地确定任何新视角的最接近的前后帧。作者将这些相邻帧的图像作为参考图像,因为它们提供了有价值的上下文信息。此外,360°激光雷达点云使我们能够为参考帧和新视图推导深度图,从而全面理解跨视角的相对空间信息。通过微调扩散模型,作者引导它从上下文图像中学习应该存在的内容,以及从深度信息中学习对象之间的空间关系。微调分为两个阶段:第一阶段是基于图像的扩散模型,第二阶段是添加深度控制网络。第一阶段旨在使扩散模型从相邻帧的图像中学习场景的高级信息,而不包括姿态信息。第二阶段旨在利用3D信息控制模型以实现更准确的图像生成。通过这两个阶段的微调,作者的方法在自动驾驶场景中展现出了优异的性能。 作者:3D视觉工坊 https://www.bilibili.com/read/cv34267043/ 出处:bilibili

开源地址是错的

GitHub - Leeiieeo/AG-Pose: CVPR2024: Instance-Adaptive and Geometric-Aware Keypoint Learning for Category-Level 6D Object Pose Estimation

原理介绍

全面超越!开源!百度最强SOTA:基于扩散模型的3DGS! - 哔哩哔哩 


http://www.mrgr.cn/news/38655.html

相关文章:

  • 兆易GD32E508的SHRTIM配置 主从定时器 产生2对相位可调互补PWM 带死区
  • 如何对TBSS的结果进行统计学的分析已完成置换检验,如何在最终的TBSS输出结果提取除具体值及如何做进一步相关性分析??
  • LCD显示屏接口
  • netdata(Linux 性能实时监测工具)一键安装 for armbian
  • 使用Mendeley生成APA格式参考文献
  • 【MySQL】MySQL库的操作
  • .Net 基于IIS部署blazor webassembly或WebApi
  • 卸载WSL(Ubuntu),卸载linux
  • project_object_model_3d
  • spring cloud Gateway网关
  • 番外篇 | 复现AC-YOLOv5,进行自动化织物缺陷检测
  • 【web安全】——信息收集
  • 1-仙灵之谜(区块链游戏详情介绍)
  • MYSQL(学习笔记)
  • 利用多模态输入的自我中心运动跟踪与理解框架:EgoLM
  • 算法分析,主定理
  • py-mmcif提取结构解析的方法、提交日期以及pdb ID等
  • Note2024092801_python 日历信息获取
  • 2025年营收1亿美元咨询代理机构的游戏策略:基于AIGC的无限可扩展业务
  • 网络编程操作—函数