当前位置: 首页 > news >正文

YOLOv8改进 | 主干篇 | YOLOv8引入EfficientViT替换Backbone

1. EfficientViT介绍

1.1  摘要: 高分辨率密集预测使得许多有吸引力的现实应用成为可能,例如计算摄影、自动驾驶等。然而,巨大的计算成本使得在硬件设备上部署最先进的高分辨率密集预测模型变得困难。 这项工作提出了 EfficientViT,这是一个新的高分辨率视觉模型系列,具有新颖的多尺度线性注意力。 与之前的高分辨率密集预测模型依赖于大量的softmax注意力、硬件效率低下的大内核卷积或复杂的拓扑结构来获得良好的性能不同,我们的多尺度线性注意力实现了全局感受野和多尺度学习(两个 高分辨率密集预测的理想功能)仅具有轻量级和硬件高效的操作。 因此,与之前最先进的模型相比,EfficientViT 提供了显着的性能提升,并在各种硬件平台(包括移动 CPU、边缘 GPU 和云 GPU)上显着加速。 在 Cityscapes 上没有性能损失的情况下,我们的 EfficientViT 比 SegFormer 和 SegNeXt 分别减少了 13.9 倍和 6.2 倍的 GPU 延迟。 对于超分辨率,EfficientViT 比 Restormer 提供高达 6.4 倍的加速,同时提供 0.11dB 的 PSNR 增益。 对于 Segment Anything,Effic


http://www.mrgr.cn/news/16643.html

相关文章:

  • 极限.....
  • AI编码新时代:免费人工智能助手Blackbox AI
  • 在内核态使用 intel avx2 加速内存操作
  • ChatGPT的全面写作革命:我们迎来效率飞跃还是创造力危机?
  • 天童教育:让孩子时常感觉被深爱
  • 大模型种草书籍——BERT基础教程:Transformer大模型实战,看完头皮发麻!
  • 让自家的智能语音助手实现todo任务的添加
  • 欧拉 函数
  • 最简单监控方案:域名、证书 SSL、服务器全搞定!发送钉钉告警消息
  • A\B求解将 B转换到 A 的坐标系中的变换
  • java基础开发-xstream解析xml
  • 【智能排班系统】Hibernate Validator 参数校验
  • C++11 新特性基础
  • MySQL事务管理与并发控制:深入理解ACID特性
  • 如何选到好的宠物空气净化器,用哪款宠物空气净化器比较好?
  • Go入门:gin框架极速搭建图书管理系统
  • C语言习题~day38
  • python实战三-提取Word数据到Excel
  • opencv之图像平滑处理
  • 如何将线程绑定到特定的CPU核