当前位置: 首页 > news >正文

在国产芯片上实现YOLOv5/v8图像AI识别-【2.5】yolov8使用C++部署在RK3588更多内容见视频

本专栏主要是提供一种国产化图像识别的解决方案,专栏中实现了YOLOv5/v8在国产化芯片上的使用部署,并可以实现网页端实时查看。根据自己的具体需求可以直接产品化部署使用。

B站配套视频:https://www.bilibili.com/video/BV1or421T74f
在这里插入图片描述

背景基础

在之前的课程里面我们已经把v5的内容进行了充分的描述,从这篇博客开始将开始关于yolov8在C++上的部署。

首先我们需要知道v5和v8之间的区别,v5的功能主要集中在分类,具体的使用方法我们也已经全部说明。

v8除了分类以外还可以实现关键点跟踪和图像分割,所以在产品多样性方面v8更具有优势。
在这里插入图片描述
图上是yolov8的github给出的示例,分类、检测、分割、追踪、关键点识别。如果需要在产品上有更多的应用,yolov8属于必须学习的部分了。

关于yolov8的模型修改

这一步和yolov5的道理相同,如果你熟悉yolov8也会知道v8在输出头方面做了不小的修改,从原来v5版本3个改成了2个。但是整个推理过程还是一样的,预处理、推理、后处理。同样修改部分都在后处理上,所以还是一样,我们需要在训练完成之后修改v8的代码去除后处理部分。主要修改是两个位置:

位置一:nn/modules/head.py 40行~50行左右位置

在这里插入图片描述
修改部分一

		print('自定义的模型初始化...')self.conv1x1 = nn.Conv2d(16,1,1, bias=False).requires_grad_(False)xx = torch.arange(16, dtype=torch.float)self.conv1x1.weight.data[:] = nn.Parameter(xx.view(1,16,1,1))

修改部分二

		y = []for i in range(self.nl):t1 = self.cv2[i](x[i])t2 = self.cv3[i](x[i])y.append(self.conv1x1(t1.view(t1.shape[0], 4, 16, -1).transpose(2,1).softmax(1)))y.append(t2)return y

位置二:engine/model.py 130行~150行左右

在这里插入图片描述
修改内容:

        import torchself.model.fuse() self.model.eval()self.model.load_state_dict(torch.load('weights/yolov8.dict.pt', map_location='cpu'), strict=False)dummy_input = torch.randn(1, 3, 640, 640)input_names = ["data"]output_names = ["reg1","cls1","reg2","cls2","reg3","cls3"]torch.onnx.export(self.model, dummy_input, "weights/yolov8.dict.onnx", verbose=True,input_names=input_names,output_names=output_names, opset_version=11)print("done!")

项目目录新建脚本export-onnx.py

from ultralytics import YOLO# # 加载模型
# model = YOLO('weights/bz-yolov8-SPPF-s-200-754.pt')
# # 加载模型配置文件,注意需要匹配
# model = YOLO('/app/docs/yolov8/ultralytics/ultralytics/cfg/models/v8/yolov8.yaml')# 加载模型
model = YOLO('weights/yolov8n.pt')
# 加载模型配置文件,注意需要匹配
model = YOLO('yolov8n.yaml')

关于yolov8的模型量化

还是一样去官方下载rknntoolkit2,使用里面的工具进行量化,具体的使用和v5一致我们就不在这重复演示了。不过需要注意,使用Netron检查导出的onnx模型,一定要是6个输出头,不然脚本执行会出问题。
在这里插入图片描述

关于yolov8的RK3588部署

此处就是正题了,关于我们在RK3588上的部署。一样的,大家可以使用官方代码,或者私信我用我的代码版本。我的代码版本里面会准备好官方量化模型供大家测试使用。
在这里插入图片描述
更多内容查看视频>>>>>>>>>>>>>>>>> https://www.bilibili.com/video/BV1or421T74f](https://www.bilibili.com/video/BV1or421T74f
更多内容查看视频>>>>>>>>>>>>>>>>> https://www.bilibili.com/video/BV1or421T74f](https://www.bilibili.com/video/BV1or421T74f
更多内容查看视频>>>>>>>>>>>>>>>>> https://www.bilibili.com/video/BV1or421T74f](https://www.bilibili.com/video/BV1or421T74f
更多内容查看视频>>>>>>>>>>>>>>>>> https://www.bilibili.com/video/BV1or421T74f](https://www.bilibili.com/video/BV1or421T74f
更多内容查看视频>>>>>>>>>>>>>>>>> https://www.bilibili.com/video/BV1or421T74f](https://www.bilibili.com/video/BV1or421T74f
更多内容查看视频>>>>>>>>>>>>>>>>> https://www.bilibili.com/video/BV1or421T74f](https://www.bilibili.com/video/BV1or421T74f


http://www.mrgr.cn/news/6336.html

相关文章:

  • 机器学习辅助复合材料预测,性能管理优化创新材料,这种王炸般的组合,还真是大开眼界!
  • Android Forensics with Belkasoft
  • mov转mp4,这几款软件轻松转换格式!
  • 基于鸿蒙Next模拟扫图识物的一个过程
  • MySQL(四)——常用函数
  • 驾校预约学习系统--论文pf
  • 洛谷P9235 [蓝桥杯 2023 省 A] 网络稳定性
  • libcurl遇到的问题总结
  • React渲染机制和源码初探(二)
  • C++类和对象(2)
  • MySQL数据库(二)
  • 数据库管理-第232期 初探OpenTenBase(20240819)
  • 计算机视觉与视觉大模型对板书检测效果对比
  • 1089:数字反转
  • Spring Boot中使用SA-Token的全面指南
  • 打卡学习Python爬虫第四天|bs4爬取优美图库的小清新图片
  • Python与React结合:构建高效前端与后端的综合性技术探索
  • git错误fatal: Unpack error, check server log
  • wpf datagrid 设置自动新增行后 避免行内没有内容也会新增行处理
  • 江协科技STM32学习- P5 GPIO输出