当前位置: 首页 > news >正文

单板挑战4路YOLOv8!米尔瑞芯微RK3576开发板性能实测

在科技飞速发展的当下,人工智能与边缘计算的融合正以前所未有的速度重塑着我们的生活。RK3576芯片拥有4核Cortex-A72以及4核Cortex-A53提供基础算力,6TOPS算力NPU来模型推导运算。使用YOLOv8模型时也是手到擒来,接下来随着步伐看看它表现如何。

YOLO简介

YOLO(You Only Look Once)是当前业界领先的实时目标检测算法系列,以其速度和精度的完美平衡而闻名。从它发布至今,经历了好几个版本变革,下图是它发展历史。

 图1-1. YOLO版本发展史

YOLOv8在性能、易用性、架构现代性和生态之间取得了最佳的平衡,它是目前最全面,最省心选择。

同样YOLOv8也有很多尾缀,用一个表简单列一下它们分别代表什么意思:

表1-1.按任务类型区分

后缀

全称

任务

输出

典型应用

-det

Detection

目标检测

边界框 (BBox)+类别和置信度

找出图像中所有感兴趣的物体并用框标出。如:行人检测、车辆检测、安全帽检测。

-seg

Segmentation

实例分割

边界框+类别+像素级掩膜 (Mask)

在目标检测的基础上,进一步勾勒出物体的精确轮廓。如:抠图、自动驾驶中识别道路和车辆形状。

-pose

Pose

关键点检测

边界框+人体关键点(17个点)

检测人体的关键骨骼点。如:动作识别、健身姿态分析、人机交互。

-cls

Classification

图像分类

整个图像的类别标签

判断一张图片属于哪个类别。如:猫狗分类、图像质量评估。

-obb

Oriented Bounding Boxes

旋转目标检测

旋转边界框(BBox+角度θ)+类别和置信度

检测带有角度的物体,其边界框不是水平的。

表1-2.按模型尺寸分

前缀

含义

特点

适用场景

n

Nano

极小的模型,速度最快,精度最低

移动端、嵌入式设备(如 Jetson Nano)、CPU实时推理

s

Small

小模型,速度和精度平衡

最常用的起点,适合大多数需要实时性的场景(如视频流分析)

m

Medium

中等模型,精度和速度的最佳权衡

对精度有较高要求,且仍有不错的速度

l

Large

大模型,精度高,速度较慢

服务器端应用,其中精度比速度更重要

x

X-Large

超大模型,精度最高,速度最慢

学术研究、刷榜、对精度有极致要求的离线分析

米尔Demo模型选择

基于MYD-LR3576来说,选择s/n小模型相对合适,使用基础功能和-seg,-obb,-pos来演示。

米尔基于RK3576开发板

单独测试视频场景

1.YOLOv8s.int 目标检测模型

 

 

2.YOLOv8s-seg.int 实例分割模型

 

 

3.YOLOv8s-pose.int 人体姿态估计模型

 

 

4.YOLOv8s-obb.float 旋转目标检测模型

 

 

 

上面已经看到了单独解析视频时,每一种模型效果,接下来演示MYD-LR3576通过4路摄像头同时推导效果。

 

实现方式如下:

MYD-LR3576拥有3路MIPI-CSI接口,通过3个MY-CAM004M分别接入3路MIPI-CSI,采用2+1+1方式搭载4路AHD高清摄像头,摄像头采集的画面输出为H.264编码的RTSP码流,1920*1080分辨率,30帧。经过MYD-LR3576开发板处理后,单路视频输出1920*1080,25fps,4路视频加起来在60~70帧,cpu占用率接近100%,NPU综合利用率在50~60%。

 图1-2. 实物接线概要图

 

 图1-3. 摄像头数据处理流程图

MYIR在程序中做了哪些优化

AI推导一轮流程

  • 获取CSI一帧数据

  • 裁剪数据到xxx*yyy较小图片

  • 调用RKNN api处理

  • 获取返回特征位置和相似度

  • 对应放大到原始图片

  • 增加方框和相似度值到原图

这样做后果是CPU利用率不高,视频采集帧数低,最后显示效果会卡顿。

米尔采用线程池方案,将上述过程通过线程处理,充分利用4个A72和4个A53资源,同时采用RGA来做图片裁剪和放大。将CPU,GPU,NPU,VPU4个模块协同工作,资源最大限度开发使用。

总结:

RK3576 在 YOLOv8 模型表现上十分亮眼,它的应用场景涉及到很多领域。例如智能安防,在公共场所,如机场、火车站、商场等,部署的安防监控系统,快速准确地识别出人群中的异常行为,如打架斗殴、奔跑逃窜等,并及时发出警报,同时,通过人脸识别技术,系统可以对进入场所的人员进行身份识别,与数据库中的信息进行比对,实现对重点人员的监控和追踪。又或者搭载智能机器人赋予迅速反馈。

更多MYD-LR3576创新应用,敬请期待。

 

http://www.wxhsa.cn/company.asp?id=2147

相关文章:

  • doms.ul.querySelectorvs document.querySelector:DOM查询的层级关系
  • 穿越钱塘江:一条高铁隧道背后的技术挑战
  • Pwn2Own Automotive 2025 决赛日:49个零日漏洞与88万美元奖金揭晓
  • 9.HPA与VPA
  • MyEMS在行动:揭秘开源能源管理系统如何重塑工业与楼宇的能效未来
  • 题解:P14015 [ICPC 2024 Nanjing R] 生日礼物
  • 吻得太逼真
  • HyperWorks许可回收机制
  • flink on k8s的基本介绍
  • 高性能计算基础
  • flutter开发window打包成exe可执行文件的步骤
  • Transtion动画组件要求包裹元素必须是单一根节点
  • linux启动ntp服务
  • 企业级 AI Agent 开发指南:基于函数计算 FC Sandbox 方案实现类 Chat Coding AI Agent
  • android开发局域网内通过NTP服务端自动更新系统时间
  • 一招解决Proxmox VE虚拟机磁盘空间耗尽:LVM在线扩容实战 - 若
  • jiaozi
  • 基于Linux系统的定制软件安装硬件设备选型指南
  • c++之is_trivially_default_constructible
  • python3协程学习-async,await
  • 猫树分治
  • Rust太难了。。。。。。。
  • AI导航生成寻路点-FindPathToLocationSynchronously
  • cache写策略
  • 个人微信开发
  • C++之std::is_trivially_copyable
  • PostgreSQL技术大讲堂 - 第104讲:PostgreSQL分区表应用实践
  • redis实现缓存1-添加商户缓存
  • qemu的外部快照实现原理
  • Springboot 集成 飞书群消息