首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >创龙 瑞芯微 RK3562 国产 2GHz 四核A53 工业开发板—NPU开发案例

创龙 瑞芯微 RK3562 国产 2GHz 四核A53 工业开发板—NPU开发案例

原创
作者头像
创龙科技Tronlong
发布于 2025-07-16 07:21:40
发布于 2025-07-16 07:21:40
1420
举报

前 言

本文主要介绍基于创龙科技TL3562-EVM评估板的NPU开发案例,适用开发环境如下。

Windows开发环境:Windows 7 64bit、Windows 10 64bit

虚拟机:VMware16.2.5

开发环境:Ubuntu20.04.6 64bit

U-Boot:U-Boot-2017.09

Kernel:Linux-5.10.209

LinuxSDK:rk3562-buildroot-2021.11-sdk-[版本号](基于rk3562_linux_release_v1.2.0_20240620)

无特殊说明情况下,本文默认使用USB TO UART0作为调试串口,使用Linux系统启动卡(Micro SD方式)启动系统,通过路由器与PC机进行网络连接,请确保PC机、Ubuntu系统可正常访问互联网。

NPU(Neural network Processing Unit),即神经网络处理器。RK3562内部已集成高能效神经网络处理器NPU,支持神经网络推理硬件加速,能够流畅运行AI算法。主要参数如下:

(1)支持INT4/INT8/INT16/FP16等;

(2)支持多种框架,如TensorFlow、MXNet、PyTorch、Caffe等;

(3)1TOPS算力。

备注:更多详细信息请查看“6-开发资料\数据手册\核心板元器件\CPU\”目录下的文档。

NPU开发流程如下:

(1)模型训练:用户根据需求自行训练模型或使用官方提供的模型;

(2)模型转换:使用RKNN-Toolkit2将预训练模型转换为RK3562 NPU可使用的RKNN模型;

(3)应用开发:基于RKNN API开发应用程序。

图 1 NPU开发流程图
图 1 NPU开发流程图

我司提供的NPU开发案例位于产品资料“4-软件资料\Demo\platform-demos\”。其中,yolov5_object_detect案例为静态演示案例(通过单张图片进行目标识别),v4l2_yolov5_detect案例为动态演示案例(通过摄像头连续获取图像进行目标识别),具体说明如下。

关于RKNN-Toolkit2环境搭建、模型转换使用说明、混合量化、精度问题排查的详细介绍,可查看yolov5_object_detect案例"tool\rknn-toolkit2\doc\"目录下的"02_Rockchip_RKNPU_User_Guide_RKNN_SDK_V2.0.0beta0_CN.pdf"文档。

关于RKNN-Toolkit2模型转换API接口说明,可查看yolov5_object_detect案例"tool\rknn-toolkit2\doc\"目录下的"02_Rockchip_RKNPU_User_Guide_RKNN_SDK_V2.0.0beta0_CN.pdf"文档。

关于RKNN API的详细使用说明,可查看yolov5_object_detect案例"tool\rknn-toolkit2\doc\"目录下的"04_Rockchip_RKNPU_API_Reference_RKNNRT_V2.0.0beta0_CN.pdf"文档。

1yolov5_object_detect案例

案例说明

本案例基于RKNN API实现对图片中目标对象的识别,并将识别结果以加水印的方式添加至图像,并保存成图片文件。案例循环测试10次,统计出推理的平均处理耗时。

备注:本案例基于瑞芯微官方例程实现,进行了目录的重构及编译的简化,功能逻辑未进行修改。官方例程位于LinuxSDK源码"/external/rknpu2/examples/rknn_yolov5_demo/"目录下。

图 2
图 2

程序处理流程图如下:

图 3
图 3

案例测试

请通过网线将评估板千兆网口ETH0 RGMII连接至路由器。

图 4
图 4

请将案例bin目录下的所有文件拷贝至评估板文件系统任意目录下。

图 5
图 5

在可执行文件所在目录,执行如下命令,对图片目标对象进行模型推理。

备注:模型运行的时间会有抖动。

Target# ./yolov5_object_detect yolov5s-640-640_rk3562.rknn car.jpg

图 6
图 6

从输出信息可知,本案例程序识别出测试图片包含person、car、bus、truck等对象,运行1次模型耗时为73.843000ms;循环运行10次模型平均耗时为47.365303ms。

案例程序对测试图片的目标对象标记成功后将输出名称为out.jpg的标记图片至当前目录,请将out.jpg文件拷贝至Windows下,并使用PC端相关软件对比查看car.jpg与out.jpg,测试结果如下所示。

图 7
图 7
图 8 car.jpg
图 8 car.jpg
图 9 out.jpg
图 9 out.jpg

从out.jpg图片可知,案例程序能正确框选出人物、汽车等物体,同时显示person、car文字标签和置信度,标记对象的数量及信息等与程序打印信息一致。

本程序能够支持识别的目标数据集类型说明位于bin目录下的coco_80_labels_list.txt文件,用户可根据相关目标类型进行测试验证。

图 10
图 10

案例编译

将案例src源码目录拷贝至Ubuntu工作目录下,进入源码目录,执行如下命令配置环境变量,并修改CMake配置文件CMakeLists.txt,请根据实际情况修改为LinuxSDK源码路径。

Host# source /home/tronlong/RK3562/rk3562-buildroot-2021.11-sdk-v1.0/buildroot/output/rockchip_rk3562/host/environment-setup

Host# vim CMakeLists.txt

图 11
图 11
图 12
图 12

新建一个build目录,用于存放编译过程产生的相关文件。

Host# mkdir -p build

图 13
图 13

进入build目录,执行如下命令进行案例编译,编译完成将会在build目录下生成编译过程产生的相关文件,并在src目录下生成install目录,该目录下存放案例相关文件。

Host# cd build

Host# cmake -DCMAKE_C_COMPILER=aarch64-buildroot-linux-gnu-gcc -DCMAKE_CXX_COMPILER=aarch64-buildroot-linux-gnu-g++ ../

Host# make -j8

Host# make install

图 14
图 14
图 15
图 15

build目录存放编译过程产生的相关文件,install目录存放案例相关文件,包括测试图片car.jpg、类别数据集coco_80_labels_list.txt、RKNN模型yolov5s-640-640_rk3562.rknn和可执行程序yolov5_object_detect等文件,如下图所示。

图 16
图 16

关键代码

(1)加载图片RGB数据。

图 17
图 17

(2)加载模型并初始化RKNN。

图 18
图 18

(3)前处理,对图像进行缩放和裁剪以适配模型输入。

图 19
图 19

(4)设置模型运行输入输出参数,NPU运行模型,获取模型输出,统计运行耗时。

图 20
图 20

(5)进行后处理,得到目标识别结果。

图 21
图 21

(6)使用目标识别结果给图片添加水印,并保存为图片文件。

图22
图22

(7)重复运行10次模型并统计平均耗时。

图 23
图 23

由于篇幅过长等原因,部分内容均不逐一展示,如需获取完整版详细资料,请关注创龙科技微信公众号或官网,或者评论区留言,感谢您的支持!

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
瑞芯微RK3562 四核 ARM Cortex-A53 + 单核 ARM Cortex-M0——NPU开发案列
本文主要介绍基于创龙科技TL3562-MiniEVM评估板的NPU开发案例,适用开发环境如下。
创龙科技Tronlong
2025/04/15
3590
瑞芯微RK3562 四核 ARM Cortex-A53 + 单核 ARM Cortex-M0——NPU开发案列
创龙 瑞芯微 RK3588 国产2.4GHz八核 工业开发板—NPU开发案例
本文主要介绍基于创龙科技TL3588-EVM评估板的NPU开发案例,适用开发环境如下。
创龙科技Tronlong
2025/09/30
1260
创龙 瑞芯微 RK3588 国产2.4GHz八核 工业开发板—NPU开发案例
NPU性能深度评测:瑞芯微RK3588、RK3576、RK3568、RK3562
随着AI技术不断发展,越来越多的嵌入式设备开始集成NPU(神经网络处理单元),以实现更高效的AI推理。作为国产芯片厂商的佼佼者,瑞芯微推出的RK3588、RK3576、RK3568、RK3562系列芯片在市场中占据了重要地位。今天,我们一起深入对比、测评上述芯片的NPU性能,快速解决在项目选型中带来的困扰。
创龙科技Tronlong
2025/04/03
3.1K0
NPU性能深度评测:瑞芯微RK3588、RK3576、RK3568、RK3562
创龙 瑞芯微 RK3562 国产 2GHz 四核A53 工业开发板—Qt工程编译说明
创龙科技 TL3562-EVM-B 是一款基于瑞芯微 RK3562J/RK3562 处理器设计的四核 ARMCortex-A53 +单核 ARM Cortex-M0 国产工业评估板,主频高达 2.0GHz。评估板由核心板和评估底板组成,核心板 CPU、ROM、RAM、电源、晶振、连接器等所有元器件均采用国产工业级方案,国产化率 100%。评估底板大部分元器件亦采用国产工业级方案,国产化率约 99%(按元器件数量占比,数据仅供参考)。核心板经过专业的PCBLayout 和高低温测试验证,质量稳定可靠,可满足各种工业应用环境要求。
创龙科技Tronlong
2025/07/02
2120
创龙 瑞芯微 RK3562 国产 2GHz 四核A53 工业开发板—Qt工程编译说明
RK3562J正式支持NPU,性价比再提升!
RK3562J是瑞芯微最新推出的一款超高性价比工业处理器,四核Cortex-A53@1.8GHz + Cortex-M0@200MHz异构多核架构,并支持十路UART、两路CAN、两路网口、三种显示、双路Camera等,外设接口资源十分丰富,是RK3568J处理器降成本、降功耗的首选平台,在工商业储能EMS、通讯管理机、运动控制器、AGV机器人、车载数据网关等场景被广泛应用。
创龙科技Tronlong
2024/12/23
6900
RK3562J正式支持NPU,性价比再提升!
基于RK3588的NPU案例分享!6T是真的强!
RK3588 NPU性能可谓十分强大,6TOPS设计能够实现高效的神经网络推理计算。这使得RK3588在图像识别、语音识别、自然语言处理等人工智能领域有着极高的性能表现。
创龙科技Tronlong
2024/07/18
1.3K0
基于RK3588的NPU案例分享!6T是真的强!
创龙 瑞芯微 RK3562 国产 2GHz 四核A53 工业开发板—IRIG-B码对时案例
创龙科技 TL3562-EVM-B 是一款基于瑞芯微 RK3562J/RK3562 处理器设计的四核 ARMCortex-A53 +单核 ARM Cortex-M0 国产工业评估板,主频高达 2.0GHz。评估板由核心板和评估底板组成,核心板 CPU、ROM、RAM、电源、晶振、连接器等所有元器件均采用国产工业级方案,国产化率 100%。评估底板大部分元器件亦采用国产工业级方案,国产化率约 99%(按元器件数量占比,数据仅供参考)。核心板经过专业的PCBLayout 和高低温测试验证,质量稳定可靠,可满足各种工业应用环境要求。
创龙科技Tronlong
2025/07/08
1800
创龙 瑞芯微 RK3562 国产 2GHz 四核A53 工业开发板—物联网模块开发案例
Windows开发环境:Windows 7 64bit、Windows 10 64bit
创龙科技Tronlong
2025/07/17
1200
创龙 瑞芯微 RK3562 国产 2GHz 四核A53 工业开发板—物联网模块开发案例
创龙 瑞芯微 RK3562 国产 2GHz 四核A53 工业开发板—GPU核心使用演示案例
本章节通过texture案例,演示基于Qt + OpenGL调用GPU核心进行图形渲染。
创龙科技Tronlong
2025/07/14
1220
创龙 瑞芯微 RK3562 国产 2GHz 四核A53 工业开发板—GPU核心使用演示案例
创龙 瑞芯微 RK3562 国产 2GHz 四核A53 工业开发板—Linux-RT应用开发案例
创龙科技 TL3562-EVM-B 是一款基于瑞芯微 RK3562J/RK3562 处理器设计的四核 ARMCortex-A53 +单核 ARM Cortex-M0 国产工业评估板,主频高达 2.0GHz。评估板由核心板和评估底板组成,核心板 CPU、ROM、RAM、电源、晶振、连接器等所有元器件均采用国产工业级方案,国产化率 100%。评估底板大部分元器件亦采用国产工业级方案,国产化率约 99%(按元器件数量占比,数据仅供参考)。核心板经过专业的PCBLayout 和高低温测试验证,质量稳定可靠,可满足各种工业应用环境要求。
创龙科技Tronlong
2025/07/01
1930
创龙 瑞芯微 RK3562 国产 2GHz 四核A53 工业开发板—Linux-RT应用开发案例
创龙 瑞芯微 RK3562 国产 2GHz 四核A53 工业开发板—ISP图像处理开发案例
本文档主要演示TL3562-EVM评估板基于ISP图像参数调试工具对摄像头采集的图像进行标定,通过IQ参数文件(即ISP参数文件,下文统称为IQ参数文件)将摄像头采集的图像优化处理后发送至显示设备。适用开发环境如下:
创龙科技Tronlong
2025/07/21
1980
创龙 瑞芯微 RK3562 国产 2GHz 四核A53 工业开发板—ISP图像处理开发案例
创龙 瑞芯微 RK3562 国产 2GHz 四核A53 工业开发板—Docker容器部署方法说明
Windows开发环境:Windows 7 64bit、Windows 10 64bit
创龙科技Tronlong
2025/07/03
1210
创龙 瑞芯微 RK3562 国产 2GHz 四核A53 工业开发板—Docker容器部署方法说明
Qwen2-VL-3B模型NPU多模态部署指导与评测--基于米尔瑞芯微RK3576开发板
瑞芯微 RK3576 开发板作为一款聚焦边缘 AI 的硬件平台,其集成的 NPU(神经网络处理器)能否高效支撑多模态 LLM 的本地运行?性能表现如何?
用户10591265
2025/08/29
2810
Qwen2-VL-3B模型NPU多模态部署指导与评测--基于米尔瑞芯微RK3576开发板
基于瑞芯微RK3562 四核 ARM Cortex-A53 + 单核 ARM Cortex-M0工业评估板——Linux应用开发手册
本文主要介绍TL3562-MiniEVM评估板的AMP(Asymmetric Multi-processing)开发案例,适用开发环境如下:
创龙科技Tronlong
2025/04/16
4670
基于瑞芯微RK3562 四核 ARM Cortex-A53 + 单核 ARM Cortex-M0工业评估板——Linux应用开发手册
创龙 瑞芯微 RK3562 国产 2GHz 四核A53 工业开发板—Linux系统启动卡制作及系统固化
Windows开发环境:Windows 7 64bit、Windows 10 64bit
创龙科技Tronlong
2025/07/04
2150
创龙 瑞芯微 RK3562 国产 2GHz 四核A53 工业开发板—Linux系统启动卡制作及系统固化
创龙瑞芯微 RK3562 国产 2GHz 四核A53 工业开发板—硬件说明书
本文主要介绍创龙科技TL3562-EVM评估板硬件接口资源,以及设计注意事项等内容。
创龙科技Tronlong
2025/06/26
2080
创龙瑞芯微 RK3562 国产 2GHz 四核A53 工业开发板—硬件说明书
开机LOGO不会换?1分钟教会您,基于瑞芯微RK3562国产平台
开机LOGO是品牌展示与用户体验的关键环节。对于企业而言,替换默认LOGO能强化品牌形象,统一产品线标识,提升用户对设备的信任感。目前提供了三种替换LOGO的方案供客户选择。
创龙科技Tronlong
2025/05/21
3220
开机LOGO不会换?1分钟教会您,基于瑞芯微RK3562国产平台
创龙 瑞芯微 RK3562 国产 2GHz 四核A53 工业开发板—Linux开发环境搭建
创龙科技 TL3562-EVM-B 是一款基于瑞芯微 RK3562J/RK3562 处理器设计的四核 ARMCortex-A53 +单核 ARM Cortex-M0 国产工业评估板,主频高达 2.0GHz。评估板由核心板和评估底板组成,核心板 CPU、ROM、RAM、电源、晶振、连接器等所有元器件均采用国产工业级方案,国产化率 100%。评估底板大部分元器件亦采用国产工业级方案,国产化率约 99%(按元器件数量占比,数据仅供参考)。核心板经过专业的PCBLayout 和高低温测试验证,质量稳定可靠,可满足各种工业应用环境要求。
创龙科技Tronlong
2025/07/01
1190
创龙 瑞芯微 RK3562 国产 2GHz 四核A53 工业开发板—Linux开发环境搭建
全国产!瑞芯微 RK3576 ARM 八核 2.2GHz 工业开发板—Linux系统使用手册
创龙科技 TL3576-EVM 是一款基于瑞芯微 RK3576J/RK3576高性能处理器设计的4核ARM Cortex-A72 +4核 ARM Cortex-A53 + ARM Cortex-M0 国产工业评估板,Cortex-A72 核心主频高达 2.2GHz,Cortex-A53 核心主频高达 2.0GHz。评估板由核心板和评估底板组成,核心板 CPU、ROM、RAM、电源、晶振、连接器等所有元器件均采用国产工业级方案,国产化率100%。同时,评估底板大部分元器件亦采用国产工业级方案,国产化率约为 99%(按元器件数量占比,数据仅供参考)。核心板经过专业的PCBLayout 和高低温测试验证,质量稳定可靠,可满足各种工业应用环境要求。
创龙科技Tronlong
2025/06/24
2950
全国产!瑞芯微 RK3576 ARM 八核 2.2GHz 工业开发板—Linux系统使用手册
创龙 瑞芯微 RK3562 国产 2GHz 四核A53 工业开发板—基于AMP的多通道AD采集开发案例
本文主要介绍创龙科技TL3562-EVM评估板演示基于AMP(Asymmetric Multi-processing)的8/16通道AD采集开发案例,使用的AD芯片为核芯互联CL1606/CL1616(国产)、ADI AD7606/AD7616。适用开发环境:
创龙科技Tronlong
2025/07/14
1660
创龙 瑞芯微 RK3562 国产 2GHz 四核A53 工业开发板—基于AMP的多通道AD采集开发案例
推荐阅读
瑞芯微RK3562 四核 ARM Cortex-A53 + 单核 ARM Cortex-M0——NPU开发案列
3590
创龙 瑞芯微 RK3588 国产2.4GHz八核 工业开发板—NPU开发案例
1260
NPU性能深度评测:瑞芯微RK3588、RK3576、RK3568、RK3562
3.1K0
创龙 瑞芯微 RK3562 国产 2GHz 四核A53 工业开发板—Qt工程编译说明
2120
RK3562J正式支持NPU,性价比再提升!
6900
基于RK3588的NPU案例分享!6T是真的强!
1.3K0
创龙 瑞芯微 RK3562 国产 2GHz 四核A53 工业开发板—IRIG-B码对时案例
1800
创龙 瑞芯微 RK3562 国产 2GHz 四核A53 工业开发板—物联网模块开发案例
1200
创龙 瑞芯微 RK3562 国产 2GHz 四核A53 工业开发板—GPU核心使用演示案例
1220
创龙 瑞芯微 RK3562 国产 2GHz 四核A53 工业开发板—Linux-RT应用开发案例
1930
创龙 瑞芯微 RK3562 国产 2GHz 四核A53 工业开发板—ISP图像处理开发案例
1980
创龙 瑞芯微 RK3562 国产 2GHz 四核A53 工业开发板—Docker容器部署方法说明
1210
Qwen2-VL-3B模型NPU多模态部署指导与评测--基于米尔瑞芯微RK3576开发板
2810
基于瑞芯微RK3562 四核 ARM Cortex-A53 + 单核 ARM Cortex-M0工业评估板——Linux应用开发手册
4670
创龙 瑞芯微 RK3562 国产 2GHz 四核A53 工业开发板—Linux系统启动卡制作及系统固化
2150
创龙瑞芯微 RK3562 国产 2GHz 四核A53 工业开发板—硬件说明书
2080
开机LOGO不会换?1分钟教会您,基于瑞芯微RK3562国产平台
3220
创龙 瑞芯微 RK3562 国产 2GHz 四核A53 工业开发板—Linux开发环境搭建
1190
全国产!瑞芯微 RK3576 ARM 八核 2.2GHz 工业开发板—Linux系统使用手册
2950
创龙 瑞芯微 RK3562 国产 2GHz 四核A53 工业开发板—基于AMP的多通道AD采集开发案例
1660
相关推荐
瑞芯微RK3562 四核 ARM Cortex-A53 + 单核 ARM Cortex-M0——NPU开发案列
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档