当前位置：首页 > news >正文

Jetson Orin Nano 新手避坑：从零部署YoloV5，我踩过的那些环境配置的‘雷’

news 2026/6/2 14:44:51

Jetson Orin Nano 边缘AI部署实战：YOLOv5环境配置全攻略与避坑指南

1. 硬件准备与系统烧录

Jetson Orin Nano作为NVIDIA新一代边缘计算设备，其强大的AI算力与紧凑体积使其成为计算机视觉项目的理想选择。但在开始YOLOv5部署前，正确的硬件准备至关重要。

关键硬件检查清单：

确认设备型号为Jetson Orin Nano Developer Kit
准备至少64GB高速microSD卡或NVMe SSD（根据版本选择）
稳定的5V/4A电源适配器
USB Type-C数据线（用于强制恢复模式）

系统烧录环节最容易出现问题的三个关键点：

镜像下载验证
务必从NVIDIA开发者网站下载与设备完全匹配的JetPack版本。常见错误包括：
- 使用了Jetson AGX Orin的镜像
- 下载了不完整的压缩包（建议验证SHA256校验值）
烧录环境配置
推荐在Ubuntu 18.04/20.04主机上进行烧录，避免使用Windows系统。必须安装的依赖：
```
sudo apt-get install qemu-user-static python3 python3-pip
```
强制恢复模式操作
正确进入恢复模式的步骤：
- 断开设备电源
- 短接FC_REC和GND引脚（位于40针GPIO接口的第2和第3引脚）
- 连接Type-C线到主机
- 最后接通电源

注意：烧录过程中若出现"USB device not recognized"错误，通常是由于VMware未正确配置USB直通。建议在物理机操作或检查虚拟机USB控制器设置。

2. JetPack组件与CUDA环境配置

成功烧录系统后，首次启动需完成基础配置。这里隐藏着几个版本兼容性"地雷"：

JetPack 5.1.1默认组件版本：

组件	版本号	关键依赖项
L4T	35.3.1	Linux内核5.10
CUDA	11.4.19	cuDNN 8.6.0
TensorRT	8.5.2	OpenCV 4.5.4
cuDNN	8.6.0.163	Python 3.8

环境配置中最易出错的三个环节：

CUDA路径设置
修改~/.bashrc时常见的语法错误：

# 错误示例（缺少$PATH连接符） export PATH=/usr/local/cuda-11.4/bin # 正确写法 export PATH=/usr/local/cuda-11.4/bin:$PATH

显存分配调整
Orin Nano的共享内存配置需要特别优化：

sudo nano /etc/systemd/nvzramconfig.sh

将默认的：

mem=$((("${totalmem}"/2/"${NRDEVICES}")*1024))

修改为：

mem=$((("${totalmem}"*3/"${NRDEVICES}")*1024))

jtop监控工具安装
推荐使用jetson-stats监控系统状态：

sudo pip3 install -U jetson-stats sudo systemctl restart jetson_stats.service

验证安装：

sudo jtop

3. PyTorch与torchvision精准安装

Arm架构的PyTorch安装是最大的"坑点"之一。必须严格匹配的版本组合：

JetPack 5.1.1兼容矩阵：

组件	官方推荐版本	替代可用版本	不兼容版本
PyTorch	1.14.0	1.13.0	≥2.0.0
torchvision	0.15.1	0.14.1	≥0.16.0

分步安装指南：

安装编译依赖：

sudo apt-get install -y libopenblas-dev libjpeg-dev zlib1g-dev \ libpython3-dev libavcodec-dev libavformat-dev libswscale-dev

下载预编译的PyTorch wheel：

wget https://nvidia.box.com/shared/static/ssf2v7pf5i245fk4i0q926hy4imzs2ph.whl -O torch-1.14.0a0+44dac51c.nv23.02-cp38-cp38-linux_aarch64.whl pip3 install torch-1.14.0a0+44dac51c.nv23.02-cp38-cp38-linux_aarch64.whl

源码编译torchvision：

git clone --branch v0.15.1 https://github.com/pytorch/vision.git cd vision export BUILD_VERSION=0.15.1 python3 setup.py install --user

验证安装成功的正确姿势：

import torch print(torch.__version__) # 应显示1.14.0 print(torch.cuda.is_available()) # 必须返回True

4. OpenCV与GStreamer深度集成

系统预装的OpenCV往往缺少GStreamer支持，这是CSI摄像头无法工作的主要原因。推荐从源码编译：

关键编译参数：

cmake -D WITH_GSTREAMER=ON \ -D WITH_CUDA=ON \ -D CUDA_ARCH_BIN=8.7 \ -D OPENCV_ENABLE_NONFREE=ON \ -D OPENCV_GENERATE_PKGCONFIG=YES \ -D BUILD_EXAMPLES=OFF \ -D BUILD_opencv_python3=ON ..

分阶段编译技巧：

# 第一阶段：仅编译核心模块 make -j$(nproc) opencv_core opencv_imgproc opencv_videoio # 第二阶段：编译剩余模块 make -j$(nproc) sudo make install

验证GStreamer支持：

import cv2 print(cv2.getBuildInformation()) # 检查GStreamer是否为YES

CSI摄像头测试命令：

gst-launch-1.0 nvarguscamerasrc ! 'video/x-raw(memory:NVMM),width=1280,height=720' ! nvvidconv flip-method=0 ! 'video/x-raw,width=640,height=480' ! nvvidconv ! nvegltransform ! nveglglessink -e

5. YOLOv5部署与性能优化

官方YOLOv5仓库的部署相对简单，但需要特别注意：

模型选择建议：

模型类型	参数量	Orin Nano推理速度(FPS)	适用场景
YOLOv5n	1.9M	85-110	实时检测
YOLOv5s	7.2M	45-60	平衡精度与速度
YOLOv5m	21.2M	20-30	高精度要求

部署步骤：

git clone https://github.com/ultralytics/yolov5 cd yolov5 pip3 install -r requirements.txt

TensorRT加速技巧：

导出ONNX模型：

python3 export.py --weights yolov5n.pt --include onnx

使用trtexec转换：

/usr/src/tensorrt/bin/trtexec --onnx=yolov5n.onnx \ --saveEngine=yolov5n.engine \ --fp16 --workspace=2048

推理测试：

python3 detect.py --weights yolov5n.engine --img 640 --source 0

6. DeepStream集成实战

对于需要多路视频流处理的场景，DeepStream是最佳选择。与YOLOv5集成的关键步骤：

安装DeepStream 6.2：

sudo tar -xvf deepstream_sdk_v6.2.0_jetson.tbz2 -C / cd /opt/nvidia/deepstream/deepstream-6.2 sudo ./install.sh

配置YOLOv5插件：

git clone https://github.com/marcoslucianops/DeepStream-Yolo.git cd DeepStream-Yolo CUDA_VER=11.4 make -C nvdsinfer_custom_impl_Yolo

修改配置文件：

[primary-gie] custom-network-config=yolov5n.cfg model-file=yolov5n.wts engine-file=yolov5n.engine

启动多路视频分析：

deepstream-app -c deepstream_app_config.txt

性能优化参数：

[streammux] batch-size=4 # 根据显存调整 width=1280 height=720

7. 真实项目中的经验分享

在实际工业检测项目中，我们总结出以下实用技巧：

CSI摄像头配置秘籍
- 修改/opt/nvidia/deepstream/deepstream-6.2/samples/configs/deepstream-app/source1_csi_dec_infer_resnet_int8.txt：
```
[source0] camera-width=1920 # 根据传感器最大分辨率设置 camera-height=1080 camera-fps-n=30 # 实际可达帧率
```
内存泄漏排查
定期检查内存使用：
```
watch -n 1 free -h
```
温度控制策略
配置风扇控制策略：
```
sudo jetson_clocks --fan
```

电源管理技巧
优化功耗配置：

sudo nvpmodel -m 0 # 最大性能模式 sudo jetson_clocks

对于需要长期运行的场景，建议添加看门狗定时器：

import subprocess def reset_watchdog(): subprocess.run(["echo", "1", ">", "/dev/watchdog"])

查看全文

http://www.cnnetsun.cn/news/2487110.html

LabVIEW项目移植必看：两种驱动文件存放位置的保姆级对比与实战选择

工业无线通信新选择：IO-Link Wireless嵌入式模块开发实战指南

Redis详解以应用场景

深入STM32WLE5的LoRa核心：对比SX126x裸驱与LoRaWAN协议栈，哪个更适合你的项目？

Redis缓存淘汰算法：LRU与LFU的实现原理与调优实战

动手搭建一个‘能源局域网’：基于开源硬件的微型能源路由器原型构想

RT-Thread实战：基于STM32F103的线程创建与LED控制

3分钟完成Windows包管理器Winget安装：PowerShell自动化部署方案

微博相册批量下载神器：三步搞定海量图片收藏

别再为RK3588 NPU环境头疼了！手把手教你用Conda搞定rknn-toolkit2安装（附国内源加速）

深入理解STM32的FSMC：如何像访问内存一样轻松驱动TFTLCD屏

开漏输出上拉电阻计算：从原理到I2C/GPIO实战选型

Android BroadcastReceiver 深度解析：原理、实践与面试指南

SpringBoot+Vue3实战：从零搭建一个咖啡店后台管理系统（附完整源码和数据库设计）

WPF TabControl美化实战：从默认丑到高级感，自定义样式与交互动画全攻略

基于HPM6750 RISC-V的PX4飞控硬件设计与移植实战

别再死记硬背了！用‘虚拟时间’这个比喻，5分钟彻底搞懂Linux CFS调度器

你的STM32 RTC时间总跑飞？可能是LSE晶振和电池备份没配对

别再为画图发愁了！手把手教你用开源神器draw.io搞定流程图和数学公式

毕业设计救星：用STC89C52单片机+AD采集，手把手教你做一个400Hz中频电源（附完整电路图）

逆向分析新思路：当Flutter遇上Frida，如何Hook加密函数并自吐算法参数？

Linux网络编程实战：从Socket基础到高并发服务器设计

从‘黑窗口’到彩色世界：用GLUT快速实现你的第一个OpenGL图形程序（含完整代码解析）

UnityPackage Extractor终极指南：快速免费提取Unity资源包

ADS1110与51单片机I2C通信详解：手把手教你驱动并读取三路电压（附常见问题排查）

用Python串口控制机械臂：从RS232协议解析到完整指令序列编程实战

从一次安全扫描告警说起：聊聊SSH Banner那点事与自定义的‘安全艺术’

华科计组实验通关秘籍：用Logisim搞定数据表示九大关卡（附避坑指南与源码）

告别C盘爆满！保姆级教程：在D盘用Qt在线安装器搞定6.2.4开发环境（附组件选择避坑指南）

OmniSharp-vim与fzf、vim-clap深度集成：提升C开发效率的7个关键点