当前位置：首页 > news >正文

YOLOv5/v8实战：用这个交通场景数据集，快速提升你的模型识别红绿灯灯色能力

news 2026/5/31 8:05:58

YOLOv5/v8实战：6类别交通灯数据集精细调优指南

从行车记录仪到精准识别：为什么需要细分灯色数据集？

去年夏天，我在一个智慧城市项目的验收现场目睹了尴尬一幕：演示车辆将200米外闪烁的黄灯误判为红灯，导致系统误触发紧急制动。这个案例让我深刻意识到，通用目标检测模型在交通灯识别场景中的局限性。传统3类别标注（行人/斑马线/交通灯）只能判断交通灯的存在，而实际应用需要精确到灯色状态——这正是6类别数据集（红灯/绿灯/黄灯/黑灯+行人/斑马线）的价值所在。

行车记录仪视角的交通灯检测面临三大核心挑战：

小目标问题：50米外的交通灯在1080p画面中可能仅占20×20像素
状态判别：同一灯体在不同时刻可能显示红/绿/黄不同状态
环境干扰：逆光、夜间低照度、雨雪天气等复杂条件

通过对比实验发现，使用相同YOLOv5m模型：

3类别数据集：mAP@0.5可达0.95，但灯色识别准确率不足40%
6类别数据集：初始mAP@0.5约0.7，经调优后可达0.85+，且灯色识别准确率提升至90%+

# 数据集结构示例 dataset/ ├── images/ │ ├── train/ │ └── val/ └── labels/ ├── train/ │ ├── frame00001.txt # 格式: class x_center y_center width height │ └── ... └── val/

数据工程：从原始视频到高质量训练集

2.1 数据准备关键步骤

原始视频抽帧过程中常见三个陷阱：

帧率过高导致相邻帧差异过小（建议间隔0.3-0.5秒抽帧）
未校验标签与帧的对应关系（约5%的标注错位需要人工复核）
存储空间预估不足（6类别完整数据集需要约25GB空间）

视频抽帧内存优化方案：

def optimized_frame_extraction(video_path, target_fps=2): cap = cv2.VideoCapture(video_path) original_fps = cap.get(cv2.CAP_PROP_FPS) frame_interval = int(original_fps / target_fps) while True: ret = cap.grab() # 快速跳帧 if not ret: break frame_pos = int(cap.get(cv2.CAP_PROP_POS_FRAMES)) if frame_pos % frame_interval == 0: ret, frame = cap.retrieve() # 处理帧...

2.2 数据分布分析与增强策略

通过分析6类别数据集的标注分布，我们发现两个典型特征：

类别	平均宽度(pixels)	平均高度(pixels)	主要分布区域
红灯	18.7	22.3	画面顶部1/3
绿灯	17.9	21.8	画面顶部1/3
黄灯	16.2	19.5	画面右侧1/4
黑灯	15.8	18.3	分散分布

基于此设计增强策略：

空间增强：侧重顶部区域的RandomCrop（保留顶部60%区域）
色彩增强：针对红/绿灯加强HSV空间的S通道扰动
小目标增强：使用4x超分辨率预处理远距离交通灯

注意：避免同时应用Mosaic和RandomAffine增强，这会导致小目标过度变形

模型训练：从基准到优化的完整路径

3.1 基准模型建立

使用YOLOv8n作为基线模型的配置要点：

# yolov8_traffic.yaml train: ../dataset/images/train val: ../dataset/images/val nc: 6 # 类别数 names: ['red', 'green', 'yellow', 'black', 'pedestrian', 'zebra_crossing'] anchors: - [4,5, 8,10, 13,16] # 针对小目标调整 - [23,29, 43,55, 73,105] - [146,217, 231,300, 335,433]

关键训练参数初始设置：

参数	值	说明
imgsz	1280	保留更多小目标信息
batch	16	根据GPU显存调整
epochs	300	早停机制通常200轮触发
lr0	0.01	配合warmup使用
weight_decay	0.0005	防止过拟合

3.2 进阶优化技巧

Anchor优化实战：

使用k-means重新聚类数据集标注框

python utils/autoanchor.py --data traffic.yaml --img-size 1280

将输出结果更新到模型配置文件中
验证新anchors的适应度（目标>0.90）

分层学习率配置：

# 在YOLOv8的train.py中添加 optimizer.param_groups[0]['lr'] = lr * 0.1 # 骨干网络 optimizer.param_groups[1]['lr'] = lr * 1.0 # 检测头

关键指标解读：

mAP@0.5-0.95：综合考量不同IoU阈值下的表现
Precision-Recall曲线：关注高置信度样本的准确率
类别平衡分析：确保没有特定类别被忽视

部署优化：让模型在实际场景中更可靠

4.1 后处理优化方案

交通灯识别特有的后处理需求：

状态稳定性滤波：连续3帧相同状态才输出
空间聚类：合并相邻检测框（同一灯体的多检测）
逻辑校验：同一灯体不可能同时显示红/绿灯

class TrafficLightPostprocessor: def __init__(self): self.state_buffer = {} def process(self, detections, frame_idx): for det in detections: if det.class_id in [0,1,2,3]: # 仅处理灯色类别 box_center = (det.x + det.width/2, det.y + det.height/2) matched = False for light_id, history in self.state_buffer.items(): if self._check_proximity(box_center, history['position']): history['states'].append(det.class_id) matched = True break if not matched: self.state_buffer[len(self.state_buffer)] = { 'position': box_center, 'states': [det.class_id] } # 应用稳定性规则 results = [] for light_id, data in self.state_buffer.items(): if len(data['states']) >= 3: mode_state = max(set(data['states'][-3:]), key=data['states'][-3:].count) results.append({ 'light_id': light_id, 'state': mode_state, 'position': data['position'] }) return results

4.2 边缘设备优化策略

针对Jetson Xavier NX的优化对比：

优化方法	推理速度(FPS)	mAP@0.5	显存占用
FP32原始模型	18	0.82	4.1GB
TensorRT-FP16	43	0.81	2.8GB
剪枝+量化(INT8)	62	0.79	1.5GB
知识蒸馏版	55	0.80	1.8GB

实际项目中，我们采用TensorRT-FP16方案，在保持精度的同时实现2.4倍加速

典型问题排查手册

问题1：模型将路灯误识别为交通灯

解决方案：
1. 检查训练集中是否包含足够多的负样本
2. 增加交通灯的空间位置先验（通常位于画面顶部）
3. 在数据增强中添加随机路灯作为背景干扰

问题2：夜间模式识别准确率骤降

优化方向：

单独收集夜间数据并重新标注
在预处理中添加低照度增强：

def low_light_augment(image): hsv = cv2.cvtColor(image, cv2.COLOR_BGR2HSV) hsv[...,2] = hsv[...,2]*random.uniform(0.3,0.7) return cv2.cvtColor(hsv, cv2.COLOR_HSV2BGR)

问题3：远距离小交通灯漏检