高速公路车道级视频检测区自动设定方法

莫宇蓉; 吴烈阳; 彭锦辉; 刘圣卿; 唐先亮; 黎川; 符锌砂

doi:10.16503/j.cnki.2095-9931.2024.05.007

交通运输研究 >

2024 , Vol. 10 >Issue 5: 78 - 90

DOI: https://doi.org/10.16503/j.cnki.2095-9931.2024.05.007

理论与方法

高速公路车道级视频检测区自动设定方法

莫宇蓉 ^,¹ ,
吴烈阳 ¹ ,
彭锦辉 ^,²^,^* ,
刘圣卿 ¹ ,
唐先亮 ¹ ,
黎川 ¹ ,
符锌砂 ³

展开

¹ 江西省交通监控指挥中心，江西南昌 330046
² 比亚迪汽车工业有限公司，广东深圳 518118
³ 华南理工大学土木与交通学院，广东广州 510641

^* 彭锦辉（1992—），男，广东深圳人，硕士，高级工程师，研究方向为智慧交通系统。E-mail: 1961475178@qq.com

莫宇蓉（1969—），女，江西南昌人，高级工程师，从事高速公路运营监控管理工作。E-mail: 452374369@qq.com

收稿日期: 2024-01-03

网络出版日期: 2024-12-03

基金资助

国家自然科学基金项目(51978283)

江西省交通运输厅科技项目(2022X0037)

收起

An Automatic Configuration Method for Video-Based Lane-Level Detection Zones on Expressways

MO Yurong ^,¹ ,
WU Lieyang ¹ ,
PENG Jinhui ^,²^,^* ,
LIU Shengqing ¹ ,
TANG Xianliang ¹ ,
LI Chuan ¹ ,
FU Xinsha ³

Expand

¹ Traffic Monitoring & Command Center of Jiangxi Province, Nanchang 330046, China
² BYD Auto Industry Co., Ltd., Shenzhen 518118, China
³ School of Civil Engineering and Transportation, South China University of Technology, Guangzhou 510641, China

Received date: 2024-01-03

Online published: 2024-12-03

Fold

摘要

针对云台摄像枪在轮巡过程中无法自动设定视频检测区，从而影响交通事件识别准确率的问题，提出了一种基于视频的高速公路车道级检测区自动设定方法。首先，通过分析U-Net和MobileNet系列模型的特征，结合深度可分离卷积和倒置残差等结构，设计了一个高效且轻量化的R-Net系列模型，专门用于车道线和可行驶区域的语义分割。在此基础上，根据高速公路特定场景识别任务的特点，提出了一种基于连通域分析的车道线和检测区标记算法，实现了车道级检测区的自动设定。同时，为了提高标记算法的准确率，首次引入了阈值处理和叠加帧数这两种预处理方法，然后利用二次方程对车道线标记结果进行拟合，实现了车道线完整且平滑的分割。实验结果表明，R-Net系列模型的性能指标MIoU与传统模型如SegNet和U-Net接近，但显著减少了模型参数量和内积运算量，其中R-NetV2模型的分割性能指标MIoU达到90.6%，与U-Net相比仅下降了0.4%，但其模型参数量减少了38.7%，内积运算量减少了62.5%。对经过预处理后的语义分割结果进行标记，车道线标记准确率与传统方法相比从80.47%提高到95.58%。

关键词： 交通事件识别; 视频检测; 车道级检测区; 轻量化; 语义分割; 连通域; 车道线

本文引用格式

莫宇蓉 , 吴烈阳 , 彭锦辉 , 刘圣卿 , 唐先亮 , 黎川 , 符锌砂 . 高速公路车道级视频检测区自动设定方法[J]. 交通运输研究, 2024 , 10(5) : 78 -90 . DOI: 10.16503/j.cnki.2095-9931.2024.05.007

Abstract

The paper proposed an automatic configuration method for lane-level detection zones on expressways based on video, addressing the issue of the inability of Pan-Tilt-Zoom cameras to automatically set up video detection zones, which affected the accuracy of traffic event recognition. Firstly, by analyzing the features of U-Net and MobileNet series models, combined with structures such as depthwise separable convolution and inverted residuals, a lightweight and efficient R-Net series model was designed specifically for semantic segmentation of lane lines and drivable areas. On this basis, according to the characteristics of expressways' specific scene recognition tasks, an algorithm for lane lines and detection zones labeling based on connected component analysis was proposed, which achieved automatic configuration of lane-level detection zones. At the same time, in order to improve the accuracy of the labeling algorithm, two preprocessing methods, threshold processing and frame stacking, were introduced for the first time. Then, a quadratic equation was used to fit the lane labeling results, achieving complete and smooth segmentation of the lane lines. The experimental results showed that the performance metric MIoU of the R-Net series models was close to traditional models such as SegNet and U-Net, but significantly reduced the number of model parameters and inner product operations. Among them, the segmentation performance metric MIoU of the R-NetV2 model reached 90.6%, which was only 0.4% lower than U-Net, but its model parameter count was reduced by 38.7% and inner product operation was reduced by 62.5%. Labeling the preprocessed semantic segmentation results resulted in an increase in lane labeling accuracy from 80.47% to 95.58% compared to traditional methods.

Key words： traffic event recognition; video detection; lane-level detection zone; lightweight; semantic segmentation; connected component; lane line

0 引言

近年来，随着人工智能技术的不断发展，基于视频识别的高速公路交通事件智能检测系统逐渐成为智慧交通领域的研究热点。这些系统通常需要设定道路检测区，以便对各种交通事件进行准确检测。对于应急车道停车、频繁变道等事件的检测尤为重要，因此需要进行车道级检测区设定。目前，大多数道路检测区的设定是通过人工在画面上标画完成的，这种方法不适合经常轮巡的云台摄像枪。因此，开发一种基于视频的高速公路车道级检测区自动设定方法，对于交通事件智能检测系统非常必要。为了实现车道级检测区的设定，首先必须对道路上的可行驶区域和车道线进行语义分割，然后通过标记算法对这些区域进行划分。尽管目前在自动驾驶领域已经有许多关于道路车道线和可行驶区域的语义分割算法研究，但在高速公路交通事件智能检测领域，这方面的研究相对较少。

早期的研究主要依赖人工设计的特征建立模型进行车道线检测。如Bertozzi等^[1]提出的GOLD 系统是通过逆透视变换方法和模板匹配技术对车道线进行检测并确定车道线的具体位置；Betke等^[2]提出了利用HSV（Hue, Saturation, Value）色彩空间特征对车道线进行识别；Lee^[3]利用霍夫变换从图像中的边缘点提取直线实现对车道线的检测；刘富强等^[4]通过自适应随机霍夫变换方法、Tabu serch算法和基于粒子滤波器的跟踪算法实现对车道线快速且稳定的检测，并同时解决了霍夫变换不能检测出弯道的问题。近年来，深度学习成为机器视觉领域最流行的技术，在图像分类、目标检测和语义分割等方面都有广泛的应用。Wang等^[5]受到语义分割技术的启发，提出了LaneNet网络，可以检测到可变车道的数量。为了提高对被遮挡的车道线的检测准确度，Pan等^[6]提出了空间卷积神经网络（Spatial Convolutional Neural Network, SCNN）。SCNN将传统的深层逐层卷积推广到特征映射中的逐片卷积，实现了层中行与列之间的像素间消息传递，从而推理出被遮挡的车道线位置。Wu等^[7]为了提高对车辆、车道线和可行驶区域的识别效率并减少计算资源占用，提出了一种多任务学习网络（YOLOP），它可以基于同一条主干网络同时检测出车辆、车道线和可行驶区域。与传统方法相比，基于深度学习的车道线和可行驶区域的检测方法的鲁棒性更好、泛化性能更强，但由于其参数量大、计算复杂度高和占用的计算资源多，限制了其在实际工程中的应用。U-Net^[8]是一种专为图像分割任务设计的神经网络结构，于2015年被首次提出。该模型以其对称的编码器-解码器结构和跳跃连接闻名，这些特点使其能够在保留空间信息的同时有效地进行特征提取和重建。U-Net在医学图像分析中尤其受到青睐，因为它能够处理小样本数据集并生成精确的分割结果。MobileNet^[9⇓-11]是由谷歌公司开发的一种轻量级深度神经网络，旨在为移动和嵌入式视觉应用提供高效的计算解决方案。其核心是深度可分离卷积，这种卷积操作将标准的卷积分解为一个深度卷积和一个1×1卷积，显著减少了参数量和计算成本，同时保持了网络的性能。

在既有研究中，经典的语义分割网络（如U-Net）和主流的轻量化网络（如MobileNet）已经在多个领域展示了其强大的性能。然而，这些模型在公路监控场景下的车道线和可行驶区域检测方面仍存在一些不足。特别是当其布署在老旧设备上时，模型的参数量和内积运算量较大，导致计算资源消耗高，难以满足实时性要求。此外，目前缺乏专门针对公路监控场景的车道线和可行驶区域检测数据集，这限制了模型在该领域的应用。本文的研究旨在解决上述问题，通过改造U-Net语义分割网络，利用MobileNet系列模型的轻量化特性，实现在保持工程应用精准度的基础上尽量轻量化网络。具体而言，首先收集并标注一个基于公路监控图像的车道线和可行驶区域的数据集，以填补现有数据集的空白。然后，从模型参数量、内积运算量和分割性能指标等3个方面与SegNet和U-Net进行比较，验证所建语义分割模型的优势。接下来，基于连通域分析的标记算法对车道线和可行驶区域进行标记，划分出上下行区域和不同位置的车道，以期最终实现车道线检测区的自动设定，从而提高交通事件识别的准确率，为高速公路交通事件智能检测提供一种高效且轻量化的解决方案。

1 车道线和检测区的语义分割算法

1.1 U-Net网络结构的特点

U-Net图像分割算法最早是用于医疗行业的病理图像分割，由于其出色的图像分割性能，该算法结构逐渐被应用到其他行业，例如路面裂缝图像的分割等。U-Net使用了编码器-解码器结构，如图1所示。该网络结构最主要的一个特点是使用了跳层连接，通过跳层连接将浅层的特征信息与深层的语义信息相结合，从而提高图像分割的性能。U-Net是一个十分经典的网络，后续很多的语义分割网络都受到其启发或者在其基础上进行改进。因此，本文将U-Net的基本结构作为语义分割模型的骨架。

卷积类型	参数量	运算量	比例
标准卷积	D_k×D_k×M×N	D_k×D_k×M×N×D_w×D_h	1
深度可分离卷积	D_k×D_k×M+ M×N	D_k×D_k×M×N×D_w×D_h+ M×N×D_w×D_h	1/N+ 1/D_k²

场景	训练集数量	验证集数量	测试集数量	合计
公路	10 848	1 356	1 356	13 560
桥梁	1 992	249	249	2 490
隧道	424	53	53	530
合计	13 264	1 658	1 658	16 580

模型	IoU（%）			MIoU （%）	模型参数量/MB	内积运算量/GB
模型	车道线	检测区	背景	MIoU （%）	模型参数量/MB	内积运算量/GB
SegNet	68.3	95.4	94.9	94.1	28.08	502.03
U-Net	58.3	91.8	92.7	91.0	7.76	174.88
R-NetV1	54.7	89.8	91.5	89.3	3.76	129.56
R-NetV2	52.5	91.5	92.5	90.6	4.76	65.63
R-NetV3	39.7	88.0	90.5	87.6	1.03	20.30

帧序号	平均准确率(%)
帧序号	1	2	3	4	5	6	7		8	9	10
检测区	100	100	100	100	100	100	100		100	100	100
车道线	80.47	87.91	91.31	91.46	92.05	93.44	94.04		94.57	94.57	95.10
帧序号	平均准确率(%)
帧序号	11	12		13	14	15	16	17	18	19	20
检测区	100	100		100	100	100	100	100	100	100	100
车道线	95.58	95.58		95.58	95.58	94.39	94.39	94.39	93.79	93.79	93.32

模态框（Modal）标题

摘要

本文引用格式

Abstract

0 引言

1 车道线和检测区的语义分割算法

1.1 U-Net网络结构的特点

图1 经典U-Net网络结构图

1.2 深度可分离卷积结构

图2 标准卷积过程

图3 深度可分离卷积过程

表1 标准卷积与深度可分离卷积的对比

1.3 倒置残差结构

图4 残差结构的卷积过程

图5 倒置残差结构的卷积过程

1.4 轻量化网络模型设计

图6 基于U-Net 网络架构设计的网络模型

图7 倒置残差模块1~模块9 的组织架构图

2 基于连通域分析的车道线和检测区标记算法

图8 连通关系示意图

3 车道线和检测区的语义分割实验

3.1 实验数据集

表2 实验数据集中各场景下的样本数量

图9 数据集部分样本实例

3.2 实验设置

3.3 实验结果分析

表3 各模型的实验结果对比

图10 部分分割结果可视化图对比

4 车道线和检测区的标记实验

4.1 实验模型和数据集

4.2 标记前的预处理方法

图11 预处理前后的对比图

4.3 实验结果分析

表4 第1帧~第10帧的平均准确率

图12 平均准确率变化趋势图

图13 部分标记结果示例

4.4 标记后的拟合方法

图14 原图、语义分割图、标记图和拟合图对比示例

图15 不同场景下的车道线检测效果

5 结束语

参考文献