您的当前位置：首页基于深度学习算法的水位识别方法研究

基于深度学习算法的水位识别方法研究

来源：哗拓教育

第 3 期 2020 年 6 月

DOI: 10.19364/j.1674-9405.2020.03.009

水利信息化

Water Resources Informatization

NO.3Jun.,2020

基于深度学习算法的水位识别方法研究

12341

王磊，陈明恩，孟凯凯，温进化，周鹏程

（1. 浙江省水资源管理中心，浙江杭州 310007；2. 杭州定川信息技术有限公司，浙江杭州 310020；3. 杭州朗澈科技有限公司，浙江杭州 311100；4. 浙江省水利河口研究院，浙江杭州 310020）

摘　要：为了提高国家水资源管控能力灌区计量监控点运行质量，提出一种基于深度学习算法的实时水位识别方法，该方法主要由 YOLO-v3 对象检测和 ResNet 刻度识别 2 种模型构成。通过算法设计、训练和集成，实现与浙江省水资源监控信息平台的集成应用。算法测试结果显示，该方法的测试识别、实际运行准确率和识别响应速度基本达到实际使用需求。随着模型训练数量增加，该方法水位识别进度将继续提高，并具备向检测断面现场环境识别拓展的应用空间。

关键词：水尺；水位；人工智能；深度学习；对象检测；图像识别

中图分类号：P332.3 　　　文献标识码：A　　　　文章编号：1674-9405(2020)03-0039-05

1 研究背景

水位是河流湖库的基本水文要素之一，也是国家水资源监控能力灌区农业在线计量监测点建设需要采集的关键数据，因此稳定可靠的水位监测数据对于流域水资源管理具有重要意义。当前，水位自动监测方法主要有浮子式、压力式、超声波式和雷达式自动水位计等，以及传统的图像识别方法。这些方法存在自动化程度低、建设运维成本高、易受现场环境影响、适应性较差等问题。

2012 年，Krizhevsky 等人基于深度学习理论搭建的 AlexNet [1] 在图像分类比赛 ILSVRC [2] 中赢得冠军，不管是分类效果还是速度都表现出绝对的优势。深度学习理论在计算机视觉领域迅速发展，获得 ILSVRC 大赛冠军的 ZFNet [3]，VGG-Net [4]，GoogleNet [5] 和 ResNet [6] 均是基于深度学习的图像分类算法，这些算法分类正确率越来越高，训练速度也越来越快。另外，基于深度学习的对象检测算法也日趋成熟，多阶段方式的 R-CNN [7] 是第 1 个将深度学习理论有效应用于对象检测任务的算法，随后发展出许多单阶段和多阶段方式的优秀算法 [8–13]，

收稿日期：2019-11-18

这些算法不仅在精度上大幅提升，而且在推理速度上不断加快。目前，基于深度学习的计算机视觉技术已成功应用于安防监控、电子医疗、无人驾驶、智能支付等领域。

为解决现有水位监测方法存在的问题，本研究提出了一种基于深度学习算法的实时水位识别方法，并初步应用于国家水资源监控能力项目运行中。

2 智能算法设计

2.1 流程设计

监控视频获取的水尺图像千差万别，水尺往往只占整张图像的很小一部分，直接识别图像刻度信息误差较大。为了提高识别方法适用性和准确性，算法按 2 个步骤识别图像水位信息：1）基于对象检测算法，检测出图像中水尺的位置，并裁剪出水尺图像；2）基于深度学习的图像识别算法识别图像中出现的水尺刻度线数量，并根据水尺总长及刻度线表示的长度，计算出当前水位，流程如图 1 所示。

2.2 模型选择

本方法主要由水尺对象检测和刻度识别算法

作者简介：王磊（1982-），男，浙江永康人，硕士，高级工程师，研究方向：水资源管理与信息化。E-mail: szszy_wl@zjwater.gov.cn

N×5 + [3 N %3-1] ， (1)L = Z - 3式中：N % 3 为 N 对 3 求余数。

水尺原图采集

水尺对象检测识别水尺图像中水尺位置

输出图像中水尺位置([])3 算法训练

3.1 数据准备与预处理

训练数据均来自国家水资源监控能力农业灌区

56 cm根据公式换算输出最终水尺刻度水尺刻度识别水尺中数字和符号数量截取原图像中水尺图像

计量监测点所拍摄的现场图片，图片分辨率为 1280×960。模型对采集图片要求：图片分辨率不能小于 800×700，图片中水尺宽度不能小于 30 像素，水面上高度至少有 2 点刻度。水尺刻度清晰可人工读取，不能有树叶或泥巴等遮挡，不能曝光过度或者光线过暗。然后对满足要求的图片进行人工标注，标注图片中的水尺位置及水面上水尺刻度线的数量。

在对象检测阶段，训练集、验证集和测试集分别有标注图片 60 000，10 000 和 10 000 张。每张图片标签为图中水尺的位置，在数据预处理阶段对图片进行了随机翻转、小区域随机裁剪，以及亮度、对比度、透明度随机调整等操作，提高算法的泛化能力。并将图片的分辨率统一调整为 352×352。

在水尺刻度识别阶段，训练集、验证集和测试集分别有 80 000，8 000 和 8 000 张图片，在对算法进行训练之前对图片进行随机翻转、小区域随机裁剪，以及亮度、对比度、透明度随机调整等操作，并将图片的分辨率统一调整为 100×350。

图 1 算法流程

组成。为满足实际场景中水位识别的准确性和实时性，分别选择 YOLO-v3 [14] 和 ResNet 网络算法检测水尺对象和识别水尺刻度。 2.2.1 水尺对象检测算法

水尺对象检测算法选用 YOLO-v3 的 105 层版本模型。该模型的骨干网络是 darknet-53 的特征提取网络，除去最后的全连接层，共有 52 个卷积层，由大量的残差模块组成。

该模型采用多尺寸融合的方式做检测。在darknet-53 网络后分别连接 3 个不同的分支，每个分支输出的特征图的大小不一样，而应用在每一个特征图上的候选框的大小也不一样，这样极大地提升了模型对于不同尺寸的目标的检测能力。

该模型由原来的单标签分类提升为多标签分类，即在一些复杂场景中，1 个对象可能属于多个类别，且准确率不会下降。

经验证，YOLO-v3 的 105 层版本仍然可以达到 51 帧/s 的识别速度，可以满足水尺检测对实时性的要求；识别精度高，在 MS COCO（Microsoft Common Objects in Context）测试数据集 [15] 上可以达到 33 mAP（平均精度均值）。2.2.2 水尺刻度识别算法

3.2 模型参数设置与训练

3.2.1 对象检测阶段

在对象检测阶段，首先基于 ImageNet 数据集预训练模型，然后基于该预训练模型在对象检测标注数据集上进行训练。

优化算法选择 Adam 梯度优化算法 [16]。和传统的随机梯度下降不同的是，Adam 梯度优化算法通过计算梯度的一阶和二阶矩估计为不同的参数设计独立的自适应性学习率，而传统的随机梯度下降保持单一的学习率更新所有的参数。步长因子 alpha、一阶矩的和二阶矩的指数衰减率 beta1 和 beta2 分别设置为默认值：0.001，0.900 和 0.999。

学习率设置分别采用指数衰减法和自定义模式，开始训练的学习率设置较大，使模型迅速逼近最优解，之后逐渐降低学习率使模型收敛。考虑到对象检测模型是基于 ImageNet 数据集预训练模型的基础上训练的，所以初始学习率设置较小，为

在水尺刻度识别模块，本研究选择 ResNet 网络的 34 层版本。ResNet 网络引入了跳层连接，在每一个残差块里使用跳层连接，由卷积操作、层层堆叠的残差块加上最后的全连接层等组成 ResNet 网络。ResNet 网络解决了随着网络层数的增加，网络学习退化的问题，同时也解决了由网络深度引起的梯度弥散问题。

ResNet 网络输出结果为水尺水面上的刻度线数量 N，根据实际水尺刻度表示的长度，以及水尺总长 Z，得出当前的水位高度 L：

0.001。自定义学习率设置多组，如表 1 所示。

表 1 对象检测算法学习率设置表

组 1

训练周期

（Epoch）学习率[0，99]

0.001

组 2

训练周期

（Epoch）学习率[0，79][79，109]

0.0010.000 1

组 3

训练周期

（Epoch）学习率[0，109]

0.001

3）召回率（R，Recall Rate）。召回率表示，测试集中所有正样本被预测为正样本的比例。在本对象检测算法中表示，所有真实标注框被预测为候选框的比例。如果预测候选框与真实框的 IoU 大于等于 0.7，即为预测正确。

4）准确率（Acc，Accuracy）。在水尺刻度预测阶段，使用准确率评估水尺刻度预测的效果。水尺刻度预测结果与标注结果相差小于等于 2 cm，即为预测正确。

[100，129]0.000 1[130，169]0.000 01[170，+∞)0.000 001

[110，149]0.0001[150，189]0.00001

[110，159]0.000 01

[160，+∞)0.000 001[190，+∞)0.000001

注：当 1 个完整的数据集通过了神经网络 1 次并且返回了 1 次，这个过程称为 1 个 Epoch。

3.4 模型训练效果分析

3.4.1 对象检测阶段

基于 60 000 个训练样本，分别使用学习率的指数衰减法和自定义模式训练模型，损失函数值随着训练 Epoch 增加，变化规律如图 2 所示。经过 170 个Epoch，随着训练迭代次数的增加，损失函数值无限接近于 0，基本不再变化，可判断模型收敛。

2 500损失函数值2 0001 5001 000 500

10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200训练周期a 整体变化

指数衰减组 1 组 2 组 36

543210

135 140 145 150 155 160 165 170 175 180 185 190 195 200

训练周期b 部分放大

指数衰减组 1 组 2 组 3

考虑到内存需求和学习率等，训练 batch size 设置为 32。

3.2.2 水尺刻度识别阶段

在水尺刻度识别阶段，同上阶段优化算法选择Adam 梯度优化算法。

学习率设置分别采用指数衰减法和自定义模式。考虑到训练任务及避免梯度爆炸，初始学习率设置为 0.1。自定义学习率设置多组，如表 2 所示，训练 batch size 设置为 64。

表 2 水尺刻度识别算法学习率设置表

组 1

训练周期

（Epoch）学习率[0，119][120，199][200，229][230，+∞)

0.10.010.0010.000 1

组 2

训练周期

（Epoch）学习率[0，99][100，169][170，209][210，+∞)

0.10.010.0010.000 1

组 3

训练周期

（Epoch）学习率[0，139][140，229][230，259][260，+∞)

0.10.010.000 10.001

以上 2 个算法训练均在配置有 NVIDIA GTX 1080Ti 显卡的服务器上完成。

3.3 模型评估指标选取

1）每秒帧数（FPS，Frame Per Second）。为满足本研究方法在实际应用时的速度要求，使用 FPS测量对象检测模块的速度。FPS，即每秒可以处理的图片数量，越大表明算法检测对象速度越快。

2）交并比（IoU，Intersection over Union）。IoU 表示算法检测的候选框 C 与真实标注的候选框 G 的重叠程度，值越大，表明重叠程度越高，为 1时表示完全重合：

C∩GIoU = 。 (2)

C G∩损失函数值图 2 训练过程中不同学习率下损失函数值变化趋势图

由图 2 可以看出，在自定义学习率组 1 模式下，模型收敛时损失函数值最小，该模型学习效果最好。在自定义学习率组 1 模式下，验证集召回率变化如图 3 所示。模型收敛后，在 10 000 个验证样本上进行验证，平均验证召回率为 94.3%。在 10 000 张测试集上测试召回率为 93.2%，FPS 为 35。

指数衰减组 1 组 2 组 38

76543210

175 180 185 190 195 200 205 210 215 220 225 230 235

训练周期b 部分放大

1.0 0.90.80.70.60.50.40.30.20.1 0

1 15 29 43 57 71 85 99 113 127 141 155 169 训练周期a 整体变化

0.944 5 0.944 0 0.943 5 0.943 0 0.942 5 0.942 0 0.941 5 0.941 0 0.940 5 0.940 0 0.939 5

167 168 169 170 171 172 173 174 175 176 177

训练周期

b 部分放大

召回率准确率损失函数值召回率图 4 训练过程中不同学习率下损失函数值变化趋势图

1.21.0 0.80.60.40.2 0

1 17 33 49 65 81 97 113 129 145 161 177 193 209 225

迭代次数a 整体变化

0.963 0.962 0.961 0.960 0.959 0.958 0.957 0.956

209 210 211 212 213 214 215 216 217 218 219 220 221

迭代次数b 部分放大

图 3 训练过程中验证集召回率随 Epoch 变化趋势图

3.4.2 水尺刻度识别阶段

基于 80 000 个训练样本，分别使用学习率的指数衰减法和自定义模式训练模型，损失函数值随着训练 Epoch 增加，变化规律如图 4 所示。经过 210 个Epoch，随着训练迭代次数的增加，损失函数值无限接近于 0，基本不再变化，可判断模型收敛。

由图 4 可以看出，在自定义学习率组 1 模式下，模型收敛时损失函数值最小，该模型学习效果最好。在自定义学习率组 1 模式下，验证集召回率变化如图 5 所示。在 10 000 个验证样本上进行验证，模型收敛后平均验证召回率为 96.1%。在 8 000 个测试样本上进行测试，测试准确率为 95.7%。

5 0004 5004 0003 5003 0002 5002 0001 5001 000 500 0

准确率图 5 训练过程中验证集准确率随 Epoch 变化趋势图

4 算法集成与应用

4.1 算法部署

文中所有算法均基于谷歌 DistBelief 研发的第 2 代人工智能学习系统 Tensorflow 框架并使用 Python 实现。训练好算法的图信息和参数值以 Tensorflow的二进制格式保存在磁盘中，再使用 Tensorflow 的 Java 接口将预训练的模型封装在智能识别系统中，最后系统以后台独立运行的程序对外提供识别服务。整个系统采用前后端分离架构，从而使得后台接口既可以向前端提供，也可以独立出来向第三方系统提供，提高应用灵活性。水资源监控信息平台只需调用系统的网络接口，向接口传递要预测的水尺图片，接口经过后台推理计算后，将

指数衰减组 1 组 2 组 3

损失函数值 32 64 96 128 160 192 224 256 288

训练周期a 整体变化

结果返回平台，从而实现水位自动识别。

参考文献：

[1] KRIZHEVSKY A, SUTSKEVER I, HINTON G. Imagenet classiﬁcation with deep convolutional neural networks[J]. Neural Information Processing Systems, 2012 (25): 1106-1114. [2] BERG A, DENG J, LI F F. Large scale visual recognition challenge 2010[EB/OL]. [2019-07-10]. http://www.docin.com/p-1423368694.html.

[3] ZEILER M, FERGUS R. Visualizing and understanding convolutional networks[C]//Proceedings of European Conf-erence on Computer Vision, LNCS 8689. Berlin: Springer, 2014: 818-833.

[4] SIMONYAN K, ZISSERMAN A. Very deep convolutional networks for large-scale image recognition[C]// InternationalConference on Interdisciplinary Research. Singapore: ICIR, 2015: 110-124.

[5] SZEGEDY C, LIU W, JIA Y, et al. Going deeper with convolutions[C]// IEEE Conference on Computer Vision andPattern Recognition. Phoenix: IEEE Conference on Computer Vision and Pattern Recognition, 2015: 1-9.

[6] HE K, ZHANG X, REN S, et al. Deep residual learning for image recognition[C]// IEEE Conference on Computer Vision and Pattern Recognition. Phoenix: IEEE Conference on Computer Vision and Pattern Recognition, 2016: 770-778.[7] GIRSHICK R, DONAHUE J, DARRELL T, et al. Rich feature hierarchies for accurate object detection and semantic segmentation[C]//IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas: CVPR, 2014: 564-597.[8] HE K, ZHANG X, REN S, et al. Spatial pyramid pooling in deep convolutional networks for visual recognition[C]//European Conference on Computer Vision. Zurich: ECCV,2014: 346-361.

[9] LIU W, ANGUELOV D, ERHAN D, et al. SSD: Single shot multibox detector[C]// European Conference on ComputerVision. Amsterdam: ECCV, 2016: 21-37.

[10] GIRSHICK R B. Fast R-CNN[C]//IEEE International

Conference on Computer Vision. Santiago: ICCV, 2015:212-226.

[11] REN S, HE K, GRISHICK R, et al. Faster r-cnn: Towards

real-time object detection with region proposal networks[J]. IEEE Transactions on Pattern Analysis and MachineIntelligence, 2017, 39 (6): 1137-1149.

[12] REDMON J, DIVVALA S, GRISHICK R, et al. You only

look once: Unified, real-time object detection[C]//IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas: CVPR, 2016: 779-788.

（下转第 56 页）

4.2 应用功能开发

为了更有效地服务于国家水资源监控能力灌区计量监测点运行管理，水资源监控信息平台开发了水位自动识别功能模块，具备历史预测结果展示、水尺基础信息配置和数据库服务配置等功能，实现了雷达式水位计上报数据与同步图片水位识别数据的自动比对，达到了定期自动对雷达式水位计运行情况进行监控校核的预期目标。以 2019 年 4 月为例，共自动识别水尺图片 6 500 张，识别正确率为 95.3%。

服务配置即数据库配置，需用户提供用户的及用于保存用户信息的 MySQL 数据库的相关信息，MySQL 服务器配置需要提供数据库地址、端口号、数据库名称、用户名和密码等信息，同时可以设置异常图片存储路径，用于保存识别为异常的图片。

完成数据库配置后会出现已有站点列表，需要根据每个点位配置该点位水尺的总长度，智能识别系统将根据水尺总长配置和智能识别的刻度计算得出实际水位值。

历史预测结果展示即展示历史预测结果的详细信息，此设计出于系统可追溯性和可靠性的考虑，后台将每次预测的结果和原图片数据统一保存在系统本地数据库中，方便用户查看历史预测数据和后期系统优化。历史预测结果展示可以展示站点编号、该数据识别的图片、图片采集时间、摄像头编号、水位预测值和预测的水尺状态等信息。

5 结语

本研究创造性地将深度学习相关算法应用于水尺水位识别，并在国家水资源监控能力灌区监测点运行管理中得到了初步应用。该识别方法具有准确率高、泛化能力强、识别速度快、环境适应能力强等特点，测试识别准确率达 95.7%，实际运行准确率达 95.3%，每张图片识别速度为 200 ms 左右。该识别方法可封装成智能识别系统，利用 Java 接口提供第三方服务，部署应用灵活，适应能力强。

该识别算法具有迭代升级的能力，随着训练样本量的持续增加，预测精度将继续提高，在特定应用场景可直接替代雷达水位计等传统监测手段。同时，可以深度挖掘图像信息，将现场监测干扰因素作为识别目标，实现检测环境异常自动预警，提高计量监测运行维护效率。

Study about issues in assessment of water resources monitoring stations trial running(1. Water Resources Management and Service Center of Guangxi Autonomous Region, Nanning 530023, China;

2. Information Center, the Ministry of Water Resources, Beijing 100053, China)

Abstract: The qualiﬁed operation of the water resources monitoring station group is the prerequisite for the completion and acceptance transfer of the contract for the completion of the national water resources monitoring capacity construction project. It puts forward a set of assessment methods for the water resources monitoring station group trial operation, from the perspectives of setting indicators, monitoring station fault response and trial operation starting conditions, and conducting research on the national water resources monitoring capacity building Guangxi project as an example. The test of the station group ran from May 1st to July 31st, 2019. The trial operation was smooth, the various assessment indicators met the requirements, and the station group operation was basically stable, meeting the technical evaluation conditions. In addition, aiming at that the individual indicators are found difﬁcult to calculate in the assessment of various indicators , and the evaluation criteria are not reasonable enough, etc., during the studing, it deeply studies the station group operation integrity rate, mean time between failures, water source water quality monitoring, the station evaluation index, the accuracy judgment method of the monitoring data and the reorganization rules, and puts forward suggestions for improvement of the trial operation assessment.Key words: water resources; monitoring; monitoring system; trial running; assessmentCHEN Jinyun 1, MEI Lin 2, DONG Jianfan 1, ZHENG Xiaoqing 1

（上接第 43 页）

[13] LIU W, ANUGULOV D, ERHAN D, et al. Ssd: Single shot

multibox detector[C]//Netherlands: European Conference on Computer Vision. Amsterdam: Springer, 2016: 21-37. [14] REDMON J, FARHADI A. Yolo9000: Better, faster,

stronger[C]// Computer Vision and Pattern Recognition. SanDiego: IEEE, 2017: 6517-6525.

[15] LIN T Y, MAIRE M, BELONGIE S, et al. Microsoft coco:

Common objects in context[C]//Computer Vision. Zurich: Springer, 2014: 740-755.

[16] KI NGMA D, BA J. ADAM: A method for stochastic

optimization[C]//IEEE International Conference on Learning Representations. San Diego: ICLR, 2015: 876-888.

Research on water level recognition method based on deep learning algorithms(1. Zhejiang Water Resources Management Cente, Hangzhou 310012, China;2. Hangzhou Dingchuan Information Technology Co., Ltd., Hangzhou 310020, China;

3. Hangzhou Langche Technology Co., Ltd., Hangzhou 311100, China;4. Zhejiang Institute of Hydraulics and Estuary, Hangzhou 310020, China)

Abstract: In order to improve the operation quality of national water resources management and control capacity for monitoring points in irrigation areas, a real-time water level identiﬁcation method based on deep learning algorithm is proposed in this paper. The method is mainly composed of YOLO-v3 object detection model and ResNet scale recognition model. Through algorithm design, training and integration, the article realizes the integrated application with Zhejiang water resources monitoring information platform. The results of algorithm test and trial run show that the accuracy rate of test recognition, the accuracy rate of actual operation and the speed of recognition response of the method basically meet the needs of actual use. With the increase of the number of the model training dataset, the progress of water level identiﬁcation will continue to improve, and it has the application space to expand to the ﬁeld environment identiﬁcation of detection section.

Key words: water gauge; water level; artiﬁcial intelligence; deep learning; object detection; image recognition

WANG Lei 1, CHEN Ming′en 2, MENG Kaikai 3, WEN Jinhua 4, ZHOU Pengcheng 1

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文