(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111668793.0
(22)申请日 2021.12.3 0
(71)申请人 华南理工大 学
地址 510640 广东省广州市天河区五山路
381号
(72)发明人 赖成光 廖耀星 王兆礼 陈佩琪
(74)专利代理 机构 广州粤高专利商标代理有限
公司 44102
代理人 周春丽
(51)Int.Cl.
G06Q 10/04(2012.01)
G06Q 50/26(2012.01)
G06N 20/10(2019.01)
G06K 9/62(2022.01)
(54)发明名称
一种基于多输出机器学习算法的城市内涝
快速预报方法
(57)摘要
本发明公开了一种基于多输出机器学习算
法的城市内涝快速预报方法。 所述方法包括下述
步骤: 根据现有研究区的数据, 构建城市内涝模
型; 提取历史暴雨雨量时程分配信息, 生成不同
特征的暴雨, 通过构建的城市内涝模 型模拟构建
暴雨内涝数据库; 构建多输出随机森林模型, 以
降雨因子为自变量、 淹没深度为因变量, 利用暴
雨内涝数据库对多输出随机森林模型进行训练
和测试; 基于降雨预报输入条件, 通过构建的多
输出随机森林模型实现二维内涝淹没的快速和
实时预报 。 本发明方法对于城市内涝灾害预警与
预防、 防涝减灾等有重要意义, 能有效提高内涝
灾害高发地区的实时内涝灾情预报效率和精度,
可为内涝灾情快速预报提供一定程度的指导。
权利要求书3页 说明书10页 附图5页
CN 114372625 A
2022.04.19
CN 114372625 A
1.一种基于多输出机器学习算法的城市内涝快速预报方法, 其特征在于, 包括下述步
骤:
S1、 根据现有研究区的数据, 构建城市内涝模型;
S2、 提取历史暴雨雨量时程分配信息, 生成不同特征的暴雨, 通过构建的城市内涝模型
模拟构建暴 雨内涝数据库;
S3、 构建多输出随机森林模型, 以降雨因子为自变量、 淹没深度为因变量, 利用暴雨内
涝数据库对多输出随机森林模型进行训练和 测试;
S4、 基于降雨预报输入条件, 通过构建的多输出随机森林模型实现二维内涝淹没的快
速和实时预报。
2.根据权利要求1所述的一种基于多输出机器学习算法的城市内涝快速预报方法, 其
特征在于, 步骤S1中, 对现有研 究区的高程、 土地利用 和管网数据进行收集, 利用ArcGIS软
件将高程和土地利用数据进行裁 剪和提取, 对管网数据进行修 正和拓扑检查。
3.根据权利要求2所述的一种基于多输出机器学习算法的城市内涝快速预报方法, 其
特征在于, 步骤S1中, 构建 的城市内涝模型为基于暴雨径流管理模型(SWMM)和元胞自动机
模型(WCA 2D)的一二维水文水动力耦合模型;
构建的城市内涝模型中, 通过高程、 管网和土地利用数据构建暴雨径流管理模型
(SWMM); 将降雨资料输入到暴雨径流管理模型(SWMM), 由暴雨径流管理模型(SWMM)导出溢
流点空间位置及溢流过程, 输入 元胞自动机模 型(WCA2D)进 行积水二维模拟, 最后元胞自动
机模型(WCA 2D)输出淹没范围及淹没水深信息;
对构建的城市内涝模型进行率定及验证, 即通过调整模型参数直到城市内涝模型满足
模拟精度要求。
4.根据权利要求1所述的一种基于多输出机器学习算法的城市内涝快速预报方法, 其
特征在于, 步骤S2中, 所述 不同特征的暴雨是指不同重现期、 不同雨型的暴 雨;
不同雨型包括8种: Ⅰ型为单峰峰前, Ⅱ型为单峰峰后, Ⅲ型为单峰峰中, Ⅳ型为均匀雨
型,Ⅴ型为双峰一前一后, Ⅵ型为双峰靠前, Ⅶ型为双峰靠后, 以及芝加哥雨型。
5.根据权利要求4所述的一种基于多输出机器学习算法的城市内涝快速预报方法, 其
特征在于, 构建暴雨内涝数据库是指, 将不同特征的暴雨输入到所构建的城市内涝模型, 模
拟不同情景 下的淹没范围和积水深度。
6.根据权利要求1所述的一种基于多输出机器学习算法的城市内涝快速预报方法, 其
特征在于, 步骤S3中, 构建单输出回归树, 在单输出回归树中, 设y为单输出输出向量, 与节
点t相关的杂质i(t)被定义 为:
其中, yk是单输出输出向量y的观测值,
是单输出输出向量y在节点t的均 值, Nt是节
点t上的数据点数;
设一个单输出预测变量Xp将作为父节点的节点t在分割点c拆分为tL和tR两个子节点,
其中tL包括所有单输出预测变量Xp≤c的数据点, tR包括所有单输出预测变量Xp>c的数据权 利 要 求 书 1/3 页
2
CN 114372625 A
2点; 由于单输出预测变量Xp和分割点c分裂导致的与节 点t相关的杂质减少量
的计
算公式如下:
其中, Nt,NtL和NtR分别是节点t、 第一子节点tL和第二子节点tR处的数据点数。
7.根据权利要求6所述的一种基于多输出机器学习算法的城市内涝快速预报方法, 其
特征在于, 对于多输出随机森林算法, 多输出随机森林模型 的构建过程基于多输出回归树
模型; 构建多输出回归树时, 假设有N个实例的训练集D, 训练集D包括具有m个特征的多输出
预测变量赋值X1,…,Xm和具有d个目标的多输出响应变量赋值Y1,…,Yd, 即D={(x(1),y
(1)) ,…,(x(N),y(N))}; 实例l中包括以m个特征来描述自变量的多输出输入向量
以及d个目标的多输出输出向量
其中i∈{1, …,m},j∈{1, …,d},l∈{1, …,N}; 其中, x(l)和y
(l)分别表示实例l的多输出输入向量和多输出输出向量,
和
分别为实例l中第m个特
征下的输入向量 值和第d个目标 下的输出向量 值;
多输出回归树的构建步骤与 单输出回归树类似, 用多变量响应替换单变量响应的方法
将单输出回归树扩展到多输出回归树, 即多输出回归树是通过对多变量响应上的单变量杂
质度量求和重新定义节点的杂质, 具体如下:
式中:
表示第j个目标下y(l)的值,
表示节点中第j个目标下y(l)的平均值, 选择最
小化平方误差
的总和作为分割点; 多输出回归树的每个叶子均通过叶子上每个 实
例的多变量平均值、 实例数量及该叶子 定义的特 征值来表征;
最后, 通过基于随机 选择特征集的多输出决策树构建多输出随机森林模型。
8.根据权利要求7所述的一种基于多输出机器学习算法的城市内涝快速预报方法, 其
特征在于, 将暴 雨内涝数据库中的N个实例根据8 :2的比例划分为训练集D和 测试集T;
训练集D包括具有m个特征的预测变量赋值X1,…,Xm和具有d个目标的响应变量赋值
Y1,…,Yd;
降雨因子对应训练集D的X1,…,Xm, 淹没深度对应Y1,…,Yd。
9.根据权利要求8所述的一种基于多输出机器学习算法的城市内涝快速预报方法, 其
特征在于,
测试集T同样包括具有m个特征的预测变量赋值X1,…,Xm和具有d个目标的响应变量赋
值Y1,…,Yd, 测试集T和训练集D的区别在于来自不同的实例;
利用包括降雨因子和淹没深度的训练集D构建多输出随机森林模型, 通过测试集T检验权 利 要 求 书 2/3 页
3
CN 114372625 A
3
专利 一种基于多输出机器学习算法的城市内涝快速预报方法
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 20:26:41上传分享