(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111633421.4
(22)申请日 2021.12.2 9
(71)申请人 上海中楠水电配套工程有限公司
地址 200245 上海市闵行区苏召路1628号
(72)发明人 陆伟伟
(74)专利代理 机构 上海科盛知识产权代理有限
公司 312 25
专利代理师 彭瑶
(51)Int.Cl.
G06Q 10/04(2012.01)
G06Q 50/06(2012.01)
G06K 9/62(2022.01)
(54)发明名称
一种基于CART的多模式集成模型的风速预
报方法
(57)摘要
本发明涉及一种基于CART的多模式集成模
型的风速预报方法, 包括步骤: 1)获取数据资料,
利用双三次插值将获取的数据资料插值到0.1 °
×0.1°分辨率的细网格 上; 2)对数据资料进行预
处理, 筛选样本资料, 并将样本资料划分为训练
期数据, 和预报期数据; 3)比较预报期内各预报
模式与观测的误差, 并分析各模式的预报准确
性; 4)根据训练期数据建立基于CART的多模式集
成模型, 并建立基于消除偏差集合平均方法的模
式集成的预测模型作为对比; 5)采用预报期数据
输入基于CART的多模式集成模型进行预测, 获取
预测结果, 并采用均方根误差对 预测误差进行对
比分析。 与现有技术相比, 本发明具有适合于对
多特征变量的复杂数据进行建模、 预报效果好等
优点。
权利要求书3页 说明书11页 附图7页
CN 114529035 A
2022.05.24
CN 114529035 A
1.一种基于 CART的多模式集成模型的风速预报方法, 其特 征在于, 包括下列步骤:
1)获取数据资料, 利用双三次插值将获取的数据资料插值到0.1 ° ×0.1°分辨率的细网
格上;
2)对数据资料进行预处理, 筛选样本资料, 并将样本资料划分为训练期数据, 和预报期
数据;
3)比较预报期内各 预报模式与观测的误差, 并分析 各模式的预报准确性;
4)根据训练期数据建立基于CA RT的多模式集成模型, 并建立基于消除偏差集合平均方
法的模式集成的预测模型作为对比;
5)采用预报期数据输入基于CART的多模式集成模型进行预测, 获取预测结果, 并采用
均方根误差对预测误差进行对比分析。
2.根据权利要求1所述的基于CART的多模式集成模型的风速预报方法, 其特征在于, 所
述数据资料包括 风速预报模式数据以及观测资料。
3.根据权利要求2所述的基于CART的多模式集成模型的风速预报方法, 其特征在于, 所
述风速预报模式数据取自TIGGE 资料集下欧洲中期天气预报中心和美国国家环境预报中心
的全球集合预报模式每天00时起报的10m风速的各自集合成员的平均; 所述观测资料采用
ERA5再分析资料每天0 0时起报的控制预报的初始场。
4.根据权利要求3所述的基于CART的多模式集成模型的风速预报方法, 其特征在于, 对
数据资料进行 预处理的具体步骤 包括:
201)将风速预报模式数据中分辨率为0.5 ° ×0.5°的ECMWF的预报数据、 分辨率为0.5 °
×0.5°的NCEP的预报数据以及分辨率为0.25 ° ×0.25°的ERA5的观测资料通过双三次插值
将分辨率提高至0.1° ×0.1°;
202)选取经纬度一致的风速预报模式数据以及观测资料, 将数据进行预处理, 筛选合
理数据后, 选择最终的总样本资料长度以及训练期数据。
5.根据权利要求2所述的基于CART的多模式集成模型的风速预报方法, 其特征在于, 根
据训练期数据建立基于 CART的多模式集成模型的具体步骤 包括:
401)一个回归树对应着输入空间, 即特征空间的一个划分以及划分的单元上的输出
值, 假设已将输入空间划分为M个单元R1,R2,…,Rm, 且在每一个单元Rm上有一个固定的输出
值cm, 则回归模型可表示为:
进而计算模型输出值与实际值的误差:
令每个单元上的cm使这个误差平方误差最小化, 当cm为相应单元的所有实际值的均值
时, 得到最优输出值
假设X与Y分别为输入变量和输出变量, 且Y为连续变量, 给定训练集:权 利 要 求 书 1/3 页
2
CN 114529035 A
2D=(x1,y1),(x2,y2),…,(xn,yn)
其中, D表示整个数据集 合, yn为第n个样本的输出值;
402)假设选择变量x(j)为切分变量, 其取值s为切分点, 将小于或者等于s的取值划分至
左子树中, 否则划分至右子树中, 则可获取两个区域:
R1(j,s)={x|x(j)≤s},R2(j,s)={x|x(j)>s}
此时:
式中, Nm为各个区域的样本数量, 并求 解:
遍历变量j, 扫描切分点 s, 选择使m(s)取得最小 值的对(j,s), 其中Rm为被划分的输入空
间, cm为空间Rm对应的输出值;
403)采用选 定的对(j,s)划分区域并决定相应的输出值;
404)继续对两个子区域调用步骤402)、 40 3), 直至满足停止条件;
405)将输入空间划分为M个区域R1,R2,…,Rm, 生成决策树:
406)对于多特征输入, 在前一个特征输入生成决策树并得出残差的基础上, 利用后一
个特征输入建立决策树去拟合残差, 并整合回归树:
f=f(X1)+f(X2)+…。
6.根据权利要求5所述的基于CART的多模式集成模型的风速预报方法, 其特征在于, 整
合回归树后, 还 包括回归树的剪枝操作。
7.根据权利要求6所述的基于CART的多模式集成模型的风速预报方法, 其特征在于, 回
归树的剪枝操作的具体步骤 包括:
(1)当位于节点t的任意 一棵子树Tt, 在没有剪枝的情况 下, 其损失函数为:
Cα(Tt)=C(Tt)+α |Tt|
式中, α 为正则化参数, C(Tt)为训练数据的误差, | Tt|为叶子节点的数量;
当剪枝到根节点, 即只保留根节点, 其损失函数为:
Cα(T)=C(Tt)+α
当α =0或者接近于0时, 则有: Cα(Tt)<Cα(T); 当α增大到一定程度时: Cα(Tt)=Cα(T); 因
此当T和Tt满足Cα(Tt)=Cα(T), 即:
对Tt进行剪枝, 将子节点全部剪掉,
剩下一个叶子节点T;
(2)当计算出所有节点是否剪枝的α后, 将α 对应的最优子树在训练集上进行交叉验证,权 利 要 求 书 2/3 页
3
CN 114529035 A
3
专利 一种基于CART的多模式集成模型的风速预报方法
文档预览
中文文档
22 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 20:26:25上传分享