医药安全标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111633421.4 (22)申请日 2021.12.2 9 (71)申请人 上海中楠水电配套工程有限公司 地址 200245 上海市闵行区苏召路1628号 (72)发明人 陆伟伟  (74)专利代理 机构 上海科盛知识产权代理有限 公司 312 25 专利代理师 彭瑶 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 50/06(2012.01) G06K 9/62(2022.01) (54)发明名称 一种基于CART的多模式集成模型的风速预 报方法 (57)摘要 本发明涉及一种基于CART的多模式集成模 型的风速预报方法, 包括步骤: 1)获取数据资料, 利用双三次插值将获取的数据资料插值到0.1 ° ×0.1°分辨率的细网格 上; 2)对数据资料进行预 处理, 筛选样本资料, 并将样本资料划分为训练 期数据, 和预报期数据; 3)比较预报期内各预报 模式与观测的误差, 并分析各模式的预报准确 性; 4)根据训练期数据建立基于CART的多模式集 成模型, 并建立基于消除偏差集合平均方法的模 式集成的预测模型作为对比; 5)采用预报期数据 输入基于CART的多模式集成模型进行预测, 获取 预测结果, 并采用均方根误差对 预测误差进行对 比分析。 与现有技术相比, 本发明具有适合于对 多特征变量的复杂数据进行建模、 预报效果好等 优点。 权利要求书3页 说明书11页 附图7页 CN 114529035 A 2022.05.24 CN 114529035 A 1.一种基于 CART的多模式集成模型的风速预报方法, 其特 征在于, 包括下列步骤: 1)获取数据资料, 利用双三次插值将获取的数据资料插值到0.1 ° ×0.1°分辨率的细网 格上; 2)对数据资料进行预处理, 筛选样本资料, 并将样本资料划分为训练期数据, 和预报期 数据; 3)比较预报期内各 预报模式与观测的误差, 并分析 各模式的预报准确性; 4)根据训练期数据建立基于CA RT的多模式集成模型, 并建立基于消除偏差集合平均方 法的模式集成的预测模型作为对比; 5)采用预报期数据输入基于CART的多模式集成模型进行预测, 获取预测结果, 并采用 均方根误差对预测误差进行对比分析。 2.根据权利要求1所述的基于CART的多模式集成模型的风速预报方法, 其特征在于, 所 述数据资料包括 风速预报模式数据以及观测资料。 3.根据权利要求2所述的基于CART的多模式集成模型的风速预报方法, 其特征在于, 所 述风速预报模式数据取自TIGGE 资料集下欧洲中期天气预报中心和美国国家环境预报中心 的全球集合预报模式每天00时起报的10m风速的各自集合成员的平均; 所述观测资料采用 ERA5再分析资料每天0 0时起报的控制预报的初始场。 4.根据权利要求3所述的基于CART的多模式集成模型的风速预报方法, 其特征在于, 对 数据资料进行 预处理的具体步骤 包括: 201)将风速预报模式数据中分辨率为0.5 ° ×0.5°的ECMWF的预报数据、 分辨率为0.5 ° ×0.5°的NCEP的预报数据以及分辨率为0.25 ° ×0.25°的ERA5的观测资料通过双三次插值 将分辨率提高至0.1° ×0.1°; 202)选取经纬度一致的风速预报模式数据以及观测资料, 将数据进行预处理, 筛选合 理数据后, 选择最终的总样本资料长度以及训练期数据。 5.根据权利要求2所述的基于CART的多模式集成模型的风速预报方法, 其特征在于, 根 据训练期数据建立基于 CART的多模式集成模型的具体步骤 包括: 401)一个回归树对应着输入空间, 即特征空间的一个划分以及划分的单元上的输出 值, 假设已将输入空间划分为M个单元R1,R2,…,Rm, 且在每一个单元Rm上有一个固定的输出 值cm, 则回归模型可表示为: 进而计算模型输出值与实际值的误差: 令每个单元上的cm使这个误差平方误差最小化, 当cm为相应单元的所有实际值的均值 时, 得到最优输出值 假设X与Y分别为输入变量和输出变量, 且Y为连续变量, 给定训练集:权 利 要 求 书 1/3 页 2 CN 114529035 A 2D=(x1,y1),(x2,y2),…,(xn,yn) 其中, D表示整个数据集 合, yn为第n个样本的输出值; 402)假设选择变量x(j)为切分变量, 其取值s为切分点, 将小于或者等于s的取值划分至 左子树中, 否则划分至右子树中, 则可获取两个区域: R1(j,s)={x|x(j)≤s},R2(j,s)={x|x(j)>s} 此时: 式中, Nm为各个区域的样本数量, 并求 解: 遍历变量j, 扫描切分点 s, 选择使m(s)取得最小 值的对(j,s), 其中Rm为被划分的输入空 间, cm为空间Rm对应的输出值; 403)采用选 定的对(j,s)划分区域并决定相应的输出值; 404)继续对两个子区域调用步骤402)、 40 3), 直至满足停止条件; 405)将输入空间划分为M个区域R1,R2,…,Rm, 生成决策树: 406)对于多特征输入, 在前一个特征输入生成决策树并得出残差的基础上, 利用后一 个特征输入建立决策树去拟合残差, 并整合回归树: f=f(X1)+f(X2)+…。 6.根据权利要求5所述的基于CART的多模式集成模型的风速预报方法, 其特征在于, 整 合回归树后, 还 包括回归树的剪枝操作。 7.根据权利要求6所述的基于CART的多模式集成模型的风速预报方法, 其特征在于, 回 归树的剪枝操作的具体步骤 包括: (1)当位于节点t的任意 一棵子树Tt, 在没有剪枝的情况 下, 其损失函数为: Cα(Tt)=C(Tt)+α |Tt| 式中, α 为正则化参数, C(Tt)为训练数据的误差, | Tt|为叶子节点的数量; 当剪枝到根节点, 即只保留根节点, 其损失函数为: Cα(T)=C(Tt)+α 当α =0或者接近于0时, 则有: Cα(Tt)<Cα(T); 当α增大到一定程度时: Cα(Tt)=Cα(T); 因 此当T和Tt满足Cα(Tt)=Cα(T), 即: 对Tt进行剪枝, 将子节点全部剪掉, 剩下一个叶子节点T; (2)当计算出所有节点是否剪枝的α后, 将α 对应的最优子树在训练集上进行交叉验证,权 利 要 求 书 2/3 页 3 CN 114529035 A 3

.PDF文档 专利 一种基于CART的多模式集成模型的风速预报方法

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于CART的多模式集成模型的风速预报方法 第 1 页 专利 一种基于CART的多模式集成模型的风速预报方法 第 2 页 专利 一种基于CART的多模式集成模型的风速预报方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 20:26:25上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。