专利 一种基于CART的多模式集成模型的风速预报方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111633421.4 (22)申请日 2021.12.2 9 (71)申请人上海中楠水电配套工程有限公司地址 200245 上海市闵行区苏召路1628号 (72)发明人陆伟伟　 (74)专利代理机构上海科盛知识产权代理有限公司 312 25 专利代理师彭瑶 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 50/06(2012.01) G06K 9/62(2022.01) (54)发明名称一种基于CART的多模式集成模型的风速预报方法 (57)摘要本发明涉及一种基于CART的多模式集成模型的风速预报方法，包括步骤： 1)获取数据资料，利用双三次插值将获取的数据资料插值到0.1 ° ×0.1°分辨率的细网格上； 2)对数据资料进行预处理，筛选样本资料，并将样本资料划分为训练期数据，和预报期数据； 3)比较预报期内各预报模式与观测的误差，并分析各模式的预报准确性； 4)根据训练期数据建立基于CART的多模式集成模型，并建立基于消除偏差集合平均方法的模式集成的预测模型作为对比； 5)采用预报期数据输入基于CART的多模式集成模型进行预测，获取预测结果，并采用均方根误差对预测误差进行对比分析。与现有技术相比，本发明具有适合于对多特征变量的复杂数据进行建模、预报效果好等优点。权利要求书3页说明书11页附图7页 CN 114529035 A 2022.05.24 CN 114529035 A 1.一种基于 CART的多模式集成模型的风速预报方法，其特征在于，包括下列步骤： 1)获取数据资料，利用双三次插值将获取的数据资料插值到0.1 ° ×0.1°分辨率的细网格上； 2)对数据资料进行预处理，筛选样本资料，并将样本资料划分为训练期数据，和预报期数据； 3)比较预报期内各预报模式与观测的误差，并分析各模式的预报准确性； 4)根据训练期数据建立基于CA RT的多模式集成模型，并建立基于消除偏差集合平均方法的模式集成的预测模型作为对比； 5)采用预报期数据输入基于CART的多模式集成模型进行预测，获取预测结果，并采用均方根误差对预测误差进行对比分析。 2.根据权利要求1所述的基于CART的多模式集成模型的风速预报方法，其特征在于，所述数据资料包括风速预报模式数据以及观测资料。 3.根据权利要求2所述的基于CART的多模式集成模型的风速预报方法，其特征在于，所述风速预报模式数据取自TIGGE 资料集下欧洲中期天气预报中心和美国国家环境预报中心的全球集合预报模式每天00时起报的10m风速的各自集合成员的平均；所述观测资料采用 ERA5再分析资料每天0 0时起报的控制预报的初始场。 4.根据权利要求3所述的基于CART的多模式集成模型的风速预报方法，其特征在于，对数据资料进行预处理的具体步骤包括： 201)将风速预报模式数据中分辨率为0.5 ° ×0.5°的ECMWF的预报数据、分辨率为0.5 ° ×0.5°的NCEP的预报数据以及分辨率为0.25 ° ×0.25°的ERA5的观测资料通过双三次插值将分辨率提高至0.1° ×0.1°； 202)选取经纬度一致的风速预报模式数据以及观测资料，将数据进行预处理，筛选合理数据后，选择最终的总样本资料长度以及训练期数据。 5.根据权利要求2所述的基于CART的多模式集成模型的风速预报方法，其特征在于，根据训练期数据建立基于 CART的多模式集成模型的具体步骤包括： 401)一个回归树对应着输入空间，即特征空间的一个划分以及划分的单元上的输出值，假设已将输入空间划分为M个单元R1,R2,…,Rm，且在每一个单元Rm上有一个固定的输出值cm，则回归模型可表示为：进而计算模型输出值与实际值的误差：令每个单元上的cm使这个误差平方误差最小化，当cm为相应单元的所有实际值的均值时，得到最优输出值假设X与Y分别为输入变量和输出变量，且Y为连续变量，给定训练集：权　利　要　求　书 1/3 页 2 CN 114529035 A 2D＝(x1,y1),(x2,y2),…,(xn,yn) 其中， D表示整个数据集合， yn为第n个样本的输出值； 402)假设选择变量x(j)为切分变量，其取值s为切分点，将小于或者等于s的取值划分至左子树中，否则划分至右子树中，则可获取两个区域： R1(j,s)＝{x|x(j)≤s},R2(j,s)＝{x|x(j)＞s} 此时：式中， Nm为各个区域的样本数量，并求解：遍历变量j，扫描切分点 s，选择使m(s)取得最小值的对(j,s)，其中Rm为被划分的输入空间， cm为空间Rm对应的输出值； 403)采用选定的对(j,s)划分区域并决定相应的输出值； 404)继续对两个子区域调用步骤402)、 40 3)，直至满足停止条件； 405)将输入空间划分为M个区域R1,R2,…,Rm，生成决策树： 406)对于多特征输入，在前一个特征输入生成决策树并得出残差的基础上，利用后一个特征输入建立决策树去拟合残差，并整合回归树： f＝f(X1)+f(X2)+…。 6.根据权利要求5所述的基于CART的多模式集成模型的风速预报方法，其特征在于，整合回归树后，还包括回归树的剪枝操作。 7.根据权利要求6所述的基于CART的多模式集成模型的风速预报方法，其特征在于，回归树的剪枝操作的具体步骤包括： (1)当位于节点t的任意一棵子树Tt，在没有剪枝的情况下，其损失函数为： Cα(Tt)＝C(Tt)+α |Tt| 式中， α 为正则化参数， C(Tt)为训练数据的误差， | Tt|为叶子节点的数量；当剪枝到根节点，即只保留根节点，其损失函数为： Cα(T)＝C(Tt)+α 当α ＝0或者接近于0时，则有： Cα(Tt)＜Cα(T)；当α增大到一定程度时： Cα(Tt)＝Cα(T)；因此当T和Tt满足Cα(Tt)＝Cα(T)，即：对Tt进行剪枝，将子节点全部剪掉，剩下一个叶子节点T； (2)当计算出所有节点是否剪枝的α后，将α 对应的最优子树在训练集上进行交叉验证，权　利　要　求　书 2/3 页 3 CN 114529035 A 3

专利 一种基于CART的多模式集成模型的风速预报方法

专利一种基于CART的多模式集成模型的风速预报方法