(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111658013.4
(22)申请日 2021.12.3 0
(71)申请人 大连海事大学
地址 116026 辽宁省大连市高新园区凌海
路1号
(72)发明人 王怡洋 郭雨寒 王军
(74)专利代理 机构 大连东方专利代理有限责任
公司 21212
代理人 姜玉蓉 李洪福
(51)Int.Cl.
G06Q 10/04(2012.01)
G06Q 50/30(2012.01)
G06F 16/2458(2019.01)
G06K 9/62(2022.01)
(54)发明名称
一种基于时序随机森林的短期船舶航速预
测方法
(57)摘要
本发明提供一种基于时序随机森林的短期
船舶航速预测方法, 包括以下步骤: 获取建模数
据并进行数据预处理; 将时间序列数据引入随机
森林学习器构建全新的预测模型框架; 模型相关
参数的设定; 使用模型进行预测。 本发明可以利
用船舶的历史航行速度和海洋气象预报数据对
短期船舶对 水速度进行预测, 避免了直接使用船
舶发动机实时监控数据的现象, 对于船载监控设
备的要求较低, 同时实现了事先对 船舶速度进行
预测和事后实验分析。 本发明的模 型平均绝对误
差(MAE)、 均方根误差(RMSE)、 可决系数(R^2)均
优于其他三种常用模型。
权利要求书3页 说明书6页 附图1页
CN 114330895 A
2022.04.12
CN 114330895 A
1.一种基于结合时序随机森林的短期船舶航速预测方法, 其特 征在于, 包括以下步骤:
S1、 获取建模数据并进行 数据预处 理;
S2、 将时间序列数据引入随机森林 学习器构建全新的预测模型框架;
S3、 对所述随机森林模型进行相关参数的设定和训练;
S4、 通过训练后的所述随机森林模型进行 预测;
具体地, 所述 步骤S2还具有以下步骤:
S21、 对数据集及参数进行定义;
设MT是截止到时间T且经过预处理后的数据集, 其中, ET、 ST和VT分别代表海洋气 象数
据集、 船舶状态数据集和对 水速度数据集; et、 st和vt分别对应着上述数据集在某特定时间
点t时刻的数据; 定义b为历史速度数据的长度, p为以当前时刻t为节点预测的长度;
S22、 假设A是决策树上某个节点对应的超矩形单元格, 而NT(A)表示落入A中的数据数
量; 在A上的一次切割通过一个数据对(j,z)描述, 其中, j表 示从1到输入 特征数之间的某个
维度, 而z表示沿j切割的位置; 另外假设输入特征Xt=(et,st,vt ‑1,vt‑2,...,vt ‑b), 输出
变量Yt=vt; 由此分类回归树原则标准可以通过如下公式(1)求得:
其中,
代表指示函数,
是当Xt落在A中时对应Yt的平均值, 若Xt未在A中则该指取0;
接着, 通过在所有可能的切割中找 到使得LT(j,z)最大的解, 即是此时A对应的最优切割
解(j,z);
S23、 当每 个单元格最终包 含的点数少于设定数目时, 单个树的构建将停止;
其中, 第i棵树 求得的回归方程
如公式(2)所示:
其中,
表示用于构建该树的子数据集, At是与Xt对应的超矩形 单元格;
将构建的k棵树得到的结果取平均值得到最终的结果, 如公式(3)所示:
S24、 以当前 时间t作为分割点, 下一个时刻的对水速度v*t+1通过步骤S22和步骤S23描
述的方法确定;
将v*t+1作为下一次预测的输入特征值, 重新输入到构建的模型中; 经过多次循环迭
代, 获取更长时间后的船舶对水速度; 具体迭代过程如公式(4)所示:权 利 要 求 书 1/3 页
2
CN 114330895 A
2其中, v*t 表示t时刻对应的船舶对水速度预测值。
2.根据权利要求1所述的一种基于结合时序随机森林的短期船舶航速预测方法, 其特
征在于: 所述 步骤S1还 包括以下步骤:
S11、 通过船载自动识别系统获取船舶历史航行数据, 通过海洋气象预报获取对应航行
时间的天气、 海况 数据;
S12、 由于步骤S11中获取的数据包括船舶的多个航次, 因此通过船期表以及船舶地理
位置信息将船舶 在港停靠时的数据进行删除 同时删除异常点数据;
S13、 为消除海流对船舶的影响, 将船舶对地速度转化为船舶对水速度, 如公式(5)所
示:
其中, Vstw表示当前时刻船舶对水速度, Vsog表示船舶对地速度, Vcurrent表示海流的对地
速度,
表示船首向与海流方向的夹角;
S14、 分析每个航次的船舶对水速度, 若满足公式(6), 则该数据将被视为离群点而删
除:
其中, erfc表示互补误差函数, Δi表示第i个 数据与数据集平均值之间的绝对 误差, σ 表
示数据集的标准差 。
3.根据权利要求1所述的一种基于结合时序随机森林的短期船舶航速预测方法, 其特
征在于: 所述 步骤S3还 包括以下步骤:
S31、 确定输入模型中的特征变量; 除确定船舶历史航行数据及天气、 海况数据及之外,
还需要确定历史速度数据的长度b的取值;
S32、 运用k折交叉验证, 通过最小化模型预测误差确定模型的5个超参数, 分别为: 树的
最大深度, 分割一个节点所需的最小 数据数, 构成一个节点所需的最小 数据数, 森林中包含
的决策树数目和在每 个决策树中寻找 节点的最佳分割时需要考虑的特 征数量;
S33、 按照确定的参数和输入变量, 训练得到最终随机森林模型。
4.根据权利要求3所述的一种基于结合时序随机森林的短期船舶航速预测方法, 其特
征在于: 所述确定历史速度数据的长度b的取值通过预实验的方法, 输入不同的b值, 计算预
测结果与真实测量值之间的均方根误差, 最终选取预测误差最小时对应的b值作为最终结
果。
5.根据权利要求1所述的一种基于结合时序随机森林的短期船舶航速预测方法, 其特
征在于: 所述 通过训练后的所述随机森林模型进行 预测包括单步预测 和多步预测。权 利 要 求 书 2/3 页
3
CN 114330895 A
3
专利 一种基于时序随机森林的短期船舶航速预测方法
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 20:26:51上传分享