(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211035116.X
(22)申请日 2022.08.26
(71)申请人 中远海运科技 (北京) 有限公司
地址 100010 北京市东城区朝阳门北 大街8
号富华大厦F座15A
(72)发明人 詹昊林
(74)专利代理 机构 北京卫智易创专利代理事务
所(普通合伙) 16015
专利代理师 朱春野
(51)Int.Cl.
G06Q 10/04(2012.01)
G06Q 10/08(2012.01)
G06K 9/62(2022.01)
(54)发明名称
竞争对手船舶运力预测方法、 计算机可读介
质
(57)摘要
本发明公开了竞争对手船舶运力预测方法、
计算机可读介质; 该预测方法包括步骤S1: 获取
竞争对手船舶定位AIS历史数据; S2: 通过船舶定
位AIS数据获得船舶在码头靠泊后吃水量的变
化; 并对获取的竞争对手船舶定位AIS历史数据
进行特征工程和数据标注; S3: 利用获得的批量
标注数据集训练KNN最近邻模型和LightGBM模
型, 获得竞争对手船舶潜在目的地预测模型; S4:
基于实时数据和获得的竞争对手船舶目的地预
测模型, 预测竞争对手船舶运力; 其中, 所述船舶
运力包括船舶前往各个目的地的概率、 船舶在目
的地码头的装卸货量。 利用该预测模型能够实
时、 有效地监测 并预测竞争对手船舶运力走向。
误判率低, 耗时短, 实时性强, 节省人力, 提高监
测效率。
权利要求书3页 说明书10页 附图1页
CN 115456258 A
2022.12.09
CN 115456258 A
1.竞争对手船舶运力预测方法, 其特 征在于, 该 方法包括 步骤:
S1: 获取竞争对手船舶定位AIS 历史数据;
S2: 通过定位AIS数据获得船舶在码头靠泊后吃水量的变化; 并对获取的竞争对手船舶
定位AIS历史数据进行 特征工程和数据标注;
S3: 利用获得的批量标注数据 集训练KNN最近邻模型和LightGBM模型, 获得竞争对手船
舶潜在目的地预测模型;
S4: 基于实时数据和获得的竞争对手船舶目的地预测模型, 预测竞争对手船舶运力; 其
中, 所述船舶运力包括船舶前往各个目的地的概 率、 船舶在目的地码头的装卸货量。
2.根据权利要求1所述的竞争对手船舶运力预测方法, 所述 步骤S2具体包括:
S201: 对AIS 历史数据集进行 预处理;
S202: 构建除AIS 历史数据集以外的额外特 征, 并对AIS 历史数据集进行 标注;
S203: 根据船舶靠泊前和靠泊后距靠泊点设定距离内的船舶吃水变化量分别 估算货量
变化量, 进而估算装/卸货量; 其中, 货量变化量=(靠泊前船舶吃水均值 ‑靠泊后船舶吃水
均值)×船舶每厘米吃水吨数TPC; 若货量变化量为正, 则为卸货, 若货物变化量为负, 则为
装货。
3.根据权利要求2所述的竞争对手船舶运力预测方法, 其特征在于, 所述步骤S201具体
包括: 对A IS历史数据中各船舶位置信息进 行等距处理, 分别对各船舶的位置信息进 行插值
得到航行路径, 然后根据球面距离等距取航行路径的经纬度坐标。
4.根据权利要求2所述的竞争对手船舶运力预测方法, 其特征在于, 所述步骤S202具体
包括:
为船舶构建额外特征X1,t、 X2,t和X3,t; 其中, 记X1,t为t时刻船舶距目的地的距离, 设置额
外变量X2,t标记船舶航向, 若X1,t‑X1,t‑1<0, 则, 船舶在靠近目的地, 标记 X2,t为1; 若X1,t‑X1,t‑1
>0, 则船舶在远离目的地, 标记X2,t为‑1; 对X2,t按时间进行有界累加得到新变量X3,t=max
(min(X3,t‑1+X2,t,B),A), 并使用移动平均方法对X3,t作平滑处理; 其中, A、 B分别 表示累加下
边界和上边界;
若该船舶在t时刻在目的地码头靠泊且在靠泊前后出现显著吃水量变化, 则从t时刻向
前搜索最大的时间段k, 使得k满足在[t ‑k,t)内X3,t为连续正序列, 并将该船舶在此时间段
内的数据标记为正样本, 即把Y1,t‑k,…,Y1,t都标记为1; 若有N个特定目的地, 则分别 进行上
述操作, Y的第一个下标 从1到n分别取值得Y1,t,…,Yn,t, X的第一个下标从1,2,3到3N ‑2,3N‑
1,3N分别取值得X1,t,X2,t,X3,t,…,X3N‑2,t,X3N‑1,t,X3N,t, 其中, N为目的地数量, Y为目标变量;
Yn,t为目的地预测值, Yn,t为1说明t时刻船舶正在去往第n个目的地; X3n,t大于0表明船舶在t
时刻属于在持续靠 近第n个目的地的状态。
5.根据权利要求1所述的竞争对手船舶运力预测方法, 其特征在于, 所述步骤S3中, 利
用获得的批量标注数据集训练KN N最邻近模型和L ightGBM模型的过程具体包括:
S301: 将批量标注数据集划分为四部分; 其中, 第一部分用于获得历史航线数据以及作
为KNN最邻近模 型的训练集, 第二部分作为KNN最邻近模 型的验证集以及LightGBM模 型的训
练集, 第三部分作为 LightGBM模型的验证集, 第四部分作为 LightGBM的测试集;
S302: 使用批量标注AIS历史数据的KNN训练集构建KNN最近邻模型, 自变量为按最佳时
间长度C切分后的经纬度序列L*,t, *表示所有的历史航线, 因变量为经纬度序列L*,t对应的权 利 要 求 书 1/3 页
2
CN 115456258 A
2目的地标注Y·,t, 其中,·表示所有的目的地, 其中C为 最佳长度参数;
S303: 将Li ghtGBM训练集 中的数据按最佳时间长度C切分后, 比对切分后的航行路径与
距离最近的若干条历史航线的经纬度序列, 通过求点线距离获得当前船舶在最佳时间长度
C内的经纬度偏差序列et, 使用额外特征X1,t,X2,t,X3,t,…,X3N‑2,t,X3N‑1,t,X3N,t、 经纬度偏差序
列et以及额外特征X1,t,X2,t,X3,t,…,X3N‑2,t,X3N‑1,t,X3N,t的差分数据与经纬度偏差序列et的
差分数据, 经过随机森林筛选特征, 用特征贡献度排名前80%的特征以及LightGBM的额外
特征来训练LightGBM模型并使用验证集数据预测竞争对手当前船舶去往各个潜在目的地
的预测值
并基于验证集的误差调整LightGBM模型的超参数; 最后, 基于LightGBM测试数
据集对LightGBM模 型进行测试, 从而 得到已完成训练和超参数调优的LightGBM模型在预测
训练集和验证集以外的数据时的表现; 其中, LightGBM的额外特征为ML,1和M(L,U),2, ML,1为输
入L时KNN的预测值, M(L,U),2表示输入L匹配到的U所在的航线是否经过LightGB M模型本次需
要预测的那个潜在目的地, 经过则M(L,U),2=1, 否则为M(L,U),2=0; 其中, L*,t为历史航线段, 是
按最佳序列长度C切分历史航线得到的经纬度序列; U为一组集合, 集合内元素由KNN训练集
的历史航线构造, 第k个集合包含来源于KNN训练集第k条历史航线的所有被切分后的历史
航线段。
6.根据权利要求5所述的竞争对手船舶运力预测方法, 其特征在于, 步骤S303中, 在使
用LightGBM测试数据集测试LightGBM模型时, 若选出的若干条历史航线中有部 分航线的目
的地相同, 则以目的地为分组维度对预测概率求平均值, 得到竞争对手船舶去该目的地的
最终预测概 率。
7.根据权利要求1所述的竞争对手船舶运力预测方法, 其特征在于, 所述步骤S4中, 预
测竞争对手船舶运力具体包括:
S401: 竞争对手船舶潜在目的地预测模型中, 传入任一船舶的定位AIS数据, 经过与训
练阶段相同的流程对数据进行处理, 并取最新的最佳时间长度C内的航行路径; 其中, 所述
流程不包括数据标注和模型训练调优;
S402: 模型给出预测概率后, 对所述任一船舶在t时刻的由K条历史航线得到的预测概
率以目的地为分组维度求平均值, 得到它在t时刻的去往N个目的地的预测值向量
其中, K取值自然数, N取值自然数;
S403: 将预测值向量
与向量[sign(sign([X3,t,X6,t,…,X3N,t])+1)]求
内积得新向量Zt, 用Zt除以其自身的1 ‑范数
即得去往各目的地的概率
其中:
sign([X3,t,X6,t,…,X3N,t])为符号 函数;
8.根据权利要求1所述的竞争对手船舶运力预测方法, 其特征在于, 步骤S3中, 所述批
量标注数据集包括步骤S1获得的船舶定位AIS历史数据和对船舶定位AIS数据进行特征工
程和数据标注得到的数据。权 利 要 求 书 2/3 页
3
CN 115456258 A
3
专利 竞争对手船舶运力预测方法、计算机可读介质
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-17 23:27:47上传分享