iso standard online
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202211081490.3 (22)申请日 2022.09.06 (65)同一申请的已公布的文献号 申请公布号 CN 115169321 A (43)申请公布日 2022.10.11 (73)专利权人 北京国电通网络技 术有限公司 地址 100085 北京市海淀区创业中路32号 楼32-3-4108-4109 专利权人 国网信息通信产业 集团有限公司 (72)发明人 王加欣 梁键 王聪 涂海涛  唐宇  (74)专利代理 机构 北京唯智勤实知识产权代理 事务所(普通 合伙) 11557 专利代理师 孙姣(51)Int.Cl. G06F 40/194(2020.01) G06F 40/166(2020.01) G06F 16/35(2019.01) G06K 9/62(2022.01) G06Q 10/08(2012.01) (56)对比文件 CN 113887215 A,202 2.01.04 CN 112699658 A,2021.04.23 CN 113886573 A,202 2.01.04 CN 114330475 A,202 2.04.12 CN 111353033 A,2020.0 6.30 审查员 吴雪 (54)发明名称 物流内容文本核对方法、 装置、 电子设备和 计算机介质 (57)摘要 本公开的实施例公开了物流内容文本核对 方法、 装置、 电子设备和计算机介质。 该方法的一 具体实施方式包括: 将第一待校验物 流内容文本 包括的各个第一物流内容文本段落与第二待校 验物流内容文本包括的各个第二物流内容文本 段落进行合并; 对物流内容文本段落集包括的各 个物流内容文本段落进行聚类处理, 以生成物流 内容文本段落组集; 对于物流内容文本段落组集 中的每个物 流内容文本段落组, 执行如下校验步 骤: 将物流内容文本段落组包括的第一物流内容 文本段落与第二物流内容文本段落输入至预先 训练的物 流内容文本核对模型中, 得到物流内容 文本核对结果。 该实施方式减少了核对时间, 降 低了出错 率。 权利要求书3页 说明书11页 附图2页 CN 115169321 B 2022.12.23 CN 115169321 B 1.一种物流内容文本核对方法, 包括: 响应于接收到用户上传的第 一待校验物流内容文本与第 二待校验物流内容文本, 将所 述第一待校验物流内容文本包括的各个第一物流内容文本段落与所述第二待校验物流内 容文本包括的各个第二物流内容文本段落进行合并, 得到物流内容文本段落 集; 根据物流内容文本段落对应的段落编 号, 对所述物流内容文本段落集包括的各个物流 内容文本段落进行聚类处理, 以生 成物流内容文本段落组集, 其中, 所述物流内容文本段落 组集中的物流内容文本段落组包括第一物流内容文本段落与第二物流内容文本段落; 对于所述物流内容文本段落组集中的每 个物流内容文本段落组, 执 行如下校验步骤: 将所述物流内容文本段落组包括的第一物流内容文本段落与第二物流内容文本段落 输入至预 先训练的物流内容文本核对 模型中, 得到物流内容文本核对结果; 响应于确定所述物流内容文本核对结果为表征物流内容文本相异的物流内容文本核 对结果, 将所述物 流内容文本核对结果添加至异常物流内容文本核对 结果组中, 其中, 所述 异常物流内容文本核对结果组初始为空; 响应于确定添加后的异常物流内容文本核对结果组包括的异常物流内容文本核对结 果的数量大于等于1, 将所述添加后的异常物流内容文本核对结果组发送至所述用户的用 户端; 响应于确定添加后的异常物流内容文本核对结果组为空, 将所述第 一待校验物流内容 文本确定为 候选物流内容文本; 对接收到的每个候选物流内容文本进行主成分分析处理, 以生成主成分分析备选物流 内容文本, 得到主成分 分析候选物流内容文本组; 对所述主成分分析候选物流内容文本组进行离群聚类处理, 以生成离群主成分分析候 选物流内容文本组与聚类主成分分析候选物流内容文本组, 其中, 所述聚类主成分分析候 选物流内容文本组中的聚类主成分分析候选物流内容文本包括: 物流内容文本指标组、 候 选物流内容文本指标特征值组和候选物流内容文本评分值, 所述物流内容文本指标 组中的 物流内容文本指标对应所述候选物流内容文本指标特征值组中的候选物流内容文本指标 特征值, 物流内容文本指标组包括: 年价值属性值、 员工数量、 生产设备数量、 生产占地面 积、 年利润率, 候选物流内容文本指标特征值表 示一物流内容文本指标的权重值, 候选物 流 内容文本评 分值表示主成分分析候选物流内容文本在离群聚类过程中, 被聚类为集群的概 率; 基于所述聚类主成分分析候选物流内容文本组, 确定目标物流内容文本组, 以及将所 述目标物流内容文本组存 储至目标 数据库中; 其中, 对所述主成分分析候选物流内容文本组进行离群聚类处理, 以生成离群主成分 分析候选物流内容文本组与聚类主成分 分析候选物流内容文本组, 包括: 通过聚类算法对所述主成分分析候选物流内容文本组进行离群聚类处理, 以生成主成 分分析候选物流内容文本组集, 其中, 主成分分析候选物流内容文本组集中的主成分分析 候选物流内容文本包括聚类标签, 聚类标签表示离群或集群; 将主成分分析候选物流内容文本组集中包括的聚类标签表示离群的各个主成分分析 候选物流内容文本确定为离群主成分 分析候选物流内容文本组; 将主成分分析候选物流内容文本组集中包括的聚类标签表示集群的各个主成分分析权 利 要 求 书 1/3 页 2 CN 115169321 B 2候选物流内容文本确定为聚类主成分 分析候选物流内容文本组。 2.根据权利要求1所述的方法, 其中, 所述物流内容文本核对模型是通过以下步骤训练 得到的: 获取物流内容文本样本集, 其中, 所述物流内容文本样本集中的物流内容文本样本包 括: 样本物流内容文本段落和对应所述样本物流内容文本段落的样本标签, 所述样本物流 内容文本段落包括: 第一样本物流内容文本段落和第二样本物流内容文本段落; 对于所述物流内容文本样本集中的每个物流内容文本样本, 对所述物流内容文本样本 包括的第一样本物流内容文本段落和 第二样本物 流内容文本段落进行分词处理, 以生成分 词后的物流内容文本样本作为备选物流内容文本样本; 基于所生成的各个备选物流内容文本样本, 对初始物流内容文本核对模型进行训练, 得到训练后的初始 物流内容文本核对 模型作为物流内容文本核对 模型。 3.根据权利要求2所述的方法, 其中, 所述基于所生成的各个备选物流内容文本样本, 对初始物流内容文本核对模型进 行训练, 得到训练后的初始物流内容文本核对模型作为物 流内容文本核对 模型, 包括: 从所述各个备选物流内容文本样本中选择备选物流内容文本样本作为目标备选物流 内容文本样本; 对所述目标备选物流内容文本样本包括的分词第一样本物流内容文本段落和分词第 二样本物流内容文本段落进行向量化处理, 以生成第一样本物流内容文本段落向量与第二 样本物流内容文本段落向量; 将所述第一样本物流内容文本段落向量与所述第二样本物流内容文本段落向量输入 至所述初始 物流内容文本核对 模型中, 得到样本物流内容文本段落比对结果; 确定所述样本物流内容文本段落比对结果与所述目标备选物流内容文本样本包括的 样本标签之间的损失值; 响应于确定所述损失值大于等于预设损失值, 调整所述初始物流内容文本核对模型的 网络参数。 4.根据权利要求3所述的方法, 其中, 所述方法还 包括: 响应于确定所述损失值小于所述预设损失值, 将训练后的初始物流内容文本核对模型 确定为物流内容文本核对 模型。 5.一种物流内容文本核对 装置, 包括: 合并单元, 被配置成响应于接收到用户上传的第 一待校验物流内容文本与第 二待校验 物流内容文本, 将所述第一待校验物流内容文本包括的各个第一物流内容文本段落与所述 第二待校验物流内容文本包括的各个第二物流内容文本段落进行合并, 得到物流内容文本 段落集; 聚类单元, 被配置成根据物流内容文本段落对应的段落编号, 对所述物流内容文本段 落集包括的各个物 流内容文本段落进 行聚类处理, 以生成物 流内容文本段落组集, 其中, 所 述物流内容文本段落组集中的物流内容文本段落组包括第一物流内容文本段落与第二物 流内容文本段落; 校验单元, 被配置成对于所述物流内容文本段落组集中的每个物流内容文本段落组, 执行如下校验步骤: 将所述物流内容文本段落组包括的第一物流内容文本段落与第二物流权 利 要 求 书 2/3 页 3 CN 115169321 B 3

.PDF文档 专利 物流内容文本核对方法、装置、电子设备和计算机介质

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 物流内容文本核对方法、装置、电子设备和计算机介质 第 1 页 专利 物流内容文本核对方法、装置、电子设备和计算机介质 第 2 页 专利 物流内容文本核对方法、装置、电子设备和计算机介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:27:21上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。