(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210977175.2
(22)申请日 2022.08.15
(71)申请人 浙江网商银行股份有限公司
地址 310012 浙江省杭州市西湖区古 荡街
道西溪路556号阿里中心D幢9层、 E幢
3-8层
(72)发明人 朱禹轲 郭胜 韩冰
(74)专利代理 机构 北京智信禾专利代理有限公
司 11637
专利代理师 金鹏
(51)Int.Cl.
G06V 10/44(2022.01)
G06V 10/764(2022.01)
G06V 10/82(2022.01)
G06N 3/04(2006.01)G06F 16/35(2019.01)
G06F 40/284(2020.01)
(54)发明名称
对象分类方法以及装置
(57)摘要
本说明书实施例提供对象分类方法以及装
置, 其中所述对象分类方法包括: 获取待分类对
象; 提取所述待分类对象的特征向量; 对所述特
征向量和查询向量进行多头交叉注 意力运算, 得
到类别向量, 其中, 所述查询向量为对预设的类
别查询向量进行多头自注意力运算得到; 根据所
述类别向量, 确定所述待分类对象的分类结果。
通过对获取的待分类对象进行特征提取, 得到待
分类对象的特征向量, 然后将特征向量与经过多
头自注意力运算得到的查询向量进行多头交叉
注意力运算得到类别向量, 进一步基于类别向
量, 确定出待分类对象的分类结果, 使得确定出
的分类结果的准确率较高。
权利要求书3页 说明书16页 附图9页
CN 115410000 A
2022.11.29
CN 115410000 A
1.一种对象分类方法, 包括:
获取待分类对象;
提取所述待分类对象的特 征向量;
对所述特征向量和查询向量进行多头交叉注意力运算, 得到类别向量, 其中, 所述查询
向量为对预设的类别查询向量进行多头自注意力运 算得到;
根据所述类别向量, 确定所述待分类对象的分类结果。
2.根据权利要求1所述的方法, 所述待分类对象为待分类图像;
所述提取所述待分类对象的特 征向量, 包括:
提取所述待分类图像的图像特 征, 其中, 所述图像特 征包括多个通道;
对所述图像特征进行展平 处理, 获得多个特征向量, 其中, 所述特征向量的维度与所述
通道的数目相同。
3.根据权利要求2所述的方法, 所述待分类图像为商品图像;
所述提取所述待分类图像的图像特 征, 包括:
提取所述商品图像中的商品特 征;
所述根据所述类别向量, 确定所述待分类对象的分类结果, 包括:
根据所述类别向量, 确定所述商品图像的商品类别。
4.根据权利要求1所述的方法, 所述待分类对象为待分类文本;
所述提取所述待分类对象的特 征向量, 包括:
提取所述待分类文本的文本特 征, 其中, 所述文本特 征包括多个通道;
对所述文本特征进行处理, 获得多个特征向量, 其中, 所述特征向量的维度与所述通道
的数目相同, 所述特 征向量的数目与所述文本特 征的长度相同。
5.根据权利要求 4所述的方法, 所述待分类文本为商品描述文本;
所述提取所述待分类文本的文本特 征, 包括:
提取所述商品描述文本中的商品特 征;
所述根据所述类别向量, 确定所述待分类对象的分类结果, 包括:
根据所述类别向量, 确定所述商品描述文本的商品类别。
6.根据权利要求1所述的方法, 所述对所述特征向量和查询向量进行多头交叉注意力
运算, 得到类别向量, 包括:
根据所述特 征向量, 确定目标键向量和目标值向量;
对所述目标键向量、 所述目标值向量与查询向量进行多头交叉注意力运算, 得到类别
向量。
7.根据权利要求1 ‑6中任一项所述的方法, 所述提取所述待分类对象的特征向量, 包
括:
将所述待分类对象输入特 征提取网络, 获得 所述待分类对象的特 征向量;
所述对所述特 征向量和查询向量进行多头交叉注意力运 算, 得到类别向量, 包括:
将所述特征向量输入任务分类网络, 经所述任务分类网络中的多头交叉注意力层, 对
所述特征向量和查询向量进行多头交叉注意力运算, 得到类别向量, 其中, 所述查询向量为
所述任务分类网络中的多头 自注意力层对预设的类别查询向量进行多头 自注意力运算得
到;权 利 要 求 书 1/3 页
2
CN 115410000 A
2所述根据所述类别向量, 确定所述待分类对象的分类结果, 包括:
经所述任务分类网络中的全连接层, 对所述类别向量进行处理, 获得所述待分类对象
的分类结果。
8.根据权利要求7所述的方法, 在所述将所述待分类对象输入特征提取网络, 获得所述
待分类对象的特 征向量之前, 还 包括:
获取样本对象集, 其中, 所述样本对象集包括多个样本对象, 各样本对象中携带有类别
标签;
提取第一样本对象, 将所述第一样本对象输入特征提取网络, 获得所述第一样本对象
的样本特 征向量, 其中, 所述第一样本对象为所述样本对象集中的任一个样本对象;
将所述样本特征向量输入任务分类网络, 经所述任务分类网络中的多头交叉注意力
层, 对所述样本特征向量和查询向量进行多头交叉注意力运算, 得到样本类别向量, 其中,
所述查询向量为所述任务分类网络中的多头 自注意力层对预设的类别查询向量进行多头
自注意力运 算得到;
经所述任务分类网络中的全连接层, 对所述样本类别向量进行处理, 获得所述第一样
本对象的分类结果;
将所述第一样本对象的分类结果与 所述第一样本对象的类别标签进行比对, 确定损失
值;
基于所述损失值, 调整所述特征提取网络、 所述多头交叉注意力层、 所述多头自注意力
层和所述全连接层的网络参数, 并返回执 行所述提取第一样本对象的步骤;
在达到训练停止条件的情况下, 确定所述特征提取网络、 所述多头交叉注意力层、 所述
多头自注意力层和所述全连接层完成训练, 获得训练后的分类模型。
9.根据权利要求8所述的方法, 在初始训练 的情况下, 所述预设的类别查询向量为随机
初始化得到;
在所述将所述第一样本对象的分类结果与 所述第一样本对象的类别标签进行比对, 确
定损失值之后, 还 包括:
基于所述损失值, 对所述类别查询向量进行 更新。
10.根据权利要求1所述的方法, 所述根据所述类别向量, 确定所述待分类对象的分类
结果, 包括:
根据所述类别向量, 确定所述待分类对象的多个分类信 息, 其中, 所述分类信 息包括多
个类别的置信度;
对所述多个分类信息进行拼接, 得到拼接向量;
根据所述 拼接向量中各类别的置信度, 确定所述待分类对象的分类结果。
11.一种对象分类装置, 包括:
获取模块, 被 配置为获取待分类对象;
提取模块, 被 配置为提取所述待分类对象的特 征向量;
运算模块, 被配置为对所述特征向量和查询向量进行多头交叉注意力运算, 得到类别
向量, 其中, 所述 查询向量 为对预设的类别查询向量进行多头自注意力运 算得到;
确定模块, 被 配置为根据所述类别向量, 确定所述待分类对象的分类结果。
12.一种计算设备, 包括:权 利 要 求 书 2/3 页
3
CN 115410000 A
3
专利 对象分类方法以及装置
文档预览
中文文档
29 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共29页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 04:42:08上传分享