(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210971536.2
(22)申请日 2022.08.15
(71)申请人 深圳市爱深盈通信息技 术有限公司
地址 518000 广东省深圳市南 山区西丽 街
道曙光社区TCL国际E城G3 栋1001
(72)发明人 陈磊 周有喜
(74)专利代理 机构 深圳市嘉勤知识产权代理有
限公司 4 4651
专利代理师 辛鸿飞
(51)Int.Cl.
G06V 10/44(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06V 10/764(2022.01)
G06V 10/82(2022.01)
(54)发明名称
基于YOLOv5网络的目标检测方法、 装置和设
备终端
(57)摘要
本申请公开了目标检测方法、 装置、 设备终
端和可读存储介质, 该目标检测方法包括: 获取
第一图片输入 数据作为训练集, 训练集包括第一
样本集和第二样本集, 基于YOLOv5网络, 对训练
集中的每张训练图片进行目标检测以生成对应
的第一预测值; 根据对应的第一预测值进行第一
预设损失函数计算, 获得优化梯度, 进行权重和
偏置更新, 直至第一预设损失函数收敛以生成第
一目标检测模型; 基于第一目标检测模型, 对第
二样本集中的每张训练图片进行目标检测以生
成对应的第二预测值; 根据对应的第二预测值进
行第二预设损失函数计算, 获得优化梯度, 进行
权重和偏 置更新, 直至第二预设损失函数收敛以
生成第二目标检测模型, 提高了对应模型的目标
检测准确率。
权利要求书2页 说明书8页 附图5页
CN 115049851 A
2022.09.13
CN 115049851 A
1.一种基于 YOLOv5网络的目标检测方法, 其特 征在于, 包括:
获取第一图片输入数据作为训练集, 所述训练集包括第一样本集和第二样本集, 所述
第一样本集的复杂度低于所述第二样本集的复杂度;
基于所述YOLOv5网络, 对所述训练集中的每张训练图片进行训练以生成对应的第一预
测值;
根据对应的第一预测值进行第一预设损 失函数计算, 获得优化梯度, 进行权重和偏置
更新, 直至所述第一预设损失函数收敛以生成对应的第一 目标检测模型, 所述第一预设损
失函数为交叉熵损失函数;
基于所述第 一目标检测模型, 对所述第 二样本集中的每张训练图片进行训练以生成对
应的第二预测值;
根据对应的第二预测值进行第二预设损 失函数计算, 获得优化梯度, 进行权重和偏置
更新, 直至所述第二预设损失函数收敛以生成对应的第二目标检测模型。
2.根据权利要求1所述的方法, 其特 征在于, 所述第二预设损失函数采用以下公式:
其中, Loss表示所述第二预设损失函数, yi表示对应样本i的标签值, Pi表示对应样本i
的预测值,
表示调整因子 。
3.根据权利要求1所述的方法, 其特 征在于, 所述目标检测方法还 包括:
获取第二图片输入数据作为测试集;
根据所述第二目标检测模型对所述测试集进行测试, 输出对应的目标检测结果。
4.根据权利要求1所述的方法, 其特征在于, 所述YOLOv5网络包括依次连接的输入端、
特征提取单元和预测输出单元, 所述特征提取单元包括依次连接的backbone单元、 Neck单
元和注意力单元, 所述backbone单元与所述输入端连接, 所述Neck单元的输出端与所述注
意力单元连接;
所述基于所述YOLOv5 网络, 对所述训练集中的每张训练图片进行训练以生成对应的第
一预测值的步骤 包括:
基于所述backbone单元对所述训练集中每张训练图片进行切片操作以及 卷积操作, 以
获得初始特 征图;
基于所述 Neck单元对初始特 征图进行二次特 征提取, 以得到不同尺度的中间特 征图;
根据各个中间特征图的尺寸, 至少获取两个注意力 子单元分别对各个中间特征图进行
特征提取, 以得到各个中间特 征图各自对应的注意力提取 特征图;
将各个中间特征图以及各个中间特征图各自对应的注意力提取特征图分别进行特征
合并, 以得到各个目标 特征图;
通过所述预测输出 单元对各个目标 特征图分别进行检测以生成对应的第一预测值。
5.根据权利要求4所述的方法, 其特征在于, 所述注意力单元包括第 一注意力 子单元和
第二注意力子单元, 所述中间特征图的尺度为三种, 所述根据各个中间特征图的尺寸, 至少
获取两个注意力子单元分别对各个中间特征图进 行特征提取, 以得到各个中间特征图各自
对应的注意力提取 特征图的步骤 包括:
通过所述第 一注意力 子单元对第 一尺度的中间特征图进行特征提取, 以得到对应的第权 利 要 求 书 1/2 页
2
CN 115049851 A
2一注意力提取 特征图;
通过所述第 二注意力 子单元对第 二尺度和第 三尺度的中间特征图分别进行特征提取,
以得到第二注意力提取特征图和第三注意力提取特征图, 所述第一尺度、 第二尺度和第三
尺度依次减小。
6.根据权利要求4所述的方法, 其特征在于, 所述注意力单元包括第一注意力子单元、
第二注意力子单元和第三注意力子单元, 所述中间特征图的尺度为三种, 所述根据各个中
间特征图的尺寸, 至少获取两个注意力子单元分别对各个中间特征图进行特征提取, 以得
到各个中间特 征图各自对应的注意力提取 特征图的步骤 包括:
通过所述第 一注意力 子单元对第 一尺度的中间特征图进行特征提取, 以得到对应的第
一注意力提取 特征图;
通过所述第 二注意力 子单元对第 二尺度的中间特征图进行特征提取, 以得到第 二注意
力提取特征图;
通过所述第 三注意力 子单元对第 三尺度的中间特征图进行特征提取, 以得到第 三注意
力提取特征图, 所述第一尺度、 第二尺度和第三尺度依次减小。
7.根据权利要求5或6所述的方法, 其特征在于, 所述第一注意力子单元为压缩和激励
模块, 所述第二注意力子单 元为卷积块注意力模块。
8.一种基于 YOLOv5网络的目标检测装置, 其特 征在于, 包括:
训练集建立单元, 用于获取第一图片输入数据作为训练集, 所述训练集包括第一样本
集和第二样本集, 所述第一样本集的复杂度低于所述第二样本集的复杂度;
第一预测值生成单元, 用于基于所述YOLOv5网络, 对所述训练集中的每张训练图片进
行训练以生成对应的第一预测值;
第一模型生成单元, 用于根据对应的第一预测值进行第一预设损 失函数计算, 获得优
化梯度, 进行权重和偏置更新, 直至所述第一预设损失函数收敛以生成对应的第一 目标检
测模型, 所述第一预设损失函数为交叉熵损失函数;
第二预测值生成单元, 用于基于所述第一目标检测模型, 对所述第二样本集中的每张
训练图片进行目标检测以生成对应的第二预测值;
第二模型生成单元, 用于根据对应的第二预测值进行第二预设损 失函数计算, 获得优
化梯度, 进行权重和偏置更新, 直至所述第二预设损失函数收敛以生成对应的第二 目标检
测模型。
9.一种设备终端, 其特征在于, 所述设备终端包括处理器和存储器, 所述存储器用于存
储计算机程序, 所述处理器运行所述计算机程序以使 所述设备终端 执行权利要求1至7中任
一项所述的目标检测方法。
10.一种可读存储介质, 其特征在于, 所述可读存储介质存储有计算机程序, 所述计算
机程序在被处 理器执行时实施权利要求1至7中任一项所述的目标检测方法。权 利 要 求 书 2/2 页
3
CN 115049851 A
3
专利 基于YOLOv5网络的目标检测方法、装置和设备终端
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 04:40:51上传分享