iso standard online
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210459033.7 (22)申请日 2022.04.27 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 刘小月  (74)专利代理 机构 北京易光知识产权代理有限 公司 11596 专利代理师 徐升升 阎敏 (51)Int.Cl. G06T 7/00(2017.01) G06V 10/74(2022.01) G06Q 10/06(2012.01) G06K 9/62(2022.01) G06F 16/957(2019.01) (54)发明名称 网页质量监测方法、 装置、 设备以及存储介 质 (57)摘要 本公开提供了一种网页质量监测方法、 装 置、 设备以及存储介质。 涉及计算机网络技术领 域, 具体涉及网页渲染、 网页显示、 网页监测等领 域。 具体实现方案为: 从目标产品线的多个页面 中确定出多个目标页面; 截取该多个目标页面的 第一状态图像和第二状态图像, 该第一状态图像 是预先渲染内容的图像, 该第二状态图像是真实 渲染内容的图像, 该第一状态图像早于该第二状 态图像显示; 分析该多个目标页面的第一状态图 像和第二状态图像, 得到目标产品线的网页质量 监测结果。 根据本公开的技术方案, 能有效监测 网页质量, 提高网页质量 监测的效率。 权利要求书3页 说明书10页 附图5页 CN 114782383 A 2022.07.22 CN 114782383 A 1.一种网页质量 监测方法, 包括: 从目标产品线的多个页面中确定出多个目标页面; 截取所述多个目标页面的第 一状态图像和第 二状态图像, 所述第 一状态图像是预先渲 染内容的图像, 所述第二状态图像是真实渲染内容的图像, 所述第一状态图像早于所述第 二状态图像显示; 分析所述多个目标页面的所述第 一状态图像和所述第 二状态图像, 得到所述目标产品 线的网页质量 监测结果。 2.根据权利要求1所述的方法, 其中, 所述从目标产品线的多个页面中确定出多个目标 页面, 包括: 在所述目标产品线的页面结构不固定的情况下, 从访问量达到第 一阈值的页面中筛选 出第一数量的页面, 直至确定所述第一数量的页面所包括的页面组件总数满足预设条件; 在所述第一数量的页面所包括的页面组件总数满足所述预设条件的情况下, 根据 所述 第一数量的页面确定所述多个目标页面。 3.根据权利要求1所述的方法, 其中, 所述从目标产品线的多个页面中确定出多个目标 页面, 包括: 在所述目标产品线的页面结构固定的情况下, 从访问量达到第 二阈值的页面中筛选出 第二数量的页面; 根据所述第二数量的页面确定所述多个目标页面。 4.根据权利要求2或3所述的方法, 还 包括: 根据所述多个目标页面构建多个集 合; 从所述多个集合中确定出至少一个目标集合, 所述目标集合包括的不同页面组件的总 数与所述目标产品线的页面组件总数之间的比值达 到预设比值; 从所述至少一个目标集 合中确定出最小集 合, 所述最小集合中的目标页面数最小; 将所述最小集合包括的目标页面作为所述多个目标页面。 5.根据权利要求2或3所述的方法, 其中, 截取所述多个目标页面的第一状态图像, 包 括: 访问所述多个目标页面时, 在访 问链接中追加预设参数, 所述预设参数用于指示显示 过程中不移除所述预 先渲染内容; 截取所述多个目标页面的所述第一状态图像。 6.根据权利要求2或3所述的方法, 其中, 截取所述多个目标页面的第二状态图像, 包 括: 响应于检测到所述多个目标页面中的预设标签消失, 开始截取图像, 将截取到的图像 作为所述第二状态图像; 其中, 所述预设标签用于表征所述多个目标页面显示的内容为所 述预先渲染内容。 7.根据权利要求2或3所述的方法, 其中, 所述分析所述多个目标页面的所述第一状态 图像和所述第二状态图像, 得到所述目标产品线的网页质量 监测结果, 包括: 识别所述多个目标页面的所述第一状态图像的第一内容; 识别所述多个目标页面的所述第二状态图像的第二内容; 确定所述多个目标页面的所述第一内容和所述第二内容的相似度;权 利 要 求 书 1/3 页 2 CN 114782383 A 2根据所述多个目标页面的所述相似度, 得到所述目标产品线的网页质量 监测结果。 8.根据权利要求7 所述的方法, 还 包括: 在所述网页质量监测结果中存在所述相似度小于第 三阈值的目标页面的情况下, 输出 告警信息 。 9.一种网页质量 监测装置, 包括: 确定模块, 用于从目标产品线的多个页面中确定出多个目标页面; 截取模块, 用于截取所述多个目标页面的第一状态图像和第二状态图像, 所述第一状 态图像是预先渲染内容的图像, 所述第二状态图像是真实渲染内容的图像, 所述第一状态 图像早于所述第二状态图像显示; 监测模块, 用于分析所述多个目标页面的所述第一状态图像和所述第二状态图像, 得 到所述目标产品线的网页质量 监测结果。 10.根据权利要求9所述的装置, 其中, 所述确定模块, 包括: 第一确定子模块, 用于在所述目标产品线的页面结构不固定的情况下, 从访 问量达到 第一阈值的页面中筛选出第一数量的页面, 直至确定所述第一数量的页面所包括的页面组 件总数满足预设条件; 在所述第一数量的页面所包括的页面组件总数满足所述预设条件的 情况下, 根据所述第一数量的页面确定所述多个目标页面。 11.根据权利要求9所述的装置, 其中, 所述确定模块, 包括: 第二确定子模块, 用于所述目标产品线的页面结构固定的情况下, 从访 问量达到第二 阈值的页面中筛 选出第二数量的页面; 根据所述第二数量的页面确定所述多个目标页面。 12.根据权利要求9或10所述的装置, 所述确定模块, 还 包括: 构建子模块, 用于根据所述多个目标页面构建多个集 合; 第三确定子模块, 用于从所述多个集合中确定出至少一个目标集合, 所述目标集合包 括的不同页面组件的总数与所述目标产品线的页面组件总数之间的比值达 到预设比值; 第四确定子模块从所述至少一个目标集合中确定出最小集合, 所述最小集合中的目标 页面数最小; 第五确定 子模块, 用于将所述 最小集合包括的目标页面作为所述多个目标页面。 13.根据权利要求9或10所述的装置, 其中, 所述截取模块, 包括: 第一截取子模块, 用于访问所述多个目标页面 时, 在访问链接 中追加预设参数, 所述预 设参数用于指示显示过程中不移除所述预先渲染 内容; 截取所述多个目标页面的所述第一 状态图像。 14.根据权利要求9或10所述的装置, 其中, 所述截取模块, 包括: 第二截取子模块, 用于响应于检测到所述多个目标页面中的预设标签消失, 开始截取 图像, 将截取到的图像作为所述第二状态图像; 其中, 所述预设标签用于表征所述多个目标 页面显示的内容 为所述预 先渲染内容。 15.根据权利要求9或10所述的装置, 其中, 所述 监测模块, 包括: 第一识别子模块, 用于识别所述多个目标页面的所述第一状态图像的第一内容; 第二识别子模块, 用于识别所述多个目标页面的所述第二状态图像的第二内容; 第六确定子模块, 用于确定所述多个目标页面的所述第 一内容和所述第 二内容的相似 度;权 利 要 求 书 2/3 页 3 CN 114782383 A 3

PDF文档 专利 网页质量监测方法、装置、设备以及存储介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 网页质量监测方法、装置、设备以及存储介质 第 1 页 专利 网页质量监测方法、装置、设备以及存储介质 第 2 页 专利 网页质量监测方法、装置、设备以及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 01:00:05上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。