(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211291692.0
(22)申请日 2022.10.21
(71)申请人 深圳市城市交通 规划设计 研究中心
股份有限公司
地址 518131 广东省深圳市龙华区民治街
道龙塘社区星河传奇花园三期商厦1
栋C座1210
(72)发明人 张晓春 杜军 鄢全文 杨良
梁晨 刘星
(74)专利代理 机构 哈尔滨市伟晨专利代理事务
所(普通合伙) 23209
专利代理师 李冬爽
(51)Int.Cl.
G07C 9/20(2020.01)
G07B 11/00(2006.01)G06F 17/16(2006.01)
G06K 9/62(2022.01)
G06Q 50/26(2012.01)
(54)发明名称
一种交通卡号 实名匹配方法、 电子设备及存
储介质
(57)摘要
本发明提出一种交通卡号实名匹配方法、 电
子设备及存储介质, 属于交通卡号实名匹配技术
领域。 包括以下步骤: S1.对轨道刷卡数据进行预
处理; S2.判断轨道站点和扫码场所之间的映射
关系; S3.对实名扫码数据进行预处理; S4.构建
轨道刷卡进站稀疏矩阵和扫码进站稀疏矩阵;
S5.将三维稀 疏矩阵变换为二维矩阵; S6.计算轨
道刷卡数据和实名扫码数据之间的匹配度, 获取
交通卡号和个体匹配结果。 解决了现有技术中存
在的数据利用率低、 匹配率低和计算资源开销大
的技术问题。
权利要求书3页 说明书8页 附图2页
CN 115359592 A
2022.11.18
CN 115359592 A
1.一种交通卡号实名匹配方法, 其特征在于, 基于实名扫码数据和轨道刷卡数据实现
的一种交通 卡号实名匹配方法, 包括以下步骤:
S1.对轨道刷卡数据进行 预处理;
S2.判断轨道 站点和扫码场所之间的映射关系;
S3.对实名扫码数据进行 预处理;
S4.构建轨道刷卡进站稀疏矩阵和扫码进站稀疏矩阵;
S5.将三维稀疏矩阵变换为 二维矩阵;
S6.计算轨道刷卡数据和实名扫码数据之间的匹配度, 获取交通 卡号和个体匹配结果。
2.根据权利要求1所述的一种交通卡号实名匹配方法, 其特征在于, S1具体是: 包括以
下步骤:
S11.数据清洗: 删除员工卡、 单次卡、 特殊类型刷卡数据、 进站时间大于出站时间的数
据、 删除个体乘坐地铁的出站 时间和出站站点信息; 若出现极短时间内重复进入同一站点
的数据, 保留其中一条 数据;
S12.建立站点索引表: 从轨道刷卡数据中提取进站和出站站点, 去重后给予唯一自增
id作为轨道 站点索引;
S13.交通卡号筛选: 基于轨道刷卡数据覆盖时间范围、 覆盖工作日数量设定卡号在轨
道刷卡数据中出现的次数; 若轨道刷卡数据中卡号的出现次数小于设定的阈值, 则将小于
设定阈值的卡 号数据删除;
S14.建立交通卡号索引表: 从卡号筛选后的数据中提取卡号, 去重后给予唯一自增id
作为交通 卡号索引。
3.根据权利要求2所述的一种交通卡号实名匹配方法, 其特征在于, S2具体是: 包括以
下步骤:
S21.通过轨道站点名称和扫码场所名称, 通过正则表达式或NLP语义分析对轨道站点
名称和扫码场所名称进行匹配;
S22.通过轨道 站点和扫码场所之间的距离进行匹配, 采用下述公式计算两者距离:
=2*
*arcsin
其中,
代表场所纬度,
代表场所经度,
代表地球赤道半径;
S23.设定轨道站点和扫码场所之间的距离阈值; 当轨道站点和扫码场所满足名称匹配
条件且距离小于设定阈值时判断轨道 站点和扫码场所存在映射关系。
4.根据权利要求3所述的一种交通卡号实名匹配方法,其特征在于, S3具体是: 包括以
下步骤:
S31.时间筛选: 筛选实名扫码数据的时间与清洗后的轨道刷卡数据的最小时间和最大
时间对应的数据;
S32.场所筛选、 获取对应轨道站点索引: 基于场所映射结果, 删除与轨道站点不存在映
射关系的场所扫码数据, 获取与轨道 站点存在映射关系的扫码场所对应的轨道 站点索引;
S33.个体筛选: 设定个体在实名扫码数据中出现的次数, 个体在实名扫码数据中出现
的次数与设定的交通卡号在轨道刷卡数据中出现次数保持一致; 若实名扫码数据中个体的权 利 要 求 书 1/3 页
2
CN 115359592 A
2出现次数小于设定的阈值, 则将小于设定阈值的个 体数据删除;
S34.建立个体索引表: 从个体筛选后的实名扫码数据提取个体信息, 去重后给予唯一
自增id作为个 体索引。
5.根据权利要求4所述的一种交通卡号实名匹配方法,其特征在于, S4具体是: 包括以
下步骤:
S41.将轨道刷卡数据中的刷卡进站时间与实名扫码数据中的扫码时间通过下述公式
进行离散化, 获取时间片索引表:
其中,
代表将时间转换为10位时间戳,
代表清洗后的轨道刷卡数据和实名扫码
数据的最小时间,
代表向下取整;
S42.根据站点索引表和交通卡号索引表构建轨道刷卡进站稀疏矩阵; 预处理后的轨道
刷卡数据中存在的交通卡号、 站点、 时间所对应的交通卡号索引、 站点索引、 时间片索引下
的元素为1, 其 余为0;
S43.根据个体索引表、 轨道站点索引表构建扫码进站稀疏矩阵; 预处理后的实名扫码
数据中存在的个体、 站点、 时间所对应的交通卡号索引、 站点索引、 时间片索引下的元素为
1, 其余为0;
S44.将扫码进站稀疏矩阵向后扩展延伸n个时间片, 扩展延伸的矩阵元 素为1;
S45.将轨道刷卡进站稀疏矩阵需向前扩展延伸n个时间片, 扩展延伸的矩阵元 素为0。
6.根据权利要求5所述的一种交通 卡号实名匹配方法,其特 征在于, S5具体是:
采用如下规则进行变换:
其中,
代表站点索引,
代表时间片索引,
代表轨道刷卡进站
数据和扫码进站数据的最大时间片索引。
7.根据权利要求6所述的一种交通 卡号实名匹配方法,其特 征在于, S6具体是:
通过二维矩阵乘法运算计算轨道刷卡数据和实名扫码数据之间的匹配度, 将轨道刷卡
进站稀疏矩阵和扫码进站稀疏矩阵相乘, 得到的矩阵行索引和列索引分别为交通卡号索引
和个体索引, 矩阵中每个元素值为交通卡号索引和个体索引匹配度, 结合交通卡号索引表
和个体索引表获取交通 卡号和个体之间的匹配度;
设定匹配度阈值 为
, 当匹配度大于等于
时, 认为卡号匹配成功;
匹配度计算结果若存在一 卡对应多人或一人拥有 多卡现象时, 设定以下规则:
A一个交通 卡最多对应一人;
B一人最多拥有
交通卡;
每个交通卡号选取匹配度最高的对应个体作为该卡持有个体, 若大于
个交
通卡号匹配度最高的对应个体为同一个, 则认为前
个匹配度最高的交通卡号为
该个体持有卡。
8.一种电子设备, 其特征在于, 包括存储器和 处理器, 存储器存储有计算机程序, 所述权 利 要 求 书 2/3 页
3
CN 115359592 A
3
专利 一种交通卡号实名匹配方法、电子设备及存储介质
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 03:55:50上传分享