本文作者:kaifamei

一种客户号压缩和解压方法及装置与流程

更新时间:2025-01-09 06:55:56 0条评论

一种客户号压缩和解压方法及装置与流程



1.本发明属于数据处理领域,尤其涉及一种客户号压缩和解压方法及装置。


背景技术:



2.客户数据是公司最重要的资产,公司往往在运营方面需要对一批客户进行营销,因此,会产生大量的数据集。
3.现有技术中,应用huffman编码,利用字符出现的频度构造二叉树,通过构造的二叉树获得对应字符的编码,进行形成的一种无损编码方法。
4.但是,基于客户号编码规则,可预测到最大的两个字符应为1和6,其他字符出现的频率大体一致,欲编码的字符出现频率接近均匀分布,huffman编码无法充分压缩数据集,压缩效率低。


技术实现要素:



5.鉴于上述问题,本技术提出了一种客户号压缩和解压方法及装置,为了提高客户号的压缩效率,具体方案如下:
6.一种客户号压缩方法,包括:
7.获取待压缩客户号集合,所述待压缩客户号集合包括多个待压缩客户号,每个待压缩客户号包括省市编码字段、顺序号字段和吉祥数字段;所述顺序号字段为九个字节,所述省市编码字段为两个字节,所述吉祥数字段为一个字节;
8.对所述多个待压缩客户号进行分组,得到多个待压缩客户号分组;每个待压缩客户号分组中包括一个顺序号字段和一个序列集合,所述序列集合中包括至少一个序列,每个序列是由同一待压缩客户号中的省市编码字段和吉祥数字段组成的;
9.针对每个待压缩客户号分组,对所述待压缩客户号分组进行压缩,得到分组压缩结果,所述分组压缩结果包括顺序号字段压缩结果、序列集合压缩结果以及预设结尾标志,所述序列集合压缩结果中包括至少一个序列压缩结果,所述顺序号字段压缩结果为四个字节,每个所述序列压缩结果为一个字节,所述预设结尾标志为一个字节;
10.基于各个分组压缩结果确定所述待压缩客户号集合的压缩结果。
11.可选的,所述对所述待压缩客户号分组进行压缩,得到分组压缩结果,包括:
12.基于预设的省市编码字段映射表和吉祥数字段映射表对所述待压缩客户号分组进行转码,转码后的顺序号字段为四个字节,转码后的每个序列包括省市编码字段映射值和吉祥数字段映射值,所述省市编码字段映射值为一个字节,所述吉祥数字段映射值为一个字节;
13.将转码后的每个序列中的省市编码字段映射值和吉祥数字段映射值合并,得到合并后的序列,所述合并后的序列为一个字节,所述字节的低六位对应省市编码字段映射值,高两位对应吉祥数字段映射值;
14.对所述转码后的顺序号字段和合并后的序列进行二进制编码,得到所述待压缩客
户号分组的二进制表示;
15.在所述待压缩客户号分组的二进制表示末尾添加预设结尾标志,得到分组压缩结果。
16.可选的,所述获取待压缩客户号集合,包括:
17.获取原始客户号集合,所述原始客户号集合包括多个原始客户号,每个原始客户号包括固定值字段、省市编码字段、顺序号字段、校验码字段和吉祥数字段;
18.对所述原始客户号集合中每个原始客户号进行清洗,消除每个原始客户号中的固定值字段和校验码字段,得到待压缩客户号集合。
19.可选的,所述对所述多个待压缩客户号进行分组,得到多个待压缩客户号分组,包括:
20.针对每个待压缩客户号,以所述待压缩客户号的顺序号字段为键,以所述待压缩客户号的省市编码字段和吉祥数字段组成的序列为值,得到所述待压缩客户号对应的键值对;
21.将各个待压缩客户号对应的键值对中,具有相同的键的键值对划定为同一分组,得到多个所述待压缩客户号分组。
22.可选的,所述基于各个分组压缩结果确定所述待压缩客户号集合的压缩结果,包括:
23.将各个分组压缩结果进行组合,得到组合后的压缩结果;
24.将所述组合后的压缩结果确定为所述待压缩客户号集合的压缩结果;
25.或者,采用预设的压缩算法对所述组合后的压缩结果进行再次压缩,得到所述待压缩客户号集合的压缩结果。
26.一种客户号解压方法,包括:
27.获取压缩结果,所述压缩结果包括多个分组压缩结果,每个分组压缩结果包括顺序号字段压缩结果、序列集合压缩结果以及预设结尾标志,所述序列集合压缩结果中包括至少一个序列压缩结果,所述顺序号字段压缩结果为四个字节,每个所述序列压缩结果为一个字节,所述预设结尾标志为一个字节;
28.针对每个分组压缩结果,对所述分组压缩结果中的前四个字节进行解压,得到顺序号字段,所述顺序号字段为九个字节;对所述分组压缩结果中除去前四个字节以及预设结尾标志之后剩余字节中的每个字节进行解压,得到一组省市编码字段和吉祥数字段,所述省市编码字段为两个字节,所述吉祥数字段为一个字节;将每组省市编码字段和吉祥数字段与所述顺序号字段进行组合得到所述分组压缩结果对应的解压后的客户号。
29.可选的,所述对所述分组压缩结果中除去前四个字节以及预设结尾标志之后剩余字节中的每个字节进行解压,得到一组省市编码字段和吉祥数字段,包括:
30.将所述字节的低六位转换为省市编码字段的映射值,高两位转换为吉祥数字段的映射值;
31.基于预设的省市编码字段映射表,将所述省市编码字段的映射值转换为省市编码字段;
32.基于预设的吉祥数字段映射表,将所述吉祥数字段的映射值转换为吉祥数字段。
33.可选的,在得到各个解压后的客户号之后,还包括:
34.针对每个解压后的客户号,基于所述客户号的顺序号字段、省市编码字段和吉祥数字段,确定所述客户号的校验码字段;基于预设字段顺序,将所述客户号的顺序号字段、省市编码字段、吉祥数字段、校验码字段和预设固定值字段进行组合,得到对应的原始客户号。
35.一种客户号压缩装置,包括:
36.获取单元,用于获取待压缩客户号集合,所述待压缩客户号集合包括多个待压缩客户号,每个待压缩客户号包括省市编码字段、顺序号字段和吉祥数字段;所述顺序号字段为九个字节,所述省市编码字段为两个字节,所述吉祥数字段为一个字节;
37.分组单元,用于对所述多个待压缩客户号进行分组,得到多个待压缩客户号分组;每个待压缩客户号分组中包括一个顺序号字段和一个序列集合,所述序列集合中包括至少一个序列,每个序列是由同一待压缩客户号中的省市编码字段和吉祥数字段组成的;
38.压缩单元,用于针对每个待压缩客户号分组,对所述待压缩客户号分组进行压缩,得到分组压缩结果,所述分组压缩结果包括顺序号字段压缩结果、序列集合压缩结果以及预设结尾标志,所述序列集合压缩结果中包括至少一个序列压缩结果,所述顺序号字段压缩结果为四个字节,每个所述序列压缩结果为一个字节,所述预设结尾标志为一个字节;
39.确定单元,用于基于各个分组压缩结果,确定所述待压缩客户号集合的压缩结果。
40.一种客户号解压装置,包括:
41.获取单元,用于获取压缩结果,所述压缩结果包括多个分组压缩结果,每个分组压缩结果包括顺序号字段压缩结果、序列集合压缩结果以及预设结尾标志,所述序列集合压缩结果中包括至少一个序列压缩结果,所述顺序号字段压缩结果为四个字节,每个所述序列压缩结果为一个字节,所述预设结尾标志为一个字节;
42.解压单元,用于针对每个分组压缩结果,对所述分组压缩结果中的前四个字节进行解压,得到顺序号字段,所述顺序号字段为九个字节;对所述分组压缩结果中除去前四个字节以及预设结尾标志之后剩余字节中的每个字节进行解压,得到一组省市编码字段和吉祥数字段,所述省市编码字段为两个字节,所述吉祥数字段为一个字节;将每组省市编码字段和吉祥数字段与所述顺序号字段进行组合得到所述分组压缩结果对应的解压后的客户号。
43.基于上述技术方案,本发明提供的一种客户号压缩和解压方法及装置,获取待压缩客户号集合,待压缩客户号集合包括多个待压缩客户号,每个待压缩客户号包括省市编码字段、顺序号字段和吉祥数字段;顺序号字段为九个字节,省市编码字段为两个字节,吉祥数字段为一个字节,对多个待压缩客户号进行分组,得到多个待压缩客户号分组;每个待压缩客户号分组中包括一个顺序号字段和一个序列集合,序列集合中包括至少一个序列,每个序列是由同一待压缩客户号中的省市编码字段和吉祥数字段组成的,消除了部分冗余信息,针对每个待压缩客户号分组,对待压缩客户号分组进行压缩,得到分组压缩结果,分组压缩结果包括顺序号字段压缩结果、序列集合压缩结果以及预设结尾标志,序列集合压缩结果中包括至少一个序列压缩结果,顺序号字段压缩结果为四个字节,每个序列压缩结果为一个字节,预设结尾标志为一个字节,创建了一个以分组为单位的压缩解压结构,将特大数据集化解为小数据集进行并行处理,基于各个分组压缩结果确定待压缩客户号集合的压缩结果,减少了待压缩客户号集合的传输内容,使得该待压缩客户号集合可采用更小空
间进行存储,提高了压缩效率。
附图说明
44.通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
45.图1为本发明实施例公开的一种客户号压缩方法的流程示意图;
46.图2为本发明实施例公开的一种对所述待压缩客户号分组进行压缩,得到分组压缩结果的方法的流程示意图;
47.图3为本发明实施例公开的一种获取待压缩客户号集合的方法的流程示意图;
48.图4为本发明实施例公开的一种对所述多个待压缩客户号进行分组,得到多个待压缩客户号分组的方法的流程示意图;
49.图5为本发明实施例公开的一种基于各个分组压缩结果确定所述待压缩客户号集合的压缩结果的方法的流程示意图;
50.图6为本发明实施例公开的一种客户号解压方法的流程示意图;
51.图7为本发明实施例公开的一种对所述分组压缩结果中除去前四个字节以及预设结尾标志之后剩余字节中的每个字节进行解压,得到一组省市编码字段和吉祥数字段的方法的流程示意图;
52.图8为本技术实施例公开的一种客户号压缩装置的结构示意图;
53.图9为本技术实施例公开的一种客户号解压装置的结构示意图。
具体实施方式
54.需要说明的是,本发明提供的应用测试方法及装置可用于人工智能领域、区块链领域、分布式领域、云计算领域、大数据领域、物联网领域、移动互联领域、网络安全领域、芯片领域、虚拟现实领域、增强现实领域、全息技术领域、量子计算领域、量子通信领域、量子测量领域、数字孪生领域或金融领域。上述仅为示例,并不对本发明提供的应用测试方法及装置的应用领域进行限定。
55.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
56.本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换,这仅仅是描述本发明的实施例中对相同属性的对象在描述时所采用的区分方式。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,以便包含一系列单元的过程、方法、系统、产品或设备不必限于那些单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它单元。
57.为了提高客户号的压缩效率,本发明提供了一种客户号压缩方法,下面结合附图和具体实施方式对本发明提供的客户号压缩方法作进一步详细的说明。
58.请参阅附图1,图1为本发明实施例提供的一种客户号压缩方法的流程示意图。该方法可以包括以下步骤:
59.步骤s101:获取待压缩客户号集合,待压缩客户号集合包括多个待压缩客户号,每个待压缩客户号包括省市编码字段、顺序号字段和吉祥数字段;顺序号字段为九个字节,省市编码字段为两个字节,吉祥数字段为一个字节。
60.需要说明的是,客户号/客户编码是指在一个领域内唯一标识一个客户的一串数字所形成的编号。
61.步骤s102:对多个待压缩客户号进行分组,得到多个待压缩客户号分组;每个待压缩客户号分组中包括一个顺序号字段和一个序列集合,序列集合中包括至少一个序列,每个序列是由同一待压缩客户号中的省市编码字段和吉祥数字段组成的。
62.在本技术中,在不同省份可以生成相同的顺序号字段,针对每个待压缩客户号分组,可以从待压缩客户号分组中提取出顺序号字段,对待压缩客户号进行分组,得到一个顺序号字段和一个序列集合,具体将通过后面的实施例详细说明,此处不再展开描述。
63.步骤s103:针对每个待压缩客户号分组,对待压缩客户号分组进行压缩,得到分组压缩结果,分组压缩结果包括顺序号字段压缩结果、序列集合压缩结果以及预设结尾标志,序列集合压缩结果中包括至少一个序列压缩结果,顺序号字段压缩结果为四个字节,每个序列压缩结果为一个字节,预设结尾标志为一个字节。
64.在本技术中,针对每个待压缩客户号分组,对待压缩客户号分组进行压缩,得到顺序号字段压缩结果、至少一个序列压缩结果以及预设结尾标志,其中预设结尾标志可以为3f,具体将通过后面的实施例详细说明,此处不再展开描述。
65.步骤s104:基于各个分组压缩结果确定待压缩客户号集合的压缩结果。
66.在本技术中,待压缩客户号集合有多个待压缩客户号分组,针对每个待压缩客户号分组,有一个分组压缩结果,所以基于各个分组压缩结果,确定待压缩客户号集合的压缩结果。
67.综上所述,本发明实施例提供的客户号压缩方法,获取待压缩客户号集合,待压缩客户号集合包括多个待压缩客户号,每个待压缩客户号包括省市编码字段、顺序号字段和吉祥数字段;顺序号字段为九个字节,省市编码字段为两个字节,吉祥数字段为一个字节,对多个待压缩客户号进行分组,得到多个待压缩客户号分组;每个待压缩客户号分组中包括一个顺序号字段和一个序列集合,序列集合中包括至少一个序列,每个序列是由同一待压缩客户号中的省市编码字段和吉祥数字段组成的,消除了部分冗余信息,针对每个待压缩客户号分组,对待压缩客户号分组进行压缩,得到分组压缩结果,分组压缩结果包括顺序号字段压缩结果、序列集合压缩结果以及预设结尾标志,序列集合压缩结果中包括至少一个序列压缩结果,顺序号字段压缩结果为四个字节,每个序列压缩结果为一个字节,预设结尾标志为一个字节,创建了一个以分组为单位的压缩解压结构,将特大数据集化解为小数据集进行并行处理,基于各个分组压缩结果确定待压缩客户号集合的压缩结果,减少了待压缩客户号集合的传输内容,使得该待压缩客户号集合可采用更小空间进行存储,提高了压缩效率。
68.在上述本发明公开的实施例的基础上,在本发明的再一个实施例中,对步骤s103对待压缩客户号分组进行压缩,得到分组压缩结果的具体实现方式进行了详细说明。
69.作为一种可实施方式,请参阅附图2,为本发明公开的一种对待压缩客户号分组进行压缩,得到分组压缩结果的方法的流程示意图。该方法可以包括以下步骤:
70.步骤s201:基于预设的省市编码字段映射表和吉祥数字段映射表对待压缩客户号分组进行转码,转码后的顺序号字段为四个字节,转码后的每个序列包括省市编码字段映射值和吉祥数字段映射值,省市编码字段映射值为一个字节,吉祥数字段映射值为一个字节。
71.其中,预设的省市编码字段映射表如表1所示:
72.[0073][0074]
表1省市编码字段映射表
[0075]
预设的吉祥数字段映射表如表2所示:
[0076]
序号原值(字符)映射值(数值)编码(8bit)161000000012820000001039300000011
[0077]
表2吉祥数字段映射表
[0078]
在本技术中,对待压缩客户号分组中的顺序号字段进行转码,顺序号字段表征范围为1-999999999,在一个32bit表示的无符号整数范围内,可以使用4个字节表示,对待压缩客户号分组中的序列集合进行转码,其中省市编码字段共有34个,在一个8bit的无符号整数范围内,可以使用1个字节表示,吉祥数字段共有3个,在一个8bit的无符号整数范围内,可以使用1个字节表示。
[0079]
步骤s202:将转码后的每个序列中的省市编码字段映射值和吉祥数字段映射值合并,得到合并后的序列,合并后的序列为一个字节,字节的低六位对应省市编码字段映射值,高两位对应吉祥数字段映射值。
[0080]
在本技术中,转码后的每个序列中的省市编码字段映射值占一个字节中的六位,转码后的每个序列中的吉祥数字段映射值占一个字节中的两位,可以进行合并,得到合并后的序列。
[0081]
步骤s203:对转码后的顺序号字段和合并后的序列进行二进制编码,得到待压缩客户号分组的二进制表示。
[0082]
需要说明的是,客户号是以二进制来存储的。
[0083]
步骤s204:在待压缩客户号分组的二进制表示末尾添加预设结尾标志,得到分组压缩结果。
[0084]
在本技术中,需要判断合并后的序列是不是待压缩客户号分组中最后的序列,若是,则在待压缩客户号分组的二进制表示末尾添加预设结尾标志,得到分组压缩结果.
[0085]
综上所述,本发明实施例提供的如对待压缩客户号分组进行压缩,得到分组压缩结果的方法,合并后的序列减小了所需的存储空间,预设结尾标志有利于进行解码。
[0086]
在上述本发明公开的实施例的基础上,在本发明的再一个实施例中,对步骤s101获取待压缩客户号集合的具体实现方式进行了详细说明。
[0087]
作为一种可实施方式,请参阅附图3,为本发明公开的一种获取待压缩客户号集合的方法的流程示意图。该方法可以包括以下步骤:
[0088]
步骤s301:获取原始客户号集合,原始客户号集合包括多个原始客户号,每个原始客户号包括固定值字段、省市编码字段、顺序号字段、校验码字段和吉祥数字段。
[0089]
在本技术中,根据客户号编码规则表可知,原始客户号包括5个字段,分别固定值字段、省市编码字段、顺序号字段、校验码字段和吉祥数字段,固定值字段为两个字节,省市编码字段为两个字节,顺序号字段为九个字节,校验码字段为两个个字节,吉祥数字段为一个字节。
[0090]
其中,客户号编码规则表如表3所示:
[0091][0092][0093]
表3客户号编码规则表
[0094]
步骤s302:对原始客户号集合中每个原始客户号进行清洗,消除每个原始客户号中的固定值字段和校验码字段,得到待压缩客户号集合。
[0095]
在本技术中,根据信息论可知,一个已知的不变的编码信息量为0,因此固定值字段可以不必进行编码,在解码时直接恢复即可;校验码字段是由固定值字段、顺序号字段、吉祥数字段通过iso 7064mode 97-10算法得到的,因此,此字段的信息量与固定值字段+顺序号字段+吉祥数字段的信息量相同,也无进行需编码,在解码时直接使用固定公式重新计算即可,所以一个客户号只有3个字段具有信息量,分别为顺序号字段、省市编码字段和吉祥数字段。
[0096]
综上所述,本发明实施例提供的获取待压缩客户号集合的方法,消除固定值字段和校验码字段,减少了冗余的信息,可采用更小空间进行存储,提高了压缩效率。
[0097]
在上述本发明公开的实施例的基础上,在本发明的再一个实施例中,对步骤s102对多个待压缩客户号进行分组,得到多个待压缩客户号分组的具体实现方式进行了详细说明。
[0098]
作为一种可实施方式,请参阅附图4,为本发明公开的一种对多个待压缩客户号进行分组,得到多个待压缩客户号分组的方法的流程示意图。该方法可以包括以下步骤:
[0099]
步骤s401:针对每个待压缩客户号,以待压缩客户号的顺序号字段为键,以待压缩客户号的省市编码字段和吉祥数字段组成的序列为值,得到待压缩客户号对应的键值对。
[0100]
在本技术中,例如,**市第100号客户,其客户号可表征11000000100,**省第100号客户,其客户号可表征为13000000100,二者均有相同的顺序号字段000000100,以顺序号字段为键,以省市编码字段和吉祥数字段组成的序列为值,组成(顺序号,[省市号、吉祥数])键值对。
[0101]
步骤s402:将各个待压缩客户号对应的键值对中,具有相同的键的键值对划定为同一分组,得到多个待压缩客户号分组。
[0102]
综上所述,本发明实施例提供的对多个待压缩客户号进行分组,得到多个待压缩客户号分组的方法,顺序号字段在省市维度存在较大的重复,通过合减小了存储空间,同时将具有相同的键的键值对划定为同一分组,也减小了存储空间,提高了压缩效率。
[0103]
在上述本发明公开的实施例的基础上,在本发明的再一个实施例中,对步骤s104基于各个分组压缩结果确定待压缩客户号集合的压缩结果的具体实现方式进行了详细说明。
[0104]
作为一种可实施方式,请参阅附图5,为本发明公开的一种基于各个分组压缩结果确定待压缩客户号集合的压缩结果的方法的流程示意图。该方法可以包括以下步骤:
[0105]
步骤s501:将各个分组压缩结果进行组合,得到组合后的压缩结果。
[0106]
步骤s502:将组合后的压缩结果确定为待压缩客户号集合的压缩结果,或者,采用预设的压缩算法对组合后的压缩结果进行再次压缩,得到待压缩客户号集合的压缩结果。
[0107]
在本技术中,预设的压缩算法可以为huffman等方法。
[0108]
综上所述,本发明实施例提供的基于各个分组压缩结果确定待压缩客户号集合的压缩结果的方法,采用huffman等方法对组合后的压缩结果进行再次压缩,可以进一步提高压缩效率。
[0109]
针对上述客户号压缩方法,本发明提供了一种客户号解压方法,下面结合附图和具体实施方式对本发明提供的客户号解压方法作进一步详细的说明。
[0110]
请参阅附图6,图6为本发明实施例提供的一种客户号解压方法的流程示意图。该方法可以包括以下步骤:
[0111]
步骤s601:获取压缩结果,压缩结果包括多个分组压缩结果,每个分组压缩结果包括顺序号字段压缩结果、序列集合压缩结果以及预设结尾标志,序列集合压缩结果中包括至少一个序列压缩结果,顺序号字段压缩结果为四个字节,每个序列压缩结果为一个字节,预设结尾标志为一个字节。
[0112]
在本技术中,获取的压缩结果有多个分组压缩结果,需要分别对每个分组压缩结果进行分析,得到顺序号字段压缩结果、序列集合压缩结果以及预设结尾标志。
[0113]
步骤s602:针对每个分组压缩结果,对分组压缩结果中的前四个字节进行解压,得到顺序号字段,顺序号字段为九个字节;对分组压缩结果中除去前四个字节以及预设结尾标志之后剩余字节中的每个字节进行解压,得到一组省市编码字段和吉祥数字段,省市编码字段为两个字节,吉祥数字段为一个字节;将每组省市编码字段和吉祥数字段与顺序号
字段进行组合得到分组压缩结果对应的解压后的客户号。
[0114]
在本技术中,顺序号字段压缩结果为前四个字节,对分组压缩结果中的前四个字节进行十进制表示,得到顺序号字段,分组压缩结果中除去前四个字节以及预设结尾标志之后剩余字节中的每个字节为一个序列,对分组压缩结果中除去前四个字节以及预设结尾标志之后剩余字节中的每个字节进行解压得到省市编码字段和吉祥数字段,具体将通过后面的实施例详细说明,此处不再展开描述。
[0115]
综上所述,本发明实施例提供的客户号解压的方法,与上述实施例提供的客户号压缩方法相对应,能够对客户号进行还原,并且减小了客户号的存储空间。
[0116]
在上述本发明公开的实施例的基础上,在本发明的再一个实施例中,对对分组压缩结果中除去前四个字节以及预设结尾标志之后剩余字节中的每个字节进行解压,得到一组省市编码字段和吉祥数字段的具体实现方式进行了详细说明。
[0117]
作为一种可实施方式,请参阅附图7,为本发明公开的一种对分组压缩结果中除去前四个字节以及预设结尾标志之后剩余字节中的每个字节进行解压,得到一组省市编码字段和吉祥数字段的方法的流程示意图。该方法可以包括以下步骤:
[0118]
步骤s701:将字节的低六位转换为省市编码字段的映射值,高两位转为吉祥数字段的映射值。
[0119]
步骤s702:基于预设的省市编码字段映射表,将省市编码字段的映射值转换为省市编码字段。
[0120]
步骤s703:基于预设的吉祥数字段映射表,将吉祥数字段的映射值转换为吉祥数字段。
[0121]
综上所述,本发明实施例提供的对分组压缩结果中除去前四个字节以及预设结尾标志之后剩余字节中的每个字节进行解压,得到一组省市编码字段和吉祥数字段的方法,通过预设的省市编码字段映射表和吉祥数字段映射表,得到省市编码字段和吉祥数字段,解压过程简单易操作。
[0122]
在上述本发明公开的实施例的基础上,在本发明的再一个实施例中,对在得到各个解压后的客户号之后的具体实现方式进行了详细说明。
[0123]
作为一种可实施方式,在得到各个解压后的客户号之后,还可以针对每个解压后的客户号,基于客户号的顺序号字段、省市编码字段和吉祥数字段,确定客户号的校验码字段;基于预设字段顺序,将客户号的顺序号字段、省市编码字段、吉祥数字段、校验码字段和预设固定值字段进行组合,得到对应的原始客户号。
[0124]
在本技术中,根据客户号的顺序号字段、省市编码字段和吉祥数字段,通过iso 7064mode 97-10算法确定客户号的校验码字段,直接恢复校验码字段和预设固定值字段字段,得到对应的原始客户号。
[0125]
综上所述,本发明实施例提供的另一种客户号解压的方法,增加了固定值字段和校验码字段,使得客户号的数据更加完整清晰。
[0126]
上述本发明公开的实施例中详细描述了方法,对于本发明的方法可采用多种形式的装置实现,因此本发明还公开了一种客户号压缩装置,下面给出具体的实施例进行详细说明。
[0127]
请参阅附图8,图8为本技术实施例公开的一种客户号压缩装置的结构示意图,该
装置包括:
[0128]
获取单元11,用于获取待压缩客户号集合,所述待压缩客户号集合包括多个待压缩客户号,每个待压缩客户号包括省市编码字段、顺序号字段和吉祥数字段;所述顺序号字段为九个字节,所述省市编码字段为两个字节,所述吉祥数字段为一个字节。
[0129]
分组单元12,用于对所述多个待压缩客户号进行分组,得到多个待压缩客户号分组;每个待压缩客户号分组中包括一个顺序号字段和一个序列集合,所述序列集合中包括至少一个序列,每个序列是由同一待压缩客户号中的省市编码字段和吉祥数字段组成的。
[0130]
压缩单元13,用于针对每个待压缩客户号分组,对所述待压缩客户号分组进行压缩,得到分组压缩结果,所述分组压缩结果包括顺序号字段压缩结果、序列集合压缩结果以及预设结尾标志,所述序列集合压缩结果中包括至少一个序列压缩结果,所述顺序号字段压缩结果为四个字节,每个所述序列压缩结果为一个字节,所述预设结尾标志为一个字节。
[0131]
确定单元14,用于基于各个分组压缩结果,确定所述待压缩客户号集合的压缩结果。
[0132]
上述本发明公开的实施例中详细描述了方法,对于本发明的方法可采用多种形式的装置实现,因此本发明还公开了一种客户号解压装置,下面给出具体的实施例进行详细说明。
[0133]
请参阅附图9,图9为本技术实施例公开的一种客户号解压装置的结构示意图,该装置包括:
[0134]
获取单元21,用于获取压缩结果,所述压缩结果包括多个分组压缩结果,每个分组压缩结果包括顺序号字段压缩结果、序列集合压缩结果以及预设结尾标志,所述序列集合压缩结果中包括至少一个序列压缩结果,所述顺序号字段压缩结果为四个字节,每个所述序列压缩结果为一个字节,所述预设结尾标志为一个字节。
[0135]
解压单元22,用于针对每个分组压缩结果,对所述分组压缩结果中的前四个字节进行解压,得到顺序号字段,所述顺序号字段为九个字节;对所述分组压缩结果中除去前四个字节以及预设结尾标志之后剩余字节中的每个字节进行解压,得到一组省市编码字段和吉祥数字段,所述省市编码字段为两个字节,所述吉祥数字段为一个字节;将每组省市编码字段和吉祥数字段与所述顺序号字段进行组合得到所述分组压缩结果对应的解压后的客户号。
[0136]
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
[0137]
另外需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
[0138]
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现,当然也可以通过专用硬件包括专用集成电路、专用cpu、专用存储器、专用元器件等来实现。一般情况下,凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现,而且,用来实现同一功能的具体硬件结构也可以是多种多样的,例如模拟电路、数字电路或专用电路等。但是,对本发明而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘,u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
[0139]
综上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制。尽管参照上述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对上述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

技术特征:


1.一种客户号压缩方法,其特征在于,包括:获取待压缩客户号集合,所述待压缩客户号集合包括多个待压缩客户号,每个待压缩客户号包括省市编码字段、顺序号字段和吉祥数字段;所述顺序号字段为九个字节,所述省市编码字段为两个字节,所述吉祥数字段为一个字节;对所述多个待压缩客户号进行分组,得到多个待压缩客户号分组;每个待压缩客户号分组中包括一个顺序号字段和一个序列集合,所述序列集合中包括至少一个序列,每个序列是由同一待压缩客户号中的省市编码字段和吉祥数字段组成的;针对每个待压缩客户号分组,对所述待压缩客户号分组进行压缩,得到分组压缩结果,所述分组压缩结果包括顺序号字段压缩结果、序列集合压缩结果以及预设结尾标志,所述序列集合压缩结果中包括至少一个序列压缩结果,所述顺序号字段压缩结果为四个字节,每个所述序列压缩结果为一个字节,所述预设结尾标志为一个字节;基于各个分组压缩结果确定所述待压缩客户号集合的压缩结果。2.根据权利要求1所述的方法,其特征在于,所述对所述待压缩客户号分组进行压缩,得到分组压缩结果,包括:基于预设的省市编码字段映射表和吉祥数字段映射表对所述待压缩客户号分组进行转码,转码后的顺序号字段为四个字节,转码后的每个序列包括省市编码字段映射值和吉祥数字段映射值,所述省市编码字段映射值为一个字节,所述吉祥数字段映射值为一个字节;将转码后的每个序列中的省市编码字段映射值和吉祥数字段映射值合并,得到合并后的序列,所述合并后的序列为一个字节,所述字节的低六位对应省市编码字段映射值,高两位对应吉祥数字段映射值;对所述转码后的顺序号字段和合并后的序列进行二进制编码,得到所述待压缩客户号分组的二进制表示;在所述待压缩客户号分组的二进制表示末尾添加预设结尾标志,得到分组压缩结果。3.根据权利要求1所述的方法,其特征在于,所述获取待压缩客户号集合,包括:获取原始客户号集合,所述原始客户号集合包括多个原始客户号,每个原始客户号包括固定值字段、省市编码字段、顺序号字段、校验码字段和吉祥数字段;对所述原始客户号集合中每个原始客户号进行清洗,消除每个原始客户号中的固定值字段和校验码字段,得到待压缩客户号集合。4.根据权利要求1所述的方法,其特征在于,所述对所述多个待压缩客户号进行分组,得到多个待压缩客户号分组,包括:针对每个待压缩客户号,以所述待压缩客户号的顺序号字段为键,以所述待压缩客户号的省市编码字段和吉祥数字段组成的序列为值,得到所述待压缩客户号对应的键值对;将各个待压缩客户号对应的键值对中,具有相同的键的键值对划定为同一分组,得到多个所述待压缩客户号分组。5.根据权利要求1至4中任意一项所述的方法,其特征在于,所述基于各个分组压缩结果确定所述待压缩客户号集合的压缩结果,包括:将各个分组压缩结果进行组合,得到组合后的压缩结果;将所述组合后的压缩结果确定为所述待压缩客户号集合的压缩结果;
或者,采用预设的压缩算法对所述组合后的压缩结果进行再次压缩,得到所述待压缩客户号集合的压缩结果。6.一种客户号解压方法,其特征在于,包括:获取压缩结果,所述压缩结果包括多个分组压缩结果,每个分组压缩结果包括顺序号字段压缩结果、序列集合压缩结果以及预设结尾标志,所述序列集合压缩结果中包括至少一个序列压缩结果,所述顺序号字段压缩结果为四个字节,每个所述序列压缩结果为一个字节,所述预设结尾标志为一个字节;针对每个分组压缩结果,对所述分组压缩结果中的前四个字节进行解压,得到顺序号字段,所述顺序号字段为九个字节;对所述分组压缩结果中除去前四个字节以及预设结尾标志之后剩余字节中的每个字节进行解压,得到一组省市编码字段和吉祥数字段,所述省市编码字段为两个字节,所述吉祥数字段为一个字节;将每组省市编码字段和吉祥数字段与所述顺序号字段进行组合得到所述分组压缩结果对应的解压后的客户号。7.根据权利要求6所述的方法,其特征在于,所述对所述分组压缩结果中除去前四个字节以及预设结尾标志之后剩余字节中的每个字节进行解压,得到一组省市编码字段和吉祥数字段,包括:将所述字节的低六位转换为省市编码字段的映射值,高两位转换为吉祥数字段的映射值;基于预设的省市编码字段映射表,将所述省市编码字段的映射值转换为省市编码字段;基于预设的吉祥数字段映射表,将所述吉祥数字段的映射值转换为吉祥数字段。8.根据权利要求6或7所述的方法,其特征在于,在得到各个解压后的客户号之后,还包括:针对每个解压后的客户号,基于所述客户号的顺序号字段、省市编码字段和吉祥数字段,确定所述客户号的校验码字段;基于预设字段顺序,将所述客户号的顺序号字段、省市编码字段、吉祥数字段、校验码字段和预设固定值字段进行组合,得到对应的原始客户号。9.一种客户号压缩装置,其特征在于,包括:获取单元,用于获取待压缩客户号集合,所述待压缩客户号集合包括多个待压缩客户号,每个待压缩客户号包括省市编码字段、顺序号字段和吉祥数字段;所述顺序号字段为九个字节,所述省市编码字段为两个字节,所述吉祥数字段为一个字节;分组单元,用于对所述多个待压缩客户号进行分组,得到多个待压缩客户号分组;每个待压缩客户号分组中包括一个顺序号字段和一个序列集合,所述序列集合中包括至少一个序列,每个序列是由同一待压缩客户号中的省市编码字段和吉祥数字段组成的;压缩单元,用于针对每个待压缩客户号分组,对所述待压缩客户号分组进行压缩,得到分组压缩结果,所述分组压缩结果包括顺序号字段压缩结果、序列集合压缩结果以及预设结尾标志,所述序列集合压缩结果中包括至少一个序列压缩结果,所述顺序号字段压缩结果为四个字节,每个所述序列压缩结果为一个字节,所述预设结尾标志为一个字节;确定单元,用于基于各个分组压缩结果,确定所述待压缩客户号集合的压缩结果。10.一种客户号解压装置,其特征在于,包括:获取单元,用于获取压缩结果,所述压缩结果包括多个分组压缩结果,每个分组压缩结
果包括顺序号字段压缩结果、序列集合压缩结果以及预设结尾标志,所述序列集合压缩结果中包括至少一个序列压缩结果,所述顺序号字段压缩结果为四个字节,每个所述序列压缩结果为一个字节,所述预设结尾标志为一个字节;解压单元,用于针对每个分组压缩结果,对所述分组压缩结果中的前四个字节进行解压,得到顺序号字段,所述顺序号字段为九个字节;对所述分组压缩结果中除去前四个字节以及预设结尾标志之后剩余字节中的每个字节进行解压,得到一组省市编码字段和吉祥数字段,所述省市编码字段为两个字节,所述吉祥数字段为一个字节;将每组省市编码字段和吉祥数字段与所述顺序号字段进行组合得到所述分组压缩结果对应的解压后的客户号。

技术总结


本发明实施例提供了一种客户号压缩和解压的方法和装置,应用于大数据领域以及金融领域,获取待压缩客户号集合,待压缩客户号集合包括多个待压缩客户号,每个待压缩客户号包括省市编码字段、顺序号字段和吉祥数字段;对多个待压缩客户号进行分组,得到多个待压缩客户号分组;每个待压缩客户号分组中包括一个顺序号字段和一个序列集合,针对每个待压缩客户号分组,对待压缩客户号分组进行压缩,得到分组压缩结果,分组压缩结果包括顺序号字段压缩结果、序列集合压缩结果以及预设结尾标志,基于各个分组压缩结果确定待压缩客户号集合的压缩结果,减少了待压缩客户号集合的传输内容,使得该待压缩客户号集合可采用更小空间进行存储,提高了压缩效率。提高了压缩效率。提高了压缩效率。


技术研发人员:

申文龙 李龙

受保护的技术使用者:

中国农业银行股份有限公司

技术研发日:

2022.10.27

技术公布日:

2023/1/13


文章投稿或转载声明

本文链接:http://www.wtabcd.cn/zhuanli/patent-1-85140-0.html

来源:专利查询检索下载-实用文体写作网版权所有,转载请保留出处。本站文章发布于 2023-01-28 18:27:20

发表评论

验证码:
用户名: 密码: 匿名发表
评论列表 (有 条评论
2人围观
参与讨论