创新思维,提高发票真伪识别能力
--移动端发票真伪查询系统开发的现实构想
杨涵深 ( 南昌市湾里区国家税务局)
席 跃 ( 抚州市金溪县国家税务局)
随着我国经济不断发展,发票相关的违法犯罪活动日益增多,严
重的干扰了我国经济秩序的正常运行,打击成为近年来税务工
作的重点工作之一。本文在分析传统的发票真伪识别办法的不足基础
上,建议要充分利用日新月异的信息技术,开发移动端发票真伪查询
软件系统。
关键词: 识别 软件开发
随着我国经济的进一步发展,发票相关的违法犯罪活动日益增
多,严重的干扰了我国经济秩序的正常运行,打击成为近年来
税务工作的重点工作之一。传统的发票真伪识别需要到税务机关人工
输入发票号码进行查询,相当费时费力。在信息技术日新月异的今天,
如何利用信息技术创造性地解决发票真伪查询问题,是一个值得研究
的课题。本文拟提出发票真伪识别的新思路一开发移动端发票真伪查
询软件系统,抛砖引玉,以期引起理论界与实践界对此问题的更多关
注。
一、现有的发票真伪鉴定方法及存在的问题
1.系统查询法
通过CTAIS查询发票的流向信息,可知该发票是否是由开票单位
所领购,杜绝“真票假开”,即借开、代开现象。但无法防范“克隆票”
的存在,即当不法分子刻意制造一批与真发票相同的代码、号码的假
发票进行查询时,无法识别。为此,一些地方如南昌市在发票上设臵
了具有唯一性的校验码,以解决这个问题,但目前校验码在网上无法
查询,仅能通过票证中心查询校验码。
2.票面识别法
通过发票印制时的一系列特征如“错体字”、纸张特征、激光防
伪等来判断发票的真假。这种方法只能判断其是否为真票,但无法知
道该发票是否是由开票单位所领购,即不知是借开、代开的发票。
3.发票联与存根联比对法
通过人工对比发票联合存根联,这种方法由专业人员进行,可以
最大程度确保鉴定的准确性,但大规模比对时工作量大,效率低下。
二、真伪发票查询的新思路-开发移动端查询系统
(一)移动端发票真伪查询系统设计思路
软件的整体思路是基于现有的税务部门网站进行查询发票真伪
的方式进行整合改进,利用了最新的智能手机软件和刚刚兴起的无线
互联网技术,通过手机拍摄识别传输发票条码代替人工输入发票条
码,实现发票真伪查询的便捷化、移动化、人性化。使用时只需要用
手机拍摄下发票的条形码,然后软件自动运行,将识别的号码发送至
发票查询服务器,然后服务器再返回查询信息,并将信息显示在使用
者的手机屏幕上。
软件基本工作流程如下图1所示:
手机拍摄
条码图像
JPG图片
图像处理
处理后的二值化图像
识别条形码
发票编码
服务器查询
查询结果
根据结果
判断发票真伪
图1 软件流程图
(二)移动端发票真伪查询系统可行性分析
该软件安装于手机平台,依托于手机网络和已有的发票数据库,
免手工输入、简单易用,能够让纳税人即时得到发票真伪判断的信息。
1. 软件所需环境简单
(1)客户端环境
本软件在处理图片时于客户端进行,对客户端性能虽有一定的要
求,最低为ARM5以上智能机环境,带摄像头,但略低于当前流行的
智能机主流配臵。
(2)服务器端环境
服务器端基本可利用现有的发票查询系统,利用发票查询服务器
镜像待机一台移动端发票查询服务器,在硬件上基本无须改变,基本
要求能达到双核2.0+2G DDR3 RAM即可(基本为08年前后主流电脑
配臵)。
2.数据库资料易获得(不知是否是意思?请再适当补充点内容)
本软件系统比对发票真伪的数据库为目前已有的发票数据库资
料,不须另行开发。
(三)的优点
移动端发票真伪查询系统
1、为纳税人带来极大的方便
该系统能够给纳税人带来极大的方便。
(1)减轻纳税人的负担。纳税人不再需要到专门到税务机关或
者带有互联网的环境下去查询发票真伪,只要手机未欠费停机就可以
随时随地进行查询。
(2)查询方法简单、易于掌握。现有的网络发票查询,需要访
问专门的网页,点击特点的链接,相当一部分年纪较大的纳税人无法
掌握,使用该系统的话,只需要用手机拍摄发票然后发送信息就能静
待查询结果了,完全傻瓜式操作,任何人都能掌握。
(3)软件本身不增加纳税人的成本。软件要求的硬件环境只是
一台智能手机,不需要纳税人加装其他的硬件设施。四是提高纳税人
真伪发票鉴别能力。纳税人在拿到发票后,直接使用该软件查询,通
过查询结果可以得知该发票的出具人、查询次数等信息,能有效化解
靠物理防伪鉴别方法无法有效解决的发票真伪检验问题。
2、有利于税务机关提升发票管理水平
(1)有效打击手工发票“套票”。“套票”问题是中的比
较棘手的一种。纳税人取得普通发票“套票”,由于发票代码、号码
以及开具人名称都与真票一样,无法通过网站或12366查询真伪,只
能通过人工鉴别。利用本软件,可以有效鉴别“套票”,查询发票时
会返回该发票查询次数,如果是“套票”,查询次数将不止一次。
(2)提高税务机关办税效率。该软件能够大量降低发票鉴别时
的人工操作,减少纳税人上门查询发票的数量,有效缓解办税服务厅
的压力。
(3)作为在线开票系统的有效补充。就当前情况来看,在线发
票开具推广势在必行,在线发票开具能够从源头上遏制发票,能
彻底解决“套票”问题,但其查询发票依然需要有互联网接入,本软
件在移动端即可实现无线查询,适合各种网络情况,可以作为在线发
票查询的有效补充。
三、同类软件应用实例
苹果手机(IOS)上的一款免费软件,能够读取条码中的信息。
某人购买了一本书,为了鉴定其是否为正版,购买者用苹果手机(IOS)
上的免费软件扫描了这本书背后的二维码(图2),扫描结果(图3)
和书上标示的9787510412097一致,则表明该书为正版。该软件测试
表明,通过手机读取发票条码是完全可行的。
图2 图3
附录:软件相关技术
1.条形码
条码是由一组规则排列的条、空以及对应的字符组成的标记,
“条”指对光线反射率较低的部分,“空”指对光线反射率较高的部
分,这些条和空组成的数据表达一定的信息,并能够用特定的设备识
读,转换成与计算机兼容的二进制和十进制信息。对于每一种物品,
它的编码是唯一的,通过数据库,建立条码与对于物品的对应关系,
当条码的数据传到计算机上时,由计算机上的应用程序对数据进行操
作和处理。
1.1条码的构成
一个完整的条码见图1,它的组成次序依次为:静区(前)、起
始符、数据符、终止符、静区(后):
静区,指条码左右两端外侧与空的反射率相同的限定区域,它能
使阅读器进入准备阅读的状态,当两个条码相距距离较近时,静区则
有助于对它们加以区分,静区的宽度通常应不小于6mm(或10倍模
块宽度)。
起始/终止符,指位于条码开始和结束的若干条与空,标志条码
的开始和结束,同时提供了码制识别信息和阅读方向的信息。
数据符,位于条码中间的条、空结构,它包含条码所表达的特定
信息。
构成条码的基本单位是模块,模块是指条码中最窄的条或空,模
块的宽度通常以mm或mil(千分之一英寸)为单位。构成条码的一
个条或空称为一个单元,一个单元包含的模块数是由编码方式决定
的,有些码制中,如EA码,所有单元由一个或多个模块组成;而另
一些码制,如39码中,所有单元只有两种宽度,即宽单元和窄单元,
其中的窄单元即为一个模块。
图1标准条码
1.2条形码的码制
常用的条形码码制有EA码、UPC码、128码、39码、93码、交
叉25码,及Codabar(库德巴码)等,税务发票中的条形码使用的
是改进型EA-128(图2)码,这种编码是对EA码和UPC代码的补充
代码,是唯一能表示EA、UPC标准补充码的条码符号。
它是一种连续型、非定长、有含义的高密度代码。具有如下特点:
a. EA-128由一组平行的条和空组成的长方形图案。
b. 除终止符有13个模块组成,其他字符均由 11 个模块组成。
c. 在条码字符中,每3个条和3个空组成一个字符,终止符由
4个条和3个空组成。条和空都有4宽度单位,可以从一个模块宽到
4个模块宽。
d. EA-128条码有一个由字符START A (B或C)和字符 FC1 构
成的特殊双字符起始符,即 START ( B 或 C ) + FC1 。
e.符号中通常采用符号校验符。符号校验符不属于条码字符的一
部分,也区别于数据代码中的任何校验码。
f. 符号可以从左、右两个方向阅读。
g. 符号的长度取决于编码字符的个数,编码字符可以从3位到
32位(含应用标识符)。
h. 对于一个特定长度的EA-128条码符号,符号的尺寸可能
随放大系数的变化而变化。
i. 一般情况下,条码符号的尺寸是指标准尺寸(放大系数为1)。
放大系数的取值范围可从0.25 — 1.2 。
图2 EA-128条形码
2基于机器视觉的条码自动识别
2.1条码识别部分的构架
基于机器视觉的条码自动识别技术是利用摄像头直接得到被测
条码的图像,在经过系列软件处理,最后得到需要的条码编号。首先
必须进行图像预处理,这是条码识读前的关键步骤。图像处理效果的
好坏直接影响到条码能否正确识读。然后,将图像信息转化为条码所
代表的数字信息,这一过程称为条码识读。再通过译码、校验、纠错
处理来识读条码,最大限度降低由于条码印刷质量以及条码污染等各
种因素的干扰,提高发票条码的识读率。最后把识读结果发送至国税
设立的专用发票信息查询服务器。
条码图图像预条码条码
像输入处理识别纠错
图3 图像处理流程
2.2条码图像预处理
通常的基于机器视觉的条码自动识别预处理大体可分为几何校
正、滤波去噪、阈值处理三大部分。
a).几何校正
通常拍摄时会受到环境的影响,条码图像经常会发生变形、倾斜。
因此,需要对倾斜变形的条码图像进行几何校正。对条形码校正通常
采取变换矩阵处理。
变换后的点集矩阵=变换矩阵T×变换前的点集矩阵。设2D图像
变换矩阵为T,
abp
Tcdq
lms
ab
,其中子矩阵可以实现图像比例、镜像、错
cd
切和旋转变换。可以实现图像透视变换,
ab
cd
s
实现图像全比例缩放。通过调整矩阵即可实现图像的集合校
pq
T
正。
b).滤波除噪
拍摄时可能由于污迹或者摄像头不净造成图片包含噪声,为保证
图像处理质量,需要通过对夹杂噪声的条码图像进行滤波处理,以使
图像边缘保留并有效的消除噪声。滤波的方法如下:如图4所示,在
5×5的区域取包含点(i,j)的五角形、六角形区域各4个(图3a和
b),3×3的区域一个(图3 c),计算这九个区域的标准差和灰度平均值,
取标准差最小的区域的灰度平均值作为点(i,j)的灰度。鉴于手机CPU
能力较弱,可以将该过程设臵为可选以加快计算速度。
图4滤波三种区域
c).图像二值化
图像的二值化有利于图像的进一步处理,使图像变得简单,减少
处理数据量并凸显出感兴趣的目标的轮廓。图像经过二值化处理
f(x)
后得到的图像公式如下:
g(x)
255f(x,y)T
g(x)
0f(x,y)T
图像二值化过程中如何确定分割阈值T是关键。鉴于手机计算能
力弱,且当前手机摄像头都带有闪光灯,拍摄环境光较均匀的情况,
采用最简单的全局阈值二值化来处理图像。T的取值根据下面公式:
T
f(x)
i
i1
n
n
2.3条码的识别
通过图像预处理得到条码二值图像,然后通过算法来识别。这里
采用容错性较高的相似边距离测量法。如图所示,T表示一个条码字
符的宽度。C1、C2、C3、C4表示每个条码字符中四个相邻条、空的
宽度。T1、T2为相似边之间的距离。则:T=C1+C2+C3+C4,此字符的平
均单位元素宽度便为T/7,从而该字符的相似边之间距离T1、T2所包
含的单位元素个数分别为7*T1/T、7*T2/T的四舍五入值。由于此数
值与商品条码字符的逻辑值唯一对应,所以只需通过查表便可得到该
字符的逻辑值。
图5相似边测量法
2.4条码纠错
经过滤波二值化,在一定程度上消除了条、空误差对识别结果的
影响。但当系统误差较大的时候,译码会出错,甚至失败。一维码纠错
上主要采用校验码的方法。即从代码位臵序号第二位开始,用所有偶
(奇)数的数字代码求和的方法来校验条码的正确性。
本文发布于:2023-05-23 13:15:11,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/falv/fa/86/100291.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |