首页 > 作文

网址转二维码

更新时间:2023-03-12 14:18:19 阅读: 评论:0

银行年度工作总结-郊祭

网址转二维码
2023年3月12日发(作者:老年人旅游)

QR二维码的生成与识别原理

一、简介

二维码(2-dimensionalbarcode),是用某种特定的几何图形按一定规律在平面(二

维方向上)分布的黑白相间的图形记录数据符号信息的。二维码的种类包括:QR

Code,DataMatrix,MaxiCode,Aztec,Vericode,PDF417,Ultracode,Code49,Code16K等。

其中QRCode是被广泛使用的二维码,QR全称QuickRespon,与其他编码方式相比,

QR二维码具有存储容量大、编码速度快的特点,并且它也能表示更多的数据类型:比

如:字符,数字,日文,中文等等。随着近几年智能手机的迅猛发展,QR二维码得到

了广泛的应用。

关于QR二维码的标准,可参见标准文档(QRCodeSpec):

/files/datasheets/misc/qr_

二、应用现状

随着智能机的普及和手机摄像头成像能力的提升,为了提高向机器内输入信息的速

度,QR二维码得到迅猛发展,在许多行业中得到应用。

在一维码时代,“扫码”主要应用在超市或图书馆等场所,以获取商品价格或图书

分类等有限的特定信息。二维码可以存储大容量数据,给人们的生活带来巨大方便。

从开始的扫描二维码提取文字或网址,到后来“扫一扫”添加好友、关注个人或公

司微信或微博,再到扫码支付,二维码的应用已经非常普遍。

三、基础知识

QR码可分为不同的尺寸,或者叫版本Version。Version1是21x21的矩阵,Version

2是25x25的矩阵,Version3是29的尺寸,每增加一个version,就会增加4的尺寸,

公式是:(V-1)*4+21(V是版本号)最高Version40,(40-1)*4+21=177,所以最高是

177x177的正方形。

样例如下:

定位图案

PositionDetectionPattern是定位图案,用于标记二维码的矩形大小。这三个定位图

案有白边叫SeparatorsforPostionDetectionPatterns。之所以三个而不是四个意思就是三

个就可以标识一个矩形了。

TimingPatterns也是用于定位的。原因是二维码有40种尺寸,尺寸过大了后需要

有根标准线,不然扫描的时候可能会扫歪了。

AlignmentPatterns只有Version2以上(包括Version2)的二维码需要这个东东,

同样是为了定位用的。

功能性数据

FormatInformation存在于所有的尺寸中,用于存放一些格式化数据的。

VersionInformation在Version7以上,需要预留两块3x6的区域存放一些版本信

息。

数据码和纠错码

除了上述的那些地方,剩下的地方存放DataCode数据码和ErrorCorrectionCode

纠错码。

四、数据编码

QR码支持如下的编码:

Numericmode:数字编码,从0到9。如果需要编码的数字的个数不是3的倍数,

那么,最后剩下的1或2位数会被转成4或7bits,则其它的每3位数字会被编成10,

12,14bits,编成多长还要看二维码的尺寸。

Alphanumericmode:字符编码,包括0-9,大写的A到Z(没有小写),以及符号

$%*+–./:包括空格。这些字符会映射成一个字符索引表。如下所示:(其中的SP

是空格,Char是字符,Value是其索引值)编码的过程是把字符两两分组,然后转成下

表的45进制,然后转成11bits的二进制,如果最后有一个落单的,那就转成6bits的二

进制。而编码模式和字符的个数需要根据不同的Version尺寸编成9,11或13个二进制

(如下表中Table3)

Bytemode:字节编码,可以是0-255的ISO-8859-1字符。有些二维码的扫描器可

以自动检测是否是UTF-8的编码。

Kanjimode:日文编码,也是双字节编码。同样,也可以用于中文编码。

ExtendedChannelInterpretation(ECI)mode:主要用于特殊的字符集。并不是所有

的扫描器都支持这种编码。

StructuredAppendmode:用于混合编码,也就是说,这个二维码中包含了多种编

码格式。

FNC1mode:这种编码方式主要是给一些特殊的工业或行业用的。比如GS1条形码

之类的。

这里我们主要介绍最常用的数字编码和字符编码。

下面两张表中,Table2是各个编码格式的“编号”(注:中文是1101),编号要写

在FormatInformation中。Table3表示了不同版本(尺寸)的二维码,对于数字、字符、

字节和Kanji模式下,对于单个编码的2进制的位数。(编码规范表可参见二维码规格说

明书)

举例说明:

示例一:数字编码

例如,在Version1的尺寸下,纠错级别为H的情况下,编码:01234567的编码

方式如下:

1.把上述数字分成三组:01234567

2.把他们转成二进制:012转成;345转成;67转成

1000011。

3.把这三个二进制串起来:011

4.把数字的个数转成二进制(version1-H是10bits):8个数字的二进制是

5.把数字编码的标志0001和第4步的编码加到前面:00

011

示例二:字符编码

同样,在Version1的尺寸下,纠错级别为H的情况下,编码:AC-42的编码方式如

下:

1.从字符索引表中找到AC-42这五个字条的索引(10,12,41,4,2)

2.两两分组:(10,12)(41,4)(2)

3.把每一组转成11bits的二进制:

(10,12)10*45+12等于462转成

(41,4)41*45+4等于1849转成

(2)等于2转成000010

4.把这些二进制连接起来:1110;

5.把字符的个数转成二进制(Version1-H为9bits):5个字符,5转成000000101;

6.在头上加上编码标识0010和第5步的个数编码:1

1110;

五、结束符和补齐符

假如我们有个HELLOWORLD的字符串要编码,根据上面的示例二,我们可以得到

下面的编码

编码字符数HELLOWORLD的编码

11111111

001101

还要加上结束符:

编码字符数HELLOWORLD的编码结束

111111110

11101

0000

按8bits重排

如果所有的编码加起来不是8个倍数我们还要在后面加上足够的0,比如上面一共

有78个bits,所以还要加上2个0,然后按8个bits分好组:

0

11000000

补齐码(PaddingBytes)

最后,如果还没有达到最大的bits数的限制,还要加一些补齐码(PaddingBytes),

PaddingBytes就是重复下面的两个bytes:1111(这两个二进制转成十

进制是236和17,关于每一个Version的每一种纠错级别的最大Bits限制,可以参看

QRCodeSpec)

假设我们需要编码的是Version1的Q纠错级,那么,其最大需要104个bits,而

我们上面只有80个bits,所以,还需要补24个bits,也就是需要3个PaddingBytes,

我们就添加三个,于是得到下面的编码:

01101

1100

上面的编码就是数据码了,叫DataCodewords,每一个8bits叫一个codeword,我

们还要对这些数据码加上纠错信息。

六、纠错码

上面我们说到了一些纠错级别,ErrorCorrectionCodeLevel,二维码中有四种级别的

纠错,这就是为什么二维码有残缺还能扫出来,也就是为什么有人在二维码的中心位置

加入图标。

错误修正容量

L水平7%的字码可被修正

M水平15%的字码可被修正

Q水平25%的字码可被修正

H水平30%的字码可被修正

那么,QR是怎么对数据码加上纠错码的?首先需要对数据码进行分组,也就是分

成不同的Block,然后对各个Block进行纠错编码,对于如何分组,可以查看QRCode

Spec的定义表。这里注意最后两列:

NumberofErrorCodeCorrectionBlocks:需要分多少个块。

ErrorCorrectionCodePerBlocks:每一个块中的code个数,所谓的code的个数,

也就是有多少个8bits的字节。

举例说明:上述的Version5+Q纠错级:需要4个Blocks(2个Blocks为一组,共

两组),第一组的两个Blocks中各15个bits数据+各9个bits的纠错码(注:表中的

codewords就是一个8bits的byte)(再注:最后一例中的(c,k,r)的公式为:c=k+2

*r,因为后脚注解释了:纠错码的容量小于纠错码的一半)

下图给一个5-Q的示例(因为二进制写起来会让表格太大,这里使用十进制表示,

可以看到每一块的纠错码有18个codewords,也就是18个8bits的二进制数)

组块数据对每个块的纠错码

11678574

1195

25247241223

229248186161

11139

2246246667118134242

73886221981991466

872124157

2917163163

120133

21182238

3415150

7

27613375242

2387619523

192141

276151

57236

17236

23575933106

4132178236

(注:二维码的纠错码主要是通过Reed-Solomonerrorcorrection(里德-所罗门纠

错算法)来实现的)。

七、最终编码

上述步骤完成之后,还要把数据码和纠错码的各个codewords交替放在一起。交替

规则如下:

对于数据码:把每个块的第一个codewords先拿出来按顺度排列好,然后再取第一

块的第二个,如此类推。如上述示例中的DataCodewords如下:

块1

6785741195

块2

246246667886221981991466

块3

38826134151507

块4

7636

我们先取第一列的:67,246,182,70

然后再取第二列的:67,246,182,70,85,246,230,247

如此类推:67,246,182,70,85,246,230,247………………,38,

6,50,17,7,236

对于纠错码,也是一样:

1

25247245416111139

2

87263163120133

3

27676

4

2357593336

和数据码取的一样,得到:213,87,148,235,199,204,116,159,…………

39,133,141,236

然后,再把这两组放在一起(纠错码放在数据码之后)得到:

67,246,182,70,85,246,230,247,70,66,247,118,134,7,119,86,87,118,50,194,38,

134,7,6,85,242,118,151,194,7,134,50,119,38,87,16,50,86,38,236,6,22,82,17,18,

198,6,236,6,199,134,17,103,146,151,236,38,6,50,17,7,236,213,87,148,235,199,

204,116,159,11,96,177,5,45,60,212,173,115,202,76,24,247,182,133,147,241,124,

75,59,223,157,242,33,229,200,238,106,248,134,76,40,154,27,195,255,117,129,

230,172,154,209,189,82,111,17,10,2,86,163,108,131,161,163,240,32,111,120,192,

178,39,133,141,236

这就是数据区。

RemainderBits

最后再加上ReminderBits,对于某些Version的QR,上面的还不够长度,还要加上

RemainderBits,比如:上述的5Q版的二维码,还要加上7个bits,RemainderBits加零

就好了。关于哪些Version需要多少个Remainderbit,可以参看QRCodeSpec的第15

页的Table-1的定义表。

八、画二维码图

PositionDetectionPattern

首先,先把PositionDetection图案画在三个角上。(无论Version如何,这个图案的

尺寸不变)

AlignmentPattern

然后,再把Alignment图案画上(无论Version如何,这个图案的尺寸就是这么大)

关于Alignment的位置,可以查看QRCodeSpec的第81页的Table-E.1的定义表

(下表是不完全表格)

下图是根据上述表格中的Version8的一个例子(6,24,42)

TimingPattern

接下来是TimingPattern的线

ormatInformation

再接下来是FormationInformation,下图中的蓝色部分。

FormatInformation是一个15个bits的信息,每一个bit的位置如下图所示:(注意

图中的DarkModule,是永远出现的)

这15个bits中包括:

5个数据bits:其中,2个bits用于表示使用什么样的ErrorCorrectionLevel,3个

bits表示使用什么样的Mask

10个纠错bits。主要通过BCHCode来计算

然后15个bits还要与110做XOR操作。这样就保证不会因为我们选

用了00的纠错级别和000的Mask,从而造成全部为白色,这会增加我们的扫描器的图

像识别的困难。

下面是一个示例:

关于ErrorCorrectionLevel如下表所示:

关于Mask图案如后面的Table23所示。

VersionInformation

再接下来是VersionInformation(版本7以后需要这个编码),下图中的蓝色部分。

VersionInformation一共是18个bits,其中包括6个bits的版本号以及12个bits的

纠错码,下面是一个示例:

而其填充位置如下:

数据和数据纠错码

然后是填接我们的最终编码,最终编码的填充方式如下:从左下角开始沿着红线填

我们的各个bits,1是黑色,0是白色。如果遇到了上面的非数据区,则绕开或跳过。

掩码图案

这样下来,图基本填好了,但是,也许那些点并不均衡,如果出现大面积的空白或

黑块,扫描识别会变得困难。所以,最后还要做Masking操作。QR的Spec中描述到,

QR有8个Mask你可以使用,其中,各个mask的公式在各个图下面。所谓mask,就

是和上面生成的图做XOR操作。Mask只会和数据区进行XOR,不会影响功能区。(注:

选择一个合适的Mask也是有算法的)

其Mask的标识码如下所示:(其中的i,j分别对应于上图的x,y)

下面是Mask后的一些样子,可以看到被某些MaskXOR了的数据变得比较零散了。

Mask过后的二维码就成最终的图了。

九、识别:

既然二维码的生成搞懂了,那么识别就会变得简单,基本上就是生成的逆过程。对

于手机端扫描QR二维码的识别而言,重点在于摄像头获取数据后,对数据的最初处理,

这里以Android手机识别QR二维码为例、以源码为主要依据进行简要说明。

1、获取摄像头原始数据。

首先Android提供了PreviewCallback接口,只要在Activity里实现PreviewCallback

接口后,就会自动重载这个函数:publicvoidonPreviewFrame(byte[]data,Cameracamera)

这个函数里的data就是实时预览帧视频,也就是摄像头返回的最原始的数据。这

样,就解决了如何获取摄像头数据的问题。

一旦程序调用PreviewCallback接口,就会自动调用onPreviewFrame这个函数。调

用PreviewCallback的方法有三种。分别是:tPreviewCallback,tOneShotPreviewCallback,

tPreviewCallbackWithBuffer,程序中使用第二种方式,示例如下:

至于何时触发onPreviewFrame()这个函数来获得摄像头数据,一般选择按一个按键

触发一次或者每隔一段时间触发一次,无论如何,只要在该触发的地方写上

ShotPreviewCallback();便会自动触发一次。这样我们就可以

得到手机摄像头实时预览帧视频数据data。

2、解码数据

获取该数据后,要对二维码进行解码,我们在DecodeHandler类中定义了解码方法:

privatevoiddecode(byte[]data,intwidth,intheight){}

我们重点对该方法进行分析:

①第78-82行代码,最初的数据应该被看成为一个矩阵数据,只是把它存放在一维数

组byte中,这里是将其转换成转置矩阵,即a[i][j]与a[j][i]交换,因此在83-85行代码中,

对宽高也进行了调换;

②第88-95行代码,这是解析数据最为关键的代码,88行我们定义了

PlanarYUVLuminanceSource类的对象,关于YUV数据格式以及该类的介绍参见后面的附

录一。

③最后,需要将PlanarYUVLuminanceSource类处理的数据转化成Bitmap对象。代码的

第91行即为此操作。

④至此,我们得到了二维码图片的Bitmap对象,就可以按照二维码生成的逆过程运

算对数据进行解析。

⑤解码示例:

例如,程序在进行解码分析时,首先要根据版本信息和纠错级别进行判断,即读取

VersionInformation和DataandErrorCorrectionCodewords处数据,若取得版本为1,

接错级别为H,按照QR码的规范,查下表:

可知应读取数据区连续的72个bits作为一个整体,比如我们读到如下数据:

111111

11101100

对于该数据,按照QR码的规范,前四位为编码格式编号,即0010对应的是

字符编号,说明后面的内容为字符;

根据QR码编码规范,版本为1、纠错级别为H的编码,数字个数占九位,即

取编码格式编号的后九位:000000101,转换成十进制为5,即得知该数据包含5个

字符。

再次按照QR码编码规范,字符编码过程中,每一组数据为11位,并且如果

最后有一个落单的,那就转成6bits的二进制。那么根据有5个字符,我们取随后

的28位数据,即为真正的数据编码:

1110

将上述三组数据转换成十进制即为(462,1849,2),根据字符编码的编码规范,编

码的过程是把字符两两分组,然后转成下表的45进制。那么,分别将462、1849、

2转化为45进制转换之前的数据,得到(10,12)(41,4)(2),查询字符编码表,得出对

应的字符分别为:A,C,-,4,2,即原始数据为AC-42,解码结束。

3、将获取数据与解码关联

在实际的应用中,因为数据的识别解析过程比较慢,并且二维码识别、解码一

次不一定能成功,那么要如何科学的把上述两步(获取数据与解码)关联在一起呢?

首先,由于数据识别和解析是一个耗时操作,我们要利用线程机制,在一个线

程中操作,这里我们定义了一个继承Thread的DecodeThread类,该线程与

DecodeHandler配合,完成解析数据的功能,

由于一次识别不一定成功,那么就要在每次识别失败之后,重新调用第一小节

中提到的方法,重新获取摄像头数据进行再一次的解析。如此反复直到成功。

那么程序又是如何判定失败的呢?在上面贴出的第95行代码处,将最终的解

析结果放置在rawResult变量中,后面对该变量就行判断,若不为空,则表示解析

成功,若为空表示解析失败,程序会向主线程发送解析失败的消息,来进行再一次

的解析过程。

附录一:YUV数据格式简介以及获得像素数据。

YUV是一种颜色编码方法。“Y”表示明亮度(Luminance、Luma),“U”和“V”则是

色度、浓度。与我们熟知的RGB类似,YUV也是一种颜色编码方法,主要用于电视系统以及

模拟视频领域,它将亮度信息(Y)与色彩信息(UV)分离,没有UV信息一样可以显示完

整的图像,只不过是黑白的,这样的设计很好地解决了彩色电视机与黑白电视的兼容问题。

并且,YUV不像RGB那样要求三个独立的视频信号同时传输,所以用YUV方式传送占用极

少的频宽。

YUV码流的存储格式其实与其采样的方式密切相关,主流的采样方式有三种,

YUV4:4:4,YUV4:2:2,YUV4:2:0,用三个图来直观地表示采集的方式如下,其中黑点

表示采样该像素点的Y分量,空心圆圈表示采用该像素点的UV分量。

这样,可以根据其采样格式来从码流中还原每个像素点的YUV值,因为只有正确

地还原了每个像素点的YUV值,才能通过YUV与RGB的转换公式提取出每个像素点的

RGB值,然后显示出来。

对于代码中的PlanarYUVLuminanceSource类,其主要作用是获得像素数据。

PlanarYUVLuminanceSource继承自LuminanceSource这个抽象类,需要实现它的构造方

法,并重载getMatrix()和getRow(inty,byte[]row)方法。其构造方法中需要传入宽高,这

两个值指的就是图片的宽和高。getMatrix()方法会返回一个byte数组,这个数组就是图

片的像素数组。getRow(inty,byte[]row)如字面的意义,就是得到图片像素数组的一行。

其中的y就是需要的哪一个行的像素数组。

其构造方法主要代码为:

注:这里的byte数组是指图片的像素数组,而不是所谓Bitmap转换成byte数组。

Bitmap对象的getPixels方法可以取得的像素数组,但它得到是int型数组。根据其

api文档解释,取得的是color,也就是像素颜色值。每个像素值包含透明度,红色,绿

色,蓝色。所以白色就是0xffffffff,黑色就是0xff000000。直接由int型转成byte型。

再来就是getRow方法:

补充:getPixels得到的像素数组是一维的,也就是按照图片宽度逐行取像素颜色值

录入。如果想得到单行的像素数组内容,通过y*width就可以找该行的第一个像素值,

拷贝后面width个就可以得到该行的像素内容。

最后一个就是getMatrix()方法,它用来返回我们的图像转换成的像素数组。

本文发布于:2023-03-12 14:18:18,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/zuowen/1678601899226579.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

本文word下载地址:网址转二维码.doc

本文 PDF 下载地址:网址转二维码.pdf

相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图