基于区域梯度统计分析与卷积神经网络的条码定位算法研究

更新时间:2023-04-20 13:45:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

上海交通大学硕士学位论文

目 录

第一章引言 (1)

1.1条码定位算法的研究意义 (1)

1.2条码识别技术的历史和现状 (3)

1.3本文的研究内容及结构安排 (3)

1.3.1 现有条码识读装置与研究难点分析 (3)

1.3.2 本文主要工作 (5)

1.3.3 研究内容及本文结构安排 (5)

1.4本章小结 (6)

第二章条码定位技术概述 (7)

2.1一维、二维条码特点比较 (7)

2.2常见条码样式介绍 (8)

2.3实验条码简介 (9)

2.3.1 线性条形码(Linear Code) (9)

2.3.2 PDF417码(PDF417 Code) (10)

2.3.3 线性堆叠码(Linear×Linear code) (10)

2.3.4 线性PDF堆叠码(Linear×PDF417 code) (10)

2.4条码定位算法概述 (11)

2.5条码定位算法研究现状 (12)

2.5.1 条码定位的时域分析法 (12)

2.5.2 条码定位的频域分析方法 (14)

2.6本章小结 (16)

第三章基于图像处理的定位算法 (17)

3.1基于图像算法思路 (17)

3.2基于图像算法主体流程 (18)

3.3图像预处理 (19)

3.3.1 灰度化 (19)

3.3.2 边缘梯度计算 (20)

3.4区域梯度统计分析 (21)

3.5条纹粗定位 (24)

3.5.1 区域块一次合并 (25)

5

万方数据

上海交通大学硕士学位论文

3.5.2 一次合并遍历规则 (26)

3.5.3 区域块二次合并 (28)

3.6条纹精确定位 (30)

3.6.1 线性码 (31)

3.6.2 PDF417码 (33)

3.6.3 线性堆叠码 (35)

3.6.4 线性PDF堆叠码 (36)

3.7本章小结 (37)

第四章卷积神经网络CNN (39)

4.1特征学习与CNN (39)

4.2神经网络 (41)

4.2.1 神经元模型 (42)

4.2.2 神经网络模型 (42)

4.2.3 反向传播算法 (44)

4.3深度学习网络 (45)

4.3.1 自编码网络 (46)

4.3.2 逐层贪婪训练 (47)

4.4卷积神经网络 (49)

4.4.1 卷积 (49)

4.4.2 池化 (51)

4.4.3 网络结构 (52)

4.5本章小结 (54)

第五章深度学习框架CAFFE (55)

5.1C AFFE简介 (55)

5.2C AFFE特点 (56)

5.3现有学习框架比较 (57)

5.4C AFFE框架的结构 (57)

5.4.1 Blob (58)

5.4.2 Layer (58)

5.4.3 Net (58)

5.5C AFFE应用 (59)

5.6本章小结 (60)

第六章实验结果与分析 (61)

6.1基于图像处理的定位算法 (61)

6

万方数据

上海交通大学硕士学位论文

6.2基于卷积神经网络的定位算法 (64)

6.2.1 实验网络结构 (64)

6.2.2 PDF417码 (65)

6.2.3 线性码 (66)

6.3本章小结 (68)

第七章总结与展望 (69)

7.1论文总结 (69)

7.2展望 (70)

参考文献 (71)

致谢 (74)

攻读硕士学位期间已发表或录用的论文 (75)

7

万方数据

上海交通大学硕士学位论文

8 图目录

图 1-1 条码在生活场景中的应用领域 ............................................................ 2 图 1-2 条码应用于工业生产的定位、测距领域示例 ..................................... 2 图 2-1 常见条码类型举例 ............................................................................... 8 图 2-2 本文研究所用的四种条码类型:(a )为线性码、(b )为PDF417码、(c )为线性堆叠码、(d )为线性PDF 堆叠码。 ................................... 9 图 2-3 (a )为采用了微PDF417的CC-A 型复合条码;(b )为采用新编码规则的PDF417码的CC-C 型复合条码。 ..............................................10 图 2-4 条码识读基本流程 .............................................................................. 11 图 2-5 文献[4]具有运动模糊的二维码定位流程图 .......................................13 图 2-6 文献[8]中骨骼化效果。 ......................................................................14 图 2-7 DCT 系数中每一个频率段i G 的最大系数构成特征向量 ....................16 图 3-1线性码、PDF417码、 线性堆叠码、线性PDF 堆叠码中都具有黑白相间条纹的共同特征 ................................................................................17 图 3-2 基于图像的条码定位算法流程 ...........................................................18 图 3-3 具有黑白条纹特征区域块的直方图示例 ............................................23 图 3-4 区域块直方图尖峰性检测效果。(a)为预处理后灰度图像。(b)为采用(2-16)式的尖峰性检测效果图,图中亮度越大区域块表明该区域内黑白间隔天文出现概率越小,反之越暗出现概率越大。 ..............................24 图 3-5 条纹粗定位的算法流程 .......................................................................25 图 3-6 误检区域块所在边缘延伸方向往往和区域块主导角度方向垂直 .....27 图 3-7 一次合并遍历规则举例 .......................................................................27 图 3-8 二次合并算法举例 ..............................................................................29 图 3-9 条纹粗定位示例。(a)为区域梯度统计分析结果,粗定位操作的输入;(b)为一次合并结果;(c)二次合并结果。 ................................................30 图 3-10 沿着条纹方向的法向量方向搜索条纹顶点 ......................................30 图 3-11 错误的精确定位结果,需要使用平行校正操作 ..............................32 图 3-12 线性码精确定位流程图 .....................................................................33 图 3-13 PDF417码起始码与终止码结构 ........................................................34 图 3-14 PDF417码精确定位流程图 ................................................................34 图 3-15 线性堆叠码精确定位流程图 .............................................................35 图 3-16 线性堆叠码精确定位流程图 .............................................................37 图 4-1 神经元模型 ..........................................................................................42 万方数据

上海交通大学硕士学位论文

图4-2 三层人工神经网络结构 (43)

图4-3 自编码网络 (46)

图4-4 利用隐藏层的特征进行自学习的预测 (48)

图4-5 卷积中的稀疏连接与权值共享示意图。 (51)

图4-6 LeNet-5卷积神经网络的结构图 (52)

图4-7 最大值池化示意图 (53)

图5-1 Caffe构建的简单逻辑回归分类器 (59)

图6-1 数据集对同一条码的八种图像变换举例。从左到右、从上到下依次为:(a)模糊,(b)亮光,(c)暗光,(d)正常,(e)位移,(f)旋转,(g)水平倾斜,

(h)竖直倾斜 (61)

图6-2 数据集中的尺度变换。 (62)

图6-3 基于图像处理的定位算法结果举例 (63)

图6-4 实验网络结构 (65)

图6-5 基于卷积神经网络的算法在实际图像中所得检测结果 (66)

图6-6 实验所用数据集中正负样本示例。前两行为16种正样本,第三行为负样本。 (67)

9

万方数据

上海交通大学硕士学位论文

表目录

表格2-1 一维条码与二维条码性能比较 (7)

表格5-1 Caffe与现有主要深度学习框架的比较 (57)

表格6-1 基于图像处理的定位结果 (63)

表格6-2 本文提出的基于图像处理算法的时间效率 (63)

表格6-3 PDF417码训练、测试所用样本个数 (65)

表格6-4 线性码训练、测试所用数据集中样本个数 (67)

表格6-5 基于卷积神经网络模型的线性码测试结果 (67)

10

万方数据

上海交通大学硕士学位论文

第一章引言

信息化和信息技术日益发展的今天,信息和信息的采集、处理在人们的生活当中扮演了越发突出的角色。现代商业领域中,人们希望对来自各方面的信息能快速、正确、有效、实时处理和管理。因此,利用计算机实现的自动化采集和数据识别技术应运而生。条码技术作为其中的一种,因其成本低、技术简单、应用场景灵活多变等特点在众多的场合的到应用。为实现商业数据的交换,提高生产效率和经营效率做出了突出的贡献。

1.1 条码定位算法的研究意义

随着生产水平和信息技术的普及化,基于计算机的自动信息采集和处理技术正在丰富着人们处理数据的手段。商品社会和大规模产品生产、运输、销售等环节的发展要求一种有效的自动化识别技术,实现物件的自动识别、分销、记录与管理。在这种背景和需求下,条码技术开始出现。经过发展,条码技术已步入人们日常的生产生活中。在超市,商品通过条码识别得到金额从而结账;旅客可以根据登机牌上的条码信息候机登机;在邮政快递等物流领域,通过在包裹上贴上条码符号,可以轻松了解跟踪包裹物品的走向,实现自动化管理。

和其他识别技术相比,条码技术的特点有下面几个:技术简单,信息采集速度快,信息搭载量大,方式灵活,设备结构简单。正因为以上特点,条码技术在过去一段时间中得到了长足的发展,在各计算机管理领域得到应用。

以智能手机为代表,移动设备和移动互联网的兴起给条码技术拓展了新的应用场景。利用手机自带的高清摄像头,用户只需要拿起手机扫描二维码,就可以获得各种各样的信息接入。相较于过去,条码技术不仅仅是作为一个信息的载体出现,通过简单的扫码、解码、接入等动作,用户能够通过条码所指向的链接,去到不同的目的地。实际上,移动互联意义下的条码更像是一个打通线下有限信息和线上海量资源的接入口。通过线下条码信息的分发,商家可以轻而易举地实现广告的覆盖和用户流量的获取。而且由于条码方式的传播成本低廉,同时带有智能科技的新鲜感,相比于传统方式更能够吸引消费者的注意。从客户角度来看,客户得到的是一个快速的接入信息的入口。和过去手动输入的方法相比,条码扫描的方式更快捷、方便。我们也会发现现在越来越多人将交换条码作为身份信息交换手段的趋势,这也成为了名片之外新的社交方式。由此可以看见,条码技术在人们生活中的应用得到了巨大的扩展,为越来越多人所认可和使用。图1-1展示了生活中可能用到的一些条码应用场景。

1

万方数据

本文来源:https://www.bwwdw.com/article/irjq.html

Top