基于电子支付密码的支票自动容错识别系统研究

更新时间:2023-08-07 22:20:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

系统地研究了基于电子支付密码 (又称变码印鉴 )的支票自动容错识别技术 ,包括基于电子支付密码的支票识别系统的组成 ,支票数字图形的提出、特征提取和预处理、应用多种神经网络识别方法对大写和阿拉伯数字识别、对多种侯选方案进行容错识别等技术 ,并建立了支票识别原型系统 ,

 2000年7期

文章编号:100026788(2000)0720013205系统工程理论与实践第7期 

基于电子支付密码的支票自动容错识别系统研究3

赵 斌,王亚利,马赓坚,刘 勇,夏绍玮

(清华大学自动化系,北京100084)

摘要: 系统地研究了基于电子支付密码(又称变码印鉴)的支票自动容错识别技术,包括基于电子

支付密码的支票识别系统的组成,支票数字图形的提出、特征提取和预处理、应用多种神经网络识别

方法对大写和阿拉伯数字识别、对多种侯选方案进行容错识别等技术,并建立了支票识别原型系统,

并取得了理论成果,该系统有应用前景Λ

关键词: 电子支付密码;容错识别;神经网络;支票识别系统

中图分类号: TP391  α

ResearchonCheckAutomaticFault2tolerant

RecognitionSystemBasedonElectronicPaymentCipher

ZHAOBin,WANGYa2li,MAGeng2jian,LIUYong,XIAShao2wei

(AutomationDepartment,TsinghuaUniversity,Beijing100084)

Abstract: Thecheckautomaticfault2tolerantrecognitiontechnologiesbasedon

electronicpaymentcipherareinvestigatedsystematicallyinthispaper,whichincludes

theconstructionoftherecognitionsystem,theextractionofchecknumeralimage,

featureextractionandpre2processing,multi2neuralnetworksrecognitionmethodon

legalandcourtesyamount,fault2tolerantrecognitionofmulti2candidatescheme.A

prototypeofcheckrecognitionsystemisestablished,whichpossesstheoryfruitand

applicationprospect.

Keywords: electronicpaymentcipher;fault2tolerant;neuralnetworks;check

recognitionsystem

1 引言

随着经济的发展,支票已经成为日常商业活动中使用最为普遍和最为常用的一种支付手段和结算工具Λ但是,随着支票使用的日益广泛和普及,银行手工处理支票的工作量越来越大,影响了工作效率,降低了结算速度Λ基于电子支付密码的支票自动识别系统不仅可提高效率,还有利于支票的通存通兑,提高防伪功能Λ

由于支票识别的可靠性和正确性是该系统的关键,在本文有关的课题中,容错识别技术被作为重点来研究Λ

所谓容错识别技术包括两方面:一是通过多种识别技术的集成来实现容错,如几种神经网络等统计识别方法的综合分类方法,阿拉伯数字和大写数字的相互校验等Λ另一方面是利用支票识别的后处理检验,在多种候选结果中选择正确的结果,以实现在识别中不能识别的只能是拒识,达到误识率为零的要求Λ

本文着重讨论了基于电子支付密码的支票识别系统的组成,支票数字图形的提出、特征提取和预处理、应用多种神经网络识别方法对大写和阿拉伯数字识别,其中,有前馈神经网络(FNN)、自组织映射α收稿日期:1998212204

资助项目:国家自然科学基金(69775001)

系统地研究了基于电子支付密码 (又称变码印鉴 )的支票自动容错识别技术 ,包括基于电子支付密码的支票识别系统的组成 ,支票数字图形的提出、特征提取和预处理、应用多种神经网络识别方法对大写和阿拉伯数字识别、对多种侯选方案进行容错识别等技术 ,并建立了支票识别原型系统 ,

(SOM)神经网络和主元神经网络(PCNN)等,研究了算法有效性和提高识别率的途径,以及由以上几种网络组成的系统容错识别的可靠性Λ

2 基于电子支付密码的支票识别系统的形成

2.1 银行向用户提供电子支付密码的过程

银行是提供支票的部门,我国有多类银行,如人民银行、中国银行、工商银行等,另外还有各种信用社提供支票Λ用户包括各种企事业单位和公司等,我国尚无个人支票Λ目前电子支付密码还只是在个别银行试用Λ

某一银行向用户提供电子支付密码器的过程如下图1所示

:

图1银行向用户提供电子支付密码器的流程

开户者向银行申请购买电子支付密码器时,先由开户者在银行电脑中预留一个该用户的企业码(这相

)Λ并由银行的电脑中心产生一组随机数,该随机数和用户预留的企业当于传统的“预留图章”或者“签名”

码在计算机中共同产生该用户的密钥Λ密钥与计算机中的某一加密算法形成密码函数,通过计算机终端专用下载器,将密码函数装入电子支付密码器,售给用户Λ

电子支付密码器具有以下特点:

开户者通过输入用户密码参与了密码函数的形成过程,因而该电子支付密码器是该用户专用的Λ 密码函数与用户申请时计算中心所产生的随机数有关,因此,不是事先预置的或固定的函数关系Λ 加密算法采用了DES算法,它定义了16种独立的选择函数进行编码,并从16种编码函数任选8种进行运算Λ因此共有P816=518,918,000(约5亿)种加密算法Λ计算中心从这5亿种算法中随机任选一种给用户,所以任意两个用户几乎不可能有同一加密算法Λ做到了一户一码Λ

加密函数是由加密算法和用户密钥共同形成的,不同用户的加密函数不可能相同Λ保障了资金的安全Λ另外,应用了现场装载的加密函数,可有效地防止了支票的涂改Λ

电子支付密码器是一手持的小型液晶显示装置,大小如同一个手持计算器Λ屏幕有提示,可按提示输入以下参数:支票号、金额、支票签发日期,电子支付密码器就会自动显示出该张支票的密码数,它就是代替图章印鉴或签名的电子支付密码Λ用户将该密码填写在支票上,这张支票就生效了Λ

2.2 支票使用过程和银行核实办法

传统的支票使用和实现过程是支票接受银行将支票送交中国人民银行的清分中心,清分中心将支票送返各开户银行,由开户银行对支票的真伪进行检验,一般是工作人员对印章或签名进行核对Λ如通过,则支票有效,由清分中心再将开户银行的金额转入接受银行Λ

在以上过程中,清分中心任务很重,需要支票票面的有关信息手工录入计算机,并在得到支票生效信息后,尽快将应支付的金额转到有关银行Λ

由于传统方法是开户行用人工办法核对印章或签名,极为费时费力,可靠性也差Λ

应用电子支付密码器后,情况有很大的不同,如果支票接收单位的银行与开户银行是同一类银行,如

系统地研究了基于电子支付密码 (又称变码印鉴 )的支票自动容错识别技术 ,包括基于电子支付密码的支票识别系统的组成 ,支票数字图形的提出、特征提取和预处理、应用多种神经网络识别方法对大写和阿拉伯数字识别、对多种侯选方案进行容错识别等技术 ,并建立了支票识别原型系统 ,

同是中国银行,而且中国银行内部是联网的,就可由计算机终端直接输入有关信号或参数:支票号、金额、支票签发日期、电子支付密码数字等Λ由与中心银行联网的计算机根据所存各用户密码,对支票信息进行校核Λ如果参数相符,则通过Λ否则,支票无效作废,并通知有关单位Λ在以上检验的同时,有关银行已将该支票的所有信息存入计算机,不必再手工录入Λ

如果接受单位属于不同类型的银行,如已联网,可通过网络查询,核实支票的真伪Λ在没有联网的情况下,通常需将支票转到开户行进行校核Λ在校核正确后,支票合法,否则作废Λ

由此可见,应用了电子支付密码的校核系统,可提高支票流通的快速有效性和使用的可靠性Λ具体讲,有以下优点:

在任何情况下,如果接受支票的用户或单位对某一支票有怀疑,可直接用电话与开户银行联系,将支票参数告诉开户行,并请开户行在终端上检查真伪Λ这一查询功能保护了用户的利益,提高了支票的信用度Λ

电子支付密码产生的密码是由复杂的密码算法产生的,不同支票密码数字均不相同,有效地防止了假伪支票的流通,并做到“一机一密”或“一户一密”Λ

由于采用了密码软件现场装载技术,可使用户得以享受一机多帐户的功能Λ也就是说,如果一个企业在银行开立了多个帐户,则通过计算中心电子支付密码器通讯口,可将多帐号装载到用户的电子支付密码器中,实现了一机多帐户的功能Λ另外,由于采用了大容量存储器设计,使电子支付密码器可适应于多达8家银行的需要,实现了“一机多行”的要求Λ

如果银行能异地联网,并采用同样的电子支付密码器,则可异地查询和检验,这将极大地有利于保护用户的利益,并促进通存通兑的实现和加速资金周转Λ

但是,使用电子支付密码器后,仍需由清分中心自动录入,并将支票转到有关的不同银行,清分中心的工作量仍较大Λ这不仅要求将各类银行都联成网,而且要求实现支票的自动识别,动态检索,这在目前是很有意义的,后者也是下面要说明的主要内容Λ

3 支票容错自动识别系统

基于电子支付密码的支票自动容错识别系统处理流程如图2所示

:

图2基于电子支付密码的支票自动容错识别系统处理流程图

支票通过光学自动扫描仪录入,录入的信息可能有斜度,支票自动识别系统首先对录入的信息找正,然后去掉背景,如底色和表格等Λ再从中提取出字符Λ扫描仪录入的样本如图3:

(样本图像)支票中的字符包括手写体和印刷体,其中,日期、金额、密码均为手写体,大体有20—25个手写数字Λ帐号、支票号为印刷体,约有20个数字Λ手写数字常见连笔或断笔,所用笔的粗细也大不相同Λ因此,需求进行预处理Λ

预处理包含字符的正确分割和分割后数字的规范化Λ正确分割有两方面任务:去掉连笔段或正确确定其归属;找出断笔段并正确确定其归属,于是可以逐个提出数字Λ数字规范化的要求是将扫描信号的粗细均匀化,并压缩成一定大小的点阵Λ

目前单个数字的识别有多种方法,我们采用了神经网络、结构跟踪和统计算法等识别方法Λ但是,尽管单字识别率已达到95%以上,整张支票的识别率仍然不高Λ因为整张支票需要识别20个以上的数字Λ例

系统地研究了基于电子支付密码 (又称变码印鉴 )的支票自动容错识别技术 ,包括基于电子支付密码的支票识别系统的组成 ,支票数字图形的提出、特征提取和预处理、应用多种神经网络识别方法对大写和阿拉伯数字识别、对多种侯选方案进行容错识别等技术 ,并建立了支票识别原型系统 ,

图3 录入支票样本图像

如,单字识别率为95%,整张支票的识别率只有28%~36%Λ单字识别率为数99%,整张支票的识别率也只是71%~81%Λ

如上所述,支票自动识别的另一重要的要求是:只能正确识别或拒识,不得误识Λ因而尽管单字识别率已经有很大提高,仍然不能满足系统的要求Λ我们采用了多种识别方法递阶组合和综合集成技术,和电子支付密码校核方法相配合,可实现以上要求Λ电子支付密码中包含的密码函数如下:

V=f(D,M,Num,Ac)

其中:V是密码数字,D是日期,M是金额,Num是支票号,Ac是帐号Λ

识别的各项数字只有满足了以上密码函数关系,支票才能通过,系统将该支票送入正确输出端,否则,送入拒识输出端,转给人工处理Λ(1)

4 基于一类神经网络的容错系统的算法实现

我们研究了多种支票容错识别技术,这里仅介绍一类采用主元神经网络—自组织映射(PCNN-SOM)的特征提取和数字识别系统Λ经过大量的样本训练后,用于组成支票容错识别系统Λ包含汉字和大写数字的系统原理框图如图4

Λ

图4 包含汉字和大写数字的系统原理框图

支票容错识别的基本原理是:利用电子支付密码与支票上日期、金额、帐号等的函数关系,找出正确的结果来Λ由于印刷体数字识别率较高,神经网络识别的主要是手写体数字,如日期、金额、密码等Λ利用神经网络识别出的有多种候选结果,可用以下算法进行容错Λ下面我们主要讨论以日期、金额、密码等为识别对象的算法Λ

令A为日期,有m位,即A=a1,a2,…,am;B为金额,有n位,即B=b1,b2,…,bn;C为密码,有k位,即C=c1,c2,…,ckΖ于是整张支票的识别任务T可表示为:

系统地研究了基于电子支付密码 (又称变码印鉴 )的支票自动容错识别技术 ,包括基于电子支付密码的支票识别系统的组成 ,支票数字图形的提出、特征提取和预处理、应用多种神经网络识别方法对大写和阿拉伯数字识别、对多种侯选方案进行容错识别等技术 ,并建立了支票识别原型系统 ,

T=(2)(ABC)

其中,C=f(A,B)Ζ

如果实际识别出的数字A′,B′,C′中,有少数几位数有误,即A′≠A,B′≠B,C′≠CΖ令H( , )为两个字符串的Hamming距离,即两个字符串间不同字符的个数Ζ由于日期或金额中有任一位或少数几位有错误:

)+H(B,B′)Φsνm+n1ΦH(A,A′(3)

(4)就会引起密码极大的差别,故而有:)=H(f(A,B),f(A′))νsH(C,C′,B′

Q个候选方案,则有:

′′(A′T′i=iBiCi) i=1,2,…,q

′H(T′j,Tj+1)=1  j=1,2,…,q-  如上所述,用PCNN2SOM神经网络进行识别,可得出多个支票识别结果作为候选方案,如最多允许有(5)1(6)

(7)′H(T′i,Tj)Φd    i,j=1,2,…,q

其中,qΦQ,d称为容错数,是一个设定值Ζ

根据以上假设,我们可利用下列容错算法,得到正确的识别结果或拒识Ζ

′′算法1 if j,1<j<q,H(C′j,f(Aj,Bj))<s,

′′′     thenA=A′j,B=Bj,C=f(Aj,Bj),

 checkisrecognizedasT=(ABC)

   elserejectthecheck

由此可见,本算法不要求所有密码全部正确识别出来,只要未正确识别的密码数字个数小于s,利用以上算法就可给出日期、金额、密码等全部数值或拒识Ζ不会影响系统的可靠性Ζ本系统还加入了一个后处理部分,进行人工复核,以保证系统的可靠性Ζ

支票上的日期是阿拉伯数字或是大写数字,不论是那一种,它都有一定规律,如现有支票的日期上年份不可能超过2000年,月份不可能是12以上,日期也不可能超过31日Ζ利用以上规律,有利于系统自动找出正确结果Ζ同时,支票上金额的大写数字可用于校核阿拉伯金额数字,提高了总体识别率Ζ

本支票自动识别系统的整张支票识别率已达到了85 以上,可满足银行的支票自动处理的要求Ζ5 结论和建议

支票识别系统已在许多国家引起了关注,1997年由S.Impedovo,.S.P.Wang,H.Bunke主编出版的《自动银行支票处理》一书,收集了意大利、法国、俄国、巴西、中国、美国、加拿大和日本等国学者的文章,专门讨论了各国银行支票识别系统,其中包括了我们的文章[3]Λ支票自动识别系统是一种要求很高而又有很实用的系统Λ我们已建立了一个系统原型,取得了很大进展,为要达到实用程度,还需作一些艰苦的工作,我们将继续研究下去,以期能为国家的金融事业作出贡献Λ

参考文献:

[1] LeeSW.Multilayerclusterneuralnetworkfortotallyunconstrainedhandwrittennumeral

~792.recognition[J].NeuralNetworks,1995,8(5):783

[2] .AhybridapproachtounconstrainedhandwrittenWANGSong,SHUChang,XIAShaowei

numeralsrecognition[A].Proc.of3rhInternationalConferenceonSignalProcessing[C],Beijing,1996.

(下转第68页)

系统地研究了基于电子支付密码 (又称变码印鉴 )的支票自动容错识别技术 ,包括基于电子支付密码的支票识别系统的组成 ,支票数字图形的提出、特征提取和预处理、应用多种神经网络识别方法对大写和阿拉伯数字识别、对多种侯选方案进行容错识别等技术 ,并建立了支票识别原型系统 ,

68系统工程理论与实践

续表1 对应于不同平均理赔额和准备金的破产概率上界1 utue-Ru2000年7期t=10020030040050060070080090010001100120013001400150016001700180015001500227.31.779.708.770

15004500675.12.473.210.296.355.398.431.457

15007500.287.049.087.121.151.178.201.222.240.256

17001700481.73.861.725.796.830.850

17005100.638.216.312.381.432.473.505.532.554.572.588.602.614.624.634

17008500.473.050.091.131.167.200.229.256.280.301.320.338.354.369.382.394.406.416.426

表2 破产概率模拟值1 Μut=10020030040050060070080090010001100120013001400150016001700180010001000

10003000

10005000

12001200

12003600

12006000

15001500

15004500

15007500

17001700

17005100

17008500.202.035.013.212.063.011.231.054.012.261.068.004.253.272.283.294.300.305.309.309.310.310.310.311.311.312.312.312.313.067.080.090.098.101.101.104.104.106.106.108.109.109.109.109.109.109.015.021.032.035.038.041.042.042.042.042.043.043.044.044.044.044.044.275.309.335.349.356.358.362.369.371.377.379.381.385.386.389.389.391.090.116.139.155.165.171.178.180.185.186.188.190.192.194.195.196.196.026.032.041.042.047.052.056.059.065.072.073.073.074.074.075.075.075.336.390.416.425.446.462.481.492.502.509.514.520.524.532.536.541.546.104.148.170.190.210.230.239.250.259.264.269.274.279.283.288.292.299.031.047.063.076.088.093.102.111.118.127.133.135.138.141.143.147.152.392.445.500.534.565.581.603.620.629.637.649.653.662.672.675.679.688.122.159.201.234.257.276.296.312.327.345.355.363.376.385.398.403.410.025.051.078.096.112.131.148.160.173.186.197.205.214.222.234.243.256参考文献:

[1] GerberHU.数学风险论导引[M].成世学,严颖译.北京:世界图书出版公司,1997.

[2] GrandellJ.AspectofRiskThory[M].Springer2Verlag[M],NowYork,1991.

[3] NelsonBL.StochasticModeling:AnalysisandSimulation[M].McGraw2Hill,Inc1994.(上接第17页)

[3] SuH,ZhaoB,MaF,WangS,XiaS.AFault2TolerantChineseCheckRecognitionSystem[A].

ImpedovoS,WangPSP,BunkeH.AutomaticBankcheckProcessing[C].Singapore:World

~131.ScientificPublishingCo.Pet.Lid.,1997:109

[4] XULei,YuilleAL.Robustprincipalcomponentanalysisbyself2organizingrulesbasedon

.onNeuralNetworks,1995,6(1):131~143.statisticalphysicsapproach[J].IEEETrans

[5] CaoJ,AhmadiM,ShridharM.Recognitionofhandwrittennumeralswithmultiplefeatureand

~160.multistageclassifier[J].PatternRecognition,1995,28(2):153

[6] ChiZ,YanH.Handwrittennumeralrecognitionusingasmallnumberoffuzzyruleswithoptimized

~827.defuzzificationparameters[J],NeuralNetworks,1995,8(5):821

本文来源:https://www.bwwdw.com/article/mfzj.html

Top