基于径向基网络的烟叶光谱分级

更新时间:2023-04-22 22:23:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

基于径向基网络的烟叶光谱分级

2009年10月             农机化研究               第10期

基于径向基网络的烟叶光谱分级

彭丹青

1

,申金媛

1

,刘剑君

2

,丁春峰

1

,刘润杰

1

(1.郑州大学信息工程学院,河南省激光与光电信息技术重点实验室,郑州 450001;2.河南省烟草

公司郑州分公司,郑州 450001)

摘 要:烟叶的红外光谱特征不仅与其化学成分密切相关,而且构有定,提出了基,换;然后,采用RBF(Radial-,而且压缩后的数,并有效地减小了神经网络的VC维数,提高50片烟叶红外光谱数据进行分析,取其中23片作训练样本,其他的27片作测试样本:训练样本的正确识别率为100%,测试样本的正确识别率为96.3%。关键词:烟叶分级;小波变换;RBF网络;红外光谱中图分类号:TP183;S126      文献标识码:A

文章编号:1003-188X(2009)10-0015-04

0 引言

由于烟叶中C-H,N-H和O-H等含氢基团对红外光有吸收,所以烟叶红外吸收光谱含有与烟草化学成分相关联的信息。近年来,不少科研工作者利用红外和近红外光谱对烟叶进行理化分析、化学成分的定性定量研究及识别。很多文献

[1-2]

进行探索和尝试,主要研究包括利用烟叶图像的颜色、形状及纹理等特征进行分级或分组识别

[8-10]

。这

些特征很难包含烟叶的内部结构,与烟叶等级紧密相关的油分和成熟度等特征也难以从图像中提取出来。此外,基于图像特征的烟叶分级在对烟叶图像提取众多特征时计算量比较大,无法满足实时的要求。

本文对烟叶智能分级进行了初步的理论研究,提出了利用红外光谱分析识别方法进行烟叶分级。对河南地区不同等级烟叶的红外吸收光谱进行分析,并利用小波变换压缩数据结合RBF神经网络进行分级识别。针对烟叶的定级收购,烟叶的红外光谱通过无损检测获取。实验对两种不同等级的烟叶进行自动分级,结果令人满意。

运用光谱分析法

测定烟草化学成分,文献[3]还研究了不同地区、不同级别烟叶在可见光区域的量化吸收特征以及各吸收特征与烟叶地域性、烟叶部位之间的关系。研究表明:烟叶的光谱吸收特征与烟叶产地和部位之间的确存在着相关性。文献[4-7]则利用红外和近红外光谱对烤烟烟叶产地、部位及对烤烟叶片成熟度进行识别研究,但还未见利用光谱对烟叶分级识别的具体研究。以上文献在获取烟叶光谱时,大多将烟叶粉碎成粉末,然后压制成薄片作为样本。显然,这种破坏烟叶的方法不适合用于烟叶收购时的等级分类。

目前,我国的烟叶分级需要专业人员眼观手摸,并依靠经验和分级标准进行分级,具有一定的主观性和模糊性,且费时费力。对于烟叶智能分级,大多数研究集中在运用计算机视觉技术与色度学理论

收稿日期:2008-12-15

基金项目:河南省创新人才培养对象(2005);河南省烟草专卖局科

学计划与技术开发项目(2008);河南省杰出青年基金项目(512000400)

作者简介:彭丹青(1983-),女,河南信阳人,硕士生,(E-mail)

scc6509@。

通讯作者:申金媛(1966-),女,山西平遥人,教授,(E-mail)jyshen

@。

1 数据预处理

对红外光谱数据进行预处理,以获得更好的定量、定性分析结果。在光谱数据统计分析中,高维数是其中一个显著的特征。这种复杂性增加了计算量。因此,光谱数据的分析必然包括对数据的压缩和提取特征等预处理,以便减少识别分析网络的规模,加快处理速度。光谱数据与一般数据不同,在一段光谱区域内,只有特征峰对应的那些波长和相对强度才是真正标识物质特征的数据。有用的数据才是该光谱数据的特征信息。因此衡量光谱数据压缩质量高低的主要标准是特征信息是否能被全部保留。

小波变换是一种有效的数据压缩方法,目前已广泛应用于光谱信号处理中。本文采用自适应小波算

基于径向基网络的烟叶光谱分级

2009年10月             农机化研究               第10期

[11]

对烟叶复杂光谱数据进行压缩,选用DB6小波  由图1与表1可知:经过第3次压缩后,数据丢失的信息较多。因此,实验中选取第2次压缩后的数据作为后面分级识别模型的输入数据。

作为母函数,对每条光谱曲线都进行了4次小波变换压缩。图1给出C2L和X3F的光谱图,以及对它们进行4次变换压缩后的数据曲线。其他烟叶的光谱有基本相同的压缩结果,不再给出

2 RBF网络分类原理及烟叶分级实验结果

对烟叶的红外光谱进行小波变换后,利用变换后的数据对烟叶进行分级识别。可以用来分级识别的方法很多,RadialBasison),roomhead和Lowe

(a) C2L烟叶的原始光谱图   (f) X3F

烟叶的原始光谱图

,RBF神经,其最显著称函数(径向基函数)作为激活函数。RBF分类的基本思想是用径向基函数作为隐单元的基,构成隐含层

(b) 对应(a)的1次压缩光谱图 (g) 对应(e)的1

次压缩光谱图

空间,隐含层对输入矢量进行变换,将低维的模式输入数据变换到高维空间内,使得在低维空间内的线性不可分的问题在高维空间内线性可分。RBF神经网络结构如图2所示,输入层有N个神经元,隐层有M个神经元,输出层有L个神经元,其中隐层的激活函

(c) 对应(a)的2次压缩光谱图  (h) 对应(e)的2

次压缩光谱图

数<i通常选为高斯函数

(d) 对应(a)的3次压缩光谱图 (i) 对应(e)的3

次压缩光谱图

图2 RBF网络结构

(e) 对应(a)的4次压缩光谱图  (j) 对应(e)的4次压缩光谱图

Fig.2 TheRBFnetworkarchitecture

图1 两片烟叶光谱曲线及其小波变换后的曲线

Fig.1 Infraredspectrumoftwotobaccosleavesandthecuresof

theirwavelettransform

设训练样本集为X=[X1,X2,…,Xk],共有K个训练样本,其中第k个训练样本表示为Xk=[xk1,xk2,…xkN],对应的实际输出表示为Yk=[yk1,yk2,…

ykL],对应的期望输出表示为dk=[dk1,dk2,…dkL](k

T

T

T

图1中:横坐标表示红外光谱波段的数据个数,对应的光谱波段范围为850~3200nm,光谱采样间隔为4nm,共588个采样点;纵坐标表示烟叶在对应波长的

=1,2…K)。当网络输入训练样本Xk时,网络第l个

输出神经元的输出为

M

相对吸收强度。表1给出图1所示两原始光谱数据分别经过4次小波变换压缩后与原始数据的标准差。

表1 经过不同次数压缩和滤波后的标准差

Fig.1 Thestandarddeviationafterdifferentcompressionandfiltering

ykl(Xk)=w0l<0+

∑w

i=1

il

<(Xk,ti) (l=1,2…L)

其中:<(Xk,ti)=exp(-

σi2

2

‖Xk-ti‖);ti=

变量

1次压缩2次压缩3次压缩4次压缩

标准差

X3F0.01860.02260.02980.0529

C2L0.02300.02700.03030.0568

[ti1,ti2,…tiN]为第i个中心;σi为第i个中心的扩展

半径,i=1,2,…M。

RBF网络包含了两个训练学习过程:一是无导师学习的隐层径向基函数中心的确定;二是有导师学习的权值的调整。根据径向基函数中心选取方法不同,

基于径向基网络的烟叶光谱分级

2009年10月             农机化研究               第10期

确定中心的算法不同。本文采用的是K—均值聚类算法。它是对所有学习输入样本进行聚类,求得隐层节点对应的中心。

中心个数的选取在RBF神经网络中也很重要。如果中心数目太多,不仅影响分类速度,而且由于VC维数过高,降低了网络的泛化能力,减小了测试样本的正确分类能力。中心数目太少,则会导致网络不易收敛,学习样本的正确分类达不到100%。靠经验选取中心个数在第一次遇到问题时变得不可能,表面上可采用两种方法寻找最佳的中心个数:一是先选取较多的个数,然后采用一定的方法删减来说,二是中心从1,本训练网络,,,增加中心的个数,增加的步长可以根据部收敛的程度决定,一次增加1个或者2个,甚至更多,直到网络比较容易收敛。如果步长不是1,则还需要将中心个数减少1个,看网络似乎还能收敛来最后决定RBF中心个数。本实验采用了这个方法,最初选取了2个中心,每次增加1个,直到网络对于学习样本的训练收敛。

本实验采用的烟叶为河南烟草局提供的2006年标准烟叶,实验仪器采用日本岛津公司型号为UV—3600的分光光度计。在850~3200nm光谱范围内,对C2L等级的烟叶20片、X3F等级的烟叶30片获取其

3 结论

1)利用红外光谱信息,结合RBF网络建立了烟

叶自动分级模型,采用自适应小波变换压缩提取光谱特征不仅去除了部分噪声,而且简化了网络输入维数,从而减少了网络的训练和分级识别时间。

2)实验结果表明:训练样本的正确识别率为100%,测试样本正确识别率为96.,能够较好地对

,有望在烟叶。烟叶智能分级的,而且可以调动烟农的积极性。烟叶智能分级的准确性可以保证卷烟的品质,并有助于保障烟民的身体健康。参考文献:

[1] 乐俊明,陈鹰,丁映.近红外光谱分析法测定烟草化学成

分[J].贵州农业科学,2005,33(3):62-63.

[2] 刘良云,靳志伟,王纪华,等.光谱法预测烟叶中的烟碱、

钾和氮素[J].烟草科技,2005(6):26-29.

[3] 靳志伟.烟叶的光谱特征及品质无损检测技术研究[D].

郑州:河南农业大学,2005.

[4] 张鑫,郭佳,倪力军,等.基于红外与近红外光谱的烟叶

部位识别[J].光谱学与光谱分析,2007,27(12):2437-2440.

[5] 王国东,束茹欣,张建平,等.不同产地国产烤烟近红外

红外吸收光谱,采样间隔为4nm,每条光谱线共有588个采样点。对原始红外光谱数据进行两次自适应小波变换,得到RBF分级神经网络的输入模式,显然输入模式的维数为147个,即输入神经元的个数;RBF网络的输出神经元的个数取1。令C2L等级对应的输出为1,X3F等级对应的输出为0,设定误差、学习率和最多神经元个数等,对RBF网络进行训练,然后利用训练后的网络对学习样本和测试样本进行烟叶分级识别。

在实验中,选取C2L的11组和X3F的12组光谱数据作为训练样本,剩下的27组作为测试样本。实验结果表明:学习样本的正确识别率为100%,测试样本的正确识别率达到96.3%,而且RBF网络的收敛速度很快,一般只需几步迭代就可达到设定目标。

RBF网络结构简单,分类能力好,学习过程收敛

光谱的特征分析及其模式识别[J].烟草科技,2006

(5):36-40.

[6] 李向阳,刘国顺,史舟,等.利用室内光谱红边参数估测

烤烟叶片成熟度[J].遥感学报,2007,11(2):269-275.

[7] MahaHana,McClureWF.Applyingartificialneuralnet2

worksusingnearinfrareddatatoclassifytobaccorypesandidentifynativegrowntobacco[J].J.NearInfraredSpec2tra,1997(5):19-25.

[8] 韩力群,何为,段正刚,等.烤烟烟叶自动分级的智能技

术[J].农业工程学报,2002,6(18):173-175.

[9] 张惠民,韩力群,段正刚.基于图像特征的烟叶分级[J].

武汉大学学报(信息科学版),2003,28(3):359-363.

[10] MacCormacJKM.On-line&nbsp:imageprocessingfor

tobaccogradinginZimbabwe[J].ProceedingsofIEEEIn2ternationalSymposiumonIndustrialElectronics,1993:327-331.

[11] 王凯,张会,常胜江,等.用于复杂光谱压缩的自适应小

速度快,而且克服了梯度下降算法中局部极小问题,近年来被广泛应用于模式识别、数据分类、函数逼近、图像处理和故障诊断等方面。

波算法[J].物理学报,2007,56(6):3613-3618.

基于径向基网络的烟叶光谱分级

2009年10月             农机化研究               第10期

TobaccoLeavesGradingwithSpectrumBasedonRBFNetwork

PengDanqing,ShenJinyuan,LiuJianjun,DingChunfeng,LiuRunjie

1

1

2

1

1

(1.SchoolofInformationEngineering,ZhengzhouUniversity,HenanKeyLaboratoryofLaserandOpto-electricInfor2mationTechnology,Zhengzhou450001,China;2.ZhengzhouFiliale,TobaccoCompanyofHenanProvince,Zhengzhou450001,China)

Abstract:Infraredspectrumoftobaccoleaveshavecloseconnectionswithnotonlytheirinternalstructuresbutalsotheirchemicalcompositions.We,therefore,proposedtogradetobaccoleavesbyfeaturesofsWavelettransformisusedtopreprocesstheoriginalspectrabecausetheyarequitealex.-Function)net2workmodelisadoptedtogradetwokindstobaccoleaves.ordimensionbutalsotheVCdimensionofneuralnetw.

inandrecognizingtimeandhigher

generalization.ofdataof50onesarechosenastrainingsamples,andtheothersareusedmresultsshowthat100%and96.3%correctgradingratesareachievedrespectivelyforandtestspectrumsamples.

Keywords:tobaccoleavesgrading;wavelettransform;RBFnetwork;infraredspectrum

(上接第14页)

[2] 佟锐,郭翔宇.黑龙江省城乡居民收入差距实证分析

[J].经济研究导刊,2008(2):148-149.

[3] 孟凡胜.影响黑龙江省农民收入增长的主要因素[J].哈

版),2008,23(1):110-115.

[5] 张传玉,梁纪尧.基于基尼系数对我国城乡收入差距的

预警分析[J].石家庄经济学院学报,2008,31(3):64-68.

[6] 刘波,于建春,陈芳.我国城乡收入差距扩大的原因及对

尔滨商业大学学报(社会科学版),2003(1):22-25.

[4] 彭朝晖,冯荣丽,李应求.湖南省城乡收入差距的基本趋

势和影响因素分析[J].长沙理工大学学报(社会科学策[J].经济研究导刊,2008(7):10-11.

AbstractID:1003-188X(2009)10-0011-EA

AResearchofIncomeDisparitybetweenCityandRuralin

HeilongjiangBasedonRegressionAnalysis

FanYadong

1,2,3

,YangYing

3

(1.HeilongjiangAcademyofAgriculturalSciencesPost-doctoralWorkstations,Harbin150086,China;2.NortheastForestryUniversityPost-doctoralResearchStation,Harbin150040,China;3.EconomyManagementCollege,NortheastAgriculturalUniversity,Harbin,150030,China)

Abstract:Recently,thedisparitybetweencityandruralresidentsincomehasbeenexpandedcontinuously,differentareasalsohavegreatdifferences,thisdisparitymustleadtopolarizationofpoorandrich,thenaffectthesocialstabilityandco2ordinationofnationaleconomy.Asanagriculturalprovince,Heilongjiangalsoconfrontwithsameproblem,evenmoredifficult.ThispaperbasedondataofHeilongjiangProvince,aimedathowtonarrowthedistanceofincome,useSPSSLinearRegression,accordingtothecurrentsituationofthedistanceofincomebetweencityandruralresidents,makeaforecastofHeilongjianginfuture,thentrytofindoutmainfactorswhichaffectthedistance,finallygiveafewpointscanreduceit.

Keywords:incomedisparitybetweencityandrural;regressionanalysis;forecast

本文来源:https://www.bwwdw.com/article/pzvq.html

Top