Markov逻辑网及其在文本分类中的应用

更新时间:2023-03-19 02:19:01 阅读量: 人文社科 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

介绍了Markov逻辑网的理论模型、学习算法和推理算法,并将其应用于中文文本分类中。实验结合了判别式训练的学习算法,MC—SAT、吉布斯抽样和模拟退火等推理算法,结果表明基于Markov逻辑网的分类方法能够取得比传统K邻近(KNN)分类算法更好的效果

第2 9卷第 l 0期2 00年 19月0文编号章:01 98 ( 901 2 2 0 10— 0 1 2 ) 0— 709— 4

算计应机用 Ju nl o oue pia n i o r fa mCp trA p lts co Vo . No 1 9 21 .0 0 .2c 0 t 9

M0kav辑网逻及其文在本分类 中的应用 ro张芳玉,黄涛,东梅,艾熊忠 阳(重庆学大计算机学,重庆院4 04 0 40(a ).nh g@ irc rit t tmlao ) n.

n摘要:介绍了 Mkva辑的网论理型模 ro、逻习学法和算推理算,法将并应用于其中文本分类文中实。验结合了判

别训练的学式习算,—A吉布法抽斯样模和退拟等火推算理法,MS T、 C结果表基明于M ao rv逻辑网的类分方法够能取k得传比统 K邻 近 N )(类算法好更的效果。 NK 分关键词:统计系学习;器关学;习ro机 akM逻v辑网;文分本类中分图类号: P 8T3 1 T 1; P 9献文标志码: A

Ma o o k i eow ka t pia i n nxt ls ic to vrl g cnt r n d si plat o i tcae sf ai nc iZ HNGA Yu—a gUHAG N AIDo og i—X I nf,Ta , n me ON, Go g y n Z h— ang( ol eo pot ne ch qn n vn tC,ogi 0 04 nh )C l g Cm ue i cS, oC g U ii i fer eg e yhn q 4 0n4, iC ga

Ab t cT: pip rn o u eetr,elr img tosa d i e cel iom f o gcre ok ta W Srst s a e th d dc t oy nne eh d fnr earh soMak vl tr t a a i r h ah nn t g n w oih sa p le o te Ci ee t l sx i ctn l o pa i d t h ns e ta cs af i.W i ee e c o t de srm i i ae lann g r hfrMa k lgv nct o k h io tr frn eth ic hi n t er gaio tm r o i ew r v ilo o w g e,tM C, GibS a l g

a dsm ua e e e n liom n ep r n s i p o e h t t me ehd sbd o i h s— AT bs spm in il td mtpr g a rg tni h i x em e, t r tv s t ha to a e n i

Mkvlg ae oki btr hcnne nl t re N e bir KN ro i t nr e e aoni v aK asNt eh o( )mN to x slfa i .ocw s tt o g e di t t si ta nh ne c c o i K e o d Sa:c eao saL ai g R ()yw r sttt aR li l e rn LS;m anher i;M avlk ge ok et l sct nilitn n icelnn a g o r i nt r;t a i oa ocw x c f S ii统计关系学习 (t i lR i li aL an, nR) S s ca ea l erigoS L称又 ta tnt

的权体值现该公了的限制式度强,值权越大满足该公,的世式界发的概生与率满足不公式该的界世发的生率之概间的差就越大。着公式上随权值的增加,ro Mkv逻a辑网渐逐纯向辑逻识库靠知拢。定义 1 Mka v r o辑逻网4 L己为元组集合二{ F ,}其 (iW ) ,中为一逻辑阶示表的公式,为实数。 定 Ma给vk辑逻网ro

概率逻辑学习 (r blb to il ri e,L)是工智人 Po aisc Lg aLa nP , iLi c n能g、机器学习和据挖掘交数研叉的产究物,旨在将关系 (逻辑表)示、然似理 (推不定确性处理)机学器(习和据挖数掘)

合起来结,以获取关数据系中的似然模型…统计。关系学习方法似然由关系型模和学习法组成算似。然系关型模是关指系的然似示形式表习,是基指数于来据调整似然系模关型学

£有和限个体项常合集C={ C,, 则可生成一个},2c… C,闭以词谓为节点、闭词关谓系为边的 M kv网 a: Mro 1中每个L闭谓词应肘对的中个一节点,闭谓为词 若 ),真则节值点为 1否则 0为;,2 中个每公式的F闭式对应公“中一个特函征数, )

的过程,即参学数习和结学构两习任个务统。计系关习学的早期研究多集

中归于纳逻辑程设序 (计 un e L g t d cIv o ii c oPm rgi L2),3rg am n,I P-tJ着随对 SL研究不的断入,深 R陆续提许多非 I出的P计统关学系方法习,ro L akv逻M辑网就是于M基ro的S方L法。 a vk网R 若闭公为式真,则特征数值函 1为否则为 特O征数值函是就,。 L中所对应的。为计了方便算,将常势函数 义定为:。 通=

1Ma kV逻辑 r网1O1 M avk辑逻简网介 . ro

真Mkvar o逻辑网是公附式权值加的阶一辑知识逻,库且

于一个对 aMvk逻辑,网不定的个同体常项集, r合给o就产生同不的 M avk。网r o由给定于的个体项常合集规模不同 (个体常项多,则成生Makv的网节就多,点 ro的网模也规就越大 )生成的 Mak v的规网可模完全不能同。, r o但因为它是来们可为构建作Mavk的网板模。从概率的角来度看, akv ro rM逻辑o网为型大M or kv网提供一种简洁a描述的言,并能够语活地将大量灵领知识模域化地块入引到M r ok va中网;一从阶逻辑的角来度看, akv逻辑网不仅可 以处理不确定性,可 Mro还

于同自一个 ro逻M辑网 a, vk所以其参相数同且构有相结的同规律性(数同相,因为对应同公式一的所有闭公均式拥参是有相权同值 )称些这Ma v网 k为闭 Mak逻v辑网。据 ro,ro根 M ka网v定义的, Mavk逻辑网帆 .r o闭 r。的o概率分布为应:

允以不许整完矛盾和的知。识外, ro此 aMkv辑逻网可还作以很多为统关计系学习务任的统一架框。 一阶逻在中辑,通常一个世界只要违反了一公式个,该世界生发的概率就为 0即一阶逻知识库作辑为能世界可的强约(束) M。avkr o逻辑网基的本想是软思化个这约束:当个一界世违反知识了中的一个库公式,世该界发生的概率降低但不不可是能;违而反的公越式,少则发生的概越率大公。式上P )=e[W): r…, (= ip] -( ) X 1∑I xn( () ̄2

其:中x为一世个界所中可能有闭谓词所构成的向量, 表示收稿日期:09— 4一2; 20 0 O修回臼

期:09 -51—。 02 07 基项金目:庆市自然科基金资助项学(目SC20 B 2 2 重 ) TC 0 8 B 0 1。者作介简:玉张(芳95 )女, 6一1,上人海,教授,副主要究研方向:数据挖掘、络入网侵检测;黄 (涛 9 2,, 1 8)男一安合肥徽人 硕,研士生究 主要研,究方向:计关统系习学、器学机习、数挖掘据;艾东梅(9 5一)女,1 8,四川内人江硕,研究士生主,研要究向:方据掘挖数、语义网;熊忠阳 9(2 )一男, 16,重庆,人授,教生导士师,博主要研究方:网格向并与处行理、据挖数掘、互联网。

23

介绍了Markov逻辑网的理论模型、学习算法和推理算法,并将其应用于中文文本分类中。实验结合了判别式训练的学习算法,MC—SAT、吉布斯抽样和模拟退火等推理算法,结果表明基于Markov逻辑网的分类方法能够取得比传统K邻近(KNN)分类算法更好的效果

70

算机应计用第29卷

词的闭真Z∑= H ()谓值, 为分配以函数保、证∈其中: Z为定给条的下的分配函数件 ,是F有 M所a kv or逻辑网的子句 (少有个一闭子 涉句及到查 原询子 )所构成的至P(= X=1即式) (), 中1出给权的值,表与世 n(示 )界相对应的公式 F的闭真公式个数表,示出现在公 F式 集合; y是涉及到查询原子的第i n( ),子个旬的真子句闭的个数; 是 G涉及中到查原子的询子闭集句合 当;据数中中闭谓的真值词, ( )=e理论…上,(和 (。 ) )…都可以过给通定的识库知计得到算。 2 M1ro逻辑网参的学数习算 .法a v对于 kMkv ro a逻辑而网言,数参知识库中各公式是的权值 W(=i 1,,…, )m因此数学参习务就是任计估出知识库所中

第个闭句子为时真,Y g )的值(为 1否则( Y g,, )值的为 0,当藏隐些某量变时 。 (非既询查谓词,也证非谓据词 )可 通,过加累和求计来算条件似然。为了述简叙便将,所的非有据证量都变作看询查变。量(微分后)通过可算计 ( )来式5 求,其近似值 (: (y )表示M P M aiu or tr状 A) ( x m mAP sii o e态)于式是( )计的算就以转可为化用 MA, 5 P推 来理寻找y ): (。此外,于最伪后大验估的计M ao辑逻网参数习方学基 vr法”” k同样可取以不得错的学习效果。 1 M3avk辑网的概率推理算法 . o逻 Mrakvr o逻辑网以回可任意类似答给定“公 式,的情况有公式权的值。先假设世界是备完 J若一的个谓词不闭在:数据库中,该闭 谓词为假。完备世界设下假,有I个可则在若 t

能闭词谓,一数据库就是个个向一量= (一,一 ), ,其中第为 f闭词谓的值真,该谓词闭在数据库中出现,个若 则= 1否 则,= 0; 。定一个数给据,库avkM r逻o网辑的权原值则上可以过通大似然最估的方计法学到习。参数即看作固定值,假并设所数有满据参数足,W过计通算使 X=的似概然率 P= ( X )取最值大的 W ( i= 1…,,m来)取获数值参。如果与界世对相应第的i个公式 n有(个真闭公式, 根据式 ()以 )则 可2导出式 ( 3:) gP l。 .

下式成立的概率是公多?少”这的查样询题。如果问F和 是两一阶逻个辑公 式,c表示出在现和中个体项常的有限集合,表 M示kv逻a网,辑o r有则PF:I(, ,C P(: l zML=, F) F, )

! l丝

一一

( x i):=x I)一∑P( t ( x:

)(x ()3P(2 F M ) M I∑ Px= ) ( f M' 0 ::

其,中 (n )和( n) 分表别示与世界和任世界意相对的公式应的真闭公F个式数。令式 (等) 0于求解并 (W 3 i 1:… ,需要知道 (, m ))和 (n )值, 的理上论 ( )和 (n可)从数以库据中算计得到。 都于由单一在数库据中算公式计的真闭公个数式是N P题问J故对于际实数据库无,法通计过算n( )和 ) (求来解。最似大估然计不行,可则可以考 用最虑大伪似然估计方法( x m Ma mui Pe—dieidEo t n tu osk lLo s ami M,PE)和别式判训方法练 hi o L i(r n t eT an n来替)代。 Ds i ia ri ig mi cv最大伪然估计似法用伪似然方概率替似代然概,率即:^∑PX= ) ( J M( 6)中其,表使公式示立世界成的集合, ( 尸. I给出。

。 )由式 ) (2

在图型模中,见常条件的

查询是 (式)特的情况殊,6即所有 、和中的谓都是零词的元且式公是都合取。的时 此, 题“问知库 K识 B是中否包公含式 ”,等价判断 P(为 FIc黜.

,

,)= 1否成立的是问题。中,是 K其, J B中所公式附有加权所得值的到M kav辑逻,网 ,出在 K现 roc 是或 FB的中所

有个常项体。述问题上的案即答在 T=ur e的条下,件过通式( )来算计 Fl P,,。 6 ( £c)由于Mkva ro逻辑的推理是网一 P N全完问题,即是便在有限的领进域行 理推,很难有 好结的。果也原则上,算P F计 (

n

l (=∑。= ) gn(

) (= I () 一 0 )× ) ) ) (4(『 0) 一 =1M x ) : P](] I (B)×中其:= (伪)似然概率, X1 表示 M的kva 为 MB( ) r o覆盖, (n:]示表定指:时第0。)公式个的真闭公式

F,I, )可以近似地使用马 尔可夫蒙链特洛卡方法 Lc ( ro h i oM t r C M,,CMa kvC a n al Me C )在不成立不时做任 n o改变何,在 立时计算成抽数样。 MMC l法是一方种殊的蒙特特洛卡方, C _法它随机过程将的马尔中可过程夫引到入蒙特卡模拟中,洛实现动模态拟 即(样抽分布模随拟过程的而改 )变质上本, M C方法是。 MC用使马尔可夫的链蒙特洛积卡分。蒙特洛积分卡是通抽过样

个数, (1]:含义类似。 2。)由于 P (l=0MIB( ) X )和 P l 1( B M )(可从 数据库中直接 得,到P =(0 X= I )故 X l X)f P( 2=1 I Xf)n( (), X (), B MBM。)和]

( n1 :。均可通)过计得到算,因当上此式等于0,时参数学习问题转化非为线优化问题。是性大最似伪估计然法方会 导但致非接变量邻间之推的结果理不理想。为了解决该题问,可采以用判别式训练方法。 在许多应 用中,果我们事知道先哪些谓词是证据谓 词如些哪词谓是查谓询词,在给定证谓词据的条件下可 以通过则推

理来正预确查测谓询词。别式 练训方 法就是把中域的闭 判

点} t’= 01… }”,,X,估计来数函h )的期望 X (,其算公式估1 _ -三为:[ () E h x]1= i mh“这样,)过估计hX ( )。通的(均 n暑 T值可以得到体总的值均,当抽样点“相独立时,互 以可增抽样次数加n来提高估精度,并且计经一过段时问迭的代,“的分布可收以到一敛平个分稳。布这时, MC算法的算式估M C应当掉去收敛以前的迭代,用敛后收的代值迭估来计。由 于C MMC法方的本思想是通过建基立个一平分稳布为7( )『的Ma kCva来n得到仃(r oih )的本样。因,此造转移核以使 已构

子分为两个原合:集据证子原合集和查询原集合子y给在,定 条的件下,Y条的是:件 P) ) p∑W )= ( l= x(I (i ), en一

∈, y知的概率分布 (仃为平稳 )分布至关重是要的。不同的移转1

e i( () ∑xw p,g )

() 5核将导致不同 M的CMC方法,本所文用到有的 M—S T、 C吉A布斯抽样、拟火退三 种算。法吉斯布抽样模和拟退是火模

介绍了Markov逻辑网的理论模型、学习算法和推理算法,并将其应用于中文文本分类中。实验结合了判别式训练的学习算法,MC—SAT、吉布斯抽样和模拟退火等推理算法,结果表明基于Markov逻辑网的分类方法能够取得比传统K邻近(KNN)分类算法更好的效果

1期

0张玉芳等:r o辑及其网文在本分中类的应用 aM kv逻 32验实法方 .2 3 71

MM C法方中常用的简变体单, C里不再赘述这,下简面要介绍下 MS TC算法。—A M S CT是种一片切抽的 MC样— MC算A法,片样抽一是切种过通一个预先定好的不变义布来构造分逆可尔马可转移核夫的方法,际上实是一种助辅变量法。MS CT联合使用—了 A满可足测性试模和退拟火用,可满足性求器解 (l TS )使aWA k

验实预处理 在 coo iMa uSi 20 进下行, risf V l tdso 0 5tu akMvr o逻辑网相的权关值学习概率和理推 Ac在e 9y下 l进 m _ h 。行Ac ey是 Dm no等人开发基的于M kav逻辑示表hl m ogsiro

软件的包提供,一了列统系计关学习和系率逻概推辑方面理算的。实验法体具程过分为以几个步下骤。 1文分本的类 akv辑表示 M ),ro逻即构 .建 lm文件n,容内如:下H s r( o ed atWodw r t,) x T pc cas t oeil(,sxt) H s r+( )W= T>p caW od,p io(+ ) CP,

的好处可以有效是地到找分布的分离模中式 ,因在而马尔可夫链收中敛很。快之标准较 CMC方法,吉布抽斯和模样 M如拟火退, A—M SCT算法的收敛速度要快多很。里给这出 MC . ST算法的伪表码示: A MC S cTas sehs nna l— s -A(l e,wu i t u,mspe)(g )。 St ( ad fcu )e ai yh r l s s asfi一 t ru s mpe oo‘ no am ls d M一 2中文文本分词。本文分词采用 中国科学院 ITL S) CA C2 00分词程序的9c} 版}本 。. fa1ro l

ca s∈s tsis bd ( d) l eu a e i y fo

3建立引索。引索用采开 L源n ) cue程序的ec版本#,针对分词后的文本建倒排索引。训立练共集有词3 0个9, 90测试集共有词 2 0个6。 5 0Wi r b b l 1y一 e a d tp o a ii ht一 d^ ot Me d f rn o S p‘ e~US T m M a l)( A ( efd r no

特 4提征取。特征提取采用 X 统)计量 选,取5 、并% 1、5%、0 5、0、%等不同数的特量征词作构建为 5 2% 5%7% 1知0识所需库的谓词输。出5知识库构 建。习学所用知识的库需要提供 Hs r )aWdo (o dt t和 Tc c s,tpt种类两型的闭谓词 ,据不 w r, ) eoi l ( e s x ) ax根

2文本分类传统的文本类分骤步下:如) 1预处理; )2将文档表示成算易法处于理向的量形式; 3)特征词选取和权值计算; ) 4用已经训好练分类的器未给知类别文的档分类;) 5评估分类 果效。预处理段阶要主是去除停用词、低频词及以网页文本中的各类标信记。若处理息是的中文文本,则在预处理时候的还事先要进分行。词常用文本表的示式有向形空量模型间和正交分解模型。常通,选特征择词本是着用少最词最贴的切反地映文档题主原则的,见常方的法有:档文率频方法、信息增益方法 互信、息方法

以及统计 等量经。特过征选取后,特征的维将降低到一个合数理范的围内,就可利用分器类行进分处类了。使理较用广泛的分方类法有:素贝斯叶、朴

支数同的量特词,征分别成生同不, b的文d件。推理所用的识库仅需要知H s r( od et 类型的 Wao w rd, t)x谓闭词,然后通过理推得到Tpc c s at t词,谓而判断 io(l, ) sex从某文本否是的属确于 某类别。 6权值学习本。文用采的权值学习算法为判别式练训 )方,法针对不同量数特征的分别词学习其值权。 7词谓理推根据。上步学一习到的权值和测知试识库, )我采用了们三种MC C算法进推行。理 M33实验结果及 分 .析持向量、机邻近分类算法 (—er s iNho N,)决 最K NK at eb rK N、 eg策树等。由于本分文类任务的质本是上判某个类断否是有篇某文本,通常而采取的特征是文本基的本单位——“”就是,词也某文本有某篇词些据此,。将文以本分用两类个词表谓示,可即: Wado w r,t t表示本文tx有 w r词; o i Hs r (o de) x e中 tod pc T对本文类的分个类的单分类果常采效用查率全查准率和评价。来其数公式学示如下表:

率查籍全c= R查率,准c:黢 PFl1=警 (1 )F t ̄为了全从局角度的价分评类性能,有两方法来种综所合有别类的类情况分,宏即平和均微平。宏平均均更多地到受稀有的影类,响而微平均更看重大别的分类结类果,给面出下种评两方法价应对的全查、查率准率值、的学公式 (数中几其为类C集别合,为某C一别,类a为某类别中类正分确文的本数 为某,别类中分类误错文本数 )的 b:(s, elt表示本文t t c t s) axe于属ca sxl类。 s根据这个两谓,词容易可以到得公 H式Wao (od 很s rwr, tt e )d>=T c pcas t)表示x某档文tx有中词 w r,x o i(s,let, e t o则d该文档属于类csa于针由对同一文档而言 ls,。不有的同词,且属不于类同别概的率也不相尽同在。 M NL示中表,公当式中的变量前加上之+”“,号每公个依据式量变代所表的体个

不同,分别学习到不同权的。所值以可在. l m文件n中该公将式为写 H s(ra oW+w,d )>= Tp c Pi (o+C)表示针对同,P。一篇文 t言,档别对同不词的W和不的同 c类习不同而分学的权。值 aMo- rc 0R

, Ry, oa P M.

. Pi,

实验及分析 33数据 1集.Mr- a- c:F o

,本文实验的的目检是验 ro辑M在网中文本分文类 avk逻中的效果,验采实复旦用学大李荣陆博士的中文分类语料的一

个小型料库语共。 2 1 6篇8档,文中机抽取了随 1 8从 2篇8

∑+∑。6 li: i= 1

档文作训为练集,3 94篇作测为试集,分共电脑艺术、、育、教交通、环境经济、、医疗、军事 政、治、体 l育 O个。类

M -i= c

等2 3

介绍了Markov逻辑网的理论模型、学习算法和推理算法,并将其应用于中文文本分类中。实验结合了判别式训练的学习算法,MC—SAT、吉布斯抽样和模拟退火等推理算法,结果表明基于Markov逻辑网的分类方法能够取得比传统K邻近(KNN)分类算法更好的效果

7

2计算机用应

\恻露 悄将第2卷9

表1出给了同不推理算下,法分别针对同不数特量征词的平宏均查全率、平均准率查、平均 F值、宏宏 1平微均查 全率、微平均准查率微平和均F1值。率的比较结果。

给出 r1与K奁N准N

表1不算同法、同特征数下分类效 比较果 不来高分提效类,果这也是文的本下一步工作。考文献参:【】RA D , KR T N .Po ais c gl an f】 n E1 LT D E ISG K brl t i l r g J i.CA ibio c e MS- KDG Ex l D trn: S e l is e IOl uM t eR ian Da a lMi— I p oa i psc s au io li l ta t n

ogi0 3 ( )— 81 ,n 02, 5 1: 43.『1 D EO K l Rn il ai g 2 Z iRS S. Ie oa a d tn[n]M【 S..: pi]gr t a 1mS r, ne20 9—8 8.8 0: 6 95f DEO .Mu i eKa o d at iim ag nrd c o【】 l3 Z R S ISl— lt n l a nna:n i t u tn jtr i o i特征数比例/%

A M SGD xl trn e s tr 3 05 1:C I KD E p oai N w l st,2 0, ( ) 1— 1 o ee .

6 f 1 RC R S N,DM I GS P I H D A O 4 MON O . ak vMl g ew r sD .— Sr oi n tko【】 e oca e W ath tn n,t ls i go, SU A:nU rv fWia ngohi esy o s i n.t2 0 t 0 .4图1 Mak ro逻v辑网 K N查与率准对比图 N

基以上于数,据们我得出以下结论 :1采用布吉斯样抽模拟退火和算的分法效果类要优于 )MCS T, A—是因这 M为C T算S法在高收敛速度的同时提失损—A

f CRR S N M D M,I S P G 1 5 IHAD O ON O .M k avgl ew r JsM a r oo n t iko 1[c — c i L ea n n 2 . 60 1: 71 6—hn r e gi0 6 .2 0 3

一部分精度了 2;本文采用的于 Ma基k辑v网的本分文类,果明显 )ro逻效

[】 DIM GSP HA ID O 6 O NO, R C SRN MMa.klvi:A u iig ea r o g cn n fm —o y f l wokrfsiat aaeni llan nC]/P re igc f t e I rottsi lr lot ae irg『/ coe d nso h—CLM 0一4 Wo k h p o ttia Rsl nt Lla n nn t o— 20 r s o n S a it e la ai e ri ga di C n c o s n ci n ot Oe de. eN r: CM r A,s0 04—5 t se t h rFlis o Yo kw Pe 2s 4:9 .4好传于统 K N的分算类法; 3N推时理,特征数增量加到 01时,效果稍有下 当)0%其降,但明显不,下降原的因是于构由建的 Ma ro v逻辑过大 k网而致导 ;4当特征数量增加 1到 0时, ) 0N%K分 N类效果 显明下降, f1 S NGL,POMI D I7 A N GSO . Di rmiaiPe tigoi oro i i sn tr n n Mtk avlgcc v a: ntok f/P 0 ends o t0 tn C lne ee iAfcar e rw s/ r ceig f Nhiaa ornI Olet i l 1C2 ioItlgi n eP n el

e e.:AAAAIP e s 0 5: —8 63 i r s 2 .0 8 8 7 .[]P A L J rb blt a ogiiitlg n s n se rw s f 8E R P. oais cr snn e ity t l i ien n les e:Nt o k O p a s ifln e M) a r r in olui nee ce .S[ nF a s c:Mg oK um n n ul h e rab a f an bPi— se s 98.,1r 8而M ro kav辑逻却网仍有然很好分的类效果。这是因为在权值学时习,o ra v逻辑M网会为个每所词在的式公予赋权篮, k若该词对分类贡献较少 ,学到权值也小,的也表明了则M这or逻网在不提辑取 征特的情况下也能获取很好的分类 ak v效果,于扰词干有较大的受程耐度。对 f1K O ,SN I, RC A D O 9K S IG PI H R S N M,ea .T ea hm ss ym At1 h l e ty c e

r tfi ia r lia A f Sa l,A W i Uri fW ah sot tl e t n l IR】 e te a s c a o t:n sv o ys— et ig o, pr m to oeu e c e ct m g Ene i g 50 .n tn D ae n fC mtp tS rin e a ne i“;2, 0

O熊[阳,李忠星智张玉芳,,等 1

]基种于正交分 的文解本分类4结语本文将 Mak vr逻辑o网应到用文中文本类中分,通过实并验证实该方了法的效有性。统计关在系 习『学,以通过逻 } 1可l新模【]型J计 .算机稃工 0,8 3 (:4 22 0,51) 2 7—29 .2『1 1 AND P EU Cd, TRA DOU T, Ae .aA nr cdi tn l d eF E S NI,CE t 1 in t u to o

o MCfMrc iel mf J g.Mhn a e'n ,0 53: 4 C . om ahn ai[】 e n ci L m g2i0, 0 5— e 3 nf2 1舒杨 .孙计统关系学习的若问题研究=【 11{ D.长存: 林学,大 2 0.0 6

辑(关系)来很地好表示识,故本分类问文的 Ma题 o逻辑 r v k表示也十简洁分。针对 他不同的应领域』,玎存若在某些 叮以用逻辑表的示关系同样,可以采用 aMo r v逻辑网来决解问k题。比在超如文本分类中,传统做都是法将其作当文来本忽略处厂页面之的链接关系¨,利玎页面问 链接的火系耍何】,[ 3]1舒杨孙刘火有,,孙敏成.基后验慨率于的Makv辑逻网数参 r o习学法方.林大占学学 报:学版,02, 4 6:12 7 06 4 ( 2)—61 f1 GE ES NRE R,I SN 41E TH M INO .L g cl t ai S or ica S J N iao md t atffi l of I miitl e c【】 L s l sC n i e enM o A .t,:MAr aK n n iP b i… l o og ng fa a u ll, 'l l1s 9 7:8 64 0

本文来源:https://www.bwwdw.com/article/f7fj.html

Top