中医证候规范和测量的多元统计学方法研究进展_李国春_王均琴_刘德麟_余小金_吴勉

更新时间:2023-05-31 04:30:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

·2394·

20134011中医证候规范和测量的多元统计学方法研究进展

11231

李国春,王均琴,刘德麟,余小金,吴勉华

(1.南京中医药大学中医统计研究和咨询中心,江苏南京210029;2.中国中医科学院中医基础理论研究所,北京100700;3.东南大学公共卫生学院,江苏南京210009)摘要:中医证及证候标准化、客观化和规范化是近30年来中医理论研究的热点和难点。证候学研究涉及到复杂

“组学”DME测量方法引入,科学,证本身具有特征,不是某一个微观指标所能表征。近年来由于多学科的介入,以及高

为解决中医证候的复杂性科学问题提供了可能。证候规范和测量涉及到多指标的速运算的计算机和信息技术的发展,

高级统计方法引入深化了证候研究。文章系统回顾了聚类分析、探索性和证实性因量化测量和降维等多元统计学方法,

子分析、结构方程模型、数据挖掘等统计学方法在中医证候学研究中的应用及其存在问题。

关键词:证候;规范;测量;多元统计中图分类号:R195.1文献标志码:A文章编号:1000-1719(2013)11-2394-03AdvancesinMultivarialbeStatisticalMethodforSyndromeMeasurementandStandardizationofTCM

LIGuochun1,WANGJunqin1,LIUDelin2,YUXiaojin3,WUMianhua1(1.CenterofChineseMedicineStatistics,NanjingUniversityofChineseMedicine,Nanjing210029,Jiangsu,China;

2.ChinaAcademyofChineseMedicineScienses,Beijing100700,China;3.SchoolofPublicHealth,SoutheastUniversity,Nanjing210009,Jiangsu,China)Abstract:Standardization,objectificationandcriterionhavebeenahotspotanddifficultquestionforsyndromeofTCMinre-cent30years.Syndromecannotbedisplayedbyanyonemicromarkerbecauseitreferstocomplicatedscienceandhasacharacter-isticofomics.Withtheintroductiontomutlimodality,D.M.E.andinformationandcomputetechnology,itwillofferpotential

methothforsolvingthiscomplicatedquestionofsyndrome.Forstandardizationandmeasurementisrelatedtomethodofstatisticalmultivariableanalysisanddimensionreduction,advancedstatisticsmethodswereappliedtodeepenstudyforsyndrome.Thearticle

[18]彭玉华.特发性肺纤维化中医药治疗思路与方法[J].中医药学

2003,21(10):1774.刊,

[19]金鸿斌,J].河南中医,2001,21何春娥.中药治疗肺间质纤维化[

(2):51.

[20]钟勇.芪参益气汤联合雾化吸入布地奈德治疗特发性纤维化56

J].中国现代药物应用,2010,4(10):134-135.例临床疗效观察[

[21]吴之煌,.张晓霞.补肺活血汤治疗特发性肺纤维化临床观察[J]

2010,29(2):118-120.北京中医药大学学报,

[22]遆丹阳,韩云丽,杨冠英,等.丹参川芎嗪治疗特发性肺间质纤维

86例疗效分析[J].黑龙江医药,2010,23(1):103-104.

[23]董辉.抗纤舒肺颗粒治疗特发性肺间质纤维化临床观察[J].中

2010,17(3):60-61.国中医药信息杂志,

[24]姚楚芳,蒋树龙.六安七味煎治疗肺间质纤维化32例临床观察[J].四川中医,2005,23(3):52-53.[25]张哓梅,姜良铎,尹婷,等.肺纤方对特发性肺间质纤维化患者肺

弥散功能及的影响[J].北京中医药大学学报(中医临床版),

2009,16(3):7-9.

收稿日期:2013-05-26

基金项目:南京中医药大学中医学一级学科开放课题资助项目

(YS2012Z-YX503);国家重点基础研究发展“973”计划(12006CB504807)

作者简介:李国春(1969-),男,江苏高邮人,副教授,博士,研究方向:

中医病因病机研究,中医药适宜的流行病学和统计学方法研究及中西医结合预防医学研究。通讯作者:吴勉华(1955-),男,江苏通州人,教授,博士,研究方向:中

E-mail:mhwu@医病因病机研究及中西医结合治疗肿瘤,

njutcm.edu.cn。

[26]孙增涛,廉富,魏葆琳,等.益气活血散结法治疗特发性肺纤维化

2007,34(7):865-867.临床与实验研究[J].辽宁中医杂志,

[27]贺雄,曹文富,赵苹利,等.益气化瘀化痰法对肺纤维化大鼠TGF

-β1、PAI-1的影响[J].重庆医学,2012,41(19):1903-1905.

[28]宋建平,李伟,李瑞琴,等.《金匮要略》不同方药对肺纤维化大

——肺纤维化早期阶段中医鼠模型早期阶段(1~14d)的影响—

J].中国中医基础医学杂志,2009,15(6):432-基本病机探讨[

434.

[29]张晓梅,姜良铎,张伟,等.肺纤方对博莱霉素大鼠肺纤维化模型

2及组织金属蛋白酶抑制剂1、2的影响[J].基质金属蛋白酶1、

2008,23(3):212-215.中华中医药杂志(原中国医药学报),

[30]杜妍,肖莉.基质金属蛋白酶蛋白在百草枯致肺纤维化大鼠肺组

J].中国医科大学学报,2011,40(11):1001织中表达及其意义[-1010.

[31]孙燕妮,顾宗元,王雄彪,等.内皮素受体拮抗剂对博莱霉素所致J].临床和实验肺纤维化论著大鼠基质金属蛋白酶表达的影响[

2007,6(2):6-7.医学杂志,

[32]张济周,李青,林萍,等.三七总皂苷对肺心病兔肺纤维化组织CathepsinB表达的影响[J].昆明医学院学报,2010(1):36-

40.

[33]李杰平,张平,张书杰,等.实验性肺纤维化大鼠肺组织CathepsinB表达的动态变化[J].中国现代医学杂志,2008,18(1):65-

68.

[34]黄艳,刘娟,杨雅茹,等.枇杷叶三萜酸对博来霉素致大鼠肺纤维

J].中国药理学通报,2011,27(5):642-646.化的干预作用[[35]黄春芳,刘霞,王晓波,等.姜黄素与博来霉素联用对A549细胞

.中华中医药学刊,2011,增殖抑制及细胞周期和凋亡的影响[J]

29(1):1229-1231.

20134011reviewedallkindsofstatisticalmethodstobeappliedandanalyzedpossibleproblem.

Keywords:syndrome;standardization;measurement;multivariablestatistics证及证候标准化、客观化和规范化是近30年来中医理论研究的热点和难点。热点是源于辨证论治是中医学精髓之一,也是中医理论的核心,而中医的另一特色—整体观点也体现在辨证论治特色之中。中医证候

证本身具有“组学”特征,不学研究涉及到复杂科学,

是某一个微观指标所能表征,建国后的前30年证实质

当时由于方法学研究的限研究已经说明了这一问题,

制和证实质研究的困境触发了后30年证候规范、标准

应该说取得了一定的成果,从中医理论和测量的研究,

研究设计和信息抽取及模型构建上创建了研究思路、

一系列可行的研究方法。以上成果的取得实际上得益

DME测量方法的引入,于多学科的介入,以及高速运

算的计算机和信息技术的发展,这些方法和技术为解决复杂科学问题提供了可能。证候是人体疾病状态的阶段性综合病理表现,证反映了疾病当前的病理本质,中医对证的识别,体现了整体观和系统观,证的表征由众多宏观生物表征信息指标群组成,证及证候的这种特性决定了其测量的复杂性,近30年来,关于其表征及其与证的关系的测量一直是现代统计学方法应用的

学者探索了各种多元统计方法在证候测量中的热点,应用,兹综述如下。1聚类分析

聚类分析(clusteranalysis)是研究事物分类的一种方法。分类学是人类认识世界的基础科学。聚类分析是在事物分类面貌尚不清楚,甚至连总共分几类也不确定的情况下讨论事物的分类问题的。所以,聚类

“历史资料”,分析没有作为分类依据的只能根据事物

本身的特性进行分类。聚类分析可以是对样品聚类解决研究对象的分类问题,也可以是对观察指标聚类,解决观察指标的分类问题。对样品的聚类也称为样品聚类,又称Q型聚类;对指标的聚类称为指标聚类,又称R型聚类。

聚类分析是直接比较样本中各指标(或样品)之“性质”,间的将性质相近的归为一类,性质差别较大的归在不同类。衡量指标(或样品)性质相近程度的

常用的有相似系数和距离两指标—聚类指标有多种,

类,常用的聚类方法有系统聚类法(hierarchicalcluste-ringmethod)、动态聚类法(k-meansmethod)、两阶段

聚类树法(classifi-聚类法(twostepclusteringmethod)、cationtreemethod)、区别分析(discriminantanalysis)和双向聚类等,以上方法根据算法不同又可分为无监督算法和有监算法。中医证候学研究中,可以根据个体证候表征信息的差别,采用样品聚类的方法将个体进行分类,然后再分析每一类的个体的共性特征,最后结合专业确定个体所属的类别;还可以采用表征指标聚类方法,将宏观表征进行归类,但是该方法不太符合中医理论,指标聚类的方法,是对证候症状、体征等表征

该方法一般只能将表征归于一类之中,而中进行归类,

医的症状表征往往可出现在不同类中,也不能显示主证、兼证、症状对证候的贡献度。双向聚类是一个可行方法,可以先根据证候特征将患者分类,然后采用指标

[1]

将特征分类,较符合中医理论。如陈建学等应聚类,

·2395·

用聚类分析方法结合Logistic回归分析方法探讨了在

[2]

中医证候诊断量化研究中的应用;司徒红林等应用该方法研究了乳腺增生病中医证候分布规律及证候分级阈值。

2主成分分析

主成分分析(principalcomponentanalysis)最早是

而Hotelling再加以发由英国统计学家Pearson创立,

展的一种多元统计方法,它是一种将多指标或变量资

因此其主要料转化为单指标或变量资料的降维技术,

目的在于资料的精简及线性转换。其基本分析思路是

精简的主成分从众多变量中寻找尽可能少的主成分,

能得到最大的变异信息量,用变量线性加权的主成分来描述复杂的事物的方法,主成分分析的作用还表现

用于后在能从多个相关指标中抽取几个独立的指标,

续的回归分析,因为传统回归分析要求变量之间具有

一般借助计算独立性。主成分的计算过程比较复杂,

机用迭代法求得。

中医的证一般由多维表征来表达,症状指标间又具有一定的相关性,如何将复杂的指标用尽可能少的

主成分分析可以解决证几个独立的综合成分来表达,

候多指标的降维问题,该方法可以建立症状和证候主成分之间权重关系。主成分分析的缺点是不能很好地解释指标或变量间的关系,也没有考虑到变量的测量

[3]

误差。如李宗信等应用该方法分析了CFS气虚证和血虚证症状主成分,能够基本准确地反映患者的实际证候。

3探索性因子分析和证实性因子分析

在多变量分析中,往往可以看到某些变量间存在相关性。是什么原因使他们之间有关联呢?是否存在

但影响可观测变量变化的潜有不能被直接观测到的、

在支配因子?因子分析(factoranalysis)就是寻找潜在

先提支配因子的模型分析方法。它像回归分析一样,

出一个假设的模型,然后估计模型中的常数(参数),再用它解决实际问题,因此,因子分析能以简洁、精确的方法来描述众多变量之间的交互关系,以协助研究者对这些变量的概念化。

通过因子分析可以将杂乱无章的变量理出头绪,此种探索性的功能有助于建立专业新的假设、发展新

而这种因子分析通常称为探索性因子分析的理论,

(exploratoryfactoranalysis);假定研究者的理论架构已经非常完善,或是引用前人理论,就可以利用因子来验证这些理论和假设,此类因子分析称为验证性因子分析(confirmatoryfactoranalysis)。

证候测量可以采用因子分析模型,病机及其组分可以看成潜在的因子,病机决定了证候的表征,证候表征之间复杂关系可以用因子分析模型来解释,因此因子分析模型正好符合这一理论假说。如果采用因子分

事先不考虑中医先验理析在分析证候表征的关系时,

论,通过算法直接获取相关因子,根据所得因子统计学特性再作专业解释,称为证候的探索性因子分析;反之,如果事先就利用中医先验理论,构筑相应模型,再

称为验证用数据去拟合和验证模型是否成立或修正,

·2396·

性因子分析。以上模型可以分析证与证之间及证与证

[4]

候表征之间复杂关系。张允岭采用探索性因子分析探讨了高血压低危组证候要素的规律,得出高血压低

气虚,次要证候要素是火、危组主要证候要素是血瘀、

[5]

瘀;史锁芳等采用验证性因子分析探讨了支气管哮

将支气管哮喘分为寒饮伏肺证、痰喘的证候分布规律,

热蕴肺证、风痰阻肺证等5大类证候。4结构方程模型及隐类分析

20世纪80年代以来,基于协方差结构(covariancestructure)的结构方程模型(structuralequationmodel,SEM)分析迅速发展[6-8],弥补传统统计方法的不足,成为多元数据分析的重要工具之一。与传统的回归分

结构方程分析能同时处理多个因变量,并可证析不同,

比较及评价不同的理论模型。与传统的探索性因实、

子(EFA)分析不同,假设基于专业上现有的理论,某些

或很小可忽略,则此时因子在一些变量上的载荷为0,

的构建的分析模型,则称为证实性因子分析(confirma-CFA),toryfactoranalysis,可分为一级和二级以上(或

而结构方程模型则是在称高阶)的证实性因子分析,

CFA基础上,可进一步分析或考察隐变量间复杂的因果及相关关系。完整SEM模型包含了测量模式和结构模式,测量模式是用显变量来反映潜变量,由于测量

测量方法的缺陷而导致测量效度的不足,误差的存在、

常用测量模式来评价和说明可观察变量(即显变量)可以定义潜变量的程度,在SEM中,根据显变量所反映的潜变量的地位不同,可分为外因显变量或独立显变量与内因显变量或依存显变量,从因果关系上来考察,前者为上游变量,后者为下游变量,外因显变量用x表示,内因显变量用y,ξ、η分别为相应显变量所反映的潜变量,前者为外因潜变量(exogenousorinde-pendentvariable),后者为内因潜变量(endogenousordependentvariable);测量模式可用矩阵简洁地表示

y=Λyη+ε,Λx、Λy为系数矩阵,δ、ε为:x=Λxξ+δ,

为测量误差;结构模式即为潜变量模式,用于建立潜在变量间的关系,潜变量间的关系可以用矩阵表示为:η=Βη+Γξ+ζ,Β、Γ分别为内外因潜在变量间的系数

ζ为潜在或干扰误差;整个SEM模型需要满足矩阵,

一些基本的假定。

有研究者提出,中医的证与证候群之间的关系类似于结构化方程模型中潜变量和显变量之间的关系,

[9-10]

。所谓潜变量(latentvariable)是指无法直接测量

也就是说,证不能直接测量,但确实能反映人体某种状态,它可以通过显性变量的测量来反应或表达,这里的显现变量(manifestvariable)主要是指四诊信息。结构方程模型是分析潜变量或隐变量的有力工具,它也提供研究者由探索分析(exploratoryanalysis)转为验证分析(confirmatoryanalysis)的可能途径。而中医证的理

中医论模型的提出的背后却是有一个深厚先验理论,

学本身是在数千年的临床经验积累过程中,逐步形成

而这个理论急需要证实、提炼和升和完善的医学理论,

华,而证本身又是基于人体疾病显性症状而从整体上提炼出的抽象概念,反映了人体的一种综合的病理状态,类似于潜变量,而这个潜变量需要量化和客观化,因此采用SEM分析疾病的证候规律是适合和必要的,可用于检验中医学者提出的基于经验的各种学说、观

20134011证与四诊点或模型的合理性;从而分析病与证的关系,

信息间的错综复杂的关系,以及证与证之间的相关性

[11]

和演变关系。如申春梯等采用该方法探讨了在中

[12]

李国春等探医病证结合及异病同证研究中的应用,

讨了该方法在慢性萎缩性胃炎证候分型中的应用。张连文则提出了应用隐类或隐结构法用于中医证候的研究,其基本思想有别于结构方程模型,是运用隐结构概率模型对临床流行病学调查数据在无先验辨证的前提下,对众多症状数据进行多维聚类分析,试

标准化研究提供客观依据。图为证候的规范化、

5数据挖掘方法

数据挖掘方法是近十年来在统计学和计算机领域发展极为迅速的一支新兴交叉学科,它集人工智能、统

机器学习、神经网络、模式识别、信息检索、高性计学、

因此数据能计算和数据可视化等学科和技术于一体,

挖掘是利用各种复杂的数据分析工具来发现大型数据

并据此进行集中的各种未知模式和数据的内在关系,

预测的一个过程。根据计算机科学家的理解,数据挖掘也被称为数据库的知识发现。实际上数据挖掘方法最早是由计算机学家提出的。它和传统统计学方法区别是事先无假设、多数据情况下总体参数未知、数据量较大(否则结论不可靠)、融合了诸如机器学习和人工智能的等方法及基本算法建模等特点。在传统统计学方法的基础上,它还具有关联规则、人工神经网络和粗

因此该方法与前面介绍的方糙集理论等独特的方法,

笔者认为数据法有交叉。随着新的算法的不断出现,

挖掘方法在证候分类和测量中将会得到广泛应用,解决证候测量和规范中的复杂性问题。

参考文献[1]陈建设,陈文垲.聚类分析结合logistic回归分析在中医证候诊断

2009,26(4):379-量化研究中的应用探讨[J].中国卫生统计,

382.

[2]司徒红林,林毅,欧爱华,等.腺增生病中医证候分布规律及证候

J].辽宁中医药杂志,2007,34(11):1545-1547.分级阈值初探[[3]李宗信,黄小波,陈文强,等.慢性疲劳综合征中医证候主成分的J].中国中医药信息杂志,2007,14(1):26-27.相关分析[[4]金香兰,张允岭,孟繁兴,等.高血压病低危组证候要素初探[J].2011,26(1):36-39.中华中医药杂志,

[5]史锁芳,刘秀芳,严志林,等.支气管哮喘患者中医四诊信息调查

J].中西医结合学报,2005,3(5):363-365.及验证性因子分析[

[6]侯杰泰,.北京:温忠麟,成子娟,等.结构方程模型及其应用[M]2005:13.教育科学出版社,[7]BentlerPM.Multivariateanalysiswithlatentvariables:Causalmodel-ing[J].AnnualReviewofPsychology,1980(31):419-456.[8]WenZ,MHW,HauKT.Interactionaleffectsingrowthmodeling:Afull

model[J].StructuralEquationModeling:AMultidisciplinaryJournal,2002(9):20-39.

[9]陈启光,申春悌,张华强,等.结构方程模型在中医证候规范研究

J].中国卫生统计,2005,22(1):2-4.中的应用[[10]李国春,陈文垲,梅晓云,等.中医宏观辨证指标量化方法研究探.中国中医基础医学杂志,2005,22(1):2-3.讨[J][11]申春悌,陈启光,张华强.DME的测量(M)方法在病证结合研究

J].北京中医药大学学报,2007,30(3):160-187.中的运用[

[12]李国春,李春婷,黄蓝洋,等.结构方程模型在慢性萎缩性胃炎中J].中国卫生统计,2007,24(4):357-361.医证候分型中应用[

[13]王天芳,张连文,赵燕,等.隐结构模型及其在中医证候研究中的

J].北京中医药大学学报,2009,32(8):519-526.应用[

[13]

本文来源:https://www.bwwdw.com/article/iw34.html

Top