多元统计分析方法在中医证候学中的应用

中医证候是指疾病发生和演变过程中某阶段以及患者个体当时所处特定内、外环境本质的反映,它以相应的症、舌、脉、形、色、神表现出来,能够不同程度地揭示病因、病位、病性、邪正盛衰、病势等病机内容,为辨证论治提供依据。证候是中医学带动中医药基础理论取得突破、促进中医药现代化的关键问题之一。多元统计分析是从经典统计学中发展起来的一个分支,是一种综合分析方法,它能够在多个对象和多个指标互相关联的情况下分析它们的统计规律,很适合中医证候学的研究特点。多元统计分析方法主要包括判别分析、聚类分析、主成分分析、因子分析、典型相关分析等。近年来多元统计分析方法在中医证候学中的应用十分广泛,是实现中医证候定量化、规范化的重要手段。

一、判别分析

[1]谢雁鸣,蔡博婧,田峰,易丹辉,虞鲲,康澍,李建鹏,崔庆荣.基于GPLM的40~65岁绝经后骨质疏松症风险判别模型分析[J].中国卫生统计,,29(06):-.

研究背景:判别分析是根据判别对象若干个指标的观测结果判定其应属于哪一类统计学方法,其特点是根据已掌握的每个类别的若干样本数据,总结出客观事物分类的规律性,建立判别公式和判别准则。

数据来源:文献[1]的研究对象来源于问卷调查,年3月至8月在上海市和北京市社区进行PMOP高危人群筛选,对符合纳入标准的人员进行现场问卷调查。在上海社区发放问卷份,返回问卷份,其中合格问卷份,在北京社区发放问卷份,返回问卷份,其中合格问卷份。

数据处理方法:文献[1]在获取例社区PMOP高危人群危险因素及证候问卷调查数据基础上,筛选出与PMOP发病相关的重要危险因素和中医症状为协变量,以骨密度定性诊断为结局变量,建立基于GPLM的PMOP判别模型。

研究结论:文献[1]的研究发现绝经年限与PMOP发病之间存在非线性效应。将西医危险因素和中医症状相结合,建立基于GPLM的PMOP判别模型,反映病证结合特点,与logistic回归模型相比,具有更好的判别准确性。

与同类研究相比较的优缺点:文献[1]运用GPLM进行40到65岁绝经后骨质疏松症风险判别模型探索性研究,能够准确描述协变量与结局变量之间的关系,通过纳入与结局变量之间存在非线性关系的连续数值协变量,增加模型的判别准确性,又不会带来因非参数形式过多而造成的估计困难,可以清楚地展示出特定变量的特殊效应。但是,由于现有的GPLM模型拟合和检验只限于两分类结局变量,尚无法实现对三分类结局变量判别模型的拟合,因此本研究只能对骨量正常和骨质疏松两部分人群进行PMOP判别模型建构,尚未能纳入骨量减少人群的数据,在PMOP高危人群不同骨量状态的判别上存在一定的局限性。

阅读参考价值:现有的ROC曲线拟合方法也是针对两分类结局变量数据,目前尚无成熟的针对三分类结局变量判别模型的ROC曲线拟合方法,这些问题有待今后进一步探索研究。

二、聚类分析

[2]牟新,庄爱文,马国玲,刘颖慧,胡永宾,寿成珉,陈家炜,周旦阳.例临床期糖尿病肾病患者中医证候聚类分析[J].中华中医药学刊,,34(02):-.

[3]王养忠,柳红芳,张先慧,许家骏,杭海燕,姜旻,张向伟,韩锦丹.基于聚类分析及主成分分析的糖尿病肾病中医四诊信息特征临床研究[J].中华中医药杂志,,31(04):-.

[4]谭奇,赵艳霞,吴萍,王树林,李斌.高原红细胞增多症中医证候聚类分析及因子分析研究[J].时珍国医国药,,30(12):-.

[5]仝延萍,杨涛,王静文,赵天佑,康越之,李娜,李珊,关瑞熙,樊永平.基于聚类分析的缓解期视神经脊髓炎谱系疾病中医证型规律研究[J].中华中医药杂志,,35(06):-.

[6]孟宪泽,万旭英,李军昌,巩小丽,梁玉清,高颂凯,徐纪平,李露嘉,岳小强.新型冠状病毒肺炎患者中医辨证规律[J].第二军医大学学报,,41(05):-.

研究背景:聚类分析又称集群分析,是将随机现象归类的一种数理统计方法。聚类是指在不能明确如何分类的前提之下,试图借助数理统计的方法,用已收集到的资料找出研究对象的适当归类。聚类分析在中医证候分类研究中应用比较广泛。此外,聚类分析和因子分析、主成分分析的联合应用也十分广泛。

数据来源:文献[2]的研究对象来自于年10月-年10月在门诊和住院病人,随机选取明确诊断的糖尿病肾病Ⅲ~Ⅳ期患者例,性别年龄不限。将入选病例依据实验室检查结果分层进行调查,其中Ⅲ期例,Ⅳ期例。文献[3]的研究对象来自于年3月-年2月就诊于北京医院、北医院、北京中医院、中医院、中国医院、中医院、医院、医院、医院、医院、解放军医院、医院、医院、医院共14家参研单位的2型糖尿病患者以及北京市东城区社区卫生服务管理中心辖管的部分2型糖尿病居民,性别不限。文献[4]的研究对象来自于年1月到年12医院符合HAPC诊断标准的住院患者病历。文献[5]的研究对象来自于年7月至年12月期间就诊于首都医科医院中医科的缓解期NMOSD患者例,均符合年NMO诊断标准或年NMOSD诊断标准[6],疾病处于缓解期,其中男性79例,女性例。文献[6]的研究对象来自于湖北省妇幼保健院光谷院区年3月2日确诊为COVID-19的在院患者。

数据处理方法:文献[2]采用糖尿病肾病中医证候问卷进行横断面调查,对例临床期糖尿病肾病患者进行调查,对所得数据进行频数统计和聚类分析。文献[3]采集例年3月-年2月收治的明确诊断DN的例患者中医证候信息,在线录入,建立数据库,运用聚类分析、主成分分析探索性研究其四诊信息特征。文献[4]在文献研究及专家讨论的基础上设置证候采集表,整理中医四诊信息,运用聚类分析与因子分析相结合行数据处理。文献[5]纳入例缓解期NMOSD患者,收集中医四诊信息,运用系统聚类分析和主成分分析方法,归纳该病的常见证候类型和主次症。文献[6]采取横断面调查的方法,对湖北省妇幼保健院光谷院区例在院COVID-19患者进行中医四诊信息收集,按早期、中期、后期不同病程阶段用频数法统计患者主要临床症状发生率,运用层次聚类法对常见症状进行聚类分析,并结合专家经验总结其证候规律。

研究结论:文献[2]得到临床期糖尿病肾病的5个证候类型,发现糖尿病肾病为本虚标实之证,以阳虚更为明显,逐渐发展为阴阳两虚,瘀血证贯穿病程始终。文献[3]发现应用聚类分析及主成分分析研究方法能够在一定程度上反映DN的中医四诊信息特征。文献[4]得出,通过对HAPC住院患者四诊资料整理、分析及统计学处理得出HAPC住院患者常见证候及证候内涵,为临床诊疗提供一定的依据。文献[5]得出,缓解期NMOSD的中医证候可分为肝肾阴虚证、脾肾阳虚证、气虚血瘀证和痰湿热证四种类型。文献[6]得出,COVID-19不同疾病阶段的中医证候呈现由表入里、由湿化热、由实转虚的规律性变化,症状上具有明显的自身特点。因子分析与聚类分析能够帮助中医证候的分类研究,宏观与微观信息相结合进行证候分类对IgA肾病证候诊断依据的客观化和微观化具有参考价值。

与同类研究相比较的优缺点:聚类分析方法其优点在于研究前不需要经验知识学习即机器学习,属于无监督学习的数理分析方法,反映在中医证候研究中即不需要预先做出证候诊断,避免了人为主观性,通过对客观的四诊信息资料按相似程度大小进行归类,达到降维的目的,为证候与症状之间的判别提供一些客观的依据,建立有统计学依据的证候关联。在对数据分析结果进行诠释时,仍须研究者参考相关标准、专业知识、专家经验等进行证型判定,似乎无法完全避免人为因素,但是比起有监督学习客观性相对较强。聚类仅是一种初步的分类方法,由于变量之间常具有复杂的相关关联,使得进一步分析发生困难。

阅读参考价值:聚类分析在中医证候规范化研究中应用较广,多根据个体症状差异分析每一个类别个体的共同特征,最后结合专业知识将其归属为某一类别;也可通过指标聚类对症状等指标进行归类。

三、因子分析

[7]张明雪,曲淼,张天奉.基于因子分析和Logistic回归分析的冠心病证候研究[J].中华中医药杂志,,30(10):-.

[8]李毅,刘艳,刘力,寇小妮,汶明琦,王捷虹,王小平.例乙肝后肝硬化中医证候特征的因子分析[J].时珍国医国药,,28(05):-1.

[9]崔寒尽,王文竹,王煜,张春虎,范荣,唐涛.例武汉地区新型冠状病毒肺炎重症患者中医临床特点[J/OL].中医杂志:1-6[-09-11].


转载请注明:http://www.heyixiaosm.com/gswh/19665.html