期刊信息
主办:中国中医科学院中药研究所;中华中医药学会
主管:国家中医药管理局
ISSN:1005-9903
CN:11-3495/R
语言:中文
周期:半月
影响因子:1.817375
数据库收录:
北大核心期刊(2008版);北大核心期刊(2011版);北大核心期刊(2014版);北大核心期刊(2017版);化学文摘(网络版);中国科学引文数据库(2015-2016);中国科学引文数据库(2017-2018);中国科学引文数据库(2019-2020);日本科学技术振兴机构数据库;中国科技核心期刊;期刊分类:中药学
期刊热词:
药理
关联规则在方剂数据挖掘中的应用述评(2)
【作者】网站采编
【关键词】
【摘要】1.3 类方及其他方剂学相关研究: 类方,是指在药物组成上具有一定相似性的方剂的集合。而关联规则的数学模型恰恰是建立在频繁项集理论基础上的,因
1.3 类方及其他方剂学相关研究:
类方,是指在药物组成上具有一定相似性的方剂的集合。而关联规则的数学模型恰恰是建立在频繁项集理论基础上的,因此在类方研究中显示了其独特的优势。
张昱等[22]搜集四君子汤类方967首,采用关联规则的FP-growth算法挖掘了该类方的主治症状和配伍规律,证实了布尔关联规则用于挖掘类方主治症状与药物之间关联的可行性。叶亮等[23]对古今治疗痛经的四物汤类方进行了关联规则挖掘,通过古今对比,探讨了该类方的药物组合规律。张文亮等[24]检索了应用地黄饮子治疗中风病的文献,运用关联规则等方法对该类方的药物归经、功效、配伍等进行了挖掘。陈明等[25]以《伤寒论》与《金匮要略》为研究对象,对桂枝汤类方的主治病症、桂芍比例、药对配伍等进行了全方位的挖掘。刘娟等[26]筛选了《中医大辞典·方剂分册》中治疗脾胃病症的白术类方,运用关联规则对药物间及药证间的关联进行了分析。陈仁波等[27]收集使用黄芪的临床医案755例,运用关联规则挖掘了黄芪类方的配伍及相关症状。冯石强[28]运用关联规则、聚类分析等方法对柴胡类方数据进行了研究,发现了其药对、证候、药症等多方面的规律。以上研究表明关联规则用于类方研究对揭示辨证用药的规律、阐明方剂的主治病症具有重要的意义。此外,关联规则在其他方剂学相关领域的研究中也显示了良好的性能。雷蕾等[29]运用关联规则对治疗肺癌的中药化学组分进行研究,发现了一些组分配伍的隐含知识。金锐等[30]对《神农本草经》中365味中药的气—味—效三维立体数据进行了关联分析,探讨了中药药性与气味的关系。尚尔鑫等[31]通过关联规则挖掘了存在配伍禁忌的中药药物属性的特点,初步探索了中药性味归经与禁忌的关系。
总之,关联规则作为一种数据挖掘技术,已渗透到方剂学研究的各个领域,且显示了其良好的适用性。
2 评述与展望
关联规则被提出仅仅20年,而用于中医学领域不过近10年,近年来,中医药领域的专家学者对数据挖掘的研究热情不断高涨,基于关联规则进行方剂学研究的文献数量呈上升趋势,这与关联规则自身特点有关。与传统统计学相比,关联规则所处理的数据具有海量性、非线性、模糊性等特征,而这些恰恰是方剂资料所具备的特征。传统统计学用样本估测总体,得到的结果是具体的数值;而关联规则挖掘的是数据库总体中所存在的频繁模式,得出的是规则。正因如此,关联规则技术在传承专家经验、研究古今医案、发现配伍规律、中医药标准化等方面被广泛应用。目前,关联规则作为数据挖掘的方法之一,业已成为方剂学研究中必不可少的数学工具之一。
但总体来说该技术在中医学方剂研究中仍处于起步阶段,尚存在诸多问题。首先,关联规则是基于数据库的。数据库中数据的质量直接决定了规则的质量,虽然中国已建立了众多较为全面的方剂数据库,但由于方剂数据自身的特点,仍存在药物名称不统一、大量模糊数据(如药物用量“一枚”、“少许”、“不拘多少”等)、数据缺失与冗余并存等诸多问题,这在古代文献的数据库中更为突出。如何消除数据库中这些噪声,使清洗后的数据更为符合关联规则挖掘的要求已成为该项技术的难点。其次,关联规则是基于频次的。某种药物出现的频次多少直接决定了其支持度和置信度的大小,那些大众化的药物会获得较高强度的关联,从而产生大量无趣的垃圾规则,同时不可避免的会丢失稀有数据(例如某些仅针对罕见症状所选用的疗效确切的单味药物),虽然通过提升度、置信率、正态卡方、信息差等指标可对关联规则进行剪枝,最大限度的剔除垃圾规则,同时通过设定也可得到部分研究者感兴趣的稀有数据,但仍然存在两大风险:相信了实际不存在的规则和抛弃了实际有意义的规则。最后,关联规则离不开人的分析。挖掘出的规则究竟有没有实际意义还需要中医理论的指导,对药物组合的解释、方—药—证三者之间的内在联系等等都是研究者对规则的主观评价的过程,往往说服力不够强,尤其是那些隐藏的不为先前经验所知的规则,常常需要后续大量的临床及实验研究的支持。
因此,关联规则在方剂学研究中未来的方向,一方面应放在数据准备阶段,着力提高数据库的质量,解决方剂数据标准化问题;另一方面应放在算法创新上,将关联规则的新算法与方剂学相结合,找到更为适合中医方剂资料的算法,使得出的规则更加客观、合理,更加符合中医学的需要。
文章来源:《中国实验方剂学杂志》 网址: http://www.zgsyfjxzzzz.cn/qikandaodu/2020/1104/339.html