温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
幼科折衷
基于
数据
挖掘
折衷
用药
规律
分析
孔明霞
107 基于数据挖掘幼科折衷用药规律分析 孔明霞(黄冈职业技术学院 医药学院,湖北 黄冈 438002)摘 要:目的 摘 要:目的 基于数据挖掘分析秦昌遇幼科折衷的用药规律。方法 方法 收集幼科折衷中符合纳入标准的方剂。利用 Excel 软件建立幼科折衷药方数据库,采用 Python、SPSS 26.0 软件对数据进行描述性分析、关联规则分析和聚类分析。结果 结果 共纳入方剂 280 首,涉及中药 294 味,使用频次较高的药物为甘草、人参、茯苓、白术。得到两位药高频药对 15 对,三味药高频药对 20 对。具有关联规则的药对 16 对,形成聚类的核心药组 7 对。结论 结论 秦昌遇在幼科折衷的思想体现在临床诊断上因证思辨,在用药上以调理脾经的药物主,以肺、肝、胃、心为辅,本次研究为临床辨治儿科病症提供思路。关键词:关键词:幼科折衷;用药规律;数据挖掘 中图分类号中图分类号:TQ460.7+2 文献标志码文献标志码:A 文章编号文章编号:1672-1047(2022)06-0107-04 DOI:10.3969/j.issn.1672-1047.2022.06.28 收稿日期:2022-11-01 作者简介:孔明霞,女,甘肃天水人,助教。研究方向:药物制剂。幼科折衷是明代著名医家秦昌遇著,其它主要著作还有幼科医验和幼科金针1。幼科折衷共记载了 50 余种小儿疾病的诊治,对各种病症结合脉经 内经等名作的要旨,倡导辩证施治、活学活用,对疾病的认知和用药配伍给出了自己独道的见解2。因此,本课题从描述性分析、常用高频药物组合、关联分析、系统聚类分析等方面对幼科折衷药方数据库进行数据挖掘,从而客观分析秦昌遇的用药规律和学术思想,为中医药治疗儿科病症的辨证治疗、临床研究和新药研发提供参考和新思路。1 资料与方法 1 资料与方法 1.1 纳入信息规则 幼科折衷3中有明确药物和药方名称的各类方剂,不限剂型;对于重复出现的药方只取一次。1.2 数据库的建立及规范化处理 首先将原始医疗案例记录中的文言文转化为进行提取方剂和对应中药名,考虑到本医书古籍收录来源于各个名家专著,所以药材名未被统一规范。因此本文阅览和参考中药学4和中药大辞典5以及对比其他古籍内的类似药方对药材名进行规范化处理,如麦冬、麦麦冬、麦门冬统一规范为麦冬。在中药材名称规范化后,将符合纳入标准的方剂录入Excel 表中,建立幼科折衷药方数据库。1.3 数据挖掘和统计方法 用 Excel 对药物进行初步统计,筛选出频次较高的药物,随后对这些药物进行归经统计;采用 Python的 Apriori 算法,进行对药物频次的统计,并且对药方内的药物与药物之间的关系进行关联规则分析;采用 SPSS 26.0 软件对药物系统聚类进行分类统计6。2 结果 2 结果 2.1.幼科折衷药物使用频次 对幼科折衷进行数据筛选,共纳入符合标准方剂 280 首,涉及中药 294 味,对全部的药物进行统计后,经过初步分析确认,将使用频次 20 次作为分界线时得到的药物数目较为合理。使用频次20 的药物见表 1,随后对使用频次20 药物进行归经分析得到表 2。表1 幼科折衷药材使用频次(20)表1 幼科折衷药材使用频次(20)药材 频次 药材 频次 甘草 156 黄芩 32 人参 61 黄连 31 茯苓 56 柴胡 30 白术 46 芍药 28 陈皮 45 枳壳 24 川芎 43 桔梗 22 当归 40 麻黄 22 半夏 39 生地 22 防风 37 苍术 21 大黄 33 麝香 20 Vol.24 No.6Dec.2022第 24 卷第 6 期 2022 年 12 月 黄 冈 职 业 技 术 学 院 学 报Journal of Huanggang Polytechnic 108 表 2 幼科折衷药材的归经频次 表 2 幼科折衷药材的归经频次 归经 频次 脾 15 肺 9 肝 9 胃 7 心 7 胆 4 大肠 3 膀胱 2 肾 2 心包 2 小肠 1 2.2幼科折衷常用药对频次 Apriori 算法的核心思想为,在一个集合中,若存在某个元素组合是频繁的,则其子集也是频繁的,这一思想有利于减少建立关联规则时的计算量,达到快速分析的目的7。因此,首先需要对幼科折衷的统计结果进行分析,得到其频繁项集,即常用药物及其频次。根据幼科折衷的统计结果,采用 Python 的Apriori 算法对幼科折衷进行高频药对分析,得到了幼科折衷的两味常用药和三味常用药。通过对结果进行初步统计,为保证呈现的常用药对数目和频次相对合理,我们分别选取了使用频次20 次的二味常用药对和使用频次10 次的三味常用药,对呈现到表 3 和表 4 中。结合表 1、表 3、表 4 可知,使用频次较高的中药也常作为药对被运用到方剂中。表 3 幼科折衷二味常用药对频次(20)表 3 幼科折衷二味常用药对频次(20)药对 频次 药对 频次 人参 甘草 46 半夏 甘草 25 茯苓 甘草 38 川芎 甘草 24 甘草 白术 32 甘草 当归 24 人参 茯苓 30 甘草 柴胡 24 陈皮 甘草 29 人参 白术 22 甘草 防风 27 甘草 芍药 21 茯苓 白术 27 桔梗 甘草 20 黄芩 甘草 25 表 4 幼科折衷三味常用药对频次(10)表 4 幼科折衷三味常用药对频次(10)药对 频次 药对 频次 人参 茯苓 甘草25 陈皮 茯苓 甘草11 茯苓 甘草 白术19 人参 半夏 甘草11 人参 甘草 白术18 人参 甘草 防风11 人参 茯苓 白术18 川芎 甘草 防风11 陈皮 半夏 甘草14 陈皮 甘草 白术11 人参 甘草 柴胡14 川芎 茯苓 甘草10 陈皮 人参 甘草12 半夏 茯苓 甘草10 人参 川芎 甘草12 桔梗 茯苓 甘草10 陈皮 半夏 茯苓12 羌活 甘草 防风10 半夏 黄芩 甘草11 茯苓 甘草 柴胡10 2.3幼科折衷药物关联分析 在得到频繁项集后,通过对即可对常用药物组合进行关联分析。Apriori 算法关联分析主要的相关概念为置信度、支持度和提升度。支持度表现的是前项和后项药物组出现的概率,置信度表现的是后项药物组出现在前项药物组所在的药方的概率,提升度是衡量前项药物组出现对后项药物组出现概率的影响。最小置信度和最小支持度是用来衡量数据挖掘出来的高频集的标准,只有当频繁项集的置信度和支持度都高于设定的最小置信度和最小支持度时,该项集才会被Apriori 算法筛选出来。在最小置信度的设置方面,若是最小置信度设置过高,可以包含大部分药物的规则,得到该规则中前项和后项关系极为接近的药物。但在实际生活中,部分疾病较为罕见,其对应的药物组合也出现的概率较少,因此若需挖掘出这一类药物组合需要适当降低最小置信度,且可能需要医师的判别。在最小支持度的设置方面,若最小支持度设置过高,则仅能反应出局部高频药物组合的规则属性,若设置过低,虽然能反应出绝大部分药物在方剂中的关联规则,但一方面会增大计算时间,另一方面这会使得表现的关联规则在结果中的出现不够频繁8。根据既往的中医药数据挖掘经验,通常将最小置信度设定为 50%,最小支持度设定为 5%9。本研究以这一条件为基础结合幼科折衷 的实际情况对最小置信度和最小支持度不断调整,最终将最小支持度设置为 5%、最小置信度设置为 80%。在这一条件下,本研究共得到关联规则 18第 6 期 基于数据挖掘幼科折衷用药规律分析 第 24 卷 109 组,按照置信度由高到低排列,关联分析结果见表 5。表 5 幼科折衷药物关联规则分析 表 5 幼科折衷药物关联规则分析 前项 后项 支持度 置信度 提升度黄芩 芍药 甘草 5.36%100.00%1.79%人参 白术 茯苓 甘草 6.07%94.44%1.70%人参 白术 甘草 7.14%90.91%1.63%桔梗 甘草 7.14%90.91%1.63%人参 茯苓 甘草 9.64%90.00%1.62%桂枝 甘草 6.07%89.47%1.61%升麻 甘草 5.00%87.50%1.57%青皮 陈皮 5.00%87.50%5.44%柴胡 甘草 9.29%86.67%1.56%人参 白术 甘草 茯苓 6.07%85.00%4.25%黄芩 甘草 9.64%84.38%1.51%人参 甘草 18.21%83.61%1.50%柴胡 人参 甘草 5.00%82.35%1.48%荆芥 甘草 5.00%82.35%1.48%羌活 甘草 5.00%82.35%1.48%人参 白术 茯苓 6.43%81.82%4.09%白术 甘草 茯苓 人参 6.07%80.95%3.72%芍药 甘草 16.43%80.70%1.45%关联规则的结果显示,前项以单项药物组合居多,两味药物组合次之,后项都为高频次药物,甘草出现最为频繁,或与甘草本身常作为佐使药使用和用药频次最高有关。2.4 幼科折衷药物系统聚类分析 聚类算法的本质是将数据分别划分为多个类别,具有较高相似度的对象会被划分为同一类,不同类别之间会存在较大的差异。聚类分析方法中较为常用的方法之一是系统聚类方法。这一聚类的中心思想是确定点与点之间的距离,根据所需距离的要求,可以选取欧式距离、绝对值距离、皮尔逊相关性等距离测算方法。在这些方法中,皮尔逊相关性可以衡量两者的相关性。因此本文根据幼科折衷的统计结果,使用 SPSS26 软件进行了以皮尔逊相关性为测算距离方法的组件系统聚类。对幼科折衷用药频次小于20 次的药物进行剔除,对剩余的较高频次的药物进行系统聚类,最终得到图 1 的聚类结果。核心药物组合为:茯苓白术、陈皮半夏、枳壳桔梗、大黄麻黄、川芎当归、黄芩柴胡、黄连麝香。图 1 幼科折衷药物聚类树状图 图 1 幼科折衷药物聚类树状图 3 讨论 3 讨论 古代儿科领域中有主寒、主温具有一定的争辩。以北宋钱乙为代表的主寒派,主张采用抱龙丸、百祥丸等寒性药剂治疗麻痘疾病。以南宋陈文中为代表的主温派则认为寒剂易伤脾胃,主张以桂、附等温补药剂治疗由于阴盛阳虚造成的痘疹。此外,在主补和主泻方面也有类似的不同见解。以隋代巢元方、唐代孙思邈等医家代表主张以泻下方治疗刚出生的幼儿疾病,而宋代钱乙、明代万全等医家代表则认为幼儿脏腑柔弱,成而未全,主张补益类方剂的使用。秦昌遇主张摒弃偏见,对各派的见解兼收并蓄,折衷其间。“幼科诸书,非偏寒偏热之误,便喜补喜泻之殊,故僭而折衷之”,遂名幼科折衷10。该书详细记载了小儿疾病和秦氏本人辩证施治,富有理论依据的独道见解,能够对现代中医儿科学的研究提供良好的参考价值。本文首先对幼科折衷所使用的药物频次进行了初步统计(频次20),甘草(156)、人参(61)、芍药(57)、茯苓(56)、白术(46)、陈皮(45)、川芎(43)、当归(40)、半夏(39)、防风(37)、大黄(33)、黄芩(32)、黄连(31)、柴胡(30)、枳壳(24)、桔梗(22)、麻黄(22)、生地(22)、苍术(21)、麝香(20)。在此之后,以中药大辞典为出处,对频次20 的中药药材从归经方面进第 6 期 基于数据挖掘幼科折衷用药规律分析 第 24 卷 110 行再一次频次统计:脾(15)、肺(9)、肝(9)、胃(7)、心(7)、胆(4)、大肠(3)、膀胱(2)、肾(2)、心包(2)、小肠(1)。秦昌遇用药、入药以脾经的药材为主,肺经、肝经、胃经、心经等归经的药材为辅,突出了脾经的主导地位。高频次的药对分析结果显示,二味药对中频次20 的有人参甘草、茯苓甘草、甘草白术、人参茯苓、陈皮甘草、甘草防风、茯苓白术、黄芩甘草、半夏甘草、川芎甘草、甘草当归、甘草柴胡、人参白术、甘草芍药、桔梗甘草、总计 15 对,其中甘草出现的频次最高,总计有 12次;三味药对中频次10 总计有 20 对,其中甘草频次最高,总计 18 次;药对几乎都由甘草、人参、茯苓、白术构成,并都含有归入脾经的药材。针对配伍规律,可以从关联规则中得到以下 4组关联性且置信度95%的药组组合:苍术厚朴陈皮、莪术陈皮、黄芩芍药甘草、人参防风甘草。其中有 2 组药材组合置信度