-
题名面向文摘的中药方剂与疾病关系抽取
被引量:3
- 1
-
-
作者
杨晓欢
单娅辉
解丹
李晓东
-
机构
湖北中医药大学信息工程学院
湖北省中医院
-
出处
《世界科学技术-中医药现代化》
CSCD
2017年第7期1167-1172,共6页
-
基金
老年病中药新产品湖北省协同创新中心项目(No.201506):湖北省中医老年病数据资源管理平台构建研究
负责人:解丹
+1 种基金
国家中医药管理局中医临床研究基地业余建设科研专项课题(No.JDZX2012051):中医治疗慢性乙型肝炎真实世界效果比较研究
负责人:李晓东
-
文摘
目的:利用机器学习的方法,从文献摘要数据入手,研究中药方剂与疾病的相关性。方法:在中国知网的"文献分类目录"中选取"医药卫生科技"—"中医学"类别,使用网络爬虫技术获取摘要数据,经过数据清洗、构建词典、分词等预处理步骤,使用自然语言处理技术对处理后的文本数据进行特征提取,并构建支持向量机(Support Vector Machine,SVM)分类模型,对中药方剂与疾病进行关系抽取。结果:共爬取1073581篇摘要,根据中药方剂与疾病词典筛选出同时包含中药方剂与疾病的语句共204780句,利用句法解析抽取的特征构建SVM分类模型,准确率达87%,将该SVM模型应用于筛选后的句子,最终得到中药方剂与疾病之间的关系三元组。结论:利用机器学习方法对中国知网中医学摘要文本数据进行关系抽取,得到的中药方剂与疾病的关系三元组,将对中药方剂治疗疾病研究起积极推动作用。
-
关键词
中药方剂与疾病关系抽取
抽取数据
中医药数据抽取
网络爬虫技术
-
Keywords
Relation extraction of traditional Chinese medicine prescription and disease Relation extraction of traditional Chinese medicine prescription and disease, data extraction, traditional Chinese medicine data extraction, web crawler technology
-
分类号
R-33
[医药卫生]
-