-
题名面向文摘的中药方剂与疾病关系抽取
被引量:3
- 1
-
-
作者
杨晓欢
单娅辉
解丹
李晓东
-
机构
湖北中医药大学信息工程学院
湖北省中医院
-
出处
《世界科学技术-中医药现代化》
CSCD
2017年第7期1167-1172,共6页
-
基金
老年病中药新产品湖北省协同创新中心项目(No.201506):湖北省中医老年病数据资源管理平台构建研究
负责人:解丹
+1 种基金
国家中医药管理局中医临床研究基地业余建设科研专项课题(No.JDZX2012051):中医治疗慢性乙型肝炎真实世界效果比较研究
负责人:李晓东
-
文摘
目的:利用机器学习的方法,从文献摘要数据入手,研究中药方剂与疾病的相关性。方法:在中国知网的"文献分类目录"中选取"医药卫生科技"—"中医学"类别,使用网络爬虫技术获取摘要数据,经过数据清洗、构建词典、分词等预处理步骤,使用自然语言处理技术对处理后的文本数据进行特征提取,并构建支持向量机(Support Vector Machine,SVM)分类模型,对中药方剂与疾病进行关系抽取。结果:共爬取1073581篇摘要,根据中药方剂与疾病词典筛选出同时包含中药方剂与疾病的语句共204780句,利用句法解析抽取的特征构建SVM分类模型,准确率达87%,将该SVM模型应用于筛选后的句子,最终得到中药方剂与疾病之间的关系三元组。结论:利用机器学习方法对中国知网中医学摘要文本数据进行关系抽取,得到的中药方剂与疾病的关系三元组,将对中药方剂治疗疾病研究起积极推动作用。
-
关键词
中药方剂与疾病关系抽取
抽取数据
中医药数据抽取
网络爬虫技术
-
Keywords
Relation extraction of traditional Chinese medicine prescription and disease Relation extraction of traditional Chinese medicine prescription and disease, data extraction, traditional Chinese medicine data extraction, web crawler technology
-
分类号
R-33
[医药卫生]
-
-
题名一种标准的ETL的设计思想及其实现
被引量:14
- 2
-
-
作者
程跟上
郑洪源
丁秋林
-
机构
南京航空航天大学信息科学与技术学院
-
出处
《计算机应用研究》
CSCD
北大核心
2005年第3期101-103,共3页
-
文摘
元数据在数据仓库系统中占据着十分重要的地位,其中存放着许多重要的信息,尤其是对于数据仓库的ETL过程,可以说是ETL的指挥中心。提出了以CWM元数据模型标准为基础来开发标准的ETL的设计思想,并描述了具体的开发步骤。
-
关键词
ETL
CWM
抽取元数据
转换元数据
加载元数据
-
Keywords
ETL(Etract-Transform-Load)
CWM(Common Warehouse Metamodel)
Metadata about Extract
Metadata about Transformation
Metadata about Load
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于CWM的标准ETL的设计与实现
被引量:10
- 3
-
-
作者
郑洪源
周良
-
机构
南京航空航天大学信息科学与技术学院
-
出处
《吉林大学学报(信息科学版)》
CAS
2006年第1期50-55,共6页
-
基金
国家863高技术研究发展计划资助项目(865-511-810-041-03)
-
文摘
目前开发ETL(Etract Transform Load)系统过程中,最典型的问题就是元数据管理混乱,在分析ETL和元数据之间关系的基础上,提出了一种基于公共仓库模型开发的标准ETL系统设计思想,给出了该标准ETL系统的实现过程。将该方法应用于某医疗保险系统的ETL开发过程中,结果表明,与传统的ETL开发过程相比,该系统开发效率提高40%以上,系统具有良好的通用性和易集成性,解决了元数据管理混乱的问题。
-
关键词
数据抽取转换加载
公共仓库模型
抽取元数据
转换元数据
加载元数据
-
Keywords
etract transformmetadata aboutload (ETL)
common warehouse metamodel (CWM)
metadata about extract
transformation
metadata about load
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名大数据体压缩和存储算法在地震剖面中的应用
被引量:1
- 4
-
-
作者
王玉娟
许建国
-
机构
中国海洋大学
胜利油田物探研究院
-
出处
《胜利油田职工大学学报》
2008年第5期38-39,共2页
-
文摘
为了提高抽取地震剖面的速度,首先采用字节压缩,把任意的浮点数(IEEE和IBM格式)转换一字节的整数的方法对数据体进行压缩;然后,采用八叉树算法对数据体分块,在八叉树中递归查找需要显示数据文件,完成数据体的抽取显示。
-
关键词
八叉树
字节压缩
分块存储大连片数据体
抽取大剖面数据
-
分类号
P631.429
[天文地球—地质矿产勘探]
-