期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
面向文摘的中药方剂与疾病关系抽取 被引量:3
1
作者 杨晓欢 单娅辉 +1 位作者 解丹 李晓东 《世界科学技术-中医药现代化》 CSCD 2017年第7期1167-1172,共6页
目的:利用机器学习的方法,从文献摘要数据入手,研究中药方剂与疾病的相关性。方法:在中国知网的"文献分类目录"中选取"医药卫生科技"—"中医学"类别,使用网络爬虫技术获取摘要数据,经过数据清洗、构建词... 目的:利用机器学习的方法,从文献摘要数据入手,研究中药方剂与疾病的相关性。方法:在中国知网的"文献分类目录"中选取"医药卫生科技"—"中医学"类别,使用网络爬虫技术获取摘要数据,经过数据清洗、构建词典、分词等预处理步骤,使用自然语言处理技术对处理后的文本数据进行特征提取,并构建支持向量机(Support Vector Machine,SVM)分类模型,对中药方剂与疾病进行关系抽取。结果:共爬取1073581篇摘要,根据中药方剂与疾病词典筛选出同时包含中药方剂与疾病的语句共204780句,利用句法解析抽取的特征构建SVM分类模型,准确率达87%,将该SVM模型应用于筛选后的句子,最终得到中药方剂与疾病之间的关系三元组。结论:利用机器学习方法对中国知网中医学摘要文本数据进行关系抽取,得到的中药方剂与疾病的关系三元组,将对中药方剂治疗疾病研究起积极推动作用。 展开更多
关键词 中药方剂与疾病关系抽取 抽取数据 中医药数据抽取 网络爬虫技术
下载PDF
一种标准的ETL的设计思想及其实现 被引量:14
2
作者 程跟上 郑洪源 丁秋林 《计算机应用研究》 CSCD 北大核心 2005年第3期101-103,共3页
元数据在数据仓库系统中占据着十分重要的地位,其中存放着许多重要的信息,尤其是对于数据仓库的ETL过程,可以说是ETL的指挥中心。提出了以CWM元数据模型标准为基础来开发标准的ETL的设计思想,并描述了具体的开发步骤。
关键词 ETL CWM 抽取数据 转换元数据 加载元数据
下载PDF
基于CWM的标准ETL的设计与实现 被引量:10
3
作者 郑洪源 周良 《吉林大学学报(信息科学版)》 CAS 2006年第1期50-55,共6页
目前开发ETL(Etract Transform Load)系统过程中,最典型的问题就是元数据管理混乱,在分析ETL和元数据之间关系的基础上,提出了一种基于公共仓库模型开发的标准ETL系统设计思想,给出了该标准ETL系统的实现过程。将该方法应用于某医疗保... 目前开发ETL(Etract Transform Load)系统过程中,最典型的问题就是元数据管理混乱,在分析ETL和元数据之间关系的基础上,提出了一种基于公共仓库模型开发的标准ETL系统设计思想,给出了该标准ETL系统的实现过程。将该方法应用于某医疗保险系统的ETL开发过程中,结果表明,与传统的ETL开发过程相比,该系统开发效率提高40%以上,系统具有良好的通用性和易集成性,解决了元数据管理混乱的问题。 展开更多
关键词 数据抽取转换加载 公共仓库模型 抽取数据 转换元数据 加载元数据
下载PDF
大数据体压缩和存储算法在地震剖面中的应用 被引量:1
4
作者 王玉娟 许建国 《胜利油田职工大学学报》 2008年第5期38-39,共2页
为了提高抽取地震剖面的速度,首先采用字节压缩,把任意的浮点数(IEEE和IBM格式)转换一字节的整数的方法对数据体进行压缩;然后,采用八叉树算法对数据体分块,在八叉树中递归查找需要显示数据文件,完成数据体的抽取显示。
关键词 八叉树 字节压缩 分块存储大连片数据 抽取大剖面数据
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部