-
题名医疗体检数据预处理方法研究
被引量:7
- 1
-
-
作者
林予松
王培培
刘炜
李润知
王宗敏
-
机构
郑州大学互联网医疗与健康服务河南省协同创新中心
郑州大学软件与应用科技学院
郑州大学信息工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2017年第4期1089-1092,共4页
-
基金
河南省重点科技攻关项目(152102210249)
-
文摘
原始体检数据存在信息模糊、有噪声、不完整和冗余的问题,无法直接用于疾病的风险评估与预测。由于体检数据在结构和格式等方面的不足,不适合采用传统的数据预处理方法。为了充分挖掘体检数据中有价值的信息,从多角度提出了针对体检数据的预处理方法:通过基于压缩方法的数据归约,降低了体检数据预处理的时间及空间复杂度;通过基于分词和权值的字段匹配算法,完成了体检数据的清洗,解决了体检数据不一致的问题;通过基于线性函数的数据变换,实现了历年体检数据的一致性和连续性。实验结果表明,基于分词和权值的字段匹配算法,相对于传统算法具有更高的准确性。
-
关键词
体检数据
预处理
字段匹配算法
数据归约
数据清洗
数据变换
-
Keywords
physical examination data
data preprocessing
field matching algorithm
data reduction'
data cleaning
data transformation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于遗传神经网络的相似重复记录检测方法研究
被引量:1
- 2
-
-
作者
肖蕾
郭乐江
胡亚慧
程敏
-
机构
空军雷达学院
-
出处
《舰船电子工程》
2011年第2期168-170,176,共4页
-
文摘
设计实现了一个相似重复记录检测系统,该系统包括预处理模块、聚类模块、字段匹配模块和记录匹配模块,支持聚类算法和字段匹配算法的定制扩充。并通过实验对比了几种著名的算法,实验结果表明该系统提高了相似重复记录检测的精确度。
-
关键词
遗传神经网络
相似重复记录检测系统
聚类算法
字段匹配算法
-
Keywords
genetic neural network, approximately duplicates detecting system, clustering algorithm, field matching algorithm
-
分类号
TN958
[电子电信—信号与信息处理]
-
-
题名基于数据清理技术的税务征收管理系统
- 3
-
-
作者
吴涤单
-
机构
南京信息职业技术学院
-
出处
《电脑知识与技术》
2013年第10X期6824-6826,共3页
-
文摘
随着税务管理信息化的不断拓展与深入,税收数据的积累日益丰富。零散、不直观的数据无法为管理层的统计分析业务提供有效的决策依据。为了解决大型税务数据库信息检索困难、查询效率低的问题,提出了一种基于数据清理技术的数据库优化查询方案。
-
关键词
数据清理
字段匹配算法
税务征收
-
Keywords
data cleaning
field matching algorithms
tax collection
-
分类号
TP315
[自动化与计算机技术—计算机软件与理论]
-