期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
不确定数据的重复记录检测
1
作者
邓
慧
挺
毛宇光
《计算机技术与发展》
2012年第8期60-62,66,共4页
随着不确定数据成为研究的热点,不确定数据管理吸引了研究者的极大兴趣。目前业界已经使用概率数据库来存储和管理不确定数据。为合并多个自治概率数据库中的数据,需要对不确定数据进行集成。现有对数据集成的研究主要集中于对确定数据...
随着不确定数据成为研究的热点,不确定数据管理吸引了研究者的极大兴趣。目前业界已经使用概率数据库来存储和管理不确定数据。为合并多个自治概率数据库中的数据,需要对不确定数据进行集成。现有对数据集成的研究主要集中于对确定数据(关系型数据和半结构化数据)的研究,对不确定性数据的集成没有相关工作。重复记录检测是集成过程中必要和具有代表性的组成部分,文中讨论了重复检测的基础,研究了有依赖和无依赖的不确定数据重复检测,最后提出了两个不确定数据重复记录检测的模型。
展开更多
关键词
不确定数据
重复记录
数据整合
比较向量
决策模型
下载PDF
职称材料
题名
不确定数据的重复记录检测
1
作者
邓
慧
挺
毛宇光
机构
南京航空航天大学计算机科学与技术学院
出处
《计算机技术与发展》
2012年第8期60-62,66,共4页
基金
国家自然科学基金(60873025)
文摘
随着不确定数据成为研究的热点,不确定数据管理吸引了研究者的极大兴趣。目前业界已经使用概率数据库来存储和管理不确定数据。为合并多个自治概率数据库中的数据,需要对不确定数据进行集成。现有对数据集成的研究主要集中于对确定数据(关系型数据和半结构化数据)的研究,对不确定性数据的集成没有相关工作。重复记录检测是集成过程中必要和具有代表性的组成部分,文中讨论了重复检测的基础,研究了有依赖和无依赖的不确定数据重复检测,最后提出了两个不确定数据重复记录检测的模型。
关键词
不确定数据
重复记录
数据整合
比较向量
决策模型
Keywords
uncertain data
duplicate record
data integration
comparison vector
decision model
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
不确定数据的重复记录检测
邓
慧
挺
毛宇光
《计算机技术与发展》
2012
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部