期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
6
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于二次模糊评判的相似重复记录检测方法
被引量:
3
1
作者
黄建琼
《江苏师范大学学报(自然科学版)》
CAS
2016年第1期39-42,共4页
数据库集成时会产生大量的相似、重复记录,字段匹配算法是对其进行检测并清洗的主要方法之一.针对等级法确定属性权值主观性过强的问题,提出改进的基于二次模糊评判的检测方法.根据等级法对属性进行第一次评判,剔除等级低的部分非重要属...
数据库集成时会产生大量的相似、重复记录,字段匹配算法是对其进行检测并清洗的主要方法之一.针对等级法确定属性权值主观性过强的问题,提出改进的基于二次模糊评判的检测方法.根据等级法对属性进行第一次评判,剔除等级低的部分非重要属性;对剩余属性进行二次模糊评判,平均属性等级评判的结果,确定属性权值,然后对数据集进行分组,并在各个数据集中检测相似重复记录.理论分析和实验结果表明,该方法不仅提高了运行效率,而且可以进一步提高查重的查准率和查全率.
展开更多
关键词
相似重复记录
属性
等级
权值
检测
模糊评判
下载PDF
职称材料
基于K-modes聚类分组的大数据相似重复记录检测研究
被引量:
1
2
作者
张平
余顺
《安徽职业技术学院学报》
2022年第1期24-29,共6页
相似重复记录检测是数据清洗的重要环节,大数据环境下对相似重复记录检测方法的效率和精度提出了更高的要求。文章针对大数据环境下对相似重复记录检测提出了一种聚类分组检测的KCG算法。该方法首先采用改进的K-modes聚类对大数据进行...
相似重复记录检测是数据清洗的重要环节,大数据环境下对相似重复记录检测方法的效率和精度提出了更高的要求。文章针对大数据环境下对相似重复记录检测提出了一种聚类分组检测的KCG算法。该方法首先采用改进的K-modes聚类对大数据进行有效的分组,然后在各分组中采用Pair-wise比较算法检测出所有相似重复记录检测。实验分析结果表明,该方法对大数据环境下的相似重复记录检测的效率和精度有明显提高。
展开更多
关键词
相似重复记录检测
网格密度
Pair-wise
KCG
下载PDF
职称材料
基于遗传神经网络的相似重复记录检测方法
被引量:
13
3
作者
孟祥逢
鲁汉榕
郭玲
《计算机工程与设计》
CSCD
北大核心
2010年第7期1550-1553,共4页
为了有效解决数据清洗领域中相似重复记录的检测问题,提出了一种基于遗传神经网络的相似重复记录检测方法。该方法计算两条记录对应字段间的相似度,构建基于神经网络的检测模型,利用遗传算法对网络模型的权值进行优化,使用遗传神经网络...
为了有效解决数据清洗领域中相似重复记录的检测问题,提出了一种基于遗传神经网络的相似重复记录检测方法。该方法计算两条记录对应字段间的相似度,构建基于神经网络的检测模型,利用遗传算法对网络模型的权值进行优化,使用遗传神经网络组合多个字段上的相似度来检测相似重复记录。在不同领域数据集上的测试结果表明,该方法能够提高相似重复记录检测的准确率和检测精度。
展开更多
关键词
相似重复记录检测
神经网络
遗传算法
数据清洗
数据集成
下载PDF
职称材料
基于优先队列的增量式重复记录识别
被引量:
7
4
作者
佘春红
《计算机应用》
CSCD
北大核心
2003年第9期61-63,共3页
介绍了优先队列方法(PriorityQueueStrategy,PQS),并以此为基础,研究了在数据模式与匹配模型不变的前提下,数据源动态增加时近似重复记录识别问题,提出了一种增量式算法IPQS(IncrementalPQS),最后给出了实验结果。
关键词
数据清理
近似重复记录
增量式识别
特征记录
下载PDF
职称材料
基于QPSO-LSSVM的数据库相似重复记录检测算法
被引量:
6
5
作者
梁雪
任剑锋
景丽
《计算机科学》
CSCD
北大核心
2012年第11期157-159,190,共4页
针对大规模数据库的相似重复记录的检测问题,提出了一种量子群优化算法(QPSO)与最小二乘支持向量机(LSSVM)相结合的相似重复记录检测方法(QPSO-LSSVM)。首先计算记录字段的相似度值;然后利用QPSO对LSSVM参数进行优化,构建相似重复记录...
针对大规模数据库的相似重复记录的检测问题,提出了一种量子群优化算法(QPSO)与最小二乘支持向量机(LSSVM)相结合的相似重复记录检测方法(QPSO-LSSVM)。首先计算记录字段的相似度值;然后利用QPSO对LSSVM参数进行优化,构建相似重复记录检测模型;最后通过具体数据集进行仿真测试实验。仿真结果表明,QPSO-LSSVM不仅提高了重复记录检测准确率,而且提高了检测效率,是一种有效的相似重复记录检测算法。
展开更多
关键词
量子粒子群优化算法
最小二乘支持向量机
相似重复记录
检测
下载PDF
职称材料
基于CNN的安防数据相似重复记录检测模型
6
作者
王巍
刘阳
+1 位作者
洪惠君
梁雅静
《计算机应用与软件》
北大核心
2023年第2期17-25,共9页
安防行业的结构化数据中存在大量的相似重复记录,传统的相似重复记录检测算法的识别率很难满足安防行业的实际需求。针对这种情况,引入了卷积神经网络模型,设计两种以LeNet-5模型为基础的改进模型,一种是输入为词向量矩阵的模型,另一种...
安防行业的结构化数据中存在大量的相似重复记录,传统的相似重复记录检测算法的识别率很难满足安防行业的实际需求。针对这种情况,引入了卷积神经网络模型,设计两种以LeNet-5模型为基础的改进模型,一种是输入为词向量矩阵的模型,另一种是输入为相似度矩阵的模型。实验表明,输入为词向量矩阵的模型的精确率和召回率均达到了96%以上,输入为相似度矩阵的模型的精确率和召回率高达98%,并且K折交叉验证的结果说明模型具有较强的泛化能力。
展开更多
关键词
安防行业
数据清洗
相似重复记录检测
CNN
LeNet-5
下载PDF
职称材料
题名
基于二次模糊评判的相似重复记录检测方法
被引量:
3
1
作者
黄建琼
机构
福州外语外贸学院信息系
出处
《江苏师范大学学报(自然科学版)》
CAS
2016年第1期39-42,共4页
基金
福建省教育厅科技项目(JB14129)
文摘
数据库集成时会产生大量的相似、重复记录,字段匹配算法是对其进行检测并清洗的主要方法之一.针对等级法确定属性权值主观性过强的问题,提出改进的基于二次模糊评判的检测方法.根据等级法对属性进行第一次评判,剔除等级低的部分非重要属性;对剩余属性进行二次模糊评判,平均属性等级评判的结果,确定属性权值,然后对数据集进行分组,并在各个数据集中检测相似重复记录.理论分析和实验结果表明,该方法不仅提高了运行效率,而且可以进一步提高查重的查准率和查全率.
关键词
相似重复记录
属性
等级
权值
检测
模糊评判
Keywords
approximately
duplicated
record
attribute
grade
weight
detection
fuzzy
evaluation
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于K-modes聚类分组的大数据相似重复记录检测研究
被引量:
1
2
作者
张平
余顺
机构
安徽职业技术学院信息工程学院
出处
《安徽职业技术学院学报》
2022年第1期24-29,共6页
基金
2018年安徽省自然科学研究项目重点项目“Web大数据环境下相似重复数据清洗的研究”(项目编号KJ2018A0710)。
文摘
相似重复记录检测是数据清洗的重要环节,大数据环境下对相似重复记录检测方法的效率和精度提出了更高的要求。文章针对大数据环境下对相似重复记录检测提出了一种聚类分组检测的KCG算法。该方法首先采用改进的K-modes聚类对大数据进行有效的分组,然后在各分组中采用Pair-wise比较算法检测出所有相似重复记录检测。实验分析结果表明,该方法对大数据环境下的相似重复记录检测的效率和精度有明显提高。
关键词
相似重复记录检测
网格密度
Pair-wise
KCG
Keywords
approximately
duplicated
record
detection
grid
density
Pair-wise
KCG
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于遗传神经网络的相似重复记录检测方法
被引量:
13
3
作者
孟祥逢
鲁汉榕
郭玲
机构
空军雷达学院研究生管理大队
空军雷达学院信息与指挥自动化系
出处
《计算机工程与设计》
CSCD
北大核心
2010年第7期1550-1553,共4页
基金
国家863高技术研究发展计划基金项目(2009AAJ127)
文摘
为了有效解决数据清洗领域中相似重复记录的检测问题,提出了一种基于遗传神经网络的相似重复记录检测方法。该方法计算两条记录对应字段间的相似度,构建基于神经网络的检测模型,利用遗传算法对网络模型的权值进行优化,使用遗传神经网络组合多个字段上的相似度来检测相似重复记录。在不同领域数据集上的测试结果表明,该方法能够提高相似重复记录检测的准确率和检测精度。
关键词
相似重复记录检测
神经网络
遗传算法
数据清洗
数据集成
Keywords
approximately
duplic
ate
record
detection
neural
network
genetic
algorithm
data
cleaning
data
integration
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于优先队列的增量式重复记录识别
被引量:
7
4
作者
佘春红
机构
荆州师范学院信息科学学院
出处
《计算机应用》
CSCD
北大核心
2003年第9期61-63,共3页
文摘
介绍了优先队列方法(PriorityQueueStrategy,PQS),并以此为基础,研究了在数据模式与匹配模型不变的前提下,数据源动态增加时近似重复记录识别问题,提出了一种增量式算法IPQS(IncrementalPQS),最后给出了实验结果。
关键词
数据清理
近似重复记录
增量式识别
特征记录
Keywords
data
cleaning
approximately
duplic
ate
record
incremental
detection
representative
record
分类号
TP311.131 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于QPSO-LSSVM的数据库相似重复记录检测算法
被引量:
6
5
作者
梁雪
任剑锋
景丽
机构
河南财经政法大学计算机与信息工程学院
出处
《计算机科学》
CSCD
北大核心
2012年第11期157-159,190,共4页
基金
河南省科学技术厅科技攻关科学项目(112102210199)
河南省科学技术厅基础与前言研究项目(112300410201)资助
文摘
针对大规模数据库的相似重复记录的检测问题,提出了一种量子群优化算法(QPSO)与最小二乘支持向量机(LSSVM)相结合的相似重复记录检测方法(QPSO-LSSVM)。首先计算记录字段的相似度值;然后利用QPSO对LSSVM参数进行优化,构建相似重复记录检测模型;最后通过具体数据集进行仿真测试实验。仿真结果表明,QPSO-LSSVM不仅提高了重复记录检测准确率,而且提高了检测效率,是一种有效的相似重复记录检测算法。
关键词
量子粒子群优化算法
最小二乘支持向量机
相似重复记录
检测
Keywords
Quantum
particle
swarm
optimization
Least
square
support
vector
machines
approximately
duplic
ate
record
detection
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于CNN的安防数据相似重复记录检测模型
6
作者
王巍
刘阳
洪惠君
梁雅静
机构
河北工程大学信息与电气工程学院
河北省安防信息感知与处理重点实验室
江南大学物联网工程学院
出处
《计算机应用与软件》
北大核心
2023年第2期17-25,共9页
基金
国家自然科学基金项目(61802107)
教育部-中国移动科研基金项目(MCM20170204)
江苏省博士后科研资助计划项目(1601085C)。
文摘
安防行业的结构化数据中存在大量的相似重复记录,传统的相似重复记录检测算法的识别率很难满足安防行业的实际需求。针对这种情况,引入了卷积神经网络模型,设计两种以LeNet-5模型为基础的改进模型,一种是输入为词向量矩阵的模型,另一种是输入为相似度矩阵的模型。实验表明,输入为词向量矩阵的模型的精确率和召回率均达到了96%以上,输入为相似度矩阵的模型的精确率和召回率高达98%,并且K折交叉验证的结果说明模型具有较强的泛化能力。
关键词
安防行业
数据清洗
相似重复记录检测
CNN
LeNet-5
Keywords
Security
industry
Data
cleaning
approximately
duplic
ate
record
detection
CNN
LeNet-5
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于二次模糊评判的相似重复记录检测方法
黄建琼
《江苏师范大学学报(自然科学版)》
CAS
2016
3
下载PDF
职称材料
2
基于K-modes聚类分组的大数据相似重复记录检测研究
张平
余顺
《安徽职业技术学院学报》
2022
1
下载PDF
职称材料
3
基于遗传神经网络的相似重复记录检测方法
孟祥逢
鲁汉榕
郭玲
《计算机工程与设计》
CSCD
北大核心
2010
13
下载PDF
职称材料
4
基于优先队列的增量式重复记录识别
佘春红
《计算机应用》
CSCD
北大核心
2003
7
下载PDF
职称材料
5
基于QPSO-LSSVM的数据库相似重复记录检测算法
梁雪
任剑锋
景丽
《计算机科学》
CSCD
北大核心
2012
6
下载PDF
职称材料
6
基于CNN的安防数据相似重复记录检测模型
王巍
刘阳
洪惠君
梁雅静
《计算机应用与软件》
北大核心
2023
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部