-
题名基于支持向量域描述的图像集匹配
被引量:5
- 1
-
-
作者
曾青松
-
机构
广州番禺职业技术学院信息工程学院
-
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2014年第8期735-740,共6页
-
基金
广东省高职教育信息技术类专业教学指导委员会2013年度项目(No.XXJS-2013-1025)
第二批广州市教育局创新团队专项项目(No.13C18)资助
-
文摘
提出一种基于支持向量域描述的图像集匹配方法.该方法首先通过支持向量机学习,将每个图像集合映射到高维特征空间,使用支持向量域对图像集合建模,建立的模型使用一个包含大部分样本的最小闭球表示.然后引入基于支持向量域之间距离的相似性度量,将集合的匹配转换为成对的支持向量域之间的距离计算.最后在基于集合的人脸和对象识别任务中分别进行测试,文中方法的识别率在ETH80、HondaUCSD和YouTube数据库上分别达到96.37%、100%和95.32%,优于其他方法.
-
关键词
支持向量域描述
图像集匹配
集合相似性
对象匹配
-
Keywords
Support Vector Domain Description Image Set Matching Set Similarity Object Matching
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名具有重叠集合约束的实体解析问题研究
- 2
-
-
作者
樊沁怿
李贵
李征宇
-
机构
沈阳建筑大学
-
出处
《数据挖掘》
2023年第2期107-116,共10页
-
文摘
本文研究了具有重叠集合约束的实体解析集合相似性连接问题。给定两个集合内元素为集合的集合以及一个常数c,找到数据集当中至少共享了c个共同元素的所有集合对。这一问题是许多领域诸如信息检索、数据挖掘和实体解析当中的基本操作。现有的方法都受到了O(n2)的限制,其中n是数据集总的大小。本文提出了一种算法复杂度为 的集合大小感知算法。集合大小感知算法根据集合大小将所有集合分为大集合与小集合并分别进行处理。本文通过现有的方法来处理大集合,对于小集合本文提出了集中启发式算法来提高算法性能。由于大集合与小集合的大小边界对于效率至关重要,本文还提出了一种有效的大小边界的选择方法来选择合适的大小边界。本文通过在真实数据集上的实验结果证明了该方法的有效性。
-
关键词
集合相似性
数据挖掘
信息检索
实体解析
算法复杂度
数据集
启发式算法
基本操作
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-
-
题名两阶段孤立点挖掘算法在保险欺诈中的应用
被引量:1
- 3
-
-
作者
陈亮
-
机构
泰山职业技术学院信息工程系
-
出处
《长春工业大学学报》
CAS
2012年第1期49-52,共4页
-
文摘
为了识别保险业中欺诈行为,推导出了基于粗糙集的模糊集合相似性度量公式。通过改进向量相似性判断最大相异系数,提出基于聚类算法的两阶段孤立点挖掘算法,提高了算法的实时性。小范围试验结果验证了算法的有效性。
-
关键词
集合相似性
向量相似性
聚类
孤立点
保险欺诈
-
Keywords
set similarity
vector similarity
clustering
lsolated-point
insurance-fraud.
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名相似性判别原理在影像变化检测中的应用
被引量:1
- 4
-
-
作者
杨书娟
邵永社
-
机构
同济大学测量与国土信息工程系
中国科学院光电研究院
-
出处
《北京测绘》
2012年第5期17-21,共5页
-
基金
国家重点基础研究发展规划973项目资助
编号2012CB719903
-
文摘
针对传统基于Bayes影像变化监测方法中分类的硬划分及对辐射畸变敏感的问题,首先,采用集合相似性测度动态更新变化和未变化两类像元模糊子集,解决变化检测分类过程中硬划分的问题;然后,采用像元相似性测度来判断变化类像元集合和未变化类像元集合中的每个像元是否真正发生了变化,剔除伪变化像元,克服对影像线性辐射畸变敏感的问题,并检测出漏检像元,最终实现影像变化区域的提取。实验结果表明,基于相似性测度的影像变化检测方法可实现变化区域自动化提取,具有较好的应用价值。
-
关键词
集合相似性
像元相似性
变化检测
-
Keywords
set similarity
pixel similarity
change detection
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于局部敏感哈希及模糊连接的实体解析算法
- 5
-
-
作者
樊沁怿
李贵
李征宇
-
机构
沈阳建筑大学
-
出处
《数据挖掘》
2022年第3期280-296,共17页
-
文摘
随着互联网技术的发展和应用,Web数据量越来越大,在Web数据集成中,实体解析作为其中的重要环节,其主要任务是将不同Web数据源中指向现实世界同一实体的记录识别出来。然而这些数据往往都来自于不同的数据源,存在着数据重复等问题。为了解决特定领域的实体解析问题通常采用自定义模糊连接的方式来解决。但是目前较为先进的模糊连接技术诸如前缀过滤技术等均不支持转换规则的定制,并且表现出较差的性能和可扩展性。为了解决特定领域的数据重复问题,提升实体解析算法的可扩展性,本文引入了一种基于自定义转换规则的模糊连接技术来提升算法的可扩展性;采用基于局部敏感哈希映射的签名方案来获得签名,与前缀过滤相比,通过局部敏感哈希映射产生的签名更具有代表性,能够对局部敏感哈希映射中高频出现的签名进行剪枝来显著地减少需要匹配的次数;最后通过集合相似性来判断是否为重复实体,并利用实际地产领域数据集验证了算法的有效性。
-
关键词
模糊连接
实体解析
集合相似性
局部敏感哈希
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
TP181
[自动化与计算机技术—计算机科学与技术]
-
-
题名基于数据摘要奇偶性的集合相似性近似算法
- 6
-
-
作者
贾建伟
陈崚
-
机构
扬州大学信息工程学院
-
出处
《计算机科学》
CSCD
北大核心
2016年第6期254-256,311,共4页
-
基金
国家自然科学基金面上项目(61070240)资助
-
文摘
在应用b位哈希函数近似计算两个集合的Jaccard相似性时,如果有多个元素与输入元素的Jaccard相似性都很高(接近于1),那么b位哈希函数不能对这些元素进行很好的区分。为了提高数据摘要函数的准确性并提高基于相似性的应用的性能,提出了一种基于数据摘要奇偶性的集合相似性近似算法。在应用minwise哈希函数得到两个变异集合后,用两个n位指示向量来表示变异集合中的元素在指示向量中出现的奇偶性,并基于这两个奇偶性向量来估计原集合间的Jaccard相似性。通过马尔科夫链和泊松分布两种模型对奇偶性数据摘要进行了推导,并证明了这两种方法的等价性。Enron数据集上的实验表明,提出的奇偶性数据摘要算法与传统的b位哈希函数相比具有更高的准确性,并且在重复文档检测和关联规则挖掘两种应用中具有更高的性能。
-
关键词
数据摘要
集合相似性
奇偶性
近似算法
-
Keywords
Data sketch, Set similarity, Parity, Approximation algorithm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名保护隐私的集合相似性度量协同计算协议
被引量:1
- 7
-
-
作者
逯绍锋
胡玉龙
逯跃锋
-
机构
东北大学计算机科学与工程学院
中国交通通信信息中心
山东理工大学建筑工程学院
中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室
-
出处
《计算机技术与发展》
2023年第1期137-143,共7页
-
基金
国家重点研发计划项目(2018YFC1506506)
国家高分辨率对地观测系统重大专项(GFZX0404130304)
山东省科技型中小企业创新能力提升工程项目(2021TSGC1056)。
-
文摘
集合相似性度量是机器学习领域的基本问题之一,研究如何在保护数据隐私的前提下计算两个集合间的相似性问题,在保护数据隐私的机器学习、图形识别、生物信息学等方面有着重要的理论意义与应用价值。在机器学习中估算不同样本集合之间的相似性时,通常通过计算集合相似度来对样本之间的相似程度进行估算,这一类集合之间的相似度统称为集合距离。其中,最常用到的集合距离就是杰卡德距离。文中从集合间杰卡德距离入手,首先通过设计一种新的编码方法,对参与计算的数据进行位置数字编码,将相似性度量问题转化为求两集合间相同数字个数问题,进而结合异或思想,借助同态加密体制具体设计了可以保护隐私的集合杰卡德距离协同计算协议,从而解决了集合间相似性度量的隐私保护问题。模拟器证明该协议是安全的,结果分析表明协议可以高效安全地判定出两对象间集合数据的相似性,在保护隐私的集合相似性度量方面,该方法具备一定的普适性。
-
关键词
隐私保护
安全多方计算
杰卡德距离
集合相似性度量
机器学习
-
Keywords
privacy-preserving
security multi-party computation
Jaccard distance
set similarity measurement
machine learning
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-
-
题名基于聚类和SVD算法的解释性模糊建模方法
- 8
-
-
作者
张永
邢宗义
项峥嵘
胡维礼
-
机构
南京理工大学自动化系
-
出处
《计算机工程与应用》
CSCD
北大核心
2006年第10期58-61,76,共5页
-
文摘
提出了一种基于减法聚类算法构造解释性模糊模型的方法。首先指出模糊模型解释性的重要地位,分析影响解释性的主要因素;然后利用减法聚类算法辨识初始模糊模型,SVD算法和集合非冗余度约简初始模糊模型,从而提高其解释性;最后采用约束优化算法整体优化模型,提高其精度。PH值中和过程的模糊建模验证了该方法的有效性。
-
关键词
模糊建模
解释性
减法聚类
奇异值分解
集合相似性测度
-
Keywords
fuzzy modeling,interpretability, subtraction clustering, singular value decomposition (SVD), similarity measure of fuzzy sets
-
分类号
TP273
[自动化与计算机技术—检测技术与自动化装置]
-