期刊文献+
共找到124篇文章
< 1 2 7 >
每页显示 20 50 100
一种文本文档相似性计算的方法 被引量:2
1
作者 黄淑芹 徐勇 常郝 《吉林师范大学学报(自然科学版)》 2014年第4期130-132,共3页
首先对当前文本文档相似度计算方法的优缺点及适用范围进行了分析.由于越长的词语表达的意思一般越完整,基于这一思想,对不同长度的词语赋予不同的权值,把长度为n的公共序列引入到相似度的计算中,构造了一文本相似度计算公式,对其中相... 首先对当前文本文档相似度计算方法的优缺点及适用范围进行了分析.由于越长的词语表达的意思一般越完整,基于这一思想,对不同长度的词语赋予不同的权值,把长度为n的公共序列引入到相似度的计算中,构造了一文本相似度计算公式,对其中相似度计算公式的合理性给予了理论证明.最后,通过实验证明该方法是有效的. 展开更多
关键词 文本文档 公共序列 相似度 字符串匹配
下载PDF
基于大货车GPS数据的轨迹相似性度量有效性研究 被引量:15
2
作者 李颖 赵莉 +1 位作者 赵祥模 陈珂 《中国公路学报》 EI CAS CSCD 北大核心 2020年第2期146-157,共12页
目前,中国货车上全球定位系统(GPS)的强制安装,使得利用包含时间、空间和速度等信息的货车轨迹数据来研究货车运行模式成为可能。基于距离的轨迹相似性度量算法,采用全国道路货运车辆公共监管与服务平台获取的货车GPS轨迹数据,对比分析... 目前,中国货车上全球定位系统(GPS)的强制安装,使得利用包含时间、空间和速度等信息的货车轨迹数据来研究货车运行模式成为可能。基于距离的轨迹相似性度量算法,采用全国道路货运车辆公共监管与服务平台获取的货车GPS轨迹数据,对比分析其在货车轨迹模式识别中的应用。选用文献中最常用的4种基于距离的轨迹相似性度量算法,分别为离散弗雷歇距离(DFD)、动态时间规整(DTW)、最长公共序列(LCS)和实序列编辑距离(EDR)。试验结果表明:当使用二维地理空间轨迹数据(即经度和纬度)时,4种基于距离的轨迹相似性度量算法都能很好地对相似轨迹进行分类(正确率均高于85%),这与现有文献的结论一致。虽然一般认为二维轨迹相似性算法可以直接应用到多维轨迹数据,但是解决具体问题时可能出现的误差以及各种轨迹相似性算法的适用性仍然不确定。目前几乎没有文献对三维及其以上的多维轨迹数据进行实例分析研究,因而,通过相同路线上的三维GPS货车轨迹数据(包括经度,纬度和速度)对4种基于距离的轨迹相似性度量算法进行验证。将第3维速度加入到二维空间轨迹上后发现LCS算法对基于地理空间轨迹的速度模式分类效果优于其他3种基于距离的轨迹相似性度量算法。这说明运用LCS轨迹相似性度量算法来识别基于三维GPS轨迹的货车运行模式是可行的,LCS算法在货车运营管理等方面将有很大的应用潜力。 展开更多
关键词 交通工程 货运 轨迹相似性度量 大货车GPS数据 轨迹分类 离散弗雷歇距离 动态时间规整 最长公共序列
原文传递
电子扫描雷达信号主干工作模式的提取 被引量:7
3
作者 关欣 张玉虎 凌寒羽 《电光与控制》 北大核心 2018年第11期84-88,共5页
为了实现对电子扫描雷达工作状态的识别,分析了电子扫描雷达的工作过程和状态转换,通过得分矩阵动态地对两个截获信号状态转换序列进行公共序列的提取,识别电子扫描雷达的主干工作模式脉冲序列。仿真试验证明截获序列的长度对序列相似... 为了实现对电子扫描雷达工作状态的识别,分析了电子扫描雷达的工作过程和状态转换,通过得分矩阵动态地对两个截获信号状态转换序列进行公共序列的提取,识别电子扫描雷达的主干工作模式脉冲序列。仿真试验证明截获序列的长度对序列相似度影响不大,而电子扫描雷达的跟踪模式类型的增多和跟踪模式比例的减小能够提高对电子扫描雷达工作模式的识别效果。 展开更多
关键词 电子扫描雷达 工作状态识别 公共序列提取
下载PDF
基于最长公共子序列的人体运动序列检索 被引量:2
4
作者 冯林 李璞 +1 位作者 孙焘 郑虎 《系统仿真学报》 CAS CSCD 北大核心 2009年第22期7164-7167,共4页
在计算机仿真领域,运用重新组合等相关技术,可以对已经捕捉的人体运动数据实现重用,以较低的成本产生新的运动。但是,由于运动库的数据庞大,对其实施有效检索成为一个重要问题。以倒排表数据结构为基础,设计出一套针对人体运动的检索算... 在计算机仿真领域,运用重新组合等相关技术,可以对已经捕捉的人体运动数据实现重用,以较低的成本产生新的运动。但是,由于运动库的数据庞大,对其实施有效检索成为一个重要问题。以倒排表数据结构为基础,设计出一套针对人体运动的检索算法。不同于传统的最长公共子序列(Longest Common Subsequence,LCSS)的度量算法,提出了一种限制最小匹配率ρmin的有限最长公共子序列(Limited-LCSS)算法,并在此基础上针对倒排表的数据结构特点对算法进行了优化,显著的提高了算法的效率。实验表明提出的检索方法具有较好的速度和准确性。 展开更多
关键词 运动捕捉 检索 最长公共序列 倒排表
下载PDF
Needleman-Wunsch算法的改进 被引量:2
5
作者 张玉虎 周正 《火力与指挥控制》 CSCD 北大核心 2019年第5期107-111,共5页
为了实现双序列的全局快速比对,分析了Needleman-Wunsch算法的运算思路,并提出了一种改进的Needleman-Wunsch算法。改进算法通过在计算过程中不断截短比对序列的长度,减少无用数据的计算,提高了运算的效率。通过以相控阵雷达辐射源的搜... 为了实现双序列的全局快速比对,分析了Needleman-Wunsch算法的运算思路,并提出了一种改进的Needleman-Wunsch算法。改进算法通过在计算过程中不断截短比对序列的长度,减少无用数据的计算,提高了运算的效率。通过以相控阵雷达辐射源的搜索模式序列识别为例进行仿真试验,仿真实验证明改进算法与Needle-man-Wunsch算法相比,具有效率高、运行时间短的优势。 展开更多
关键词 Needleman-Wunsch算法 截短序列 公共序列提取 相控阵雷达
下载PDF
结合Hausdorff距离和最长公共子序列的轨迹分类 被引量:26
6
作者 魏龙翔 何小海 +1 位作者 滕奇志 高明亮 《电子与信息学报》 EI CSCD 北大核心 2013年第4期784-790,共7页
为了提高运动目标轨迹分类的准确性,该文综合考虑了轨迹的位置信息和方向信息,提出了一种结合Hausdorff距离和最长公共子序列(Longest Common SubSequence,LCSS)的轨迹分类算法。该算法首先采用改进的Hausdorff距离对轨迹的位置信息进... 为了提高运动目标轨迹分类的准确性,该文综合考虑了轨迹的位置信息和方向信息,提出了一种结合Hausdorff距离和最长公共子序列(Longest Common SubSequence,LCSS)的轨迹分类算法。该算法首先采用改进的Hausdorff距离对轨迹的位置信息进行相似性测量,然后采用改进的LCSS算法对轨迹的方向信息进行相似性测量。与其他轨迹聚类算法不同,该算法融合了Hausdorff距离和LCSS两种算法的优点,提高了轨迹分类的准确性。此外,为了进一步降低计算复杂度,该文还实现了一种基于插值的保距变换算法和一种LCSS快速算法。实验结果表明,该轨迹分类算法可以明显提高轨迹的聚类准确率,聚类准确率可达到96%;基于插值的保距变换算法和LCSS快速算法可以很大程度上降低算法的计算复杂度,下降幅度最大可达到80%。该方法可以同时满足轨迹分类对精确度、实时性和鲁棒性的要求。 展开更多
关键词 图像处理 轨迹分类 HAUSDORFF距离 最长公共序列(LCSS) 保距变换 LCSS快速算法
下载PDF
基于改进的模糊C-Means航迹聚类方法研究 被引量:18
7
作者 王超 王明明 王飞 《中国民航大学学报》 CAS 2013年第3期14-18,共5页
为指导飞行程序的改善和发现管制员的指挥模式,在分析历史飞行航迹特征基础上,应用最小描绘长度(MDL)原理对航迹特征点进行划分,运用融合了遗传算法和模拟退火算法的改进的模糊C-Means算法对特征点进行聚类,通过最长公共子序列(LCS)算... 为指导飞行程序的改善和发现管制员的指挥模式,在分析历史飞行航迹特征基础上,应用最小描绘长度(MDL)原理对航迹特征点进行划分,运用融合了遗传算法和模拟退火算法的改进的模糊C-Means算法对特征点进行聚类,通过最长公共子序列(LCS)算法得到航迹相似性矩阵,利用矩阵得到航迹簇,最后形成中心航迹,算例仿真验证了新算法的有效性。 展开更多
关键词 航迹聚类 遗传模拟退火算法 模糊C—Means 最长公共序列
下载PDF
基因序列相似程度的LCS算法研究 被引量:14
8
作者 王映龙 杨炳儒 +2 位作者 宋泽锋 陈卓 唐建军 《计算机工程与应用》 CSCD 北大核心 2007年第31期45-47,共3页
首先重新审视了采用穷举法求解LCS问题的困难,以及对应的优点;随后针对穷举法的优点进行了两类优化;最后给出了算法实现的图示以及算法的结论。通过实验证明,算法的效率较传统的动态规划的LCS算法有了很大的提升。
关键词 最长公共序列 穷举法 基因序列排比
下载PDF
最长公共子序列问题的改进快速算法 被引量:9
9
作者 李欣 舒风笛 《计算机应用研究》 CSCD 2000年第2期28-30,共3页
现在几个最常用的解决最长公共子序列(LCS)问题的算法的时间复杂度分别是O(pn),O(n(m-p)).这里m、n两个待比较字符串的长度,p是最长公共子串的长度.给出一种时间复杂度为O(p(m-p));空间复杂度为O(... 现在几个最常用的解决最长公共子序列(LCS)问题的算法的时间复杂度分别是O(pn),O(n(m-p)).这里m、n两个待比较字符串的长度,p是最长公共子串的长度.给出一种时间复杂度为O(p(m-p));空间复杂度为O(m+n)的算法.与以前的算法相比;不管在p<<m的情况下,还是在p接近m时,这种算法都有更快的速度. 展开更多
关键词 最长公共序列 算法 差分压缩算法 字符串
下载PDF
一种基于熵的文本相似性计算方法 被引量:13
10
作者 李圣文 凌微 +1 位作者 龚君芳 周长征 《计算机应用研究》 CSCD 北大核心 2016年第3期665-668,共4页
文本比较是求解两个文本间相似度的过程,文本间的相似度越高代表两个文本越趋于类似。传统的相似度算法主要从字符的角度度量文本的相似性,忽略了文本内多个共同文本串对于文本相似度的影响。针对此问题提出一种基于熵的相似度求解方法... 文本比较是求解两个文本间相似度的过程,文本间的相似度越高代表两个文本越趋于类似。传统的相似度算法主要从字符的角度度量文本的相似性,忽略了文本内多个共同文本串对于文本相似度的影响。针对此问题提出一种基于熵的相似度求解方法,在对文本间字符信息的提取基础上,建立共同子文本串度量维度,然后采用熵的方法进行相似度度量。实验表明,该方法具有更平滑的相似度曲线,从而验证了算法的有效性和准确性。 展开更多
关键词 文本相似性 字符串匹配 编辑距离算法 最长公共序列
下载PDF
基于最长公共子序列的非同步相似轨迹判断 被引量:11
11
作者 刘宇 王前东 《电讯技术》 北大核心 2017年第10期1165-1170,共6页
针对非同步相似轨迹判断问题,提出了一种基于最长公共子序列理论的相似轨迹判断新算法。首先,求出查询轨迹线段与候选轨迹线段之间的距离;其次,利用最长公共子序列算法,计算两轨迹的最长公共子轨迹长度;最后,根据相似度门限,判断轨迹是... 针对非同步相似轨迹判断问题,提出了一种基于最长公共子序列理论的相似轨迹判断新算法。首先,求出查询轨迹线段与候选轨迹线段之间的距离;其次,利用最长公共子序列算法,计算两轨迹的最长公共子轨迹长度;最后,根据相似度门限,判断轨迹是否相似。数值实例验证了所提算法能够提高非同步轨迹的相似度。 展开更多
关键词 侦察监视 最长公共序列 非同步相似轨迹 最长公共子轨迹
下载PDF
短文本相似度研究及其在微博话题检测中的应用 被引量:11
12
作者 黄贤英 陈红阳 刘英涛 《计算机工程与设计》 北大核心 2015年第11期3128-3133,共6页
针对微博短文本特征稀疏导致文本相似性度量不精确的问题,提出一种基于多视角的微博短文本相似度算法。根据词形相同与词义相近寻找微博短文本中的公共块,以公共块所含词项总数与公共块之间的组合顺序,构建基于公共块序列的语义相似度;... 针对微博短文本特征稀疏导致文本相似性度量不精确的问题,提出一种基于多视角的微博短文本相似度算法。根据词形相同与词义相近寻找微博短文本中的公共块,以公共块所含词项总数与公共块之间的组合顺序,构建基于公共块序列的语义相似度;利用微博短文本发布时间、转发与评论等信息来修正该语义相似度,形成新的微博短文本相似度算法,度量微博短文本之间的相似性;将新的微博短文本相似度算法融入Single-Pass聚类算法中以检测微博话题。实验结果表明,将该算法应用于微博话题检测时,能够有效降低话题检测的平均漏检率与误检率等,提高了话题检测的质量。 展开更多
关键词 微博短文本相似度 微博话题检测 结构化信息 公共序列 语义相似度
下载PDF
一种带匹配路径约束的最长公共子序列长度算法 被引量:9
13
作者 王前东 《电子与信息学报》 EI CSCD 北大核心 2017年第11期2615-2619,共5页
在带约束的最长公共子序列问题中提出一种特殊的新问题:假设有两序列Q和C,Q中指定的匹配位置序列I,计算两序列Q和C的最长公共子序列,且这个最长公共子序列的匹配路径必须经过位置序列I。针对此问题,该文提出一种带匹配路径约束的最长公... 在带约束的最长公共子序列问题中提出一种特殊的新问题:假设有两序列Q和C,Q中指定的匹配位置序列I,计算两序列Q和C的最长公共子序列,且这个最长公共子序列的匹配路径必须经过位置序列I。针对此问题,该文提出一种带匹配路径约束的最长公共子序列算法。首先定义带匹配路径约束的最长公共子序列模型,其次推出该序列的性质,最后求出带匹配路径约束的最长公共子序列长度的基础算法和快速算法。基础算法和快速算法时间复杂度分别为O(mnt)和O(mn),m,n,t分别为序列Q,C,I的长度。 展开更多
关键词 最长公共序列 匹配路径约束 带约束的最长公共序列 带匹配路径约束的最长公共序列
下载PDF
动态规划算法综述 被引量:11
14
作者 张莹 《科技视界》 2014年第28期126-126,158,共2页
本文通过系统的介绍动态规划算法的基本概念、基本思想、适用情况分析、基础求解步骤、实现的说明和算法的基本框架,对动态规划算法进行了总结和概述。
关键词 算法 动态规划 最长公共序列
下载PDF
多节点系统异常日志流量模式检测方法 被引量:10
15
作者 王晓东 赵一宁 +2 位作者 肖海力 迟学斌 王小宁 《软件学报》 EI CSCD 北大核心 2020年第10期3295-3308,共14页
随着国家高性能计算环境各个节点产生日志数量的不断增加,采用传统的人工方式进行异常日志分析已不能满足日常的分析需求.提出一种异常日志流量模式的定义方法:同一节点相同时间片内日志类型的有序排列代表了一种日志流量模式,并以该方... 随着国家高性能计算环境各个节点产生日志数量的不断增加,采用传统的人工方式进行异常日志分析已不能满足日常的分析需求.提出一种异常日志流量模式的定义方法:同一节点相同时间片内日志类型的有序排列代表了一种日志流量模式,并以该方法为出发点,实现了一个异常日志流量模式检测方法,用来自动挖掘异常日志流量模式.该方法从系统日志入手,根据日志内容的文本相似度进行自动分类.然后将相同时间片内日志各个类型出现的次数作为输入特征,基于主成分分析的异常检测方法对该输入进行异常检测,得到大量异常的日志类型序列.之后,使用基于最长公共子序列的距离度量对这些序列进行层次聚类,并将聚类结果进行自适应K项集算法,以得出不同异常日志流量模式的序列代表.将国家高性能计算环境半年产生的日志根据不同时间段(早、晚、夜)使用上述方法进行分析,得出了不同时间段的异常日志流量模式和相互关系.该方法也可以推广到其他分布式系统的系统日志中. 展开更多
关键词 异常日志流量 主成分分析 层次聚类 最长公共序列 自适应K项集算法
下载PDF
基于序列匹配的作业相似度检测系统 被引量:9
16
作者 王晓英 靳力 +1 位作者 王晓青 黄维通 《计算机工程》 CAS CSCD 2012年第24期53-56,61,共5页
为辅助教师进行电子作业的批改和抄袭鉴别,设计并实现一种基于序列匹配的作业相似度检测系统。以班级为分组建立相似度计算模型,利用序列匹配算法计算公共子序列的长度,得到每组作业两两之间的相似度,并在此基础上进行聚类分析,给出可... 为辅助教师进行电子作业的批改和抄袭鉴别,设计并实现一种基于序列匹配的作业相似度检测系统。以班级为分组建立相似度计算模型,利用序列匹配算法计算公共子序列的长度,得到每组作业两两之间的相似度,并在此基础上进行聚类分析,给出可视化结果。实验结果表明,该系统具有较强的实用性,能够辅助教师在批改作业时快速高效地鉴别疑似抄袭的情况。 展开更多
关键词 电子作业 相似度检测 抄袭检测 序列匹配 相似度聚类 公共序列
下载PDF
最长公共子序列算法在程序代码相似度度量中的应用 被引量:7
17
作者 于海英 赵俊岚 《内蒙古大学学报(自然科学版)》 CAS CSCD 北大核心 2008年第2期225-229,共5页
阐述了最长公共子序列算法在程序代码结构相似度度量中的应用,列举了两种计算最优值和一种获取最长公共标识符子序列的算法.根据最优值得到结构相似度值,进而可以查找出结构相似程序对.最后探讨了程序代码相似度的实际应用.
关键词 最长公共序列算法 最优值 结构相似度 最长公共标识符子序列
下载PDF
一种最长扩展公共子序列新算法
18
作者 王前东 《电讯技术》 北大核心 2024年第8期1307-1314,共8页
在最长填充公共子序列问题中提出一种新问题:假设有一个完整序列C和一个不完整序列Q,长度分别为m和n,Q中丢失的元素为相邻的相同元素,要求寻找一个丢失前的序列Q,使得C和Q具有最长的公共子序列。针对此问题,首先将Q中每个元素复制m-1个... 在最长填充公共子序列问题中提出一种新问题:假设有一个完整序列C和一个不完整序列Q,长度分别为m和n,Q中丢失的元素为相邻的相同元素,要求寻找一个丢失前的序列Q,使得C和Q具有最长的公共子序列。针对此问题,首先将Q中每个元素复制m-1个并插入Q中原来的位置,生成长度为mn的扩展序列Q^(*),然后证明了C和Q的最长扩展公共子序列是两序列C和Q^(*)的最长公共子序列,最后提出一种时空复杂度为O(mn)的最长扩展公共子序列求解新算法,并用轨迹实验证明了该算法对强噪声干扰和轨迹点丢失的同时有效性。 展开更多
关键词 最长公共序列(LCS) 最长填充公共序列(LFCS) 扩展公共序列(ECS) 最长扩展公共序列(LECS)
下载PDF
基于句子相似度的论文抄袭检测模型研究 被引量:9
19
作者 冷强奎 秦玉平 王春立 《计算机工程与应用》 CSCD 北大核心 2011年第24期199-201,共3页
提出一种基于句子相似度的论文抄袭检测模型。利用局部词频指纹算法对大规模文档进行快速检测,找出疑似抄袭文档。根据最长有序公共子序列算法计算句子间的相似度,并标注抄袭细节,给出抄袭依据。在标准中文数据集SOGOU-T上进行的实验表... 提出一种基于句子相似度的论文抄袭检测模型。利用局部词频指纹算法对大规模文档进行快速检测,找出疑似抄袭文档。根据最长有序公共子序列算法计算句子间的相似度,并标注抄袭细节,给出抄袭依据。在标准中文数据集SOGOU-T上进行的实验表明,该模型具有较强的局部信息挖掘能力,在一定程度上克服了现有的论文抄袭检测算法精度不高的缺点。 展开更多
关键词 句子相似度 抄袭检测 局部词频 最长有序公共序列
下载PDF
一种面向大规模序列数据的交互特征并行挖掘算法 被引量:8
20
作者 赵宇海 印莹 +2 位作者 李源 汪嗣尧 王国仁 《计算机研究与发展》 EI CSCD 北大核心 2019年第5期992-1006,共15页
序列是一种重要的数据类型,在诸多应用领域广泛存在.基于序列的特征选择具有广阔的现实应用场景.交互特征是指一组整体具有显著强于单独个体与目标相关性的特征集合.从大规模序列中挖掘交互特征面临着位点的"组合爆炸"问题,... 序列是一种重要的数据类型,在诸多应用领域广泛存在.基于序列的特征选择具有广阔的现实应用场景.交互特征是指一组整体具有显著强于单独个体与目标相关性的特征集合.从大规模序列中挖掘交互特征面临着位点的"组合爆炸"问题,计算挑战性极大.针对该问题,以生物领域高通量测序数据为背景,提出了一种新的基于并行处理和演化计算的高阶交互特征挖掘算法.位点数是制约交互作用挖掘效率的根本因素.摈弃了现有方法基于序列分块的并行策略,采用基于位点分块的并行思想,具有天然的效率优势.进一步,提出了极大等位公共子序列(maximal allelic common subsequence, MACS)的概念并设计了基于MACS的特征区域划分策略.该策略能将交互特征的查找范围缩小至许多"碎片"空间,并保证不同"碎片"间不存在交互特征,避免计算耦合引起的高额通信代价.利用基于置换搜索的并行蚁群算法,执行交互特征选择.大量真实数据集和合成数据集上的实验结果,证实提出的PACOIFS算法在有效性和效率上优于同类其他算法. 展开更多
关键词 交互特征 数据挖掘 大规模序列 蚁群算法 并行计算 极大等位公共序列
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部