期刊文献+

基于改进GST算法的字符串相似度检测

String Similarity Detection Based on Improved GST Algorithm
下载PDF
导出
摘要 为了降低贪婪模式匹配(GST)算法的运行时间,提高字符串相似度检测效率,提出一种将改进KR算法与GST相结合的字符串相似度检测算法.以学生作业源代码作为实验数据,对改进算法和GST算法进行了性能测试,结果表明,改进算法能够在较少的比较次数情况下达到与GST算法类似的查重结果. To reduce the running time and improve the efficiency of string similarity detection,an improved string similarity detection algorithm is proposed utilizing the improved KR algorithm and GST algorithm.Using students'homework source code as the experimental data,the performance of the improved algorithm is tested,and the results show that the improved algorithm can achieve the duplicate check result similar to GST in less fewer comparison times.
作者 孙宇扬 欧云 奉松绿 周恺卿 SUN Yuyang;OU Yun;FENG Songlyu;ZHOU Kaiqing(College of Information Science & Engineering, Jishou University, Jishou 416000, Hunan China)
出处 《吉首大学学报(自然科学版)》 CAS 2021年第5期34-37,共4页 Journal of Jishou University(Natural Sciences Edition)
基金 湖南省教育厅科学研究重点项目(19A414) 吉首大学校级科学研究项目(14JD027) 吉首大学校级科研项目(JDX21021) 2021年吉首大学大学生创新创业训练计划项目(教通[2021]21号130)。
关键词 字符串 相似度 近似匹配 贪婪模式匹配算法 随机串匹配算法 string similarity approximate matching greedy pattern matching algorithm Karp-Rabin algorithm
  • 相关文献

参考文献6

二级参考文献32

  • 1张立航,潘正运,刘海峰.基于改进的KR算法在网闸中的实现[J].微计算机信息,2008,24(6):137-138. 被引量:3
  • 2程金宏,刘东升.程序代码相似度自动度量技术研究综述[J].内蒙古师范大学学报(自然科学汉文版),2006,35(4):457-461. 被引量:13
  • 3Michael J.Wise.Neweyes:A System for Comparing Biologi-cal Sequences Using the Running Karp-Rabin Greedy String-Tiling Algorithm[C]∥In Third International Conference on In-telligent Systems for Molecular Biology Ambridge,England,pages:393-401. 被引量:1
  • 4Aho A.V.,Hirschberg D.S.,Ullman J.D.:Bounds on theComplexity of the Longest Common Subsequence Problem[J].1976,23(1):1-12. 被引量:1
  • 5Matthew Szuskiewicz.Automatic Plagiarism Detection in Soft-ware Code[A].Information and Communications Technology,May 2003. 被引量:1
  • 6Clough P. Plagiarism in natural and programming languages: an overview of current tools and technologies[R].Internal Report CS-00-05, University of Sheffield, 2000. 被引量:1
  • 7Gitchell D, Tran N. Sim: A utility for detecting similarity in computer programs [C]. New Orleans, Louisiana, USA: The 30th SIGCSE Technical Symposium on Computer Science Education, 1999:266-270 被引量:1
  • 8Boywer Kevin W, Hall Lawrence O. Experience using 'MOSS' to detect cheating on programming assignments[C]. San Juan, Puerto Rico: 29th ASEE/IEEE Frontiers in Education Conference,1999:18-22. 被引量:1
  • 9Andrew Granville.Detecting plagiarism in Java code[D]. Supervisor:Yorick Wilks,2002. 被引量:1
  • 10Prechelt L,Malpohl G,Philippsen M.Finding plagiarisms among a set of programs with JPlag[J]. Journal of Universal Computer Science,2002,8(11): 1016- 1038. 被引量:1

共引文献58

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部