摘要
相同功能的程序代码之间存在较高的相似度,识别出这些相似的代码有助于代码的抄袭检测、软件中克隆代码检测以及代码同源性检测。将程序转换成了一些量化的标识串(Token),然后使用高效的RKR-GST串匹配算法找出每对Token串的所有最长公共子串,然后根据公式计算相似度,最后根据相似度的值作为判定相似性的依据。
出处
《黑龙江科技信息》
2015年第29期167-,共1页
Heilongjiang Science and Technology Information
基金
内蒙古自治区高等学校科学研究项目(NJZY14039)资助