-
题名一种基于段落词频统计的论文抄袭判定算法
被引量:12
- 1
-
-
作者
赵俊杰
胡学钢
-
机构
合肥工业大学
安徽财经大学
-
出处
《计算机技术与发展》
2009年第4期231-233,238,共4页
-
基金
教育部社科研究基金青年项目(07JC870006)
安徽财经大学教研重点项目(ACJYZD200914)
-
文摘
解决论文抄袭的判定问题不但可以减轻审稿人员的工作负担,而且对于提高学术论文质量、净化学术领域、防止学术腐败都有很重要的意义。从抄袭的定义和法律规定出发,在分析比较国内外主要的论文抄袭判定方法基础上,提出存在的问题和改进策略,然后给出一种基于段落词频统计的论文抄袭判定算法。此算法不但可以检测出抄袭者成段抄袭的情况,而且可以检测出段落中语句顺序改变、段落内容压缩和扩充的情况,若疑似抄袭还可以将抄袭论文和被抄袭论文的相似内容输出,方便用户进一步审查。
-
关键词
抄袭判定
词频统计
段落相似度
中文分词
-
Keywords
plagiarism judgment
word- frequency statistics
similarity between paragraphs
Chinese text segment
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于段落相似度的论文抄袭判定
被引量:2
- 2
-
-
作者
赵俊杰
谢飞
-
机构
合肥工业大学
-
出处
《电脑与电信》
2008年第8期22-23,35,共3页
-
基金
2007年度国家教育部人文社科研究基金青年项目
研究方向:07JC870006
+1 种基金
安徽财经大学教研重点项目
研究方向:ACJYZD200914
-
文摘
从抄袭的定义和法律规定出发,在分析比较国内外主要的论文抄袭判定方法基础上,提出存在的问题和改进策略,最后给出一种基于段落相似度的论文抄袭判定算法。此算法可以检测出抄袭者将论文的段落顺序打乱或者将段落文字打乱重新组合的情况,并将确认抄袭和疑似抄袭的抄袭论文和原论文的相应内容输出,方便用户进一步审查。
-
关键词
抄袭判定
段落相似度
向量空间模型
TFIDF
-
Keywords
plagiarism judgrnent
similarity between paragraphs
vector space model
TFIDF
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
N533
[自动化与计算机技术—计算机科学与技术]
-