期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
学术论文抄袭检测方法研究综述 被引量:3
1
作者 赵俊杰 《湖南工业大学学报(社会科学版)》 2010年第1期157-159,共3页
从学术论文抄袭的现象和危害出发,分析归纳了学术论文抄袭的主要类型及形式。接着从论点抄袭、文本抄袭、算法与程序代码抄袭和图片与公式抄袭等几个方面,综述了近阶段所采用的主要抄袭检测方法。最后概述了解决论文抄袭检测问题的重要... 从学术论文抄袭的现象和危害出发,分析归纳了学术论文抄袭的主要类型及形式。接着从论点抄袭、文本抄袭、算法与程序代码抄袭和图片与公式抄袭等几个方面,综述了近阶段所采用的主要抄袭检测方法。最后概述了解决论文抄袭检测问题的重要意义,并对如何防止学术论文抄袭提出建议。 展开更多
关键词 抄袭检测 文本相似度 词频统计 数字指纹 图像匹配
下载PDF
基于主题和特征的文本相似度算法研究
2
作者 药珍妮 《软件》 2016年第10期123-126,共4页
本文提出了结合主题和各主题下关键特征的文本相似度算法,目的在于更准确的挖掘被描述对象的近邻对象集。本文首先介绍卡方统检验特征统计法,并利用改进的卡方检验,计算训练集中已知主题的文本的特征;而后介绍了最小编辑距离算法、余弦... 本文提出了结合主题和各主题下关键特征的文本相似度算法,目的在于更准确的挖掘被描述对象的近邻对象集。本文首先介绍卡方统检验特征统计法,并利用改进的卡方检验,计算训练集中已知主题的文本的特征;而后介绍了最小编辑距离算法、余弦相似度算法和杰卡德相似系数,在论证了主题对文本相似度的重要性后,又针对难提取主题的文本加以改进,最终提出了基于主题和特征的文本相似度算法;然后对各个算法在测试集上的相似度计算结果进行分析,证明本文提出的算法在速度和精确度上明显优于其他算法;最后将该算法应用于股票的概念股题材标注上,分析结果并提出改进空间和不足之处。 展开更多
关键词 数据挖掘 文本相似度 主题 特征
下载PDF
图结构在文本聚类中的应用
3
作者 王雅思 梁赟辉 《大连民族学院学报》 CAS 2013年第3期284-286,共3页
提出了一种基于图结构的文本聚类方法,采用基于图结构的文本表示方法来构建文本的图结构模型,将一个文本映射为相应的图结构,通过最大完全公共子图的求解计算文本间相似度,并进行聚类。实验结果验证了该方法的有效性。
关键词 最大完全公共子图 文本间相似度 文本聚类
下载PDF
相似文本的快速搜索 被引量:1
4
作者 燕继坤 郑辉 席建民 《计算机工程》 CAS CSCD 北大核心 2004年第15期22-23,71,共3页
相似文本的快速搜索是大规模文本处理需要解决的基本问题。从两方面改进了Udi的相似文本搜索方法,通过Hash把集合映射成ID,从而得到更快的集合比较算法,重新定义了相似关系,能够减少误判,同时对有固定格式的文本也有更好的效果。
关键词 大规模文本处理 相似文本搜索 复制检测
下载PDF
同类文本的开发与助读
5
作者 王唐平 《江苏教育研究》 2019年第28期64-67,共4页
同类文本就是在主题、手法、意象、语言、原型、结构、题材等方面与目标文本有一点或多点相同或相近的文本。同类文本类助读材料的开发可分为历时性开发和共时性开发两类。同类文本的助读策略主要有比较、迁移、还原、阐释、深化、拓展等。
关键词 同类文本 助读材料 文本开发
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部