自动组卷中试题去重技术研究被引量：9

Question similarity identification in automatic generation of test papers

下载PDF

导出

摘要针对大规模题库中存在相似试题的问题,提出一种自动识别相似试题的方法.在知网词汇语义相似度模型的基础上,引入领域词汇对其进行改进,并且提出一种试题去重模型,来实现试题相似度的计算,解决了题库中相似和重复试题的自动识别问题,提高了相似试题识别的准确率.综合随机抽取法和试探回溯法两种组卷算法的优点,提出一种基于相似试题识别的组卷算法,提高了组卷的质量.实验表明试题相似度识别准确率达96%,非常接近人工判断结果,该方法不仅可以从同一试题类型内部,还可在不同类型之间消除相似试题.该方法已在C语言上机考试中进行了应用. To solve the problem of identifying similar questions in examination database, an algorithm for question similarity identification is proposed in this paper. By introducing domain words to the improvement of the word similarity model in HowNet, a model for question similarity identification is proposed to make the same or similar questions be identified and cut off automatically. This method improves the accuracy of identi- fication compared with other methods. By combining merits of the random selection with those of the back- tracking method, a new algorithm of generating papers automatically based on question similarity identification is proposed. It can guarantee the quality of papers. Test results show that the accuracy of question similarity i- dentification of this method is 96% , which approaches to that of manual identification. This method can cut off similar questions not only of the same type, but also of different types. Finally, this method has been applied to the on-line examination of C programming language.

作者王宇颖陈振苏小红

机构地区哈尔滨工业大学计算机科学与技术学院

出处《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2009年第1期85-88,共4页 Journal of Harbin Institute of Technology

基金国家自然科学基金资助项目(60673035)

关键词相似题识别智能组卷难度等级题库系统 similarity identification automatic paper generation difficult level system of examination

分类号 TP314 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献11

1任爱华,武新利.题库建设的目标及数学模型[J].山东师范大学学报（自然科学版）,1998,13(4):441-445. 被引量：35
2林雪明,张钧良,蒋伟钢.基于知识点的试题库组卷算法的建立[J].微机发展,2001,11(2):77-79. 被引量：32
3GUAN Y, WANG X L. Quantifying semantic similarity of Chinese words from HowNet[ C]//International Conference on Machine Learning and Cybernetics. Beijing: [s. n. ] , 2002:234 -239. 被引量：1
4YU Z T, HU L. Similarity computation of Chinese question based on chunk [ C ]//International Conference on Machine Learning and Cybernetics. Dalian: [ s. n. ] , 2006 : 17 - 22. 被引量：1
5李彬,刘挺,秦兵,李生.基于语义依存的汉语句子相似度计算[J].计算机应用研究,2003,20(12):15-17. 被引量：127
6齐浩亮,杨沐昀,孟遥,韩习武,赵铁军.面向特定领域的汉语句法主干分析[J].中文信息学报,2004,18(1):1-5. 被引量：8
7MANDREOLI F, MARTOGLIA R, TIBERIO P. A syntactic approach for searching similarities within sentences [ C ]//Proceedings of the eleventh international conference on Information and knowledge management. Virginia, USA : [ s. n. ] , 2002:635 - 637. 被引量：1
8GAN K W, WONG P W, CHARNIAK E. Annotation information structures in Chinese texts using How net [ C]//Second Chinese Language Processing Workshop. Hong Kong: [ s. n. ] , 2000:85 -92. 被引量：1
9NIRENBURG S, DONMASHNEW C, DEAN J. Two approaches to Matching in Example-based Machine Translation [ C ]//Proceddings of the fifth International Conference on Theoretical and Methodological in Machine Translation of Natural Languages. Kyoto, Japan : [ s. n. ] , 1993:45 - 57. 被引量：1
10刘群李素建.基于《知网》的词汇语义相似度计算.中文计算语言学,2002,7(2):59-76. 被引量：147

二级参考文献13

1刘海涛.依存语法和机器翻译[J].语言文字应用,1997(3):91-95. 被引量：43
2桂诗春.题库建设讲话(一)[J].现代外语,1989,12(4):1-7. 被引量：12
3郭艳华,周昌乐.一种汉语语句依存关系网协动生成方法研究[J].杭州电子工业学院学报,2000,20(4):24-32. 被引量：11
4浙江大学数学系高等数学教研组.概率论与数理统计[M].人民教育出版社,1982,8.. 被引量：1
5车万翔等.面向依存文法分析的搭配抽取方法研究[A]..全国第六届计算语言学联合学术会议[C].,2001.. 被引量：1
6穗志方俞士汶.基于骨架依存树的语句相似度计算模型[A]..中文信息处理国际会议(ICCIP''98)[C].,1998.. 被引量：4
7赵铁军.[D].哈尔滨工业大学,1997:26-30. 被引量：1
8池抚新,沈丽,孙桂兰.计算机随机抽题组卷算法与应用[J].抚顺石油学院学报,1999,19(2):45-47. 被引量：23
9刘立新,童兆春,侯方勇.多层次通用试题库管理系统设计[J].计算机工程与科学,1999,21(3):71-74. 被引量：2
10熊伟清,胡军.一种题库模型与组卷算法[J].兰州铁道学院学报,1999,18(2):85-88. 被引量：12

共引文献340

1贾善崇,周兰江,张建安,周枫.融入多特征的汉-老双语对齐方法[J].中国水运（下半月）,2020,20(3):78-80. 被引量：2
2张嵩,杨晓明,田露.基于语义相似度计算的航天标准关联度评价[J].南京航空航天大学学报,2021,53(S01):153-156. 被引量：3
3余正涛,邓锦辉,韩露,毛存礼,郑志蕴,郭剑毅.受限域FAQ中文问答系统研究[J].计算机研究与发展,2007,44(z2):388-393. 被引量：6
4刘凤华.计算机基础课题库系统中试卷生成模型研究[J].纺织高校基础科学学报,2004,17(2):164-166.
5冉丽,何毅舟,许龙飞.基于Web结构挖掘的搜索引擎作弊检测方法[J].计算机应用,2004,24(10):158-160. 被引量：4
6宣仲良.各级难度试题分值比例的确定[J].淮阴师范学院学报（自然科学版）,2004,3(3):240-245. 被引量：6
7王雍钧,黄毓瑜.基于知识点题型分布和分值的智能组卷算法研究[J].计算机应用与软件,2004,21(8):111-113. 被引量：33
8陈丽燕.智能组卷算法研究[J].杭州师范学院学报（自然科学版）,2004,3(4):326-328. 被引量：10
9秦兵,刘挺,李生.基于局部主题判定与抽取的多文档文摘技术[J].自动化学报,2004,30(6):905-910. 被引量：10
10陈科,贾焰,杨树强,王永恒.汉语短文话题提取系统中SDTF*PDF算法的研究[J].计算机应用,2005,25(1):14-16. 被引量：1

同被引文献44

1高思丹,袁春风.语句相似度计算在主观题自动批改技术中的初步应用[J].计算机工程与应用,2004,40(14):132-135. 被引量：47
2杨路明,陈大鑫.改进遗传算法在试题自动组卷中的应用研究[J].计算机与数字工程,2004,32(5):76-79. 被引量：29
3马娅婕,田翔川.多媒体网络教学系统在线考试题库的设计[J].计算机应用研究,2005,22(1):182-183. 被引量：33
4陈治纲,何丕廉,孙越恒,郑小慎.基于向量空间模型的文本分类系统的研究与实现[J].中文信息学报,2005,19(1):36-41. 被引量：43
5陈晓东,王宏宇.一种基于改进遗传算法的组卷算法[J].哈尔滨工业大学学报,2005,37(9):1174-1176. 被引量：34
6陆亿红,柳红.基于整数编码和自适应遗传算法的自动组卷[J].计算机工程,2005,31(23):232-232. 被引量：29
7汤世平,樊孝忠.基于多示例学习的题库重复性检测研究[J].北京理工大学学报,2005,25(12):1071-1074. 被引量：5
8袁锋.遗传算法在自动组卷系统中的应用[J].山东师范大学学报（自然科学版）,2006,21(1):53-56. 被引量：16
9张亮,冯冲,陈肇雄,黄河燕.基于语句相似度计算的FAQ自动回复系统设计与实现[J].小型微型计算机系统,2006,27(4):720-723. 被引量：19
10王友仁,张砦,施玉霞,姚睿.题库系统智能成卷理论和组卷方法研究[J].电子科技大学学报,2006,35(3):363-366. 被引量：31

引证文献9

1汪忠国,吴敏.基于向量空间模型的题库相似度检查算法[J].计算机系统应用,2010,19(3):213-216. 被引量：12
2郑炜冬.试卷相似度自动评估技术的研究[J].智能计算机与应用,2011,1(4):16-19.
3宫磊,赵方.基于改进自适应遗传算法的智能组卷算法[J].计算机与现代化,2012(5):152-156. 被引量：3
4杨素锦,陈莹.基于改进遗传算法的自动组卷问题研究[J].煤炭技术,2012,31(12):217-219. 被引量：3
5张栋梁,陈森.考试题目去重问题研究[J].计算机光盘软件与应用,2013,16(18):246-247.
6曹丽华,伍春兰,张玉.基于试题库组卷的最小题量的构建[J].北京教育学院学报（自然科学版）,2016,11(2):9-13.
7王凌.基于B/S的网络考试系统的设计与实现[J].信息与电脑（理论版）,2012(8):41-42.
8梁圣.基于RNN的试题相似度计算模型研究与实现[J].数码设计,2018,7(1):15-17. 被引量：1
9金林樵.基于Web的VB程序设计在线考试系统设计与实现[J].浙江树人大学学报（自然科学版）,2014,14(2):15-20.

二级引证文献19

1付永贵.一种改进的余弦向量度量法文本检索模型[J].图书情报工作,2011,55(19):115-119. 被引量：2
2杨瑞成,吕强,杨静.基于圆形邻域孤立点挖掘算法的企业信用风险失真度研究[J].数学的实践与认识,2012,24(4):94-101. 被引量：2
3付永贵.基于云计算的余弦向量度量法文本检索模型[J].情报科学,2012,30(5):736-739. 被引量：4
4周小平,王佳,马晓轩.基于VSM的电子作业反抄袭系统的设计与实现[J].实验技术与管理,2013,30(3):109-111. 被引量：2
5付永贵,尚成国,马尚才.基于云计算的改进余弦向量度量法索引项权值算法[J].计算机系统应用,2013,22(6):86-90.
6刁建忠,曾爱林,杨斌.基于改进小生境遗传算法的自适应组卷系统[J].顺德职业技术学院学报,2013,11(4):13-16.
7贺海涛,郑山红,侯丽鑫,王国春,王璐.基于中文文本的疾病领域本体学习的研究[J].吉林大学学报（信息科学版）,2014,32(1):76-81. 被引量：5
8刘忠宝,赵文娟,贾君枝.多标记用户分类系统构建方法研究[J].图书情报工作,2014,58(10):145-148. 被引量：1
9胡玉琦.基于Levenshtein算法的题库相似度检测算法的设计与改进[J].东莞理工学院学报,2014,21(5):57-60. 被引量：1
10肖崇星,李郴,曹晓洒.基于代码相似性算法的敌对题发现问题研究[J].无线互联科技,2017,14(1):137-139.

1邱云明,许镕涛,封玲.基于.NET的题库管理与试卷生成系统的设计与开发[J].现代计算机,2013,19(15):71-73.
2杨绍先.上机考试系统中电影题的设计、制作和播放[J].高师理科学刊,2004,24(2):29-31.
3付萍萍.浅析计算机课程教学与计算机等级考试的接轨[J].江西电力职工大学学报,1996,9(3):33-34.
4刘延风,刘三阳.基于遗传算法求解数独难题[J].计算机科学,2010,37(3):225-226. 被引量：11
5阳王东,陶壮志.基于J2ME智能手机的拼图游戏开发[J].湖南城市学院学报（自然科学版）,2010,19(1):61-63. 被引量：3
6第九关：破解BBSXP后台密码并获得Webshell[J].黑客防线,2005(3):139-139.
7王凤.Web应用在线考试系统[J].才智,2011,0(12):57-57.
8第八关：获得最新版BBSXP前台管理权限[J].黑客防线,2005(3):138-139.
9《计算机组成原理》复习指导[J].内蒙古电大学刊,2002(3):77-80.
10软件水平考试试题类型及选解[J].软件世界,1994(4):43-45.

哈尔滨工业大学学报

2009年第1期

浏览历史

内容加载中请稍等...

自动组卷中试题去重技术研究被引量：9

参考文献11

二级参考文献13

共引文献340

同被引文献44

引证文献9

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

自动组卷中试题去重技术研究 被引量：9

参考文献11

二级参考文献13

共引文献340

同被引文献44

引证文献9

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

自动组卷中试题去重技术研究被引量：9