基于CFN的相似度计算在实例机器翻译中的应用被引量：1

Application of Similarity Computation Based on CFN to Example-based Machine Translation

下载PDF

导出

摘要在信息检索,文本挖掘以及基于实例的机器翻译中,相似度计算都是一个关键问题。在实例机器翻译中,相似度计算一般是基于字符、词的匹配以及向量空间模型,但基于句子语义结构的相似度研究还不多见。借助了汉语框架语义网(Chinese FrameNet,简称CFN)的场景语义描述优势,提出了一种新的面向EBMT进行实例相似度计算的方法。该方法主要基于CFN从句子整体结构相似和各语义块内部相似两个角度来度量句子相似度,将这两部分的相似度结果进行凸组合作为待翻译句子与候选实例之间的相似度值。实验结果表明,与传统方法相比,所提出的这种方法是有效的。 In the information retrieval,text mining,as well as Example based Machine Translation,Similarity calculation is a key issue.In the Example based Machine Translation,General similarity calculation is based on the characters,word matching,and vector space model.However,the study of the similarity based on the semantic structure of sentences is still rare.In this paper, with the semantic description advantage of Chinese FrameNet,We proposed a new method of similarity calculation oriented EBMT.This method is mainly based on the CFN from the overall structure of the sentence and the internal of the semantic block to measure the similarity between two sentences,then the convex combination of the results of these two Similarities is considered to be the similarity between Sentence to be translated and the candidate example.The experimental results show that compared with traditional methods the method proposed in this paper is effective.

作者杨立波

机构地区太原大学计算机工程系

出处《电脑开发与应用》 2011年第6期58-60,共3页 Computer Development & Applications

关键词相似度实例机器翻译汉语框架网框架语义 similarity example based machine translation chinese frameNet frame semantic

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献5

1Yuan S T, 0002 J S. Ontology-based Structured Cosine Similarity in Document Summarization : With Applications to Mobile Audio-based Knowledge Management [J]. IEEE Transactions on Systems, Man, and Cybernetics, Part B, 2005, 35 (5), 1028- 1040. 被引量：1
2Maedche A, Staab S. Measuring Similarity Between Ontologies[Z]. EKAW, 2002 : 251-263. 被引量：1
3Vitanyi M L C L. The Similarity Metric[J].IEEE Transactions on Information Theory, 2004, 50 (12) : 3250-3264. 被引量：1
4荀恩东,颜伟.基于语义网计算英语词语相似度[J].情报学报,2006,25(1):43-48. 被引量：41
5车万翔,刘挺,秦兵,等.面向双语句对检索的汉语句子相似度计算[C]//全国第七届计算语言学联合学术会议论文集.北京:清华大学出版社,2003:81-88. 被引量：6

二级参考文献10

1George A.Miller,Richard Beckwith,Christiane Fellbaum,Derek Gross,and Katherine Miller.Introduction to WordNet:An On-line Lexical Database[EB].Cognitive Science Laboratory,Princeton University,1993.51 ～ 57 被引量：1
2关毅,王晓龙.基于统计的汉语词汇间语义相似度计算.语言计算与基于内容的文本处理,清华大学出版社,2003.221～227 被引量：2
3Rada R.etc.Development and application of a metric on semantic nets.IEEE Transactions on System,Man and Cybernetics,1989 被引量：1
4Lee J.H.etc.Information retrieval based on conceptual distance in ISA hierarchies.Journal of Documentation,1993(49) 被引量：1
5Agirre E.and Rigau G..A proposal for word sense disambiguation using conceptual distance.In:International Conference "Recent Advances in Natural Language Processing"RANLP'95,Tzigov Chark,Bulgaria,1995.91 ～ 98 被引量：1
6P.Brown etc.Word sense disambiguation using tactical methods.In:Proceedings of 29th Meeting of the Association for Computational Linguistics (ACL-91),1991.201 ～ 207 被引量：1
7Lillian Lee.Similarity-Based Approaches to Natural Language Processing:[Ph.D.Thesis].Harvard University Technical Report TR-11-97 被引量：1
8刘群李素建.基于《知网》的词汇语义相似度计算[A]..Computational Linguistics and Language Processing[C].,2002.7.2:59-76. 被引量：11
9于江生,俞士汶.中文概念词典的结构[J].中文信息学报,2002,16(4):12-20. 被引量：67
10胡俊峰,俞士汶.唐宋诗中词汇语义相似度的统计分析及应用[J].中文信息学报,2002,16(4):39-44. 被引量：43

共引文献45

1钟冬,朱怡安,王云岚.一种新的基于隐式经验的服务发现模型[J].西北工业大学学报,2009,27(1):71-76.
2谌志群,周其力.基于综合语义的XML文档相似度计算方法[J].杭州电子科技大学学报（自然科学版）,2009,29(3):64-67.
3秦春秀,赵捧未,刘怀亮.词语相似度计算研究[J].情报理论与实践,2007,30(1):105-108. 被引量：30
4周文,徐国梁.翻译记忆中语句相似度计算方法的研究[J].计算机应用,2007,27(5):1210-1213. 被引量：6
5徐丽平,张俊卿,姜利群,赵亮.基于知识库的知识发现的研究[J].计算机工程与设计,2008,29(10):2689-2691. 被引量：10
6裘江南,罗志成,王延章.基于中文语义词典的语义相关度方法比较研究[J].情报理论与实践,2008,31(5):715-719. 被引量：5
7林丽,薛方,任仲晟.一种改进的基于《知网》的词语相似度计算方法[J].计算机应用,2009,29(1):217-220. 被引量：26
8李星毅,曾路平,施化吉.基于单词相似度的文本聚类[J].计算机工程与设计,2009,30(8):1966-1968. 被引量：9
9宋锐,林鸿飞.基于文档语义图的中文多文档摘要生成机制[J].中文信息学报,2009,23(3):110-115. 被引量：6
10车超,滕弘飞.伪实例与人工标注实例相结合的词义消歧方法[J].中文信息学报,2009,23(6):31-38. 被引量：1

同被引文献2

1龚成清.基于Java的相似图片搜索[J].电脑开发与应用,2012,25(10):13-15. 被引量：3
2张猛,李玲娟.基于改进的Jaccard相似系数矩阵的社团划分算法[J].南京邮电大学学报（自然科学版）,2018,38(6):96-102. 被引量：12

引证文献1

1鲜翠琼,秦学,朱道恒,操淑敏.一种图文组合相似度算法的设计与优化[J].软件工程,2020,23(8):9-12. 被引量：5

二级引证文献5

1王征强.大比例尺数字测图精度与测距长度之关系浅析[J].测绘通报,2000(4):32-33. 被引量：10
2于强,徐志栋,时斌,魏伟,任鹏程.基于事理知识图谱的舆情推演方法[J].计算机系统应用,2021,30(4):25-31. 被引量：2
3王钰宁,刘晓霞,周绍军.基于相似度估计文档重复率检测算法研究[J].电子测试,2021,32(14):40-42.
4张鑫,王竞雪,刘肃艳,高嵩.基于可靠匹配点约束的遥感影像密集匹配[J].地球信息科学学报,2021,23(8):1508-1523. 被引量：3
5杨钊,马艳霞,张玮琪.组合相似度算法与知识图谱在电网数字化项目统筹中的应用研究[J].电力信息与通信技术,2023,21(3):41-46. 被引量：2

1杨立波.基于CFN的相似度计算方法[J].太原大学学报,2011,12(1):111-113.
2李茹,宋小香,王文晶.基于汉语框架网的中文问题分类[J].计算机工程与应用,2009,45(31):111-114. 被引量：8
3徐启菊.基于CFN的家庭医生问答系统设计[J].商,2013,0(20):211-212.
4王爽,熊德兰,王晓霞.基于实例的古文机器翻译设计与实现[J].许昌学院学报,2009,28(5):88-91. 被引量：6
5刘开瑛.汉语框架语义网构建及其应用技术研究[J].中文信息学报,2011,25(6):46-52. 被引量：23
6王文晶,李茹.基于汉语框架网的问句分析及本体知识库推理[J].电脑开发与应用,2011,24(9):12-14.
7袁冬,熊晶,刘永革.面向甲骨文的实例机器翻译技术研究[J].现代图书情报技术,2012(5):48-54. 被引量：8
8李茹,王文晶,梁吉业,宋小香,刘海静,由丽萍.基于汉语框架网的旅游信息问答系统设计[J].中文信息学报,2009,23(2):34-40. 被引量：14
9王文晶,宋小香,李茹.面向问题分类的汉语框架网特征选择[J].计算机与现代化,2011(8):9-12.
10由丽萍,杨翠.汉语框架语义知识库概述[J].电脑开发与应用,2007,20(6):2-4. 被引量：8

电脑开发与应用

2011年第6期

浏览历史

内容加载中请稍等...

基于CFN的相似度计算在实例机器翻译中的应用被引量：1

参考文献5

二级参考文献10

共引文献45

同被引文献2

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于CFN的相似度计算在实例机器翻译中的应用 被引量：1

参考文献5

二级参考文献10

共引文献45

同被引文献2

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于CFN的相似度计算在实例机器翻译中的应用被引量：1