基于术语原形化的英文同义词群构建方法研究被引量：2

Research on the Synset Construction Method Based on Term Normalization

下载PDF

导出

摘要介绍了词干提取和词形还原两种词形规范方式以及基于规则和基于词典的两种词形规范实现方法,阐述了基于术语原形化的同义词群构建的基本原理,同时对术语原形化的基本处理方式、通过单词字顺排序构建同义词群以及原形化过程中的排序和词性等问题进行了分析和论述,最后指出对缩略语需进行特殊处理,并针对原形化方法的不足之处提出辅以人工判断和其他同义词获取方法的必要性。 This article introduces two ways of normalization, Stemming and Lemmatization, and also the rule-based and dictionary-based implementation methods. It also expounds the basic principles of the synset construction method based on term normalization, and then makes an analysis and discussion on its basic approach, synset construction method using alphabetical sorting of words and the problems of sorting and parts of speech. Finally it proposes the necessity to pay attention to acronyms and to assist with human judgment and other syn-set construction methods with regard to the inadequacies of the synset construction method based on term normalization.

作者张冰常春

机构地区中国科学技术信息研究所

出处《情报杂志》 CSSCI 北大核心 2014年第7期171-175,共5页 Journal of Intelligence

基金国家社会科学基金资助项目“网络环境下叙词表的编制模式与应用方式研究”(编号:10BTQ048)的研究成果之一

关键词同义词群构建术语原形化叙词表词形还原词干提取缩略语 construction of synset term normalization thesaurus lemmatization stemming acronym

分类号 G254.24 [文化科学—图书馆学]

引文网络
相关文献

参考文献16

1常春,曾建勋,吴雯娜,张鹏.叙词表词间关系合并方法研究[J].情报杂志,2010,29(12):117-120. 被引量：5
2马张华编著..信息组织[M].北京:清华大学出版社,2001:315.
3Oliveira H G, Gomes P. Automatic Discovery of Fuzzy Synsets from Dictionary Definitions [ C] //Proceedings of the Twenty -Second international joint conference on Artificial Intelligence -Volume Volume Three. AAAI Press, 2011 : 1801-1806. 被引量：1
4李芳,陈颖,侯丽,冀玉静.RxNorm多词表语义互操作机制研究[J].数字图书馆论坛,2012(12):64-70. 被引量：5
5宋培彦,袁旭.基于词形模糊归并的英文同义关系发现研究[J].数字图书馆论坛,2012(12):53-57. 被引量：2
6李晓瑛,李丹亚,胡铁军.基于UMLS专家词典与工具的词形归并算法研究[J].情报科学,2013,31(4):134-138. 被引量：3
7Jacob Perkins. Python Text Processing with NLTK 2. 0 Cook-bookfM]. Birmingham: Packt Publishing,2010:25-30. 被引量：1
8韩普,王东波,路高飞.Stemming和Lemmatization对英文文本聚类的影响研究[J].情报理论与实践,2012,35(7):109-113. 被引量：2
9Lexical Tools[EB/OL]. [2014-02-23]. http://lexsrv3. nlm, nih. gov/LexSysGroup/Projects/lvg/current/web/index, html. 被引量：1
10李丹亚,胡铁军,李亚子,李晓瑛,孙海霞,李军莲,钱庆.UMLS多词表整合机制研究[J].数字图书馆论坛,2012(4):28-36. 被引量：15

二级参考文献107

1周钦强,孙炳达,王义.文本自动分类系统文本预处理方法的研究[J].计算机应用研究,2005,22(2):85-86. 被引量：15
2顾益军,樊孝忠,王建华,汪涛,黄维金.中文停用词表的自动选取[J].北京理工大学学报,2005,25(4):337-340. 被引量：35
3罗杰,陈力,夏德麟,王凯.基于新的关键词提取方法的快速文本分类系统[J].计算机应用研究,2006,23(4):32-34. 被引量：17
4史俊.英语同义词聚合的语义差别分析及其教学[J].浙江理工大学学报（自然科学版）,2006,23(4):540-544. 被引量：1
5陆勇,侯汉清.基于模式匹配的汉语同义词自动识别[J].情报学报,2006,25(6):720-724. 被引量：21
6王昊.基于层次模式匹配的命名实体识别模型[J].现代图书情报技术,2007(5):62-68. 被引量：8
7熊文新,宋柔.信息检索用户查询语句的停用词过滤[J].计算机工程,2007,33(6):195-197. 被引量：16
8国家图书馆《中国图书馆分类法》编辑委员会.中图分类主题词表(第二版)[M].北京:北京图书馆出版社,2005. 被引量：1
9马张华.信息组织[M].北京:清华大学出版社,2009. 被引量：1
10农业部情报研究所.农业科学叙词表[M].中国农业出版社,1994. 被引量：1

共引文献75

1雷刚,冷荣秋,林思扬.一种计算机领域英汉双语语料库平台的构建[J].科技广场,2009(9):132-135.
2江耿豪.基于FAQ的自动答疑系统的设计与实现[J].计算机时代,2009(12):39-41. 被引量：4
3江耿豪.基于VisualProlog的自动答疑系统设计与实现[J].现代教育技术,2010,20(7):122-125. 被引量：3
4程肖,陆蓓,谌志群.热点主题词提取方法研究[J].现代图书情报技术,2010(10):43-48. 被引量：5
5巩政,关高娃.蒙古文停用词和英文停用词比较研究[J].中文信息学报,2011,25(4):35-38. 被引量：6
6刘里,刘小明.基于分隔符和上下文术语的领域现象术语抽取[J].华南理工大学学报（自然科学版）,2011,39(7):146-149. 被引量：6
7郑炜冬,江耿豪.网络答疑系统的研究、设计与实现[J].中国现代教育装备,2012(3):36-38. 被引量：2
8李丹亚,李军莲,李晓瑛,夏光辉,胡铁军.医学知识组织体系发展现状及研究重点[J].数字图书馆论坛,2012(12):12-20. 被引量：6
9宋培彦,袁旭.基于词形模糊归并的英文同义关系发现研究[J].数字图书馆论坛,2012(12):53-57. 被引量：2
10张寿华,刘振鹏.网络舆情热点话题聚类方法研究[J].小型微型计算机系统,2013,34(3):471-474. 被引量：25

同被引文献25

1李荣,杨冬,刘磊.基于本体的概念相似度计算方法研究[J].计算机研究与发展,2011,48(S3):312-317. 被引量：12
2杜慧平,何琳,侯汉清.基于聚类分析的自然语言叙词表的自动构建[J].国家图书馆学刊,2007,16(3):44-49. 被引量：12
3赖院根,吴雯娜.基于叙词表的概念语义相似度计算[J].图书情报工作,2009,53(8):21-24. 被引量：9
4陈建超,郑启伦,李庆阳,严桂夺.基于特征词关联性的同义词集挖掘算法[J].计算机应用研究,2009,26(7):2517-2519. 被引量：10
5薛春香,乔晓东,朱礼军.KOS互操作中的术语映射研究综述[J].现代图书情报技术,2010(2):31-37. 被引量：13
6常春,曾建勋,吴雯娜,张鹏.叙词表词间关系合并方法研究[J].情报杂志,2010,29(12):117-120. 被引量：5
7常春,赖院根.专业概念机器辅助分类方法研究[J].现代图书情报技术,2011(10):34-39. 被引量：4
8常春,赖院根.数字环境下通用概念获取方法[J].图书情报工作,2011,55(22):22-25. 被引量：9
9吴雯娜,王星.叙词表融合方法研究[J].中国图书馆学报,2012,38(4):110-118. 被引量：7
10吴思竹,钱庆,胡铁军,李丹亚,李军莲,洪娜.词干提取方法及工具的对比分析研究[J].图书情报工作,2012,56(15):109-115. 被引量：13

引证文献2

1刘伟,吴雯娜,王星.叙词表等同概念映射研究[J].数字图书馆论坛,2018(8):20-24. 被引量：2
2常春,杨婧,李永泽.知识组织生态系统构架形成与研究进展[J].图书情报工作,2019,63(7):146-150. 被引量：5

二级引证文献7

1温斌斌,常春.基于生态翻译学的叙词表术语翻译研究[J].中华医学图书情报杂志,2019,28(2):50-54. 被引量：2
2储节旺,夏莉.国内知识生态系统研究述评[J].情报科学,2021,39(8):184-192. 被引量：11
3刘志国,赵莹,陈威莉,刘蕾.图书馆空间服务的认知定位与作用机理研究[J].山东图书馆学刊,2021(5):62-68. 被引量：1
4李凌宇,常春.基于生态学边缘效应的叙词表交叉概念多样性研究[J].情报杂志,2022,41(6):142-147.
5苏新宁.面向知识服务的领域知识组织纵论[J].情报学报,2022,41(9):889-899. 被引量：12
6郑影,常春.食物链能量流动递减视角下叙词表概念相关性研究[J].中华医学图书情报杂志,2022,31(10):48-55.
7郑影,常春.基于Lotka-Volterra捕食者-猎物模型的概念间相关关系研究[J].中华医学图书情报杂志,2022,31(12):7-13. 被引量：1

1吴思竹,钱庆,胡铁军,李丹亚,李军莲,洪娜.词形还原方法及实现工具比较分析[J].现代图书情报技术,2012(3):27-34. 被引量：12
2杨晓娟.一部分英文图书索书号的特殊处理[J].图书情报通讯,1997(1):32-34.
3孙晓晨.浅谈网络语言传播的弊端及规范方式[J].教育教学论坛,2016(14):48-49. 被引量：2
4尹鸿.网络剧与电视剧的规范方式应该探索同中求异[J].人民周刊,2016(10):56-56.
5吴思竹,钱庆,胡铁军,李丹亚,李军莲,洪娜.词干提取方法及工具的对比分析研究[J].图书情报工作,2012,56(15):109-115. 被引量：13
6马正伟.数字图书馆建设策略研究[J].中国经贸,2016,0(24):89-89.
7赵越.事件词:新词语家族中的重要成员[J].语文学刊（基础教育版）,2009(9):168-169.
8李晓瑛,李丹亚,钱庆,孙海霞,李军莲,胡铁军.面向知识组织系统整合的英文同义关系自动发现算法研究[J].现代图书情报技术,2014(5):26-32. 被引量：7
9赵岩,陈秉林.新闻导语刍议——从报纸大战谈起[J].当代劳模,1995,0(6):16-16.
10本刊编辑部.“其他”与“其它”的区别[J].广东电力,2009,22(6):9-9.

情报杂志

2014年第7期

浏览历史

内容加载中请稍等...

基于术语原形化的英文同义词群构建方法研究被引量：2

参考文献16

二级参考文献107

共引文献75

同被引文献25

引证文献2

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于术语原形化的英文同义词群构建方法研究 被引量：2

参考文献16

二级参考文献107

共引文献75

同被引文献25

引证文献2

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于术语原形化的英文同义词群构建方法研究被引量：2