-
题名共词聚类分析法中的主要问题与对策
被引量:33
- 1
-
-
作者
李佳
-
机构
广东医学院图书馆
-
出处
《情报学报》
CSSCI
北大核心
2010年第4期614-617,共4页
-
文摘
共词聚类分析法通过聚类运算的方式对学科主题词进行划分,从而实现对学科结构的分析研究。聚类运算的结果,通常能把共现频次高的词聚在一起,而学科内主题词的分布与词的共现关系并不完全正向相关,因此,聚类运算的原理不完全符合学科研究点主题词分布的方式,是共词聚类分析法中的主要问题,并由此造成共词聚类分析存在许多不足的地方,主要表现在:聚类不稳定、聚类不完整、成员划分不合理以及容易造成没有意义类团的出现。问题的对策是:改进聚类算法、改变聚类策略、类团的弹性划分以及对结果的创新分析能有效弥补聚类算法的不足。
-
关键词
共词分析
类团分析
核心词
问题与对策
-
Keywords
co-word analysis
clustered-words analysis
core word
problem and countermeasure
-
分类号
G254.2
[文化科学—图书馆学]
-
-
题名汉英中型语文词典义项精细度对比研究
被引量:11
- 2
-
-
作者
李仕春
-
机构
西南大学文学院
-
出处
《长江学术》
2016年第3期122-128,共7页
-
基金
国家社会科学基金重点项目"语料库视野下的现代汉语单音多义词义项分布研究"(14AYY018)
西南大学中央高校基本业务费专项资金创新团队项目(SWU1609105)
西南大学科研基金人才引进项目(SWU1509502)
-
文摘
与英语类中型语文词典相比,汉语类中型语文词典中100核心词的义项精细度过于粗疏,出现这种情况的主要原因在于,长期以来中国词典的编纂者乃至研究现代汉语词汇的学者忽视了用语料库技术的方法研究现代汉语100核心词乃至更多常用词的义项分布,从而导致汉语词典中常用词的义项存在收录不全的情况。
-
关键词
语料库
核心词
义项分布
-
Keywords
Corpus
core word
the Distribution of Senses
-
分类号
H164
[语言文字—汉语]
-
-
题名汉英词典100核心词释义对比研究
被引量:9
- 3
-
-
作者
李仕春
-
机构
广西大学文学院
-
出处
《中南大学学报(社会科学版)》
CSSCI
2013年第6期252-258,共7页
-
基金
广西大学"211四期区域文化传承创新与交流学科群"研究项目(211QYWH13Z04)
-
文摘
文章认为判定不同国家的词典是否属于同类词典的标准有三条:词典性质、词典收词、词典释义。根据上述标准,文章认定《现汉》《牛津》《韦氏》等汉英词典都是中型语文性词典,在此基础上,对这些词典中100核心词的义项数目及其分布做了简要对比,认为与《牛津》《韦氏》等英语词典相比,《现汉》等汉语词典在100核心词的义项划分方面比较粗疏。最后,文章从语料库技术、词典的编纂历史以及语言学理论等三方面,分析了中国词典100核心词义项划分粗疏的原因。
-
关键词
语料库
《现代汉语词典》(第6版)
核心词
义项分布
-
Keywords
Corpus
the 6th Edition of the Contemporary Chinese Dictionary
core word
the distribution of meaning item
-
分类号
H164
[语言文字—汉语]
-
-
题名汉英词典100核心词义项分布研究
被引量:7
- 4
-
-
作者
李仕春
-
机构
广西大学
-
出处
《北华大学学报(社会科学版)》
2013年第6期9-15,共7页
-
文摘
在认定《现汉》《牛津》《韦氏》等汉英词典是同类词典的基础上,对这些词典中100核心词的义项数目及其分布进行简要对比,发现与《牛津》《韦氏》等英语词典相比,《现汉》等汉语词典在核心词的义项划分方面比较粗疏。
-
关键词
语料库
核心词
义项分布
-
Keywords
Corpus
core word
Distribution of meaning item
-
分类号
H164
[语言文字—汉语]
-
-
题名汉语核心词“畀”研究
被引量:5
- 5
-
-
作者
黄树先
-
机构
华中科技大学中国语言研究所
-
出处
《语言研究》
CSSCI
北大核心
2008年第1期45-59,共15页
-
文摘
最近几年,我们在进行历史比较时,采用"三级比较法"。所谓"三级比较法",是依据被比较语言的语义,建立一个语义场;在这个语义场之下,再系联同族词;同族词里,再拿单个的字词进行比较。这种研究的思路,简单来说就是"语义场-词族-词"的比较模式。本文主要通过汉语词族的变化,结合汉藏语言来探讨汉语"畀"义场早期的语音面貌,探讨其形态变化。
-
关键词
三级比较
核心词
历史比较
畀
-
Keywords
three-stage comparative method
core word
historical comparative research
Bi(畀)
-
分类号
H131
[语言文字—汉语]
-
-
题名基于舆情新闻的中文关键词抽取综述
被引量:6
- 6
-
-
作者
杨文忠
丁甜甜
康鹏
卜文秀
-
机构
新疆大学信息科学与工程学院
新疆大学
-
出处
《计算机工程》
CAS
CSCD
北大核心
2023年第3期1-17,共17页
-
基金
国家自然科学基金(U1603115,62262065)
国家重点研发计划子课题(2017YFC0820702-3)
+2 种基金
新疆维吾尔自治区重点科技专项(2020A02001-1)
四川省区域创新合作项目(2020YFQ0018)
新疆维吾尔自治区自然科学基金(2021D01C080)。
-
文摘
基于舆情事件的关键词抽取算法作为舆情监测的基础技术之一,其目的是在不同的舆情事件中抽取出人们关注的核心词汇,从而快速了解新闻内容。随着深度学习的发展,传统的无监督关键词抽取技术和有监督算法中的分类模型已经逐渐被基于深度学习的序列标注模型所替代。梳理无监督关键词抽取的限制性、分类模型在关键词抽取中的优势与不足、以及现有的深度学习对关键词抽取技术发展的帮助,重点分析整体关键词抽取技术的发展中卷积神经网络、循环神经网络等深度学习的关键词抽取方法,并归纳现有方法的优缺点与发展趋势。此外,深度学习虽然在关键词抽取领域发挥了重要的作用,但其自身也存在着依赖大规模带标签样本、训练时间长与复杂度高等缺陷,需要在未来发展中进行解决。为确保分析过程的真实性,利用6个舆情新闻数据集和2个小型数据集进行实验复现,实验结果与文中理论分析一致。在此基础上,对关键词抽取技术及其所面临的困难和挑战进行梳理和分析,并针对现存问题对该领域的发展前景加以展望。
-
关键词
舆情监测
关键词抽取
核心词汇
深度学习
自然语言处理
-
Keywords
opinion monitoring
keyword extraction
core word
deep learning
Natural Language Processing(NLP)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名从核心词替换微观个案看词阶法
- 7
-
-
作者
余德江
-
机构
北京大学中文系
-
出处
《当代语言学》
CSSCI
北大核心
2024年第3期418-437,共20页
-
基金
国家社科基金重大项目“我国民族音乐文化与语言数据集成及共演化研究”(22&ZD218)资助。
-
文摘
词阶法作为语源关系判断的一种方法,其理论基础可以通过观察词汇替换微观个案予以补充和检验。在由语言接触引发核心词替换的骑马坝傣语个案中,200核心词替换过程严格符合高阶少于低阶的分布模式,符合词阶法的理论假设;hihi-lolo词表和基于雅加达-莱比锡词表的改编词表等替换过程出现了较多例外,可能不宜应用到词阶法中。通过对观测数据进行曲线拟合,我们认为语言接触引发的核心词替换过程并不是匀速、渐变的,而是非匀速、突变的。拟合曲线和语言使用情况在对比验证中呈现出较强的关联性,整体上反映了语言接触情形的变化。我们通过模拟的方法将200核心词表与hihi-lolo等词表进行比较,发现200核心词表更能反映接触信息,更适合被应用到词阶法中。
-
关键词
核心词
词阶法
语言接触
语言转用
-
Keywords
core word
rank analysis
language contact
language shift
-
分类号
H146
[语言文字—汉语]
-
-
题名中学英语词汇教学存在的问题及其对策(英文)
被引量:1
- 8
-
-
作者
曾泽怀
-
出处
《广东教育(教研版)》
2006年第7期57-59,21,共4页
-
文摘
本文讨论了当前中学英语词汇教学中普遍存在的问题, 即过分强调学生死记硬背单词的读音、词形和字典意义, 而忽略了词汇的搭配、用法、实际含义和语法特征,忽略了语境在词汇学习中的重要性, 导致学生对许多单词只会记而不会用, 一用就错漏百出, 给英语学习造成障碍, 也给考试质量带来很大的负面影响。词汇关是英语学习中最关键的一关, 而这种强调死记硬背的词汇教学方法使许多学生对英语单词望而生畏, 因此解决这一问题可以说是英语教学需要突破的瓶颈。作者通过分析产生这一问题的原因, 引述国内外有关英语词汇教学的理论著作, 结合我国学生急于求成、词汇运用能力低下和缺乏学习兴趣的现象, 提出教师首先要充分利用常规课堂教学的阵地,帮助学生掌握基本词汇的用法和自主学习的技巧, 如猜词、查词典、词义联想等策略, 通过课堂活动、校园英语角、英语晚会等, 让学生拥有学习和运用英语的基本能力,并引导学生结合自己的兴趣, 多渠道增加阅读量和泛听量, 如听英文歌曲和英语新闻、看英语电影和电视节目、读简易读物等, 使学生通过多听、多说、多读、多写和多练来习得词汇。
-
关键词
英语词汇教学
教学存在
中学
词汇教学方法
词汇运用能力
词汇学习
英语学习
语法特征
-
Keywords
receptive word, productive word, intentional learning, incidental learning, vocabulary learningstrategy, core word
-
分类号
G42
[文化科学—课程与教学论]
-
-
题名黎语指示代词比较研究
被引量:2
- 9
-
-
作者
杨遗旗
-
机构
海南师范大学文学院
-
出处
《贵州民族研究》
CSSCI
北大核心
2014年第8期221-225,共5页
-
基金
海南省社科规划资助课题研究成果(课题号:HNSK(Z)13-75)
-
文摘
斯瓦迪士《一百词的修订表》是历史比较语言学研究语源关系的重要依据,其排序的主要依据是词语在社会交际中的重要性和稳定性。指示代词主要用来指代交际双方所涉话题,因此排序紧随人称代词之后。论文对黎语指示代词进行了黎语方言之间、壮侗语族内和壮侗语族外的比较研究。
-
关键词
核心词
代词
同源词
黎语
壮侗语族
-
Keywords
core word
pronoun
paronym
Li language
Zhuang-Dong group
-
分类号
H281
[语言文字—少数民族语言]
-
-
题名黎语核心词“红”
被引量:2
- 10
-
-
作者
李清桓
-
机构
海南师范大学文学院
-
出处
《贵州民族研究》
CSSCI
北大核心
2019年第3期183-188,共6页
-
基金
海南省社科项目"黎语复音词研究"(项目编号:HNSK[YB]17-44)的阶段性成果
-
文摘
黎语词语"红"的读音与意义来源总体上可分为五个类型:(1)■等与侗台语词语"红"■对应;(2)■等与侗台语词语"红"■对应;(3)■"红",从侗台语词语"血"*■引申而来;(4)■与侗台语词语"烧"或"热"*■相对应,但是黎语引申为"红";(5) i:k^7"红"与南岛语词语"红"*iraq相对应,其实此亦是个汉藏南岛语相对应的词。
-
关键词
黎语
红
核心词
-
Keywords
Li Language
red
core word
-
分类号
H281
[语言文字—少数民族语言]
-
-
题名类型学视角英语核心词“父”研究
被引量:1
- 11
-
-
作者
张莉
-
机构
华中科技大学中文系
华中科技大学外语系
-
出处
《萍乡高等专科学校学报》
2012年第2期60-62,共3页
-
文摘
本文通过对英语核心词"父"这个概念的语义场进行历时考察,同时结合印欧语系和汉藏语系的一些语言采用语义类型学的研究方法来讨论"父"的语义之间的联系和演变,试图找出词义演变的普遍规律。
-
关键词
核心词
父
语义演变
类型学
-
Keywords
core word
father
semantic change
typology
-
分类号
D621.5
[政治法律—政治学]
-
-
题名《汉书》中“胸”的语义场
- 12
-
-
作者
郭玲玲
-
机构
华中科技大学中文系
-
出处
《贵州民族学院学报(哲学社会科学版)》
2012年第3期96-100,共5页
-
文摘
《汉书》中的"胸"语义场有"乳、榖、重、胸(匈)、膺、臆、心"等词。这些词在义项和语法功能上,有的发生了一些变化,有的则渐趋隐没。
-
关键词
汉书
胸
核心词
-
Keywords
Book of Han
chest
core word
-
分类号
H030
[语言文字—语言学]
-
-
题名两个“烧结”一个也不能少
- 13
-
-
作者
邹志强
-
机构
中南大学粉末冶金研究院
-
出处
《中国科技术语》
2010年第1期51-54,共4页
-
文摘
"烧结"在矿物工程和粉末冶金两个学科领域都是核心名词,尽管两类烧结都是通过高温改变物料的凝聚状态,但已分别被赋予了互不相同的内涵,存在着一系列本质上的差别,不能相互取代。在汇编冶金学基本名词时,两个"烧结"应该分别列出,一个也不能少。
-
关键词
烧结
矿物工程
粉末冶金
核心名词
-
Keywords
sintering, mineral engineering, powder metallurgy, core word
-
分类号
TF046.4
[冶金工程—冶金物理化学]
-
-
题名土家语的“土”与“地”
- 14
-
-
作者
熊英
-
机构
中南民族大学文学与新闻传播学院
-
出处
《语言研究》
CSSCI
北大核心
2021年第2期118-122,共5页
-
基金
国家社会科学基金青年项目“土家语基本词研究”(13CYY078)。
-
文摘
zo55、li55"土、地"是土家语的核心基本词,可以与汉语、藏缅语、侗台语进行比较。zo55、li55"土,地"与汉藏语系诸多语言有着广泛的对应关系,与藏缅语族缅彝语支语源关系最近。
-
关键词
土家语
核心词
“土”
“地”
-
Keywords
Tujia(土家)Language
core word
Tu(土)
Di(地)
-
分类号
H211
[语言文字—少数民族语言]
-
-
题名论翻译的宏观分析
- 15
-
-
作者
吕兴师
李冬梅
-
机构
丹东职业技术学院公外一部
辽宁财政高等专科学校
-
出处
《辽宁财专学报》
2001年第5期50-52,共3页
-
文摘
宏观分析是翻译的起点 ,也是基本的翻译方法。本文阐述了利用这种方法 ,在翻译时确定句子的性质。逐一找出全句中各部分的关系之后再进行翻译 ,使译文准确无误。
-
关键词
宏观分析
核心词
结构
翻译
日语
-
Keywords
macro-analysis
core word
structure
-
分类号
H365.9
[语言文字—日语]
-
-
题名英语核心词“尘”研究
- 16
-
-
作者
张莉
-
机构
华中科技大学中文系
华中科技大学外国语学院
-
出处
《科教文汇》
2012年第14期139-139,141,共2页
-
文摘
本文通过对英语核心词"尘"这个概念的语义场进行历时考察,同时结合印欧语系和汉藏语系的一些语言采用语义类型学的研究方法来讨论"尘"的语义之间的联系和演变,试图找出词义演变的普遍规律。
-
关键词
核心词
尘
语义演变
类型学
-
Keywords
core word
dust
semantic change
typology
-
分类号
H319
[语言文字—英语]
-
-
题名西汉“目”的语义场研究
- 17
-
-
作者
吴宝安
-
机构
湖北大学文学院
-
出处
《语言历史论丛》
2015年第1期271-282,共12页
-
基金
2013年湖北省教育厅青年项目“上古(先秦——西汉)核心动词语义场演变研究(13q010)”的资助.
-
文摘
西汉与“目”有关的词共10个,其中最重要的是“眼、目”。一般认为,上古“眼、目”有语义上的分工,“眼”指眼珠,“目”指眼睛。我们发现,“眼、目”在上古即是同义词,都有“眼睛和眼珠”义。西汉文献中,表示“眼珠”的词另有6个:眸、瞳、?(卢)、睛(精)、眹、?。“眼、目”同义,“眼珠”另有专词,正是“眼”能取代“目”成为“眼睛”语义场代表词的条件。
-
关键词
语义场
眼
目
核心词
-
Keywords
semantic field
eye
eyeball
core word
-
分类号
H131
[语言文字—汉语]
-
-
题名《后汉书》中核心词“我”初探
- 18
-
-
作者
施真珍
-
机构
华中科技大学人文学院
-
出处
《贵州民族学院学报(哲学社会科学版)》
2008年第1期134-137,共4页
-
文摘
本文从核心词的角度讨论了《后汉书》中的"我"的早期形式,比较了表示"我"义的这组词的异同,并简单勾勒了其发展演变。
-
关键词
后汉书
核心词
我
-
Keywords
The Post-Han Dynasty Book
core word
"I"
-
分类号
H146.1
[语言文字—汉语]
-
-
题名俄英语言意识核心词对比研究
- 19
-
-
作者
武利茹
-
机构
长春大学外国语学院
-
出处
《长春大学学报》
2007年第11期41-43,共3页
-
基金
吉林省教育厅高校人文社会科学研究项目(吉教科文合字2005第51号)
-
文摘
语言意识是人们对于语言本质以及语言在人类生活中所起作用的敏感和自觉的意识,是词、词组、句子、篇章以及联想等形成的意识形式的总和。从言语结构角度及取向角度对俄英语言意识核心词进行了对比分析,揭示了俄英语不同的文化内涵。
-
关键词
语言意识
核心词
对比
-
Keywords
linguistic consciousness
core word
antithesis
-
分类号
H35
[语言文字—俄语]
-
-
题名基于组块的核心词无监督提取方法
- 20
-
-
作者
杨陈菊
孙俊
邵玉斌
龙华
皮乾东
-
机构
昆明理工大学信息工程与自动化学院
-
出处
《电子测量技术》
2020年第22期88-92,共5页
-
基金
国家自然科学基金(61761025)项目资助。
-
文摘
为了从中文组块中提取出核心词,结合组块核心词识别的3个有效因素,包括词语相似度信息、位置信息和词性信息,提出了一种基于TextRank的无监督的组块核心词提取方法。该方法分别给3个有效因素分配权值,从而改进TextRank关键词提取方法;然后递归地计算图中的概率转移矩阵,并且求出组块中每个词对应的重要度的值;最后把最高的重要度值对应的词语作为最终的核心词。在宾州中文树库(CTB8.0)中采集的8 126个组块数据上进行了人工标记和实验。在实验中,对传统经典算法和所提方法进行了比较,结果表明同时考虑3个有效因素的方法稳定性好,总体识别率最高。所提方法对组块核心词的提取效果好,验证了模型的有效性。
-
关键词
组块
核心词
无监督
TextRank
-
Keywords
chunk
core word
non-supervision
TextRank
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-