期刊文献+
共找到104篇文章
< 1 2 6 >
每页显示 20 50 100
消解中文三字长交集型分词歧义的算法 被引量:22
1
作者 孙茂松 左正平 黄昌宁 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 1999年第5期101-103,共3页
汉语自动分词在中文信息处理现实应用中占据着十分重要的位置。三字长交集型分词歧义是分词歧义的主要类型之一,在真实文本中的出现频率相当高。提出了一种针对这种分词歧义的消解算法,回避了训练代价比较高昂的词性信息而仅仅利用了... 汉语自动分词在中文信息处理现实应用中占据着十分重要的位置。三字长交集型分词歧义是分词歧义的主要类型之一,在真实文本中的出现频率相当高。提出了一种针对这种分词歧义的消解算法,回避了训练代价比较高昂的词性信息而仅仅利用了词的概率信息及某些具有特定性质的常用字集合。从一个60万字的汉语语料库中抽取出全部不同的三字长交集型分词歧义共5367个作为测试样本。实验结果表明,该算法的消解正确率达到了92.07%,基本可以满足实用型中文信息处理系统的需要。 展开更多
关键词 中文信息处理 交集型分词歧义 消解算法
原文传递
计算语言学的历史回顾与现状分析 被引量:41
2
作者 冯志伟 《外国语》 CSSCI 北大核心 2011年第1期9-17,共9页
本文简要介绍了计算语言学的发展历程,总结了计算语言学中形式模型研究的成果,并分析了当前计算语言学发展的四个特点。
关键词 计算语言学 机器翻译 形式模型 语料库 战略转移
原文传递
系统功能语言学近况 被引量:23
3
作者 胡壮麟 《外国语》 CSSCI 北大核心 1998年第1期2-6,共5页
本文根据密克·奥唐纳尔(MickODonnel)在国际互联网上所提供的有关国际系统功能语言学派活动的材料整理。内容包括对系统功能语言学理论框架的一些新的阐述,系统语言学与计算语言学的结合、研究方向和当前水平,图... 本文根据密克·奥唐纳尔(MickODonnel)在国际互联网上所提供的有关国际系统功能语言学派活动的材料整理。内容包括对系统功能语言学理论框架的一些新的阐述,系统语言学与计算语言学的结合、研究方向和当前水平,图书资料检索和动态信息,以及国际会议、地区会议和定期学术活动。 展开更多
关键词 系统功能语言学 计算语言学 语篇生成 语篇分析
原文传递
语言网络:隐喻,还是利器? 被引量:23
4
作者 刘海涛 《浙江大学学报(人文社会科学版)》 CSSCI 北大核心 2011年第2期169-180,共12页
语言不仅是一种网络,更是一种复杂网络。由于缺乏适宜的研究手段,语言的网络观大多只是一种隐喻,复杂网络研究方法的出现使对语言网络进行大规模实证性研究成为可能。在构造网络的过程中,应该以语言学理论为基础,让复杂网络真正成为语... 语言不仅是一种网络,更是一种复杂网络。由于缺乏适宜的研究手段,语言的网络观大多只是一种隐喻,复杂网络研究方法的出现使对语言网络进行大规模实证性研究成为可能。在构造网络的过程中,应该以语言学理论为基础,让复杂网络真正成为语言研究的利器,而不只是一种隐喻。复杂网络的相关特征不仅可以反映语言的语体与类型特点,也可作为区分语言各个层面结构的手段。复杂网络可发现语言系统与其他自然和社会系统的共性,而社会网络分析方法则可用于挖掘语言网络的个性,将两者结合起来有助于更好地寻求人类语言系统最本质的规律和特性。 展开更多
关键词 语言 网络 复杂网络 语言学 计算语言学 隐喻
下载PDF
中文信息处理60年 被引量:17
5
作者 宗成庆 曹右琦 俞士汶 《语言文字应用》 CSSCI 北大核心 2009年第4期53-61,共9页
本文首先简要回顾中国语文现代化走过的历程、取得的重要成果及其对中文信息处理的影响,然后对汉字信息处理和汉语信息处理的其他工作予以归纳阐述,并对这一领域的学术活动与国际交流情况做简要介绍,最后对中文信息处理所面临的挑战和... 本文首先简要回顾中国语文现代化走过的历程、取得的重要成果及其对中文信息处理的影响,然后对汉字信息处理和汉语信息处理的其他工作予以归纳阐述,并对这一领域的学术活动与国际交流情况做简要介绍,最后对中文信息处理所面临的挑战和未来发展的目标给予粗略的展望。 展开更多
关键词 中文信息处理 自然语言处理 自然语言理解 计算语言学
下载PDF
计算语言学的超学科研究 被引量:22
6
作者 李颖 冯志伟 《现代外语》 CSSCI 北大核心 2015年第3期407-415,439,共9页
在学术领域,学科间融合逐渐成为一种共识,语言学界也在探索超越学科界限的科研创新途径。超学科理念是学科间融合的最高层次,是各学科相互配合与协调的研究方法及教育模式。早在1990年,Halliday就提到,应用语言学的研究重点转向计算语言... 在学术领域,学科间融合逐渐成为一种共识,语言学界也在探索超越学科界限的科研创新途径。超学科理念是学科间融合的最高层次,是各学科相互配合与协调的研究方法及教育模式。早在1990年,Halliday就提到,应用语言学的研究重点转向计算语言学,广义的教育语言学理念也初露端倪。本文就以计算语言学为例,阐述语言学的超学科研究,探讨计算语言学的超学科特征和超学科研究方法。 展开更多
关键词 超学科 计算语言学 基于规则的方法 基于统计的方法 机器学习
原文传递
基于多特征的自适应新词识别 被引量:14
7
作者 罗智勇 宋柔 《北京工业大学学报》 EI CAS CSCD 北大核心 2007年第7期718-725,共8页
为提高自动分词系统对未登录词的识别性能,提出和实现了一种基于多特征的自适应新词识别方法,综合考虑了被处理文本中重复字符串的上下文统计特征(上下文熵)、内部耦合特征(似然比)、背景语料库对比特征(相关频率比值)以及自动分词系统... 为提高自动分词系统对未登录词的识别性能,提出和实现了一种基于多特征的自适应新词识别方法,综合考虑了被处理文本中重复字符串的上下文统计特征(上下文熵)、内部耦合特征(似然比)、背景语料库对比特征(相关频率比值)以及自动分词系统辅助的边界确认信息等,并直接从被抽取文本中自动训练识別模型.同时,新词识别过程在字串PAT-Array数据结构上进行,可以抽取任意长度的新词语.实验结果表明,该方法新词发现速度快、节省存储空间. 展开更多
关键词 自然语言处理系统 计算语言学 词语处理 新词识别 多特征 自适应 自动分词
下载PDF
基于隐Markov模型的汉语词类自动标注的实验研究 被引量:6
8
作者 孙茂松 卢红娜 邹嘉彦 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2000年第9期57-60,共4页
汉语词类自动标注技术在中文信息处理现实应用中占据着十分重要的位置。论文在经过人工分词和词类标注的大规模汉语语料库的支持下 ,通过一系列对比实验 ,对基于隐 Markov模型的汉语词类自动标注算法进行了系统的考察 ,并得出结论 :1Big... 汉语词类自动标注技术在中文信息处理现实应用中占据着十分重要的位置。论文在经过人工分词和词类标注的大规模汉语语料库的支持下 ,通过一系列对比实验 ,对基于隐 Markov模型的汉语词类自动标注算法进行了系统的考察 ,并得出结论 :1Bigram模型的“性能价格比”较 Tri-gram模型更令人满意 ;2以 7万词次左右的标注语料库训练 Bigram模型即已基本够用 (此时 ,兼类词词类标注正确率及文本词类标注正确率分别可达 93%和 97%以上 ) ;3Bi-gram模型对不同领域具有一定的适应性。这些结论对设计实用型汉语词类自动标注系统具有指导意义。 展开更多
关键词 中文信息处理 汉语词类 自动标注 隐马氏模型
原文传递
中文信息处理研究现状分析 被引量:16
9
作者 宗成庆 《语言战略研究》 2016年第6期19-26,共8页
60多年来中文信息处理研究取得了令人瞩目的成就。但是,这一领域也面临问题和挑战。本文在对中文信息处理研究成就简要归纳的基础上,分析这一领域的技术现状,直面存在的问题,并对未来发展的方向提出一些看法。希望本文指出的问题能够引... 60多年来中文信息处理研究取得了令人瞩目的成就。但是,这一领域也面临问题和挑战。本文在对中文信息处理研究成就简要归纳的基础上,分析这一领域的技术现状,直面存在的问题,并对未来发展的方向提出一些看法。希望本文指出的问题能够引起中国国内同行的关注,为未来的中文信息处理研究提供有益的参考。 展开更多
关键词 中文信息处理 自然语言处理 自然语言理解 计算语言学
下载PDF
基于半监督学习算法的虚假评论识别研究 被引量:15
10
作者 任亚峰 姬东鸿 尹兰 《四川大学学报(工程科学版)》 EI CAS CSCD 北大核心 2014年第3期62-69,共8页
已有的虚假评论识别方法主要采用启发式策略或简单特征建模。针对这些方法的不足,提出使用机器学习方法识别虚假评论。首先整合计算语言学与心理语言学的知识对评论文本进行建模,使用全监督学习算法来评价不同特征建模的性能,选出最好... 已有的虚假评论识别方法主要采用启发式策略或简单特征建模。针对这些方法的不足,提出使用机器学习方法识别虚假评论。首先整合计算语言学与心理语言学的知识对评论文本进行建模,使用全监督学习算法来评价不同特征建模的性能,选出最好的特征组合。为了提高识别性能,设计2种半监督学习算法充分利用大量的未标注文本。实验结果证实所提算法超过当前的基准。 展开更多
关键词 机器学习 半监督学习 计算语言学 虚假评论
下载PDF
机器翻译技术的发展及其应用 被引量:9
11
作者 刘群 《术语标准化与信息技术》 2002年第1期27-30,共4页
本文结合一些典型的机器翻译系统,介绍了近年来机器翻译技术的进展情况,探讨了机器翻译技术的发展趋势,最后介绍了目前机器翻译的实际应用情况。
关键词 机器翻译 中文信息处理 计算语言学 自然语言处理 计算机技术
下载PDF
建设综合型语言知识库的理念与成果的价值 被引量:12
12
作者 俞士汶 《中文信息学报》 CSCD 北大核心 2007年第6期3-12,共10页
积20余年之努力与锤炼,北京大学计算语言学研究所完成的一项科研成果"综合型语言知识库"于2007年2月通过了教育部组织的技术鉴定。鉴定结论认为"其规模、深度、质量和应用效果在我国语言工程实践中是前所未有的。该成果... 积20余年之努力与锤炼,北京大学计算语言学研究所完成的一项科研成果"综合型语言知识库"于2007年2月通过了教育部组织的技术鉴定。鉴定结论认为"其规模、深度、质量和应用效果在我国语言工程实践中是前所未有的。该成果是以汉语为核心的多语言知识库建设中最全面、最重要的研究成果,总体上达到了国际领先水平"。本文在介绍以《现代汉语语法信息词典》为基础的综合型语言知识库的规模、构成、内容、品质和发展历程之后,陈述建设综合型语言知识库的理念,期望与读者分享在计算语言学和自然语言处理这一交叉学科领域内治学的心得与研发的经验。同时也对这项成果的应用实例进行分析,评估它的应用潜力,期望它在以汉语为核心的多语言信息处理事业的发展中起到铺路填坑或者投石问路的作用。 展开更多
关键词 计算机应用 中文信息处理 综合型语言知识库 多语言信息处理 计算语言学 自然语言处理 现代汉语语 法信息词典 治学心得
下载PDF
计算语言学中语言知识生产范式的变迁 被引量:5
13
作者 冯志伟 张灯柯 《当代修辞学》 北大核心 2024年第2期23-44,共22页
在计算语言学这门学科的发展过程中,语言知识的生产范式经历了四次大的变迁:基于规则的语言知识生产范式、基于统计的语言知识生产范式、基于深度学习与神经网络的语言知识生产范式、基于生成式人工智能的语言知识生产范式。本文详细地... 在计算语言学这门学科的发展过程中,语言知识的生产范式经历了四次大的变迁:基于规则的语言知识生产范式、基于统计的语言知识生产范式、基于深度学习与神经网络的语言知识生产范式、基于生成式人工智能的语言知识生产范式。本文详细地描述了这些语言知识生产范式的变迁过程。 展开更多
关键词 计算语言学 基于规则的语言知识生产范式 基于统计的语言知识生产范式 基于深度学习与神经网络的语言知识生产范式 基于生成式人工智能的语言知识生产范式
原文传递
中文阅读难度模型及易读性公式探索 被引量:8
14
作者 陈阿林 张素 《计算机科学》 CSCD 北大核心 1999年第11期42-44,27,共4页
1.前言计算机应用已从数据处理开始迈入知识处理、语言理解阶段,人们对计算机的智能提出了新的要求,机器的智能化则对语言文字的处理深度和广度越来越高。利用计算机对汉语基础研究在字、词用语方面取得了相当的成果并进入到对汉语词汇... 1.前言计算机应用已从数据处理开始迈入知识处理、语言理解阶段,人们对计算机的智能提出了新的要求,机器的智能化则对语言文字的处理深度和广度越来越高。利用计算机对汉语基础研究在字、词用语方面取得了相当的成果并进入到对汉语词汇属性、句子的分析,文本、语义等处理。 展开更多
关键词 汉语信息处理 中文阅读难度 易读性公式 计算机
下载PDF
自然语言处理中句群划分及其判定规则研究 被引量:7
15
作者 吴晨 张全 《计算机工程》 CAS CSCD 北大核心 2007年第4期157-159,共3页
在自然语言处理,尤其是在基于语法和语义规则的信息检索、机器翻译系统中,对于句群的处理显得格外重要。它是计算机从理解孤立的词义和句义上升到理解篇章整体中心内容的一个重要的跃变步骤。作为句群理解的关键一步,句群的识别显得尤... 在自然语言处理,尤其是在基于语法和语义规则的信息检索、机器翻译系统中,对于句群的处理显得格外重要。它是计算机从理解孤立的词义和句义上升到理解篇章整体中心内容的一个重要的跃变步骤。作为句群理解的关键一步,句群的识别显得尤为重要。该文从句群本身的构成特点出发,对句群进行了内部语义组合方式的划分,这一划分适宜计算机进行处理。根据已经取得的“HNC语言概念空间表示”的研究成果,制定了识别具有以上构成特点句群的相关规则。实验表明,划分方法具有很高的句群覆盖率,同时切分规则具有很高的准确度。 展开更多
关键词 句群 切分策略 计算语言学
下载PDF
从单语词典中获取定义原语的一种方法 被引量:6
16
作者 张津 黄昌宁 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 1997年第3期28-33,共6页
语义原语是词汇语义学研究中的一个重要概念,但在计算语言学中对它的研究尚未全面展开。文中主要讨论了从单语词典中获取定义原语的方法。对词典建立了数学模型,将获取定义原语的问题转化为图论中的一个问题。对这个问题进行了分析求... 语义原语是词汇语义学研究中的一个重要概念,但在计算语言学中对它的研究尚未全面展开。文中主要讨论了从单语词典中获取定义原语的方法。对词典建立了数学模型,将获取定义原语的问题转化为图论中的一个问题。对这个问题进行了分析求解,指出了问题的计算复杂程度,并且给出了简化问题的算法以及求解问题的两种启发式方法。该方法是一种适合于所有单语词典的一般方法。 展开更多
关键词 计算语言学 语义原语 定义原语 单语词典
原文传递
计算语言学与外语教学 被引量:8
17
作者 俞士汶 柏晓静 《外语电化教学》 CSSCI 2006年第5期3-11,共9页
本文概要介绍计算语言学的基本概念及计算语言学对外语教学的意义和作用,希望为促进外语教学提供一些新的想法,同时也希望吸引更多外语教学研究者关注计算语言学,共同推动人类语言技术的进步。
关键词 计算语言学 外语教学 人类语言技术 语料库 教育科技
原文传递
综合型语言知识库及其前景 被引量:8
18
作者 俞士汶 穗志方 朱学锋 《中文信息学报》 CSCD 北大核心 2011年第6期12-20,共9页
北京大学计算语言学研究所自1986年起,历时25年建成综合型语言知识库(CLKB)。CLKB包括6个语言知识库、10项规范与标准、基础软件工具集和4个应用系统,它们相互支撑,形成一个有机整体。CLKB的系列化的语言知识涵盖词、词组、句子、篇章... 北京大学计算语言学研究所自1986年起,历时25年建成综合型语言知识库(CLKB)。CLKB包括6个语言知识库、10项规范与标准、基础软件工具集和4个应用系统,它们相互支撑,形成一个有机整体。CLKB的系列化的语言知识涵盖词、词组、句子、篇章各单位和词法、句法、语义各层面,从汉语向多语言辐射,从通用领域深入到专业领域。尽管CLKB已形成阶段性成果,但它仍在发展中。该文重点介绍CLKB的语言知识库,也探讨其发展方向。 展开更多
关键词 自然语言处理 计算语言学 语言工程 综合型语言知识库 现代汉语语法信息词典
下载PDF
蒙古语语料库的研究与建设 被引量:7
19
作者 赵斯琴 高光来 何敏 《内蒙古大学学报(自然科学版)》 CAS CSCD 北大核心 2003年第5期578-581,共4页
论述了蒙古语语料库的建设所涉及的重要问题.详细讨论了语料库的结构,包括总体框架结构和实现的表结构,语料的加工及统计分析.简单介绍了蒙古语语料库在语音合成、形码到音码的转换、文字识别后处理方面的应用.
关键词 计算语言学 语料库 蒙古语 智能信息处理
下载PDF
组合范畴语法(CCG)的计算语言学价值 被引量:8
20
作者 陈鹏 《重庆理工大学学报(社会科学)》 CAS 2016年第8期5-11,共7页
组合范畴语法(CCG)是在AB演算基础上进行扩展而产生的范畴语法。从语法理论视角看,CCG是一种词汇形式化的方法;从计算语言学视角看,CCG属于一类适度上下文相关文法;从逻辑语义学视角看,CCG在句法与语义的接口方面非常融洽。无论是CCG语... 组合范畴语法(CCG)是在AB演算基础上进行扩展而产生的范畴语法。从语法理论视角看,CCG是一种词汇形式化的方法;从计算语言学视角看,CCG属于一类适度上下文相关文法;从逻辑语义学视角看,CCG在句法与语义的接口方面非常融洽。无论是CCG语言的、计算的,还是逻辑的特征,都使得CCG非常适用于自然语言信息处理,对于计算语言学具有很好的理论和实际价值。 展开更多
关键词 组合范畴语法 语法理论 计算语言学 逻辑语义学 自然语言信息处理 适度上下文相关文法 句法与语义接口融洽
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部