-
题名一种规则与统计相结合的汉语分词方法
被引量:35
- 1
-
-
作者
赵伟
戴新宇
尹存燕
陈家骏
-
机构
南京大学计算机科学与技术系软件新技术国家重点实验室
-
出处
《计算机应用研究》
CSCD
北大核心
2004年第3期23-25,共3页
-
基金
国家"863"基金资助项目(2001AA114102)
-
文摘
汉语自动分词是中文信息处理领域的一项基础性课题,对现有的汉语分词方法作了简单的概述和分析,然后提出了一种新的分词方法,该方法基于一个标注好了的语料库,并且结合了规则和语料库统计两种分词方法。
-
关键词
中文信息处理
分词
语料库
交集型歧义
-
Keywords
chinese nlp
Word Segmentation
Corpus
Crossing Ambiguities
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种基于概率上下文无关文法的汉语句法分析
被引量:11
- 2
-
-
作者
林颖
史晓东
郭锋
-
机构
厦门大学计算机系
-
出处
《中文信息学报》
CSCD
北大核心
2006年第2期1-7,32,共8页
-
基金
国家高科技研究发展计划(863)资助项目(2002AA117010)
-
文摘
本文研究了PCFG独立性假设的局限性,并针对这一局限性提出了句法结构共现的概念以引入上下文信息,给出了计算方法;为了打破中文树库规模过小的局限性,对于句法规则参数的获取,本文利用In-side-Outside算法进行迭代,最后提出了一个基于统计模型的自顶向下的汉语句法分析器。在封闭测试下,其标记精确率和标记召回率分别为88.1%和86.8%。实验结果表明,这种方法确实能够提高标记的精确率和召回率,值得深入研究。
-
关键词
人工智能
自然语言处理
统计句法分析
概率上下文无关文法
汉语自动分析
-
Keywords
artificial intelligence
natural language processing
statistical paring
probabilistic context-free grammar
chinese nlp
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名自然语言处理开放资源平台
被引量:9
- 3
-
-
作者
刘群
张浩
白硕
-
机构
中国科学院计算技术研究所
国家计算机与网络信息安全管理中心
-
出处
《语言文字应用》
CSSCI
北大核心
2002年第4期50-56,共7页
-
基金
国家 973项目支持
项目编号是 :G19980 30 50 7- 4和G19980 30 510。
-
文摘
我国自然语言处理研究在一定程度上处于一种低水平重复状态。由于缺乏一些公共的基础设施 ,很多研究工作都要花费大量的精力从底层模块做起 ,造成研究工作难以深入。本文提出 ,可将开放式的开发模式应用于自然语言处理领域 ,并给出了一个面向中文的自然语言处理开放资源平台的设计方案。这个平台能够共享源代码、语料库、词典、学术论文等各种资源 ,并支持协作式的项目开发。随着参与者的增多和项目的发展 ,这个平台一定会为我国自然语言处理的研究提供有力的支持。
-
关键词
开放源码
资源平台
自然语言处理
-
Keywords
open source code
resource platform
chinese nlp
-
分类号
H08
[语言文字—语言学]
-
-
题名基于大数据和人工智能进行网络舆情分析的研究
被引量:4
- 4
-
-
作者
郭乐江
肖蕾
何松
胡俊
-
机构
空军预警学院
-
出处
《长江信息通信》
2021年第3期19-23,29,共6页
-
文摘
随着互联网、移动互联网、物联网、社交网络等技术和应用的兴起,媒体技术的革命正在造就一个全新的舆论环境,网上言论已达到前所未有的活跃程度,互联网日益成为社会各阶层利益表达、情感宣泄和思想碰撞的平台,进而产生巨大的舆论信息。面对网络上产生的海量信息数据,快速筛选出有用的网络舆情信息,通过网络舆情分析、监控民情意见、情感倾向,为相关部门提供及时的协助决策和分析结果,快速形成处理网络上突发性群体事件的可行性方案,是保障大数据舆论监督有效性的关键。文章提出了一种基于大数据云计算、信息预处理优化聚类算法及中文NLP(自然语言处理)情感倾向分析算法的人工智能网络舆情分析平台。加快有效信息的筛选速度及民情导向的分析速度,保证在海量网络数据的环境下,舆论监控工作的及时性和有效性。最后通过实验,与传统的统计式大数据信息分析系统进行比较,该方法具有信息收敛速度快、信息分析高效,可靠性高,特别是在做好重点关注领域的分类训练后,随着采集数据量的增长,对舆情导向分析结果也更准确。
-
关键词
大数据
云计算
人工智能
中文nlp
情感倾向分析
-
Keywords
big data
cloud computing
artificial intelligence
chinese nlp
emotional tendency analysis
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-