期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
一种规则与统计相结合的汉语分词方法 被引量:35
1
作者 赵伟 戴新宇 +1 位作者 尹存燕 陈家骏 《计算机应用研究》 CSCD 北大核心 2004年第3期23-25,共3页
汉语自动分词是中文信息处理领域的一项基础性课题,对现有的汉语分词方法作了简单的概述和分析,然后提出了一种新的分词方法,该方法基于一个标注好了的语料库,并且结合了规则和语料库统计两种分词方法。
关键词 中文信息处理 分词 语料库 交集型歧义
下载PDF
一种基于概率上下文无关文法的汉语句法分析 被引量:11
2
作者 林颖 史晓东 郭锋 《中文信息学报》 CSCD 北大核心 2006年第2期1-7,32,共8页
本文研究了PCFG独立性假设的局限性,并针对这一局限性提出了句法结构共现的概念以引入上下文信息,给出了计算方法;为了打破中文树库规模过小的局限性,对于句法规则参数的获取,本文利用In-side-Outside算法进行迭代,最后提出了一个基于... 本文研究了PCFG独立性假设的局限性,并针对这一局限性提出了句法结构共现的概念以引入上下文信息,给出了计算方法;为了打破中文树库规模过小的局限性,对于句法规则参数的获取,本文利用In-side-Outside算法进行迭代,最后提出了一个基于统计模型的自顶向下的汉语句法分析器。在封闭测试下,其标记精确率和标记召回率分别为88.1%和86.8%。实验结果表明,这种方法确实能够提高标记的精确率和召回率,值得深入研究。 展开更多
关键词 人工智能 自然语言处理 统计句法分析 概率上下文无关文法 汉语自动分析
下载PDF
自然语言处理开放资源平台 被引量:9
3
作者 刘群 张浩 白硕 《语言文字应用》 CSSCI 北大核心 2002年第4期50-56,共7页
我国自然语言处理研究在一定程度上处于一种低水平重复状态。由于缺乏一些公共的基础设施 ,很多研究工作都要花费大量的精力从底层模块做起 ,造成研究工作难以深入。本文提出 ,可将开放式的开发模式应用于自然语言处理领域 ,并给出了一... 我国自然语言处理研究在一定程度上处于一种低水平重复状态。由于缺乏一些公共的基础设施 ,很多研究工作都要花费大量的精力从底层模块做起 ,造成研究工作难以深入。本文提出 ,可将开放式的开发模式应用于自然语言处理领域 ,并给出了一个面向中文的自然语言处理开放资源平台的设计方案。这个平台能够共享源代码、语料库、词典、学术论文等各种资源 ,并支持协作式的项目开发。随着参与者的增多和项目的发展 ,这个平台一定会为我国自然语言处理的研究提供有力的支持。 展开更多
关键词 开放源码 资源平台 自然语言处理
下载PDF
基于大数据和人工智能进行网络舆情分析的研究 被引量:4
4
作者 郭乐江 肖蕾 +1 位作者 何松 胡俊 《长江信息通信》 2021年第3期19-23,29,共6页
随着互联网、移动互联网、物联网、社交网络等技术和应用的兴起,媒体技术的革命正在造就一个全新的舆论环境,网上言论已达到前所未有的活跃程度,互联网日益成为社会各阶层利益表达、情感宣泄和思想碰撞的平台,进而产生巨大的舆论信息。... 随着互联网、移动互联网、物联网、社交网络等技术和应用的兴起,媒体技术的革命正在造就一个全新的舆论环境,网上言论已达到前所未有的活跃程度,互联网日益成为社会各阶层利益表达、情感宣泄和思想碰撞的平台,进而产生巨大的舆论信息。面对网络上产生的海量信息数据,快速筛选出有用的网络舆情信息,通过网络舆情分析、监控民情意见、情感倾向,为相关部门提供及时的协助决策和分析结果,快速形成处理网络上突发性群体事件的可行性方案,是保障大数据舆论监督有效性的关键。文章提出了一种基于大数据云计算、信息预处理优化聚类算法及中文NLP(自然语言处理)情感倾向分析算法的人工智能网络舆情分析平台。加快有效信息的筛选速度及民情导向的分析速度,保证在海量网络数据的环境下,舆论监控工作的及时性和有效性。最后通过实验,与传统的统计式大数据信息分析系统进行比较,该方法具有信息收敛速度快、信息分析高效,可靠性高,特别是在做好重点关注领域的分类训练后,随着采集数据量的增长,对舆情导向分析结果也更准确。 展开更多
关键词 大数据 云计算 人工智能 中文nlp 情感倾向分析
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部