期刊文献+
共找到1,380篇文章
< 1 2 69 >
每页显示 20 50 100
文本情感分析 被引量:537
1
作者 赵妍妍 秦兵 《软件学报》 EI CSCD 北大核心 2010年第8期1834-1848,共15页
对文本情感分析的研究现状与进展进行了总结.首先将文本情感分析归纳为3项主要任务,即情感信息抽取、情感信息分类以及情感信息的检索与归纳,并对它们进行了细致的介绍和分析;进而介绍了文本情感分析的国内外评测和资源建设情况;最后介... 对文本情感分析的研究现状与进展进行了总结.首先将文本情感分析归纳为3项主要任务,即情感信息抽取、情感信息分类以及情感信息的检索与归纳,并对它们进行了细致的介绍和分析;进而介绍了文本情感分析的国内外评测和资源建设情况;最后介绍了文本情感分析的应用.重在对文本情感分析研究的主流方法和前沿进展进行概括、比较和分析. 展开更多
关键词 文本情感分析 情感信息抽取 情感信息分类 情感信息的检索与归纳 评测 资源建设
下载PDF
自动问答综述 被引量:165
2
作者 郑实福 +1 位作者 秦兵 李生 《中文信息学报》 CSCD 北大核心 2002年第6期46-52,共7页
自动问答技术是自然语言处理领域中一个非常热门的研究方向 ,它综合运用了各种自然语言处理技术。本文介绍了自动问答技术的发展现状和自动问答系统中常用的技术。自动问答系统一般包括三个主要组成部分 :问题分析、信息检索和答案抽取... 自动问答技术是自然语言处理领域中一个非常热门的研究方向 ,它综合运用了各种自然语言处理技术。本文介绍了自动问答技术的发展现状和自动问答系统中常用的技术。自动问答系统一般包括三个主要组成部分 :问题分析、信息检索和答案抽取。本文分别介绍了这三个主要组成部分的主要功能和常用的方法。最后还介绍了自动问答系统的评价问题。 展开更多
关键词 自动问答 问题分类 信息检索 答案抽取 自然语言处理 问题分析
下载PDF
基于语义依存的汉语句子相似度计算 被引量:127
3
作者 李彬 +1 位作者 秦兵 李生 《计算机应用研究》 CSCD 北大核心 2003年第12期15-17,共3页
句子间相似度的计算在自然语言处理的各个领域都占有很重要的地位,在多文档自动文摘技术中,句子间相似度的计算是一个关键的问题。由于汉语句子的表达形式是多种多样的,要准确地刻画一个句子所表达的意思,必须深入到语义一级并结合语法... 句子间相似度的计算在自然语言处理的各个领域都占有很重要的地位,在多文档自动文摘技术中,句子间相似度的计算是一个关键的问题。由于汉语句子的表达形式是多种多样的,要准确地刻画一个句子所表达的意思,必须深入到语义一级并结合语法结构信息,由此提出了一种基于语义依存的汉语句子相似度计算的方法,该方法取得了令人满意的实验效果。 展开更多
关键词 相似度计算 语义 依存结构 自然语言处理 多文档文摘
下载PDF
话题检测与跟踪的评测及研究综述 被引量:153
4
作者 洪宇 张宇 +1 位作者 李生 《中文信息学报》 CSCD 北大核心 2007年第6期71-87,共17页
话题检测与跟踪是一项面向新闻媒体信息流进行未知话题识别和已知话题跟踪的信息处理技术。自从1996年前瞻性的探索以来,该领域进行的多次大规模评测为信息识别、采集和组织等相关技术提供了新的测试平台。由于话题检测与跟踪相对于信... 话题检测与跟踪是一项面向新闻媒体信息流进行未知话题识别和已知话题跟踪的信息处理技术。自从1996年前瞻性的探索以来,该领域进行的多次大规模评测为信息识别、采集和组织等相关技术提供了新的测试平台。由于话题检测与跟踪相对于信息检索、信息挖掘和信息抽取等自然语言处理技术具备很多共性,并面向具备突发性和延续性规律的新闻语料,因此逐渐成为当前信息处理领域的研究热点。本文简要介绍了话题检测与跟踪的研究背景、任务定义、评测方法以及相关技术,并通过分析目前TDT领域的研究现状展望未来的发展趋势。 展开更多
关键词 计算机应用 中文信息处理 综述 话题检测与跟踪 自然语言处理 事件 新闻报道
下载PDF
基于常问问题集的中文问答系统研究 被引量:96
5
作者 秦兵 +2 位作者 王洋 郑实福 李生 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2003年第10期1179-1182,共4页
首先根据用户的提问建立一个候选问题集,然后通过计算句子语义相似度,在候选问题集中找到相似的问句,并将答案返回给用户.该系统还能够自动地更新和维护FAQ库.实验表明,与基于关键词的句子相似度计算相比,基于语义的句子相似度计算提高... 首先根据用户的提问建立一个候选问题集,然后通过计算句子语义相似度,在候选问题集中找到相似的问句,并将答案返回给用户.该系统还能够自动地更新和维护FAQ库.实验表明,与基于关键词的句子相似度计算相比,基于语义的句子相似度计算提高了问题匹配的准确率. 展开更多
关键词 常问问题集 中文问答系统 候选问题集 句子相似度 数据库 数据结构 TFIDF方法
下载PDF
实体关系自动抽取 被引量:115
6
作者 车万翔 李生 《中文信息学报》 CSCD 北大核心 2005年第2期1-6,共6页
实体关系抽取是信息抽取领域中的重要研究课题。本文使用两种基于特征向量的机器学习算法 ,Winnow和支持向量机 (SVM) ,在 2 0 0 4年ACE(AutomaticContentExtraction)评测的训练数据上进行实体关系抽取实验。两种算法都进行适当的特征选... 实体关系抽取是信息抽取领域中的重要研究课题。本文使用两种基于特征向量的机器学习算法 ,Winnow和支持向量机 (SVM) ,在 2 0 0 4年ACE(AutomaticContentExtraction)评测的训练数据上进行实体关系抽取实验。两种算法都进行适当的特征选择 ,当选择每个实体的左右两个词为特征时 ,达到最好的抽取效果 ,Win now和SVM算法的加权平均F Score分别为 73 0 8%和 73 2 7%。可见在使用相同的特征集 ,不同的学习算法进行实体关系的识别时 ,最终性能差别不大。因此使用自动的方法进行实体关系抽取时 ,应当集中精力寻找好的特征。 展开更多
关键词 计算机应用 中文信息处理 实体关系抽取 ACE评测 特征选择
下载PDF
中文事件抽取技术研究 被引量:105
7
作者 赵妍妍 秦兵 +1 位作者 车万翔 《中文信息学报》 CSCD 北大核心 2008年第1期3-8,共6页
事件抽取是信息抽取领域一个重要的研究方向,本文对事件抽取的两项关键技术——事件类别识别以及事件元素识别进行了深入研究。在事件类别识别阶段,本文采用了一种基于触发词扩展和二元分类相结合的方法;在事件元素识别阶段,本文采用了... 事件抽取是信息抽取领域一个重要的研究方向,本文对事件抽取的两项关键技术——事件类别识别以及事件元素识别进行了深入研究。在事件类别识别阶段,本文采用了一种基于触发词扩展和二元分类相结合的方法;在事件元素识别阶段,本文采用了基于最大熵的多元分类的方法。这些方法很好的解决了事件抽取中训练实例正反例不平衡以及数据稀疏问题,取得了较好的系统性能。 展开更多
关键词 计算机应用 中文信息处理 事件抽取 事件类别识别 事件元素识别
下载PDF
基于句法结构分析的中文问题分类 被引量:82
8
作者 文勖 张宇 +1 位作者 马金山 《中文信息学报》 CSCD 北大核心 2006年第2期33-39,共7页
问题分类是问答系统中重要的组成部分,问题分类结果的好坏直接影响问答系统的质量。本文提出了一种用于问题分类的特征提取的新方法,该方法主要使用句法分析的结果,提取问题的主干和疑问词及其附属成分作为分类的特征,此方法大幅度地减... 问题分类是问答系统中重要的组成部分,问题分类结果的好坏直接影响问答系统的质量。本文提出了一种用于问题分类的特征提取的新方法,该方法主要使用句法分析的结果,提取问题的主干和疑问词及其附属成分作为分类的特征,此方法大幅度地减少了噪音,突出了问题分类的主要特征,利用贝叶斯分类器分类,有效地提高了问题分类的精度。实验结果证明了该方法的有效性,大类和小类的分类精度分别达到了86.62%和71.92%,取得了较好的效果。 展开更多
关键词 计算机应用 中文信息处理 问答系统 问题分类 特征提取 句法分析
下载PDF
串频统计和词形匹配相结合的汉语自动分词系统 被引量:65
9
作者 吴岩 王开铸 《中文信息学报》 CSCD 北大核心 1998年第1期17-25,共9页
本文介绍了一种汉语自动分词软件系统,该系统对原文进行三遍扫描:第一遍,利用切分标记将文本切分成汉字短串的序列;第二遍,根据各短串的每个子串在上下文中的频度计算其权值,权值大的子串视为候选词;第三遍,利用候选词集和一部... 本文介绍了一种汉语自动分词软件系统,该系统对原文进行三遍扫描:第一遍,利用切分标记将文本切分成汉字短串的序列;第二遍,根据各短串的每个子串在上下文中的频度计算其权值,权值大的子串视为候选词;第三遍,利用候选词集和一部常用词词典对汉字短串进行切分。实验表明,该分词系统的分词精度在1.5%左右,能够识别大部分生词。 展开更多
关键词 中文信息处理 自动分词 汉语 串频统计 词形匹配
下载PDF
评价对象抽取及其倾向性分析 被引量:99
10
作者 鸿宇 赵妍妍 +1 位作者 秦兵 《中文信息学报》 CSCD 北大核心 2010年第1期84-88,122,共6页
情感分析近年来已经成为自然语言处理领域的热点问题,该文对情感分析中的两项关键技术——评价对象抽取和倾向性判断进行了深入研究。在评价对象抽取阶段,首先使用句法分析结果获取候选评价对象,继而结合基于网络挖掘的PMI算法和名词剪... 情感分析近年来已经成为自然语言处理领域的热点问题,该文对情感分析中的两项关键技术——评价对象抽取和倾向性判断进行了深入研究。在评价对象抽取阶段,首先使用句法分析结果获取候选评价对象,继而结合基于网络挖掘的PMI算法和名词剪枝算法对候选评价对象进行筛选。在倾向性判断阶段,通过分析情感句句型,归纳相应的分析规则,使用无指导的方法完成评价对象在情感句中的倾向性判断。该系统参加了COAE2008任务三的评测,取得了较好成绩。 展开更多
关键词 计算机应用 中文信息处理 情感分析 评价对象 倾向性判断 句法分析
下载PDF
自动文摘的四种主要方法 被引量:55
11
作者 王开铸 《情报学报》 CSSCI 北大核心 1999年第1期10-19,共10页
本文将现有的自动文摘方法概括为四种:自动摘录、基于理解的自动文摘、信息抽取和基于结构的自动文摘,并详细介绍了这四种方法的基本原理,剖析了它们的优点和不足。最后,概述了中文自动文摘的研究状况。
关键词 自然语言处理 情报科学 自动文摘
下载PDF
基于最大熵分类器的语义角色标注 被引量:73
12
作者 车万翔 李生 《软件学报》 EI CSCD 北大核心 2007年第3期565-573,共9页
语义角色标注是浅层语义分析的一种可行方案.描述了一个采用最大熵分类器的语义角色标注系统,该系统把句法成分作为语义标注的基本单元,用最大熵分类器对句子中谓词的语义角色同时进行识别和分类.最大熵分类器中使用了一些有用的特征及... 语义角色标注是浅层语义分析的一种可行方案.描述了一个采用最大熵分类器的语义角色标注系统,该系统把句法成分作为语义标注的基本单元,用最大熵分类器对句子中谓词的语义角色同时进行识别和分类.最大熵分类器中使用了一些有用的特征及其组合.在后处理阶段,在具有嵌套关系的结果中,只有概率最高的语义角色被保留.在预测了全部能够在句法分析树中找到匹配成分的角色以后,采用简单的后处理规则去识别那些找不到匹配成分的角色.最终在开发集和测试集上分别获得了75.49%和75.60%的F1值,此结果是已知的基于单一句法分析结果中最好的.最后提出了对该任务的一些难点问题的解决方案以及对语义角色标注发展的一个初步展望. 展开更多
关键词 语义角色标注 浅层语义分析 最大熵分类器
下载PDF
多文档自动文摘综述 被引量:51
13
作者 秦兵 李生 《中文信息学报》 CSCD 北大核心 2005年第6期13-20,56,共9页
多文档文摘是将同一主题下的多个文本描述的主要的信息按压缩比提炼为一个文本的自然语言处理技术。随着互联网上信息的日益丰富,多文档文摘技术成为新的研究热点。本文介绍了多文档文摘的产生和应用背景,阐述了多文档文摘和其他自然语... 多文档文摘是将同一主题下的多个文本描述的主要的信息按压缩比提炼为一个文本的自然语言处理技术。随着互联网上信息的日益丰富,多文档文摘技术成为新的研究热点。本文介绍了多文档文摘的产生和应用背景,阐述了多文档文摘和其他自然语言处理技术的关系,对多文档文摘国内外研究现状进行了分析,在此基础上汇总提出了多文档文摘研究的基本路线及关键技术,并总结了多文档文摘的未来及发展趋势。 展开更多
关键词 人工智能 自然语言处理 多文档文摘 自然语言处理 文本压缩
下载PDF
微博用户的相似性度量及其应用 被引量:79
14
作者 徐志明 李栋 +3 位作者 李生 王刚 袁树仑 《计算机学报》 EI CSCD 北大核心 2014年第1期207-218,共12页
微博用户的兴趣分析和模型表示是用户关系分析的基础,而用户关系分析又构成了微博社会网络的生成和分析的基础.该文主要讨论微博的用户关系分析技术.作者将微博社会网络视为一个加权无向图,节点表示用户,边表示用户之间的关系,边的权值... 微博用户的兴趣分析和模型表示是用户关系分析的基础,而用户关系分析又构成了微博社会网络的生成和分析的基础.该文主要讨论微博的用户关系分析技术.作者将微博社会网络视为一个加权无向图,节点表示用户,边表示用户之间的关系,边的权值表示用户之间的关系强度.该文将用户关系强度定义为用户之间的相似度,分别给出了基于各种用户属性信息(背景信息、微博文本、社交信息)的用户相似度计算方法,并通过实验系统性对比了上述方法的优劣.实验结果显示:基于社交信息的用户相似度在用户关系分析方面取得了最好的效果.为了进一步验证上述用户相似度的实际性能,该文将它们应用于用户推荐的相关实验,基于社交信息的用户相似度又取得了最好的推荐效果.最后,该文应用基于社交信息的用户相似度生成了微博的社会网络(称作用户相似性网络),在该社会网络上进行了团体挖掘的实验,实验结果显示了该相似度在团体挖掘上的有效性. 展开更多
关键词 微博 社会网络 用户相似度 团体挖掘 用户推荐
下载PDF
基于改进编辑距离的中文相似句子检索 被引量:63
15
作者 车万翔 +1 位作者 秦兵 李生 《高技术通讯》 EI CAS CSCD 2004年第7期15-19,共5页
中文相似句子检索的方法在基于实例的机器翻译等中文信息处理领域,具有非常广泛的应用背景。本文提出的基于改进编辑距离的中文相似句子检索方法,在使用信息检索技术提高检索效率的同时,以普通编辑距离算法为基础,加入了词汇的语义... 中文相似句子检索的方法在基于实例的机器翻译等中文信息处理领域,具有非常广泛的应用背景。本文提出的基于改进编辑距离的中文相似句子检索方法,在使用信息检索技术提高检索效率的同时,以普通编辑距离算法为基础,加入了词汇的语义信息,使之更加符合中文句子相似度计算的要求。改进编辑距离与单纯基于语义辞典计算句子相似度的方法相比,具有便于扩展,准确率高等优点。在基于大规模双语句对检索的英文辅助写作系统中使用该算法进行中文句子检索,最后获得了81.33%的查准率和95.31%的查全率。 展开更多
关键词 改进编辑距离 中文 相似句子 检索 英文 辅助写作 机器翻译
下载PDF
一种基于离散小波变换和HVS的彩色图像数字水印技术 被引量:38
16
作者 尤韦彦 《计算机工程》 CAS CSCD 北大核心 2003年第4期115-117,共3页
提出了一种将彩色数字水印嵌入到原始彩色数字图像中的算法,通过将水印多次嵌入到DWT后相应的频段来增强鲁棒性;该算法利用了HVS(Human Visual System)特性,并通过实验得出了水印不同彩色分量(R、G、B)的加权系数,从而使嵌入水印后... 提出了一种将彩色数字水印嵌入到原始彩色数字图像中的算法,通过将水印多次嵌入到DWT后相应的频段来增强鲁棒性;该算法利用了HVS(Human Visual System)特性,并通过实验得出了水印不同彩色分量(R、G、B)的加权系数,从而使嵌入水印后的图像无主观视觉上的失真。通过实验验证,该算法在对嵌入水印后的图像进行JPEG有损压缩、剪切、不规则色块污染、添加各种噪声处理后,提取出的水印表现出了较好的鲁棒性,且主观视觉失真较小。 展开更多
关键词 离散小波变换 HVS 彩色图像 数字水印 图像处理 多媒体 版权保护
下载PDF
自然语言文本水印 被引量:51
17
作者 张宇 +2 位作者 陈毅恒 赵世奇 李生 《中文信息学报》 CSCD 北大核心 2005年第1期56-62,70,共8页
本文主要介绍了基于自然语言处理的文本水印技术 ,也即自然语言文本水印技术。该技术是在不改变文本原意的前提下 ,将需要隐藏的文本信息 (水印信息 )插入到原始文本中的一种信息隐藏技术。这种技术对于确认信息来源和信息的秘密传送 ,... 本文主要介绍了基于自然语言处理的文本水印技术 ,也即自然语言文本水印技术。该技术是在不改变文本原意的前提下 ,将需要隐藏的文本信息 (水印信息 )插入到原始文本中的一种信息隐藏技术。这种技术对于确认信息来源和信息的秘密传送 ,以及版权维护等方面都有着很大的应用价值。本文首先给出了基于自然语言处理技术的文本水印的概念、特点及攻击模型 ,并对文本水印的研究现状进行了分析。通过分析可以看出 ,自然语言文本水印技术有着更好的灵活性 ,并且在适度的攻击下 ,不会破坏水印信息。本文详细介绍了文本水印系统的设计过程 ,包括该技术的基础数学理论 -二次余数理论。最后详细介绍了两种自然语言文本水印嵌入方法 ,分别是基于句法分析和基于语义的水印嵌入方法。 展开更多
关键词 人工智能 自然语言处理 文本水印 二次余数 本体语义
下载PDF
在线社会网络中信息扩散 被引量:63
18
作者 李栋 徐志明 +2 位作者 李生 王秀文 《计算机学报》 EI CSCD 北大核心 2014年第1期189-206,共18页
在线社会网络中信息扩散研究可以帮助网络用户获取有价值信息、帮助企业推广产品、帮助政府调控舆情,应用价值巨大.该文旨在综述在线社会网络中信息扩散研究的现状.首先详细阐述了研究背景和研究意义;随后将当前研究划分为基于理论扩散... 在线社会网络中信息扩散研究可以帮助网络用户获取有价值信息、帮助企业推广产品、帮助政府调控舆情,应用价值巨大.该文旨在综述在线社会网络中信息扩散研究的现状.首先详细阐述了研究背景和研究意义;随后将当前研究划分为基于理论扩散模型的研究和基于信息扩散级联的研究两类,前者包括信息扩散特性研究、信息扩散概率计算、信息扩散最大化问题和竞争性的信息扩散最大化问题,后者包括信息扩散特性研究、用户影响力计算和信息扩散预测模型,对上述各方向的研究方法和研究进展进行了概括、比较和归纳,同时对各研究方向之间的内在关联进行了深入分析;接着探讨了信息扩散动态性和在线社会网络动态性的关系;最后对该研究目前存在的问题和一些未来发展方向进行了总结. 展开更多
关键词 信息扩散 在线社会网络 预测 影响力 网络动态性
下载PDF
基于改进贝叶斯模型的问题分类 被引量:47
19
作者 张宇 文勖 《中文信息学报》 CSCD 北大核心 2005年第2期100-105,共6页
随着计算机及互联网络技术的发展 ,开放域问答系统越来越受到人们的关注 ,因为它能够给用户提供相对简洁、准确的结果。开放域问答系统通常包括问题分类、问题扩展、搜索引擎、答案抽取和答案选择五个主要部分。问题分类在问答系统中起... 随着计算机及互联网络技术的发展 ,开放域问答系统越来越受到人们的关注 ,因为它能够给用户提供相对简洁、准确的结果。开放域问答系统通常包括问题分类、问题扩展、搜索引擎、答案抽取和答案选择五个主要部分。问题分类在问答系统中起着很重要的作用 ,它的准确性直接影响到最终抽取的答案的准确性。本文在对已有的贝叶斯分类方法进行分析的基础上 ,对该方法进行了改进。为了验证该方法的效果 ,构造了问题的训练集和测试集。从实验结果可以看出 ,该方法在实际应用中获得了较好的效果。 展开更多
关键词 计算机应用 中文信息处理 贝叶斯模型 问题分类 问答系统
下载PDF
基于句法路径的情感评价单元识别 被引量:58
20
作者 赵妍妍 秦兵 +1 位作者 车万翔 《软件学报》 EI CSCD 北大核心 2011年第5期887-898,共12页
不同于已有的基于手工模板和规则的方法,提出了一种基于句法路径的情感评价单元自动识别方法.该方法自动获取句法路径来描述评价对象及其评价词语之间的修饰关系,并通过计算句法路径编辑距离来改进情感评价单元抽取的系统性能.实验语料... 不同于已有的基于手工模板和规则的方法,提出了一种基于句法路径的情感评价单元自动识别方法.该方法自动获取句法路径来描述评价对象及其评价词语之间的修饰关系,并通过计算句法路径编辑距离来改进情感评价单元抽取的系统性能.实验语料来自数码相机和MP3播放器两个典型的电子产品领域.实验结果表明:(1)句法路径能够有效描述评价对象及其评价词语之间的关系,对情感评价单元的识别有很大帮助;(2)基于编辑距离的句法路径改进策略能够进一步提高情感评价单元识别的系统性能. 展开更多
关键词 情感评价单元 情感分析 句法路径 评价词语 评价对象
下载PDF
上一页 1 2 69 下一页 到第
使用帮助 返回顶部