期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
视觉及听觉刺激诱发语言通路的fMRI初步探讨 被引量:7
1
作者 牟君 沈彤 +4 位作者 杨泽松 吕发金 李勇 罗天友 谢鹏 《第三军医大学学报》 CAS CSCD 北大核心 2006年第23期2327-2329,共3页
目的利用功能核磁共振成像(fMRI)探讨视觉刺激和听觉刺激诱发的大脑思维活动,大脑激活区域的差异。方法采用血氧水平依赖法(BOLD)组块设计,考查6例以汉语为母语的健康中国志愿者,接受中文单音节字的视觉和听觉任务刺激,通过组词来诱发... 目的利用功能核磁共振成像(fMRI)探讨视觉刺激和听觉刺激诱发的大脑思维活动,大脑激活区域的差异。方法采用血氧水平依赖法(BOLD)组块设计,考查6例以汉语为母语的健康中国志愿者,接受中文单音节字的视觉和听觉任务刺激,通过组词来诱发思维活动时,相关脑区激活特点,并分析其差异。结果视觉任务主要激活了双侧额上回、中央前回及枕叶,左侧额中回、顶上小叶,右侧颞上回;听觉任务主要激活了双侧颞上回、中央前回及枕叶,左侧顶上小叶。听觉任务见到小脑和基底节区的激活。两种任务都伴随海马激活。结论组词过程激活的脑区交叉多。颞叶和枕叶在2种任务都有激活。 展开更多
关键词 视觉 听觉 功能磁共振 组词
下载PDF
词汇同义关系对多维词汇知识习得的影响研究 被引量:7
2
作者 王新朋 孔文 《外语界》 CSSCI 北大核心 2014年第2期49-57,共9页
本研究基于Nation的多维词汇知识框架设计了多维词汇知识测试,从拼写、词义、句法搭配、语法功能、语义联系5个维度考察有无同义词的词表和例句学习对目标词多维词汇知识习得的影响。实验结果表明,有已知高频同义词的目标词在拼写接受... 本研究基于Nation的多维词汇知识框架设计了多维词汇知识测试,从拼写、词义、句法搭配、语法功能、语义联系5个维度考察有无同义词的词表和例句学习对目标词多维词汇知识习得的影响。实验结果表明,有已知高频同义词的目标词在拼写接受性词汇知识、语义联系产出性词汇知识和句法搭配接受性词汇知识上的得分显著高于无已知同义词的目标词。由此,已知同义词能够促进未知同义新词的习得。 展开更多
关键词 多维词汇知识 已知同义词 词表 例句
原文传递
融合多特征的藏文新闻热点事件检测研究 被引量:1
3
作者 孔春伟 吕学强 +1 位作者 张乐 赵海兴 《中文信息学报》 CSCD 北大核心 2023年第2期53-61,共9页
针对藏文舆情分析需求,该文以藏文新闻文本数据为研究对象,提出一种融合多特征的藏文新闻热点事件检测方法。首先研究藏文新闻热点事件产生的特点,分析热词的词频、词频增长率、网站影响力特征,提出热度度量方法,通过热度过滤获取热词... 针对藏文舆情分析需求,该文以藏文新闻文本数据为研究对象,提出一种融合多特征的藏文新闻热点事件检测方法。首先研究藏文新闻热点事件产生的特点,分析热词的词频、词频增长率、网站影响力特征,提出热度度量方法,通过热度过滤获取热词集。其次分析事件词对分布特点,建立词对生成模型和词对语义引力模型,通过热度筛选获取词对集。最后采用凝聚式层次聚类方法,聚类混合表示的热词和词对,实现藏文新闻热点事件检测。测试结果表明,该方法最优F值达到0.6000,优于对比方法,可以较有效地检测热点事件,具有一定的应用价值。 展开更多
关键词 事件检测 热词 词对 语义引力 层次聚类
下载PDF
Role of the Dorsal Anterior Cingulate Cortex in Relational Memory Formation: A Deep Brain Activity Index Study
4
作者 Ariko Araki Emiko Imai Yoshitada Katagiri 《Journal of Behavioral and Brain Science》 2018年第5期269-293,共25页
The dorsal area of the anterior cingulate cortex (ACC) constructs the salience network associated with the anterior insular cortex. Conventional brain imaging studies, such as functional magnetic resonance imaging (fM... The dorsal area of the anterior cingulate cortex (ACC) constructs the salience network associated with the anterior insular cortex. Conventional brain imaging studies, such as functional magnetic resonance imaging (fMRI), have demonstrated that relational memory formation occurs in the ACC. However, how such memory is encoded and retrieved remains unknown due to limited time resolution of conventional fMRI. This study aimed to investigate temporal dynamics of the dorsal ACC (dACC) during word-pair tasks based on a newly developed event-related deep brain activity (ER-DBA) method using occipital electroencephalogram (EEG) signal powers. The method assesses dACC activity at a temporal resolution of approximately 0.3 s beyond the conventional resolution limit. We found that transient deactivation of dACC during the presentation of the second word of each pair was essential for encoding success regardless of whether the words were related or unrelated. We also found that memory accuracy was not affected by the intervention of inter-trials until the recall trial. Taken together, these findings suggest that dACC deactivation for encoding success is accompanied with short-term potentiation essential for durability of memory. We further found that false memory formation associated with the presentation of word pairs was occasionally committed. In such cases, dACC exhibited a similar transient deactivation although false memory commission was independent of related or unrelated conditions. Our findings suggest that encoding and retrieval of associates are paralleled and that simultaneous production of associates seems to be an essential strategy for successful relational memory formation. The study was limited to the assessment of dACC activity and did not account for other regional brain activities or receptor regulation related to short-term potentiation. We detected fast behavior of dACC during relational memory formation using the novel ER-DBA method. Such temporal dynamics will be important for eliciting underlying m 展开更多
关键词 RELATIONAL Memory word-pair Task EVENT-RELATED DEEP Brain Activity DORSAL ANTERIOR CINGULATE Cortex Temporal Dynamics
下载PDF
BWDSP104X字节寻址模式扩展及64位数据运算模拟实现 被引量:1
5
作者 赵高义 郑启龙 《计算机工程》 CAS CSCD 北大核心 2016年第8期14-18,23,共6页
目前BWDSP104X编译器的编程模型支持以字为单位的寻址方式,不支持非32位宽数据并且不兼容以字节为单位的寻址模式。通过对BWDSP104X前端相关数据类型进行修改,产生基于字节寻址模式的中间代码,而后端由此输出一系列32位机器指令来完成... 目前BWDSP104X编译器的编程模型支持以字为单位的寻址方式,不支持非32位宽数据并且不兼容以字节为单位的寻址模式。通过对BWDSP104X前端相关数据类型进行修改,产生基于字节寻址模式的中间代码,而后端由此输出一系列32位机器指令来完成对应的字节地址转换或数据操作,从而实现字节寻址模式的扩展。利用寄存器对模拟实现64位数据的存取与运算,提高浮点数据运算的精度。实验结果表明,该编译器兼容字节寻址模式以及64位浮点数据类型,能较好地满足高速实时信号处理的需求。 展开更多
关键词 编译器 字寻址 字节寻址 字节对齐 64位数据运算 寄存器对
下载PDF
Word-Pair Relevance Modeling with Multi-View Neural Attention Mechanism for Sentence Alignment
6
作者 Ying Ding Jun-Hui Li +1 位作者 Zheng-Xian Gong Guo-Dong Zhou 《Journal of Computer Science & Technology》 SCIE EI CSCD 2020年第3期617-628,共12页
Sentence alignment provides multi-lingual or cross-lingual natural language processing(NLP)applications with high-quality parallel sentence pairs.Normally,an aligned sentence pair contains multiple aligned words,which... Sentence alignment provides multi-lingual or cross-lingual natural language processing(NLP)applications with high-quality parallel sentence pairs.Normally,an aligned sentence pair contains multiple aligned words,which intuitively play different roles during sentence alignment.Inspired by this intuition,we propose to deal with the problem of sentence alignment by exploring the semantic interactionship among fine-grained word pairs within the framework of neural network.In particular,we first employ various relevance measures to capture various kinds of semantic interactions among word pairs by using a word-pair relevance network,and then model their importance by using a multi-view attention network.Experimental results on both monotonic and non-monotonic bitexts show that our proposed approach significantly improves the performance of sentence alignment. 展开更多
关键词 sentence alignment neural network word-pair relevance network multi-view attention network
原文传递
领域问答系统中的文本错误自动发现方法 被引量:19
7
作者 刘亮亮 王石 +2 位作者 王东升 汪平仄 曹存根 《中文信息学报》 CSCD 北大核心 2013年第3期77-83,共7页
文本自动校对是自然语言处理的一个挑战性的研究课题,也是一个难题。该文对中文的错误类型和原因进行分析,提出了一种基于领域问答系统用户问题日志的错别字自动发现方法。该方法首先对语料进行分词,然后对分词的结果中出现的散串进行合... 文本自动校对是自然语言处理的一个挑战性的研究课题,也是一个难题。该文对中文的错误类型和原因进行分析,提出了一种基于领域问答系统用户问题日志的错别字自动发现方法。该方法首先对语料进行分词,然后对分词的结果中出现的散串进行合并,对分词中的多字词和合并的串进行相似词串聚类,对相似词串的上下文语境进行统计分析,从中自动获取错别字对。实验表明,该系统获得71.32%的召回率,82.6%的准确率。 展开更多
关键词 文本自动校对 问答系统 非词错误 真词错误 错别字对
下载PDF
在线产品评论用户满意度综合评价研究 被引量:17
8
作者 吕品 钟珞 唐琨皓 《电子学报》 EI CAS CSCD 北大核心 2014年第4期740-746,共7页
文中提出一种基于灰色理论的用户满意度评价方法。基本思想:根据对各种类型的产品和对象(如旅社、酒店等)的评价具有相对性、不确定性和模糊性(这三种特性统称为灰色性)的特征,将用户满意度分为很满意,满意,一般,不满意和很不满意等五... 文中提出一种基于灰色理论的用户满意度评价方法。基本思想:根据对各种类型的产品和对象(如旅社、酒店等)的评价具有相对性、不确定性和模糊性(这三种特性统称为灰色性)的特征,将用户满意度分为很满意,满意,一般,不满意和很不满意等五种类型,克服了已有方法将情感分为满意和不满意的粗粒度定性评价缺陷。构建了用户满意度灰色评估模型,为了扩大对各类型产品评价的适应性,引用了相似性情感词匹配词对和对象对应产品的对应性热点词匹配词对来构建用户对产品和对象的满意度评测指标。以实际产品为实验数据对象,仿真结果表明:提出的方法不仅能获得产品或对象的总体满意度结论值VB,还能得到各项评测指标(影响产品或对象的因素)的量化评估结论值VBi,有效解决了定性评价方法的不足,为消费者提供了更详细的消费指导,为商业机构提供了有针对性的生产销售措施。 展开更多
关键词 在线产品评论 满意度评价 灰色理论 观点挖掘 相似性情感词匹配词对 对应性热点词匹配词对
下载PDF
语义关系相似度计算中的数据标准化方法比较 被引量:16
9
作者 王正鹏 谢志鹏 邱培超 《计算机工程》 CAS CSCD 2012年第10期38-40,共3页
研究数据标准化处理对语义关系相似度计算的影响。从大规模文本语料中提取词法模式,生成词对-词法模式矩阵,利用3种数据标准化方式对矩阵数据进行处理,通过规律学习方法对隐含语义关系相似度进行计算。实验结果表明,不做数据标准化、z-s... 研究数据标准化处理对语义关系相似度计算的影响。从大规模文本语料中提取词法模式,生成词对-词法模式矩阵,利用3种数据标准化方式对矩阵数据进行处理,通过规律学习方法对隐含语义关系相似度进行计算。实验结果表明,不做数据标准化、z-score标准化、范围标准化、熵加权标准化处理的分类准确率分别为0.87、0.89、0.95、0.96。 展开更多
关键词 语义关系 相似度 词法模式 词对-词法模式矩阵 数据标准化 WEB数据挖掘
下载PDF
基于锚点词对的双语词对齐算法 被引量:10
10
作者 张孝飞 陈肇雄 +1 位作者 黄河燕 王建德 《小型微型计算机系统》 CSCD 北大核心 2006年第2期330-334,共5页
双语词对齐是指在源、译文中找到词汇级的对译关系,是自然语言处理领域一个非常有用而又比较困难的研究课题,其中涉及词法、语法、语义以及英汉语言间的固有差异和翻译习惯等诸多问题.文章在词法分析的基础上,利用有限的语言资源(主要... 双语词对齐是指在源、译文中找到词汇级的对译关系,是自然语言处理领域一个非常有用而又比较困难的研究课题,其中涉及词法、语法、语义以及英汉语言间的固有差异和翻译习惯等诸多问题.文章在词法分析的基础上,利用有限的语言资源(主要只使用了一部双语词典),采取多级匹配和消歧策略,将词对齐问题转化为迭代求解锚点词对的过程,使得词对齐既有较高的准确率又有较高的召回率.经过对真实语料的测试,词对齐准确率达93.0%,召回率达77.3%,F值达84.2%,基本上满足了有关应用的实际要求. 展开更多
关键词 自然语言处理 双语词对齐 语料 锚点词对
下载PDF
基于词对依存分类的藏语树库半自动构建研究 被引量:8
11
作者 华却才让 姜文斌 +1 位作者 赵海兴 刘群 《中文信息学报》 CSCD 北大核心 2013年第5期166-172,共7页
依据依存句法理论,该文制订了藏语句法标注体系及层次结构。通过分析构建藏语依存树库中存在的问题,提出了半自动依存树库构建模式,针对藏语特性提出了融合丰富特征的词对依存分类模型和依存边标注模型,实现了依存树库构建可视化工具,... 依据依存句法理论,该文制订了藏语句法标注体系及层次结构。通过分析构建藏语依存树库中存在的问题,提出了半自动依存树库构建模式,针对藏语特性提出了融合丰富特征的词对依存分类模型和依存边标注模型,实现了依存树库构建可视化工具,校对构建了1.1万句藏语依存句法树后,在基线系统下经实验验证,依存识别正确率提高了3%,使构建藏语依存树库工作取得了有效进展。 展开更多
关键词 藏语依存句法 词对依存分类 藏语树库 藏语依存标注工具
下载PDF
基于旋转注意力的命名实体识别模型
12
作者 来小孟 魏嘉银 《电脑与电信》 2024年第1期21-25,共5页
针对命名实体识别中实体词对关系建模分类性能不高的问题,提出一种基于旋转注意力的命名实体识别方法,该方法首先用BERT模型和Bi-LSTM进行编码,然后用卷积神经网络对输入的文本进行特征提取,接着将提取的特征序列输入旋转注意力模型中... 针对命名实体识别中实体词对关系建模分类性能不高的问题,提出一种基于旋转注意力的命名实体识别方法,该方法首先用BERT模型和Bi-LSTM进行编码,然后用卷积神经网络对输入的文本进行特征提取,接着将提取的特征序列输入旋转注意力模型中计算输出概率,最后使用MLP层对输出进行分类。实验结果表明,本文提出的方法在CADEC、GENIA和CoNLL2003等标准英文数据集上均取得了较好的性能,验证其在命名实体识别任务中的有效性和可行性。 展开更多
关键词 命名实体识别 旋转注意力 词对关系 分类
下载PDF
融合多窗口特征的词对标记情感三元组抽取
13
作者 林杰 刘建华 +2 位作者 陈林颖 郑智雄 孙水华 《计算机工程与应用》 CSCD 北大核心 2024年第16期159-167,共9页
方面情感三元组抽取旨在从句子中抽取方面词、意见词和对应的情感极性。针对目前研究未充分挖掘局部上下文语义信息,缺乏对局部范围内的方面意见词对关联学习,以及遭受错误传播等问题,提出一种融合多窗口特征的词对标记情感三元组抽取... 方面情感三元组抽取旨在从句子中抽取方面词、意见词和对应的情感极性。针对目前研究未充分挖掘局部上下文语义信息,缺乏对局部范围内的方面意见词对关联学习,以及遭受错误传播等问题,提出一种融合多窗口特征的词对标记情感三元组抽取模型。该模型利用BERT对句子信息进行处理,获取句子编码特征,采用多窗口特征学习机制学习局部范围内的情感特征关联,并挖掘句子包含的潜在语义信息,使用多头注意力图转换模块将所学习到的特征聚合成标记分布概率,利用改进的词对标记方案标记句子并解码得到三元组。在SemEval-ASTE的四个基准数据集上进行实验分析,相比GTS-BERT模型,所提模型在三元组抽取任务上F1分值分别提高了2.33、6.57、2.97、4.84个百分点。实验结果表明,所提模型可以有效学习局部语义信息,准确标记方面意见跨度,较为精确地提取情感三元组。 展开更多
关键词 方面情感三元组 情感极性 特征学习 多头注意力 词对标记方案
下载PDF
基于因子分析和聚类分析的情感维度提取 被引量:5
14
作者 刘征宏 潘伟杰 +1 位作者 吕健 林丽 《组合机床与自动化加工技术》 北大核心 2016年第3期4-8,共5页
为从大量用户情感维度(感性词对)中提取少量具有代表性情感维度(感性词对),文章提出结合因子分析(factor analysis,FA)和聚类分析(cluster analysis,CA)的情感维度提取方法。首先通过语义差分(semantic differential,SD)实验获取用户对... 为从大量用户情感维度(感性词对)中提取少量具有代表性情感维度(感性词对),文章提出结合因子分析(factor analysis,FA)和聚类分析(cluster analysis,CA)的情感维度提取方法。首先通过语义差分(semantic differential,SD)实验获取用户对少量具有代表性样品的情感认知;然后使用FA对SD结果进行分析,获得初始情感维度的潜在因子及因子载荷矩阵;最后根据FA结果进行聚类分析,对初始情感维度到每个聚类几何中心的距离进行排序,距离最近的感性词对即为所提取的情感维度。以数控机床造型设计为研究案例,对该方法进行描述,结果表明,该方法能有效提取情感维度,并保留了初始情感维度的整体结构。 展开更多
关键词 因子分析 聚类分析 情感维度 感性词对
下载PDF
基于网络评论情感量化的商品综合评分模型 被引量:5
15
作者 王晓耘 史玲玲 《杭州电子科技大学学报(社会科学版)》 2016年第3期8-15,共8页
传统网络商品评论的评分是五分制评分,存在评分与评论内容情感不一致问题,为修正五分制评分,本文基于Apriori算法和隶属度算法分别提取产品特征和特征观点词对,并构建了观点词本体库,在此基础上,分析程度副词和否定词对观点词的影响,量... 传统网络商品评论的评分是五分制评分,存在评分与评论内容情感不一致问题,为修正五分制评分,本文基于Apriori算法和隶属度算法分别提取产品特征和特征观点词对,并构建了观点词本体库,在此基础上,分析程度副词和否定词对观点词的影响,量化评论内容情感,最后结合各影响因素构建一种基于评论情感量化的商品综合评分模型。实验结果表明,本文提出的评分模型相比原先五分制的评分更能反映评论者的情感。 展开更多
关键词 评论挖掘 特征观点词对 情感量化 综合评分模型
下载PDF
情绪动机对中学生即时性学习判断的影响
16
作者 付卉敏 钟建军 +1 位作者 高雅欣 姚静静 《中华行为医学与脑科学杂志》 CAS CSCD 北大核心 2023年第12期1104-1110,共7页
目的探讨情绪动机是否影响学习判断及其在短时记忆阶段的影响机制。方法通过初步测试并且用E-Prime软件编制了一套适用的试验流程,选取134名中学生群体作为被试。以情绪视频诱发后进行即时学习判断为试验范式,进行2(情绪动机方向:正性... 目的探讨情绪动机是否影响学习判断及其在短时记忆阶段的影响机制。方法通过初步测试并且用E-Prime软件编制了一套适用的试验流程,选取134名中学生群体作为被试。以情绪视频诱发后进行即时学习判断为试验范式,进行2(情绪动机方向:正性趋近、负性回避)×2(动机强度:高、低)×2(词对关联性:高关联、低关联)×2(短时记忆载荷:多、少)的四因素混合试验,观察受试者的学习判断成绩,结果采用SPSS 23.0进行重复测量方差分析。结果在学习判断等级上,情绪动机方向和动机强度交互作用显著(F=5.177,P=0.025,η^(2)=0.040),情绪动机强度和方向分别与短时记忆容量载荷交互作用显著(F=4.778,P=0.031,η^(2)=0.037;F=4.302,P=0.040,η^(2)=0.034)。此外,情绪动机方向(F=15.256,P<0.001,η^(2)=0.110)、动机强度(F=7.518,P=0.007,η^(2)=0.057)、短时记忆载荷(F=13.384,P<0.001,η^(2)=0.097)、词对关联性(F=212.238,P<0.001,η^(2)=0.631)的主效应显著;在学习判断准确性上,情绪动机方向和动机强度交互作用显著(F=5.646,P=0.019,η^(2)=0.044)。情绪动机强度和方向分别与短时记忆容量载荷交互作用显著(F=4.593,P=0.034,η^(2)=0.036;F=4.033,P=0.047,η^(2)=0.031)。此外,情绪动机方向(F=15.318,P<0.001,η^(2)=0.110)、动机强度(F=7.572,P=0.007,η^(2)=0.058),短时记忆载荷(F=11.119,P=0.001,η^(2)=0.082)、词对关联性(F=135.814,P<0.001,η^(2)=0.523)的主效应显著;在回忆成绩上,词对关联性(F=416.326,P<0.001,η^(2)=0.771)、短时记忆载荷的主效应显著(F=9.609,P=0.002,η^(2)=0.772)。结论情绪动机方向、强度对学习判断产生影响,情绪动机与短时记忆联合影响学习判断等级和准确性,情绪动机通过对短时记忆阶段学习过程有关的线索作用而影响学习判断。 展开更多
关键词 学习判断 词对关联度 情绪动机 短时记忆载荷
原文传递
基于词对向量空间模型的新事件检测方法 被引量:4
17
作者 樊旭琴 张永奎 《计算机工程与应用》 CSCD 北大核心 2010年第12期123-125,共3页
新事件检测(NED)的目标是从一个或多个新闻源中检测出报道一个新闻话题的第一个新闻。传统向量空间模型采用单个词来表示文本特征,考虑到词的位置信息以及其他的表示内容的信息,提出了词对表示文本的方法,并结合HowNet资源对所抽取的词... 新事件检测(NED)的目标是从一个或多个新闻源中检测出报道一个新闻话题的第一个新闻。传统向量空间模型采用单个词来表示文本特征,考虑到词的位置信息以及其他的表示内容的信息,提出了词对表示文本的方法,并结合HowNet资源对所抽取的词对进行归一化处理,最后对不同类别新闻中不同词性对的权重参数进行优化。通过在已有的突发性新闻语料上进行实验,表明这种改进方法的效果比较明显,性能也有一定的提高。 展开更多
关键词 向量空间模型 词对特征 新事件检测
下载PDF
基于VOLT的藏汉双向机器翻译 被引量:3
18
作者 孙义栋 拥措 杨丹 《计算机与现代化》 2022年第5期28-32,39,共6页
藏汉词表的生成不仅是藏汉双向机器翻译任务开始的第一步,而且影响着藏汉双向翻译效果。本文通过改进生成藏汉词表来提升下游藏汉双向翻译性能。一方面从词表拼接入手,采用高频使用正常词表,低频使用字节对编码词表的思想,通过反复训练... 藏汉词表的生成不仅是藏汉双向机器翻译任务开始的第一步,而且影响着藏汉双向翻译效果。本文通过改进生成藏汉词表来提升下游藏汉双向翻译性能。一方面从词表拼接入手,采用高频使用正常词表,低频使用字节对编码词表的思想,通过反复训练找到最佳词频阈值;另一方面通过最优传输的词汇学习方法学习生成藏汉词表,并针对藏语本身语言特点进行改进后应用到藏汉双向翻译上。实验结果表明,本文针对藏文语言特点提出的字节对编码加最优传输的词汇学习方法效果最佳,在藏汉翻译任务上BLEU值达到37.35,汉藏翻译任务上BLEU值达到27.60。 展开更多
关键词 藏文词表 字节对编码 藏汉双向翻译 VOLT
下载PDF
基于词对向量的中文新闻话题检测方法 被引量:3
19
作者 张文博 米成刚 杨雅婷 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2019年第2期231-236,共6页
针对传统话题检测方法得到的结果和实际话题个数相差较大的缺点,根据话题所包含的文本数对话题之间的相似度进行衰减,进而优先合并粒度较小类,并根据文档话题频率和权重对较大的话题向量进行降维,通过这两方面对传统的层次聚类方法进行... 针对传统话题检测方法得到的结果和实际话题个数相差较大的缺点,根据话题所包含的文本数对话题之间的相似度进行衰减,进而优先合并粒度较小类,并根据文档话题频率和权重对较大的话题向量进行降维,通过这两方面对传统的层次聚类方法进行改进.同时为了更好地表达话题的语义信息,使用在句子中共现的词对向量来取代传统的向量空间模型.实验结果表明,使用词对模型和改进的方法可以取得更好的效果,而且得到的聚类结果和实际话题个数相近. 展开更多
关键词 话题检测 词对模型 降维 相似度
下载PDF
基于主题词对的文档重排方法 被引量:2
20
作者 何婷婷 许婷 +1 位作者 瞿国忠 涂新辉 《计算机工程与应用》 CSCD 北大核心 2007年第11期161-163,共3页
提出了一种基于主题词对的文档重排方法,使得检索结果在保持召回率的前提下提高精确率。主题词对意指能够共同表征同一主题的两个词语,其中一个来自于查询,另一个来自于文档,两者之间具有紧密的联系。主题词对的选择采用概率潜在语义索... 提出了一种基于主题词对的文档重排方法,使得检索结果在保持召回率的前提下提高精确率。主题词对意指能够共同表征同一主题的两个词语,其中一个来自于查询,另一个来自于文档,两者之间具有紧密的联系。主题词对的选择采用概率潜在语义索引的方法,并根据主题词对在文档中的分布状况对其进行重排。对NTCIR-5中文信息检索的文档集合进行测试,采用trec标准评估方法,结果表明采用该方法使得精确率在rigid和relax结果集上分别提高了53.6%和55.8%。 展开更多
关键词 主题词对 概率潜在语义索引 文档重排
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部