期刊文献+
共找到42篇文章
< 1 2 3 >
每页显示 20 50 100
问答社区中回答质量的评价方法研究 被引量:33
1
作者 孔维泽 刘奕群 +1 位作者 张敏 马少平 《中文信息学报》 CSCD 北大核心 2011年第1期3-8,共6页
问答社区已经成为网络信息获取的一种重要渠道,但其信息质量差异较大。该文研究了问答社区中回答质量的评价方法。具体考察了百度知道的问答社区环境,并对其构建了大规模的语料数据。针对百度知道的特点,文本提出的基于时序的特征、基... 问答社区已经成为网络信息获取的一种重要渠道,但其信息质量差异较大。该文研究了问答社区中回答质量的评价方法。具体考察了百度知道的问答社区环境,并对其构建了大规模的语料数据。针对百度知道的特点,文本提出的基于时序的特征、基于问题粒度的特征和基于百度知道社区用户的特征,从更多的角度对回答质量进行评价。利用分类学习的框架,该文综合了新设计的三方面特征和经典的文本特征、链接特征,对高质量和非高质量的回答进行分类。基于大规模问答语料的实验表明,在文本特征与链接特征的基础上,基于时序与基于问题粒度的特征能够有效地提高回答质量的评估效果。另外也发现,根据该文的回答质量评价框架做出的质量评分能够有效地预测最佳答案。 展开更多
关键词 问答社区 质量评价
下载PDF
中文社区问答中问题答案质量评价和预测 被引量:27
2
作者 李晨 巢文涵 +1 位作者 陈小明 李舟军 《计算机科学》 CSCD 北大核心 2011年第6期230-236,共7页
知识共享型网站为自动问答系统带来了新的研究契机。但用户提供的问题及其答案质量参差不齐,在提供有用信息的同时可能包含各种无关甚至恶意的信息。对此类信息进行判别和过滤,并选取高质量的问题与答案对,有助于在基于社区的自动问答... 知识共享型网站为自动问答系统带来了新的研究契机。但用户提供的问题及其答案质量参差不齐,在提供有用信息的同时可能包含各种无关甚至恶意的信息。对此类信息进行判别和过滤,并选取高质量的问题与答案对,有助于在基于社区的自动问答系统中重用相关问题的答案以提高问答系统的服务质量。首先从中文社区问答网站上抓取大量问题及答案,利用社会网络的方法对提问者和回答者的互动关系及特点进行了统计与分析。然后基于给定的问答质量判定标准,对3000多个问题及其答案进行了人工标注。并通过提取文本和非文本两类特征集,利用机器学习算法设计和实现了基于特征集的问答质量分类器。试验结果表明其精度和召回率均在70%以上。最后分析了影响社区网络中问答质量的主要因素。 展开更多
关键词 社区问答 社会网络 机器学习 问题答案质量评价和预测 人工标注
下载PDF
社区问答系统研究综述 被引量:15
3
作者 张中峰 李秋丹 《计算机科学》 CSCD 北大核心 2010年第11期19-23,54,共6页
作为一种新兴的知识共享模式,社区问答系统(CQA)具有交互性、开放性的特点,能够更好地满足为用户提供个性化的信息服务的需求。对社区问答系统的研究及应用现状进行综述,系统阐述了用户行为模式、内容质量检测、问题检索等CQA中主要问... 作为一种新兴的知识共享模式,社区问答系统(CQA)具有交互性、开放性的特点,能够更好地满足为用户提供个性化的信息服务的需求。对社区问答系统的研究及应用现状进行综述,系统阐述了用户行为模式、内容质量检测、问题检索等CQA中主要问题的研究以及CQA在其他媒体中的应用。最后展望了CQA中下一步值得研究的问题。本讨论有助于进一步丰富和拓展CQA的研究。 展开更多
关键词 社区问答系统 用户行为模式 内容质量检测 问题检索
下载PDF
A Survey on Expert Recommendation in Community Question Answering 被引量:13
4
作者 Xianzhi Wang Chaoran Huang +2 位作者 Lina Yao Boualem Benatallah Manqing Dong 《Journal of Computer Science & Technology》 SCIE EI CSCD 2018年第4期625-653,共29页
Community question answering (CQA) represents the type of Web applications where people can exchange knowledge via asking and answering questions. One significant challenge of most real-world CQA systems is the lack... Community question answering (CQA) represents the type of Web applications where people can exchange knowledge via asking and answering questions. One significant challenge of most real-world CQA systems is the lack of effective matching between questions and the potential good answerers, which adversely affects the efficient knowledge acquisition and circulation. On the one hand, a requester might experience many low-quality answers without receiving a quality response in a brief time; on the other hand, an answerer might face numerous new questions without being able to identify the questions of interest quickly. Under this situation, expert recommendation emerges as a promising technique to address the above issues. Instead of passively waiting for users to browse and find their questions of interest, an expert recommendation method raises the attention of users to the appropriate questions actively and promptly. The past few years have witnessed considerable efforts that address the expert recommendation problem from different perspectives. These methods all have their issues that need to be resolved before the advantages of expert recommendation can be fully embraced. In this survey, we first present an overview of the research efforts and state-of-the-art techniques for the expert recommendation in CQA. We next summarize and compare the existing methods concerning their advantages and shortcomings, followed by discussing the open issues and future research directions. 展开更多
关键词 community question answering expert recommendation CHALLENGE SOLUTION future direction
原文传递
一种面向社区型问句检索的主题翻译模型 被引量:7
5
作者 张伟男 张宇 刘挺 《计算机学报》 EI CSCD 北大核心 2015年第2期313-321,共9页
基于统计机器翻译模型的问句检索模型,其相关性排序机制主要依赖于词项间的翻译概率,然而已有的模型没有很好地控制翻译模型的噪声,使得当前的问句检索模型存在不完善之处.文中提出一种基于主题翻译模型的问句检索模型,从理论上说明,该... 基于统计机器翻译模型的问句检索模型,其相关性排序机制主要依赖于词项间的翻译概率,然而已有的模型没有很好地控制翻译模型的噪声,使得当前的问句检索模型存在不完善之处.文中提出一种基于主题翻译模型的问句检索模型,从理论上说明,该模型利用主题信息对翻译进行合理的约束,达到控制翻译模型噪声的效果,从而提高问句检索的结果.实验结果表明,文中提出的模型在MAP(Mean Average Precision)、MRR(Mean Reciprocal Rank)以及p@1(precision at position one)等指标上显著优于当前最先进的问句检索模型. 展开更多
关键词 社区型问答 问句检索 主题模型 翻译模型 LDA(Latent DIRICHLET Allocation) 社会计算 社交网络
下载PDF
基于用户回答顺序的社区问答答案质量预测研究 被引量:6
6
作者 徐安滢 吉宗诚 王斌 《中文信息学报》 CSCD 北大核心 2017年第2期132-138,共7页
近年来,随着互联网的普及和知识爆炸性的增长,社区问答网站积累了大量的用户和内容,同时也产生了大量的低质量文本,极大地影响了用户检索满意答案的效率,因此如何提升答案质量预测的性能十分重要。目前,社区问答答案质量预测方面的研究... 近年来,随着互联网的普及和知识爆炸性的增长,社区问答网站积累了大量的用户和内容,同时也产生了大量的低质量文本,极大地影响了用户检索满意答案的效率,因此如何提升答案质量预测的性能十分重要。目前,社区问答答案质量预测方面的研究大都是使用点方式(pointwise)来实现分类模型,但由于问题的难度不同,对答案的要求也有所差异,使用点方式会忽略掉部分答案的特点,所以该文使用点对方式(pairwise)来预测答案质量。另外,已有的研究工作表明,社区问答中同一问题下的答案数量特征对答案质量预测没有效果,甚至有冗余作用。对于时间差也有相同的结论,即不能提升预测性能。该文提出了一种将上述两者结合在一起的新特征,实验结果表明,该特征能显著提高社区问答答案质量预测的性能。 展开更多
关键词 答案质量预测 排序学习 社区问答 回答顺序
下载PDF
面向问答社区的答案摘要方法研究综述 被引量:6
7
作者 刘秉权 徐振 +3 位作者 刘峰 刘铭 孙承杰 王晓龙 《中文信息学报》 CSCD 北大核心 2016年第1期1-7 15,共8页
社区问答系统(Community-Based Question Answering Portal,CQA)的兴起,不仅为用户提供了信息获取与知识分享的平台,同时也积累了大量的问答资源。近年来对于问答社区中的问题匹配、专家发现、用户满意度分析、答案质量评价等方面的研... 社区问答系统(Community-Based Question Answering Portal,CQA)的兴起,不仅为用户提供了信息获取与知识分享的平台,同时也积累了大量的问答资源。近年来对于问答社区中的问题匹配、专家发现、用户满意度分析、答案质量评价等方面的研究也逐渐加深,特别是答案质量研究已经从通过答案质量评价改善用户体验,逐步过渡到使用答案摘要提升答案质量。该文阐述了答案摘要对于社区问答系统中问答对资源再利用的重要意义,概括了答案摘要的主要任务,分析了答案摘要和多文档自动文摘的异同点,对答案摘要国内外的研究现状进行了概述,并且总结了答案摘要中需要进一步解决的关键技术问题。 展开更多
关键词 答案摘要 问答社区 问句分类 文本语义相似度
下载PDF
社会化问答网站知识传播网络推断方法 被引量:6
8
作者 左遥 梁英 +3 位作者 毕晓迪 史红周 董祥祥 李锦涛 《计算机学报》 EI CSCD 北大核心 2018年第1期82-97,共16页
社会化问答网站通过用户间提问与回答的方式帮助用户获得全面的知识.知识传播过程是进一步研究信息传播规律和社交行为的基础,由于无从得知传播者影响了哪些用户,因而无法直接获得答案的完整传播过程.该文提出了一种描述社会化问答网站... 社会化问答网站通过用户间提问与回答的方式帮助用户获得全面的知识.知识传播过程是进一步研究信息传播规律和社交行为的基础,由于无从得知传播者影响了哪些用户,因而无法直接获得答案的完整传播过程.该文提出了一种描述社会化问答网站知识传播过程的传播网络模型,定义了社会化问答网站知识从传播者到接收者的传播过程,归纳出follow,notification,qlink,recommendation这4种可能的知识传播方式,给出了知识传播网络定义,为传播网络推断奠定了理论基础.提出了一种社会化问答网站知识传播网络推断方法,分别提取节点类型、节点时间关系及候选传播者排序特征推断follow关系,采用启发式方法推断另外3种关系,生成知识传播网络.结合知乎问答数据对所提方法进行了实验验证及实例分析,结果表明推断方法有效并具有较高的准确率. 展开更多
关键词 社会化问答网站 知识传播方式 信息传播模型 传播网络推断 知识传播过程
下载PDF
考虑主题兴趣和领域权威的问答社区专家推荐研究
9
作者 李明珠 米传民 +1 位作者 苟小义 肖琳 《数据分析与知识发现》 EI CSCD 北大核心 2024年第5期68-79,共12页
【目的】对用户历史问答文本实现考虑上下文语义信息的主题识别,进而提升问答社区专家推荐的准确度。【方法】通过构建BERT-LLDA模型,将BERT模型与Labeled-LDA主题模型相结合,充分利用标签信息对用户历史问答文本进行向量化,通过降维和... 【目的】对用户历史问答文本实现考虑上下文语义信息的主题识别,进而提升问答社区专家推荐的准确度。【方法】通过构建BERT-LLDA模型,将BERT模型与Labeled-LDA主题模型相结合,充分利用标签信息对用户历史问答文本进行向量化,通过降维和主题聚类实现考虑上下文语义信息的主题识别,获得用户的主题兴趣概率分布;根据主题兴趣挖掘结果构建主题敏感PageRank算法(TSPR),并加入用户质量权重迭代计算用户的领域权威;基于此得到考虑主题兴趣和领域权威的问答社区专家推荐算法TIDARank,为新问题推荐潜在回答专家。【结果】基于Stack Exchange公开数据集,BERT-LLDA模型经过主题聚类后相比TF-IDF、BERT、BERT-LDA等对比模型具有更高的轮廓系数(0.5756)和主题连贯性(0.4766);TIDARank算法的最佳回答者命中率ACC@20和平均倒数排名MRR@20分别为0.5807和0.2430,相比于表现最优的对比模型BiLSTM+TSPR分别提升0.145和0.081。【局限】在链接分析中未考虑用户的活跃情况。【结论】BERT-LLDA模型不仅可以优化主题聚类的效果,且有助于提升问答社区专家推荐的性能。 展开更多
关键词 社区问答 专家推荐 BERT Labeled-LDA PAGERANK
原文传递
基于混合式的社区问答答案质量评价模型 被引量:5
10
作者 袁健 刘瑜 《计算机应用研究》 CSCD 北大核心 2017年第6期1708-1712,共5页
社区问答系统已经成为获取和分享知识的一种重要渠道,但用户提供的信息质量差异比较大。针对社区问答系统中具有多个答案的问题,提出了一种基于混合式的社区问答答案质量评价模型,可实现最佳答案的选取。该模型首先利用基于用户活动的UA... 社区问答系统已经成为获取和分享知识的一种重要渠道,但用户提供的信息质量差异比较大。针对社区问答系统中具有多个答案的问题,提出了一种基于混合式的社区问答答案质量评价模型,可实现最佳答案的选取。该模型首先利用基于用户活动的UAM模型获得问题和答案的主题相似度并剔除无关回复,然后结合用户权威度及多重评价标准,对答案进行评分,获得对答案的定量评价结果。基于Stack Overflow的实验表明,该方法可有效地对答案进行质量评分,有实用价值。 展开更多
关键词 社区问答系统 质量评价 主题 用户权威度 多重评价标准
下载PDF
Enhanced Answer Selection in CQA Using Multi-Dimensional Features Combination 被引量:3
11
作者 Hongjie Fan Zhiyi Ma +2 位作者 Hongqiang Li Dongsheng Wang Junfei Liu 《Tsinghua Science and Technology》 SCIE EI CAS CSCD 2019年第3期346-359,共14页
Community Question Answering(CQA) in web forums, as a classic forum for user communication,provides a large number of high-quality useful answers in comparison with traditional question answering.Development of method... Community Question Answering(CQA) in web forums, as a classic forum for user communication,provides a large number of high-quality useful answers in comparison with traditional question answering.Development of methods to get good, honest answers according to user questions is a challenging task in natural language processing. Many answers are not associated with the actual problem or shift the subjects,and this usually occurs in relatively long answers. In this paper, we enhance answer selection in CQA using multidimensional feature combination and similarity order. We make full use of the information in answers to questions to determine the similarity between questions and answers, and use the text-based description of the answer to determine whether it is a reasonable one. Our work includes two subtasks:(a) classifying answers as good, bad, or potentially associated with a question, and(b) answering YES/NO based on a list of all answers to a question. The experimental results show that our approach is significantly more efficient than the baseline model, and its overall ranking is relatively high in comparison with that of other models. 展开更多
关键词 community question answering information RETRIEVAL MULTI-DIMENSIONAL features extraction SIMILARITY computation
原文传递
一种基于主题类别信息问句检索的新方法 被引量:4
12
作者 杨海天 王健 林鸿飞 《计算机应用与软件》 CSCD 2015年第2期24-27,44,共5页
社区问答系统CQA(Community Question Answering),如雅虎问答是专门为了解决传统搜索引擎的局限来帮助用户获取有用信息的社区。问句检索在CQA中主要是针对用户提出来的新问题,在历史问答对中检索出与用户最相关的问题,从而减少用户等... 社区问答系统CQA(Community Question Answering),如雅虎问答是专门为了解决传统搜索引擎的局限来帮助用户获取有用信息的社区。问句检索在CQA中主要是针对用户提出来的新问题,在历史问答对中检索出与用户最相关的问题,从而减少用户等待的时间,给用户带来更好的体验。提出一种基于主题类别信息问句检索的新方法来解决问句检索问题,利用问句的主题类别信息对语言模型进行平滑,同时融入问句的语义信息来解决问句检索问题。实验在Yahoo!Answers上抽取的真实标注数据集上进行,对比实验结果表明,所提出的方法在性能上得到了较好的结果。 展开更多
关键词 社区问答 问句检索 语言模型
下载PDF
融合多头自注意力的问答社区专家推荐算法
13
作者 陈颖婷 林耿 +3 位作者 陈梦 陈双梅 林夏莹 龙素娟 《计算机应用研究》 CSCD 北大核心 2023年第5期1452-1458,共7页
专家推荐是在线问答社区的研究热点之一,但现有的算法大多关注用户的静态兴趣和问题信息的匹配,忽视了对用户的动态兴趣表征信息的有效捕捉,从而导致推荐的准确度不足。针对上述问题,提出了融合多头自注意力的问答社区专家推荐算法。首... 专家推荐是在线问答社区的研究热点之一,但现有的算法大多关注用户的静态兴趣和问题信息的匹配,忽视了对用户的动态兴趣表征信息的有效捕捉,从而导致推荐的准确度不足。针对上述问题,提出了融合多头自注意力的问答社区专家推荐算法。首先,构造由卷积神经网络和注意力机制组成的问题编码器,来处理目标问题和用户历史回答问题,提取对应的问题表征;其次,将用户历史回答问题序列当做时间序列,利用多头自注意力机制学习序列中所蕴涵的动态兴趣表征,结合用户的静态兴趣表征,获取用户的综合兴趣表征;最后,将目标问题表征和用户综合表征进行相似性计算产生推荐结果。利用来自知乎问答社区的真实数据进行了不同参数配置及不同算法的对比实验,实验结果表明该算法性能要明显优于目前较流行的深度学习专家推荐算法。 展开更多
关键词 深度学习 卷积神经网络 多头自注意力机制 专家推荐 社区问答
下载PDF
面向社区问答匹配的混合神经网络模型 被引量:3
14
作者 张衍坤 陈羽中 刘漳辉 《小型微型计算机系统》 CSCD 北大核心 2020年第9期1833-1838,共6页
问答匹配是社区问答的一项重要且具有挑战性的任务.本文提出了一种面向社区问答匹配的混合神经网络模型.针对问答对序列,提出了融合卷积神经网络(CNN)与双向长短期记忆网络(Bi-LSTM)的混合模型,学习问答对的语义信息及问答对序列的上下... 问答匹配是社区问答的一项重要且具有挑战性的任务.本文提出了一种面向社区问答匹配的混合神经网络模型.针对问答对序列,提出了融合卷积神经网络(CNN)与双向长短期记忆网络(Bi-LSTM)的混合模型,学习问答对的语义信息及问答对序列的上下文相关性信息;针对用户的历史回答,提出基于多维度注意力机制的用户-问题建模方法,学习用户与问题之间的相关性信息.在SemEval-2015CQA数据集上的实验结果表明,与现有的社区问答匹配算法相比,本文算法能够有效提高社区问答匹配精度. 展开更多
关键词 社区问答 问答匹配 多维度注意力机制 用户建模
下载PDF
基于异构信息网络的推荐系统 被引量:3
15
作者 崔鑫 《计算机与现代化》 2020年第12期13-19,共7页
随着互联网、计算机等技术的深入发展,互联网为用户带来了各类网络服务用于增进用户交流。其中,问答社区为用户提供了提问和回答的交流平台,其目的是通过互联网实现用户间的知识经验分享和信息传播。但仍存在一些问题限制问答社区的发展... 随着互联网、计算机等技术的深入发展,互联网为用户带来了各类网络服务用于增进用户交流。其中,问答社区为用户提供了提问和回答的交流平台,其目的是通过互联网实现用户间的知识经验分享和信息传播。但仍存在一些问题限制问答社区的发展,例如随着用户数量的不断增长,大量问题得不到及时回答且提问者对已有问题的回答并不满意。因此,对于问答社区来说,如何从大量的用户中找到专家用户是非常重要的。针对以上问题,本文提出一种基于异构信息网络的推荐方法,首先对问答社区中的问题属性和用户属性建立异构信息网络,利用元路径来捕捉异构信息网络中丰富的语义信息,然后使用基于元路径的相似度计算方法分别计算问题与用户的相似度矩阵,采用3种方式将得到的相似度矩阵与问题-用户评分矩阵相融合,然后使用矩阵分解获得问题和用户的潜在特征,最后使用因子分解机进行训练和推荐。在海川化工问答数据集上将本文提出的方法同多种先进的推荐算法进行对比,并利用评价指标对模型进行评估。实验结果表明,本文提出的算法在相关评估指标方面相较于之前的算法具有一定优势。 展开更多
关键词 异构信息网络 问答社区 协同过滤 因子分解机
下载PDF
社区问答系统中基于当前兴趣的问题推荐研究 被引量:2
16
作者 赵永标 张其林 谷琼 《现代信息科技》 2019年第11期1-4,共4页
社区问答系统作为一种新兴的知识分享平台,在帮助用户获取有用信息方面取得了相当大的成功。将用户提出的问题推荐给感兴趣的回答者依然是社区问答平台面临的一个问题。针对兴趣度,已提出了多个表示模型,但这些模型没有考虑兴趣的时间... 社区问答系统作为一种新兴的知识分享平台,在帮助用户获取有用信息方面取得了相当大的成功。将用户提出的问题推荐给感兴趣的回答者依然是社区问答平台面临的一个问题。针对兴趣度,已提出了多个表示模型,但这些模型没有考虑兴趣的时间维度。本文提出用TOT主题模型建立备选回答者兴趣的动态变化模型,找出备选回答者的当前兴趣,然后进行问题推荐。实验表明本文提出的方法是有效的。 展开更多
关键词 社区问答系统 问题推荐 兴趣度 TOPICS OVER Time主题模型
下载PDF
问答社区中基于问题粒度的用户专业性预测方法 被引量:1
17
作者 朱敏 田伟 +2 位作者 彭第 苏亚博 牛颢 《工程科学与技术》 EI CAS CSCD 北大核心 2019年第1期173-180,共8页
在线问答社区中大量问题等待回答时间过长、高质量回答数极少,对社区用户在具体问题上的专业程度进行度量具有现实需求。现有的基于链接分析和基于文本分析等方法多集中在社区和话题粒度的专业性度量,并未深入到问题粒度。针对上述问题... 在线问答社区中大量问题等待回答时间过长、高质量回答数极少,对社区用户在具体问题上的专业程度进行度量具有现实需求。现有的基于链接分析和基于文本分析等方法多集中在社区和话题粒度的专业性度量,并未深入到问题粒度。针对上述问题,定义了问答社区中基于问题粒度的用户专业性概念,在此基础上提出了基于问题粒度的用户专业性预测方法,包括用户专业性度量方法和用户专业性预测模型。该预测方法先利用问答社区中社区用户对回答质量的评价机制,在问题粒度上为用户建立专业性度量;再基于矩阵分解,融合用户偏差、问题偏差以及用户已回答问题集的隐含反馈等信息,构建用户在问题粒度上的专业性预测模型,进而预测用户在待回答问题上的专业程度。利用知乎问答社区互联网话题下的问答数据集,设计了与前述两种主流方法的对比实验。实验结果表明,提出的用户专业性度量方法可以有效地度量用户在具体问题上的专业程度,基于此方法构建的用户专业性预测模型具有更高的预测精度。 展开更多
关键词 在线问答社区 问题粒度 用户专业性 矩阵分解 预测模型
下载PDF
基于语义共现与注意力网络的问题分类方法 被引量:1
18
作者 楼姣 马伟锋 +1 位作者 季曹婷 马来宾 《浙江科技学院学报》 CAS 2020年第4期264-271,共8页
针对汽车故障问答文本特征稀疏、语义信息不全、深层次语义特征较难提取等问题,提出基于问题-答案语义共现的多层次注意力卷积长短时记忆网络模型(co-occurrence word attention convolution LSTM neural network,CACL)的问题分类方法... 针对汽车故障问答文本特征稀疏、语义信息不全、深层次语义特征较难提取等问题,提出基于问题-答案语义共现的多层次注意力卷积长短时记忆网络模型(co-occurrence word attention convolution LSTM neural network,CACL)的问题分类方法。通过向量空间模型计算问题与答案文本中语义相似的共现词,使用注意力机制聚焦问题文本中的共现词特征,输入卷积神经网络(convolutional neural network,CNN)提取问题局部特征,通过长短时记忆网络(long short-term memory network,LSTM)及词级别注意力机制提取长距离依赖特征及其更高层次的文本特征,采用Softmax进行问题分类。结果表明,相比较于主流的问题分类方法,该方法有效提高了问题分类的精度,最高提升了10.04%的准确率。同时,试验发现当选用11个有效共现词且共现词来自问题文本时,模型的处理精度最佳。合理利用问题-答案文本语义相似的共现词,能有效提升汽车故障问题的分类性能,且共现词的个数、来源对问题的分类精度有一定的影响。 展开更多
关键词 问答社区 语义共现 问题分类 共现词注意力机制 长短时记忆网络
下载PDF
基于特征融合的社区问答问句相似度计算 被引量:1
19
作者 杨海天 王健 林鸿飞 《江西师范大学学报(自然科学版)》 CAS 北大核心 2013年第2期125-129,共5页
提出了一种基于特征融合的问句匹配框架来解决问句相似度检测方法,利用答案特征、词序特征、统计特征和语义特征相结合来解决问句相似度计算问题.在Yahoo!Answers上抽取的真实标注数据集上进行实验,实验结果表明:该方法在性能上得到了... 提出了一种基于特征融合的问句匹配框架来解决问句相似度检测方法,利用答案特征、词序特征、统计特征和语义特征相结合来解决问句相似度计算问题.在Yahoo!Answers上抽取的真实标注数据集上进行实验,实验结果表明:该方法在性能上得到了较好的结果. 展开更多
关键词 问句相似度 社区问答 相似度计算 特征融合
下载PDF
面向大规模社区问答数据的问题检索方法
20
作者 田作辉 关毅 《智能计算机与应用》 2013年第6期63-66,69,共5页
随着问答社区网站的兴起,越来越多的用户生成数据积累了起来。这些用户生成数据不仅具有海量的、多样性的等特点,还有着极高的质量和重用价值。为了高效地管理和利用这些数据,近年来研究人员基于这些数据进行了大量的研究和实践,而社区... 随着问答社区网站的兴起,越来越多的用户生成数据积累了起来。这些用户生成数据不仅具有海量的、多样性的等特点,还有着极高的质量和重用价值。为了高效地管理和利用这些数据,近年来研究人员基于这些数据进行了大量的研究和实践,而社区问答中的问题检索就是一个被广泛研究的课题。主要研究了面向大规模社区问答数据的问题检索方法。收集来自Yahoo!Answers等社区网站的超过1.3亿问题和10亿答案的大规模数据,与之前的基于百万量级的数据的问答社区相关研究工作相比有着明显的不同和极高的实用价值。在此数据的基础上,通过查询自动分类方法来提高每次查询效率和效果。在问题检索过程中,提出了应用查询问句和问题的结构信息和语义信息,结合排序学习算法来融合多种不同类别的特征的方法,通过应用训练数据生成排序模型来提高问题检索的相关性和词语不匹配等问题。实验表明,本文应用Ranking SVM方法来训练的排序模型在不同数据集上,其准确率等评价指标上都相比以往的方法有着显著的提高。 展开更多
关键词 社区问答 问题检索 排序支持向量机
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部