期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
基于词句重要性的中文专利关键词自动抽取研究 被引量:5
1
作者 王志宏 过弋 《情报理论与实践》 CSSCI 北大核心 2018年第9期123-129,160,共8页
[目的/意义]专利关键词是对专利核心内容的概括,高效准确地抽取专利关键词不仅可以辅助人们对专利的快速查找,同时对专利分类、聚类、翻译等具有重要意义。[方法/过程]提出了"关键词在关键句中"的关键词抽取新思路。首先构建... [目的/意义]专利关键词是对专利核心内容的概括,高效准确地抽取专利关键词不仅可以辅助人们对专利的快速查找,同时对专利分类、聚类、翻译等具有重要意义。[方法/过程]提出了"关键词在关键句中"的关键词抽取新思路。首先构建了一个联合句网络语义图特征和启发式规则特征的专利摘要句排序模型,然后仅选择Top-KS%的句子参与关键词计算,同时将句子语义权重参数引入到关键词权重计算过程中,从而使得句子的重要性传递到句中的词上。[结果/结论]在真实中文专利数据集中实验表明,从中文专利中选择适当比例关键句参与关键词抽取计算,相较于传统关键词抽取算法F值提升了6%~13%左右,有效地降低原始文档的噪声数据,提升了关键词抽取的效果。 展开更多
关键词 中文专利 关键句 句排序 专利关键词 自动抽取
原文传递
基于段落-句子互增强的自动文摘算法 被引量:3
2
作者 谢浩 孙伟 《计算机科学》 CSCD 北大核心 2013年第11A期246-250,共5页
句子排序问题是文本自动摘要的核心问题,基于互增强关系(MRP)的基本思想,提出一种新的句子排序模型——段落-句子互增强模型。利用段落关系,通过段落句子的互增强,迭代计算出句子的显著度,抽取出文摘句。分析了模型中的内、外影响因子... 句子排序问题是文本自动摘要的核心问题,基于互增强关系(MRP)的基本思想,提出一种新的句子排序模型——段落-句子互增强模型。利用段落关系,通过段落句子的互增强,迭代计算出句子的显著度,抽取出文摘句。分析了模型中的内、外影响因子对算法效果的影响并对冗余处理进行了讨论。实验表明,将其运用在单文本自动摘要中,能取得高质量的文摘。 展开更多
关键词 句子排序 互增强关系 自动文摘
下载PDF
基于语种关联度课程学习的多语言神经机器翻译 被引量:1
3
作者 于东 谢婉莹 +1 位作者 谷舒豪 冯洋 《计算机科学》 CSCD 北大核心 2022年第1期24-30,共7页
近年来,使用单一模型实现多语言神经机器翻译的方法受到了广泛关注。然而,现有方法多将所有语种语料直接混合作为训练语料,未能利用多种语言之间关联和相似的信息。此外,模型训练涉及语言种类多、数据量大、整体训练难度大、耗时长等问... 近年来,使用单一模型实现多语言神经机器翻译的方法受到了广泛关注。然而,现有方法多将所有语种语料直接混合作为训练语料,未能利用多种语言之间关联和相似的信息。此外,模型训练涉及语言种类多、数据量大、整体训练难度大、耗时长等问题。针对以上两个问题,文中提出了一种基于语种关联度的课程学习方法来提高多语言神经机器翻译的整体性能和收敛速度。具体来说,提出了两种度量语种关联度的指标:使用奇异向量典型相关分析对不同语言进行排序以及使用余弦相似度对特定语言中的不同句子进行排序。进一步,文中提出以验证集损失为课程替换标准的课程学习策略,使模型训练由整体训练转化为一系列课程上的训练,降低了训练难度。该方法填补了课程学习策略在多语言神经机器翻译领域的空白。文中在平衡和非平衡的IWSLT多语言数据集和Europarl语料库数据集上进行了实验,结果表明,所提方法优于多语言基线翻译系统,最多可使训练时间缩短64%。 展开更多
关键词 机器翻译 多语言 课程学习 关联度评估 语种排序 句子排序
下载PDF
Construction of an Automatic Bengali Text Summarizer Using Machine Learning Approaches
4
作者 Busrat Jahan Mahfuja Khatun +2 位作者 Zinat Ara Zabu Afranul Hoque Sayed Uddin Rayhan 《Journal of Data Analysis and Information Processing》 2022年第1期43-57,共15页
In our study, we chose python as the programming platform for finding an Automatic Bengali Document Summarizer. English has sufficient tools to process and receive summarized records. However, there is no specifically... In our study, we chose python as the programming platform for finding an Automatic Bengali Document Summarizer. English has sufficient tools to process and receive summarized records. However, there is no specifically applicable to Bengali since Bengali has a lot of ambiguity, it differs from English in terms of grammar. Afterward, this language holds an important place because this language is spoken by 26 core people all over the world. As a result, it has taken a new method to summarize Bengali documents. The proposed system has been designed by using the following stages: pre-processing the sample doc/input doc, word tagging, pronoun replacement, sentence ranking, as well as summary. Pronoun replacement has been used to reduce the incidence of swinging pronouns in the performance review. We ranked sentences based on sentence frequency, numerical figures, and pronoun replacement. Checking the similarity between two sentences in order to exclude one since it has less duplication. Hereby, we’ve taken 3000 data as input from newspaper and book documents and learned the words to be appropriate with syntax. In addition, to evaluate the performance of the designed summarizer, the design system looked at the different documents. According to the assessment method, the recall, precision, and F-score were 0.70, 0.82 and 0.74, respectively, representing 70%, 82% and 74% recall, precision, and F-score. It has been found that the proper pronoun replacement was 72%. 展开更多
关键词 Natural Language Processing Formatting Bangla Text Summarizer Bengali Language Processing Word Tagging Pronoun Replacement sentence ranking
下载PDF
基于频率算符的专利智能化检索策略及其在农药等化学领域中的高效运用
5
作者 严华 《世界农药》 CAS 2023年第6期25-29,共5页
农药等化学领域专利申请往往以化合物、组合物以及制备方法等形式较多,针对于这方面申请在构建检索表达式上存在较大的难度,且在专利数据库中检索往往呈现噪音大、漏检等现象。智能检索系统已成为专利检索工作的主要工具,提升检索效能... 农药等化学领域专利申请往往以化合物、组合物以及制备方法等形式较多,针对于这方面申请在构建检索表达式上存在较大的难度,且在专利数据库中检索往往呈现噪音大、漏检等现象。智能检索系统已成为专利检索工作的主要工具,提升检索效能潜力明显。信息化时代文献数量的爆炸式增长以及数据库不断整合使得文献检索范围的扩大,导致实际检索中噪音文献越来越多,智能语义检索推荐TOP 100篇文献的命中率对于文献查全和查准也存在局限性。为基于智能语义排序快速筛选出对比文件,探索了在智能检索模式下,以频率算符为基础,联合其他布尔运算符快速降噪,实现了“人工智慧+机器智能”协同作用,利于智能化检索系统在农药等化学领域中高效运用。 展开更多
关键词 频率算符 同段算符 同句算符 邻近算符 语义排序
下载PDF
查询无关排序主题模型
6
作者 肖智博 车丰 +2 位作者 吴镝 李庆丰 鲁明羽 《模式识别与人工智能》 EI CSCD 北大核心 2014年第7期623-630,共8页
主题模型已成为机器学习和自然语言处理等领域研究的重要工具,它可发现大规模语料库中的隐含主题.随着语料库规模增大,发现的主题规模也随之增大.绝大多数主题模型以词袋模型为基础,无法描述词项间的顺序关系,使得主题之间无法按照重要... 主题模型已成为机器学习和自然语言处理等领域研究的重要工具,它可发现大规模语料库中的隐含主题.随着语料库规模增大,发现的主题规模也随之增大.绝大多数主题模型以词袋模型为基础,无法描述词项间的顺序关系,使得主题之间无法按照重要性区分.文中提出查询无关排序主题模型框架,利用主题间各种关系排序主题,得到有序主题列表.主题关系从主题层面评价主题影响度,继而提出词项贡献度,从词项语义层面评价主题,削弱流行但语义空泛的排序主题.由于排序主题模型尚未有公认的评价标准,将有序主题作为特征进行多文档自动文摘生成,通过文摘效果间接评价主题排序的效果.实验结果证明有序主题模型优于非排序主题模型的结果. 展开更多
关键词 排序主题模型 主题模型评价 多文档自动文摘 抽取性文摘 文摘句排序
下载PDF
词句协同排序的自动摘要算法 被引量:5
7
作者 陈晨 张璐 伍之昂 《江苏大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第4期443-449,共7页
为了提高自动摘要的质量,研究了基于图模型的词句协同排序的自动摘要算法技术.自动摘要试图从原始文本中提取一定数量的重要句子形成节录式摘要,句排序是实现自动摘要的典型手段,已有工作大多通过构建词或句关联网络,再使用PageRank计... 为了提高自动摘要的质量,研究了基于图模型的词句协同排序的自动摘要算法技术.自动摘要试图从原始文本中提取一定数量的重要句子形成节录式摘要,句排序是实现自动摘要的典型手段,已有工作大多通过构建词或句关联网络,再使用PageRank计算节点排序分值,该算法考虑词与句之间的互影响,提出词句协同排序的自动摘要算法,在句关联网络上融入词对句子排序分值的影响,而词的重要性由包含其句子的排序分值所决定.在句排序结果基础上,提出基于冗余度的句选择方法,以进一步提升自动摘要质量.在10篇中文文档上的试验结果表明,较之于单纯的句排序方法,所提出方法能有效提升自动摘要的准确率和召回率. 展开更多
关键词 自动摘要 单文本文摘 节录式摘要 词句协同排序 PAGERANK
下载PDF
融合回答者排序得分的CQA答案摘要方法
8
作者 丁邱 严馨 +2 位作者 刘艳超 徐广义 邓忠莹 《陕西理工大学学报(自然科学版)》 2023年第5期38-46,共9页
针对现有答案摘要方法对句子建模不够充分,并且忽略了回答者相关信息在摘要过程中的作用,提出了融合回答者排序得分的CQA答案摘要方法。首先,使用RoBERTa-wwm结合平均池化对句子进行编码获取句子深层语义表示;然后,使用DUM专家推荐方法... 针对现有答案摘要方法对句子建模不够充分,并且忽略了回答者相关信息在摘要过程中的作用,提出了融合回答者排序得分的CQA答案摘要方法。首先,使用RoBERTa-wwm结合平均池化对句子进行编码获取句子深层语义表示;然后,使用DUM专家推荐方法依据回答者相关信息对回答者进行排序,依据排序结果求得回答者排序得分;最后,综合句子相关性、句子新颖性、回答者排序得分计算句子综合得分,根据句子综合得分使用MMR思想迭代选取句子构成答案摘要。实验表明,使用RoBERTa-wwm结合平均池化能更好地获取到答案句的深层语义信息,综合3个评分选取摘要句既能考虑答案与问题、答案与答案间的交互,也能较好地融入回答者的信息,有效地改善了答案摘要的质量。 展开更多
关键词 问答社区 答案摘要 RoBERTa-wwm 句子相关性 句子新颖性 回答者排序得分
下载PDF
词句协同自动摘要提取方法 被引量:2
9
作者 吴云 杨长春 +1 位作者 梅佳俊 顾寰 《计算机工程与设计》 北大核心 2018年第9期2776-2779,2810,共5页
为提高自动文摘的质量,提出一种词句协同的自动摘要提取算法(F-CoRank)。在传统词频的基础上,提高与标题相似的特征词的词频,得出提高后的词频矩阵和句子之间的相似度后,构建无向网络图,根据词句协同算法,得到各个节点的权重,对得到的... 为提高自动文摘的质量,提出一种词句协同的自动摘要提取算法(F-CoRank)。在传统词频的基础上,提高与标题相似的特征词的词频,得出提高后的词频矩阵和句子之间的相似度后,构建无向网络图,根据词句协同算法,得到各个节点的权重,对得到的粗文摘进行冗余处理,根据相应的需求,选择权重较高的前几个句子作为摘要。在哈工大的单文本文档语料上进行实验,实验结果表明,提高词频权重在一定程度上改进了文摘的质量,相比词句协同算法(Co-Rank)在覆盖率上有了较大提高。 展开更多
关键词 词权重 标题 词句协同 单文本文档 覆盖率
下载PDF
“框架核心分析法”解读
10
作者 戚晓杰 《东方论坛(青岛大学学报)》 2017年第3期69-75,共7页
"框架核心分析法"是黄伯荣先生晚年创建并大力倡导的一种分析句子的方法,已开始在他所主编的黄廖本《现代汉语》教材中实施运用。该分析法可说是一种既讲核心又讲层次、既讲框架又讲位次的分析句子的方法,它简明、实用,有自... "框架核心分析法"是黄伯荣先生晚年创建并大力倡导的一种分析句子的方法,已开始在他所主编的黄廖本《现代汉语》教材中实施运用。该分析法可说是一种既讲核心又讲层次、既讲框架又讲位次的分析句子的方法,它简明、实用,有自己的句法理论、析句程序与符号,并考虑到计算机析句法基础的问题,显示了其深远的学术眼光。通过对该分析法的产生过程、基本思想及其发展演变的追溯,可以使我们对其有更为全面、深入的了解和认知,进而便于吸收其合理内核,以推动汉语句法研究向前迈进。 展开更多
关键词 析句法 核心 框架 层次 位次 计算机析句法
下载PDF
英语句子重音策略的优选实证研究
11
作者 季文 《合肥学院学报(社会科学版)》 2015年第1期127-130,共4页
通过采用优选论的理论依据,同时结合实验语音学中的声学软件Praat对重音进行分析、标注,对英语句子重音重读策略进行实证研究,以制约条件等级排序形式表示出来,向英语母语者接近。
关键词 句子重音重读策略 Praat软件 优选论 制约条件等级排序
下载PDF
基于多特征和Ranking SVM的微博新闻自动摘要研究 被引量:2
12
作者 李孟爽 昝红英 贾会贞 《郑州大学学报(理学版)》 CAS 北大核心 2017年第2期43-47,共5页
提出了面向微博应用的新闻文本自动摘要研究方法.利用互信息对新闻文本中词语和句子之间的语义特征进行计算,根据其关联度对句子进行主题划分,赋予主题句较高的权重,同时从文本中抽取多种组合特征,利用Ranking SVM对句子进行排序,从而... 提出了面向微博应用的新闻文本自动摘要研究方法.利用互信息对新闻文本中词语和句子之间的语义特征进行计算,根据其关联度对句子进行主题划分,赋予主题句较高的权重,同时从文本中抽取多种组合特征,利用Ranking SVM对句子进行排序,从而得到自动摘要.在NLP&CC2015面向微博中文新闻自动摘要评测数据集上进行对比实验,取得了良好效果,证明该方法的有效性. 展开更多
关键词 互信息 语义特征 主题句 新闻文本自动摘要
下载PDF
基于框架语义的高考语文阅读理解答案句抽取 被引量:8
13
作者 李国臣 刘姝林 +3 位作者 杨陟卓 李茹 张虎 钱揖丽 《中文信息学报》 CSCD 北大核心 2016年第6期164-172,共9页
高考语文阅读理解问答相对普通阅读理解问答难度更大,问句抽象表述的理解需要更深层的语言分析技术,答案候选句抽取更注重与问句的关联分析,答案候选句排序更注重答案句之间的语义相关性。为此,该文提出借助框架语义匹配和框架语义关系... 高考语文阅读理解问答相对普通阅读理解问答难度更大,问句抽象表述的理解需要更深层的语言分析技术,答案候选句抽取更注重与问句的关联分析,答案候选句排序更注重答案句之间的语义相关性。为此,该文提出借助框架语义匹配和框架语义关系抽取答案候选句,在排序时引入流形排序模型,通过答案句之间的框架语义相关度将排序分数进行传播,最终选取分数较高的Top-4作为答案句。在北京近12年高考语文阅读理解问答题上的准确率与召回率分别达到了53.65%与79.06%。 展开更多
关键词 高考语文 阅读理解 框架语义 答案句抽取 流形排序
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部