期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
大规模多粒度中文复述语料库
被引量:
1
1
作者
安波
《情报工程》
2022年第2期19-33,共15页
[目的/意义]复述是相同语义的不同表达,集中反映了语言的多样性,一直是自然语言处理领域的核心问题。PPDB英文复述数据集在英文自然语言处理的多种任务中得到了应用,推动了英文自然语言处理领域的发展。缺少大规模多粒度中文复述数据集...
[目的/意义]复述是相同语义的不同表达,集中反映了语言的多样性,一直是自然语言处理领域的核心问题。PPDB英文复述数据集在英文自然语言处理的多种任务中得到了应用,推动了英文自然语言处理领域的发展。缺少大规模多粒度中文复述数据集阻碍了复述技术在中文自然语言处理中的应用,是亟待解决的问题。[方法/过程]本文实现了一个针对多源数据的复述抽取系统,并抽取构建了一个大规模中文复述数据集,该数据集具有规模大、质量高的特点,且包含复述短语、复述模板和复述句三种粒度的复述文本。[结果/结论]自动评估和人工评估的结果表明,我们抽取的中文复述数据具有较高的文本多样性和语义一致性。
展开更多
关键词
中文复述
复述识别
复述抽取
下载PDF
职称材料
一种句词五特征融合模型的复述研究
2
作者
何贤江
何维维
左航
《四川大学学报(工程科学版)》
EI
CAS
CSCD
北大核心
2012年第6期127-132,共6页
为解决中文同义词词林无法用做上下文相关的复述语料问题,提出了一种词汇级复述方法。在中文大语料库环境下,根据给定的上下文,提取复述目标词和复述候选词;建立词、句融合的分层概率统计模型,给出了计算句、词复述相似度的5项特征值,...
为解决中文同义词词林无法用做上下文相关的复述语料问题,提出了一种词汇级复述方法。在中文大语料库环境下,根据给定的上下文,提取复述目标词和复述候选词;建立词、句融合的分层概率统计模型,给出了计算句、词复述相似度的5项特征值,用以训练二元分类器,并对候选复述词进行筛选。实验结果证明:1)基于大语料库数据挖掘,获取候选复述词提取方法具有实用价值,每个目标词给定的上下文句子中获取3.1个正确复述词;2)利用二元分类器对复述确认是有效的,精确率达到0.65;3)提取的复述中,有32%在《中文同义词扩展词林》无法查出,有效扩展了传统同义词复述方法。
展开更多
关键词
中文复述
五特征融合
智能识别
二元分类
下载PDF
职称材料
基于多翻译引擎的汉语复述平行语料构建方法
被引量:
3
3
作者
王雅松
刘明童
+3 位作者
马彬彬
张玉洁
徐金安
陈钰枫
《情报工程》
2020年第5期27-40,共14页
复述指同一语言内相同意思的不同表达,复述生成指同一种语言内意思相同的不同表达之间的转换,是改进信息检索、机器翻译、自动问答等自然语言处理任务不可或缺的基础技术。目前,复述生成模型性能都依赖于大量平行的复述语料,而很多语言...
复述指同一语言内相同意思的不同表达,复述生成指同一种语言内意思相同的不同表达之间的转换,是改进信息检索、机器翻译、自动问答等自然语言处理任务不可或缺的基础技术。目前,复述生成模型性能都依赖于大量平行的复述语料,而很多语言并没有可用的复述资源,使得复述生成任务的研究无法开展。针对复述语料十分匮乏的问题,我们以汉语为研究对象,提出基于多翻译引擎的复述平行语料构建方法,将英语复述平行语料迁移到汉语,构建大规模高质量汉语复述平行语料,同时构建有多个参考复述的汉语复述评测数据集,为汉语复述生成的研究提供一定的基础数据。基于构建的汉语复述语料,我们进一步对汉语复述现象进行总结和归纳,并进行复述生成研究。我们构建基于神经网络编码-解码框架的汉语复述生成模型,采用注意力机制、复制机制和覆盖机制解决汉语复述生成中的未登录词和重复生成问题。为了缓解复述语料不足导致的神经网络复述生成模型性能不高的问题,我们引入多任务学习框架,设计联合自编码任务的汉语复述生成模型,通过联合学习自编码任务来增强复述生成编码器语义表示学习能力,提高复述生成质量。我们利用联合自编码任务的复述生成模型进行汉语复述生成实验,在评测指标ROUGE-1、ROUGE-2、BLEU、METEOR上以及生成汉语复述实例分析上均取得了较好性能。实验结果表明所构建的汉语复述平行语料可以有效训练复述生成模型,生成高质量的汉语复述句。同时,联合自编码的汉语复述生成模型,可以进一步改进汉语复述生成的质量。
展开更多
关键词
复述语料构建
汉语复述现象分类
复述生成
多任务学习
自编码任务
下载PDF
职称材料
古代汉语文献释义方式新探
4
作者
郭焰坤
《集美大学学报(教育科学版)》
2011年第1期95-99,共5页
准确地阐释语义是古代汉语文献教学的重要内容。吸收传统训诂学的基本方法据形释义、因声求义,依据古代文献的语言特征据文例释义,吸纳现代学术思想据语境释义,三种释义方式能取得较好的效果,准确地阐释文言文本的思想内涵。
关键词
古文释义
据形释义
因声求义
据文例释义
据语境释义
下载PDF
职称材料
题名
大规模多粒度中文复述语料库
被引量:
1
1
作者
安波
机构
中国社会科学院民族学与人类学研究所
出处
《情报工程》
2022年第2期19-33,共15页
基金
国家自然科学基金面上项目“知识增强的中文复述识别关键技术研究”(62076233)
社科院2022创新工程青年学者资助计划项目(2022MZSQN001)。
文摘
[目的/意义]复述是相同语义的不同表达,集中反映了语言的多样性,一直是自然语言处理领域的核心问题。PPDB英文复述数据集在英文自然语言处理的多种任务中得到了应用,推动了英文自然语言处理领域的发展。缺少大规模多粒度中文复述数据集阻碍了复述技术在中文自然语言处理中的应用,是亟待解决的问题。[方法/过程]本文实现了一个针对多源数据的复述抽取系统,并抽取构建了一个大规模中文复述数据集,该数据集具有规模大、质量高的特点,且包含复述短语、复述模板和复述句三种粒度的复述文本。[结果/结论]自动评估和人工评估的结果表明,我们抽取的中文复述数据具有较高的文本多样性和语义一致性。
关键词
中文复述
复述识别
复述抽取
Keywords
chinese
paraphrase
paraphrase
detection
paraphrase
extraction
分类号
G35 [文化科学—情报学]
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种句词五特征融合模型的复述研究
2
作者
何贤江
何维维
左航
机构
四川大学计算机学院
出处
《四川大学学报(工程科学版)》
EI
CAS
CSCD
北大核心
2012年第6期127-132,共6页
基金
四川省科技平台支撑计划资助项目(JCPT2011-7)
文摘
为解决中文同义词词林无法用做上下文相关的复述语料问题,提出了一种词汇级复述方法。在中文大语料库环境下,根据给定的上下文,提取复述目标词和复述候选词;建立词、句融合的分层概率统计模型,给出了计算句、词复述相似度的5项特征值,用以训练二元分类器,并对候选复述词进行筛选。实验结果证明:1)基于大语料库数据挖掘,获取候选复述词提取方法具有实用价值,每个目标词给定的上下文句子中获取3.1个正确复述词;2)利用二元分类器对复述确认是有效的,精确率达到0.65;3)提取的复述中,有32%在《中文同义词扩展词林》无法查出,有效扩展了传统同义词复述方法。
关键词
中文复述
五特征融合
智能识别
二元分类
Keywords
chinese
paraphrase
five-feature
intelligent
identification
binary
classification
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于多翻译引擎的汉语复述平行语料构建方法
被引量:
3
3
作者
王雅松
刘明童
马彬彬
张玉洁
徐金安
陈钰枫
机构
北京交通大学计算机与信息技术学院
出处
《情报工程》
2020年第5期27-40,共14页
基金
国家自然科学基金(61876198,61976015,61370130,61473294)
北京市自然科学基金(4172047)
科学技术部国际科技合作计划(K11F100010)。
文摘
复述指同一语言内相同意思的不同表达,复述生成指同一种语言内意思相同的不同表达之间的转换,是改进信息检索、机器翻译、自动问答等自然语言处理任务不可或缺的基础技术。目前,复述生成模型性能都依赖于大量平行的复述语料,而很多语言并没有可用的复述资源,使得复述生成任务的研究无法开展。针对复述语料十分匮乏的问题,我们以汉语为研究对象,提出基于多翻译引擎的复述平行语料构建方法,将英语复述平行语料迁移到汉语,构建大规模高质量汉语复述平行语料,同时构建有多个参考复述的汉语复述评测数据集,为汉语复述生成的研究提供一定的基础数据。基于构建的汉语复述语料,我们进一步对汉语复述现象进行总结和归纳,并进行复述生成研究。我们构建基于神经网络编码-解码框架的汉语复述生成模型,采用注意力机制、复制机制和覆盖机制解决汉语复述生成中的未登录词和重复生成问题。为了缓解复述语料不足导致的神经网络复述生成模型性能不高的问题,我们引入多任务学习框架,设计联合自编码任务的汉语复述生成模型,通过联合学习自编码任务来增强复述生成编码器语义表示学习能力,提高复述生成质量。我们利用联合自编码任务的复述生成模型进行汉语复述生成实验,在评测指标ROUGE-1、ROUGE-2、BLEU、METEOR上以及生成汉语复述实例分析上均取得了较好性能。实验结果表明所构建的汉语复述平行语料可以有效训练复述生成模型,生成高质量的汉语复述句。同时,联合自编码的汉语复述生成模型,可以进一步改进汉语复述生成的质量。
关键词
复述语料构建
汉语复述现象分类
复述生成
多任务学习
自编码任务
Keywords
paraphrase
corpus
construction
chinese
paraphrase
phenomenon
classification
paraphrase
generation
multi-task
learning
auto-encoding
task
分类号
G35 [文化科学—情报学]
下载PDF
职称材料
题名
古代汉语文献释义方式新探
4
作者
郭焰坤
机构
集美大学文学院
出处
《集美大学学报(教育科学版)》
2011年第1期95-99,共5页
文摘
准确地阐释语义是古代汉语文献教学的重要内容。吸收传统训诂学的基本方法据形释义、因声求义,依据古代文献的语言特征据文例释义,吸纳现代学术思想据语境释义,三种释义方式能取得较好的效果,准确地阐释文言文本的思想内涵。
关键词
古文释义
据形释义
因声求义
据文例释义
据语境释义
Keywords
ancient
chinese
literature
paraphras
ing
paraphras
ing
by
form
paraphras
ing
by
sound
paraphras
ing
by
example
paraphras
ing
by
context
分类号
G613.2 [文化科学—学前教育学]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
大规模多粒度中文复述语料库
安波
《情报工程》
2022
1
下载PDF
职称材料
2
一种句词五特征融合模型的复述研究
何贤江
何维维
左航
《四川大学学报(工程科学版)》
EI
CAS
CSCD
北大核心
2012
0
下载PDF
职称材料
3
基于多翻译引擎的汉语复述平行语料构建方法
王雅松
刘明童
马彬彬
张玉洁
徐金安
陈钰枫
《情报工程》
2020
3
下载PDF
职称材料
4
古代汉语文献释义方式新探
郭焰坤
《集美大学学报(教育科学版)》
2011
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部