期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
领域问答系统中的文本错误自动发现方法
被引量:
19
1
作者
刘亮亮
王石
+2 位作者
王东升
汪平仄
曹存根
《中文信息学报》
CSCD
北大核心
2013年第3期77-83,共7页
文本自动校对是自然语言处理的一个挑战性的研究课题,也是一个难题。该文对中文的错误类型和原因进行分析,提出了一种基于领域问答系统用户问题日志的错别字自动发现方法。该方法首先对语料进行分词,然后对分词的结果中出现的散串进行合...
文本自动校对是自然语言处理的一个挑战性的研究课题,也是一个难题。该文对中文的错误类型和原因进行分析,提出了一种基于领域问答系统用户问题日志的错别字自动发现方法。该方法首先对语料进行分词,然后对分词的结果中出现的散串进行合并,对分词中的多字词和合并的串进行相似词串聚类,对相似词串的上下文语境进行统计分析,从中自动获取错别字对。实验表明,该系统获得71.32%的召回率,82.6%的准确率。
展开更多
关键词
文本自动校对
问答系统
非词错误
真词错误
错别字对
下载PDF
职称材料
题名
领域问答系统中的文本错误自动发现方法
被引量:
19
1
作者
刘亮亮
王石
王东升
汪平仄
曹存根
机构
中国科学院计算技术研究所智能信息处理重点实验室
中国科学院大学
出处
《中文信息学报》
CSCD
北大核心
2013年第3期77-83,共7页
基金
国家自然科学基金项目(60573063
60573064
+2 种基金
60773059
61035004)
国家社科基金重点项目(10AYY003)
文摘
文本自动校对是自然语言处理的一个挑战性的研究课题,也是一个难题。该文对中文的错误类型和原因进行分析,提出了一种基于领域问答系统用户问题日志的错别字自动发现方法。该方法首先对语料进行分词,然后对分词的结果中出现的散串进行合并,对分词中的多字词和合并的串进行相似词串聚类,对相似词串的上下文语境进行统计分析,从中自动获取错别字对。实验表明,该系统获得71.32%的召回率,82.6%的准确率。
关键词
文本自动校对
问答系统
非词错误
真词错误
错别字对
Keywords
text
automatic
proofreading
question
answering
system
no-word
error
real-word
error
typos
pair
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
领域问答系统中的文本错误自动发现方法
刘亮亮
王石
王东升
汪平仄
曹存根
《中文信息学报》
CSCD
北大核心
2013
19
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部