期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
词素位置概率在中文重叠歧义词识别中的作用
被引量:
2
1
作者
曹海波
任亮
+2 位作者
韩丹
贾东立
王敬欣
《心理与行为研究》
CSSCI
北大核心
2022年第6期732-738,共7页
采用模糊词报告范式,探究词素位置概率在中文词汇识别中的作用。实验1操纵重叠歧义词(如“邮差距”)首、尾的词素位置概率,被试任务是快速报告重叠歧义词中间字的读音,结果发现,读者倾向于报告词素位置概率高的一侧字的读音。实验2操纵...
采用模糊词报告范式,探究词素位置概率在中文词汇识别中的作用。实验1操纵重叠歧义词(如“邮差距”)首、尾的词素位置概率,被试任务是快速报告重叠歧义词中间字的读音,结果发现,读者倾向于报告词素位置概率高的一侧字的读音。实验2操纵重叠歧义词(如“惹祸害”)首、尾的词素位置概率,被试任务是报告重叠歧义词其中的一个词,结果发现,读者倾向于报告词素位置概率高的一侧词的读音。结果表明,词素位置概率是中文词切分的有效线索,首、尾词素位置概率在词汇加工中均发挥了作用。
展开更多
关键词
词素位置概率
重叠歧义词
中文阅读
词切分
下载PDF
职称材料
基于最大熵模型的交集型切分歧义消解
被引量:
6
2
作者
张锋
樊孝忠
《北京理工大学学报》
EI
CAS
CSCD
北大核心
2005年第7期590-593,共4页
利用最大熵模型研究中文自动分词中交集型切分歧义的消解.模型输出的类别为两种:前两个字结合成词和后两个字结合成词.模型采用的特征为:待切分歧义字段的上下文各一个词、待切分歧义字段和歧义字段两种切分可能的词概率大小关系.通过...
利用最大熵模型研究中文自动分词中交集型切分歧义的消解.模型输出的类别为两种:前两个字结合成词和后两个字结合成词.模型采用的特征为:待切分歧义字段的上下文各一个词、待切分歧义字段和歧义字段两种切分可能的词概率大小关系.通过正向最大匹配(FMM)和逆向最大匹配(BMM)相结合的分词方法,发现训练文本中的交集型歧义字段并进行标注,用于最大熵模型的训练.实验用1998年1月《人民日报》中出现的交集型歧义字段进行训练和测试,封闭测试正确率98.64%,开放测试正确率95.01%,后者比常用的词概率法提高了3.76%.
展开更多
关键词
中文信息处理
汉语自动分词
交集型歧义
最大熵模型
下载PDF
职称材料
融合字特征的平滑最大熵模型消解交集型歧义
被引量:
3
3
作者
任惠
林鸿飞
杨志豪
《中文信息学报》
CSCD
北大核心
2010年第4期18-24,共7页
交集型歧义的切分问题是分词阶段需要解决难点之一。该文将交集型歧义的消解问题转化为分类问题,并利用融合丰富字特征的最大熵模型解决该问题,为了克服最大熵建模时的数据稀疏问题,该文引入了不等式平滑技术和高斯平滑技术。我们在第...
交集型歧义的切分问题是分词阶段需要解决难点之一。该文将交集型歧义的消解问题转化为分类问题,并利用融合丰富字特征的最大熵模型解决该问题,为了克服最大熵建模时的数据稀疏问题,该文引入了不等式平滑技术和高斯平滑技术。我们在第二届国际分词竞赛的四个数据集上比较了高斯平滑技术、不等式平滑技术和频度折扣平滑技术,测试结果表明:不等式平滑技术和高斯平滑技术比频度折扣技术有显著提高,而它们之间不分伯仲,但是不等式平滑技术能使特征选择无缝嵌入到参数估计过程中,显著压缩模型规模。该方法在四个测试集上最终获得了96.27%、96.83%、96.56%、96.52%的消歧正确率,对比实验表明:丰富的特征使消歧性能分别提高了5.87%、5.64%、5.00%、5.00%,平滑技术使消歧性能分别提高了0.99%、0.93%、1.02%、1.37%,不等式平滑使分类模型分别压缩了38.7、19.9、44.6、9.7。
展开更多
关键词
计算机应用
中文信息处理
分词
交集型歧义
融合丰富字特征
最大熵模型
平滑技术
下载PDF
职称材料
一种快速的交集型歧义检测方法
被引量:
3
4
作者
刘健
张维明
《计算机应用研究》
CSCD
北大核心
2008年第11期3259-3261,共3页
中文分词中,交集型歧义检测方法采用的双向最大匹配法与全切分方法存在着各自的弊病,无法满足大规模数据的精确处理。为此,提出了一种快速的交集型歧义检测方法,引入次长词进行检测,能高效准确地检测出中文文本中的交集型歧义。经实验验...
中文分词中,交集型歧义检测方法采用的双向最大匹配法与全切分方法存在着各自的弊病,无法满足大规模数据的精确处理。为此,提出了一种快速的交集型歧义检测方法,引入次长词进行检测,能高效准确地检测出中文文本中的交集型歧义。经实验验证,该方法在精度与速度两方面均能满足大规模语料的处理。
展开更多
关键词
中文分词
交集型歧义
最长交集字段
下载PDF
职称材料
题名
词素位置概率在中文重叠歧义词识别中的作用
被引量:
2
1
作者
曹海波
任亮
韩丹
贾东立
王敬欣
机构
教育部人文社会科学重点研究基地天津师范大学心理与行为研究院
河北北方学院艺术学院
河北北方学院法政学院
天津师范大学心理学部
学生心理发展与学习天津市高校社会科学实验室
出处
《心理与行为研究》
CSSCI
北大核心
2022年第6期732-738,共7页
基金
国家自然科学基金项目(32271119)
天津市研究生科研创新项目(2019YJSB128)。
文摘
采用模糊词报告范式,探究词素位置概率在中文词汇识别中的作用。实验1操纵重叠歧义词(如“邮差距”)首、尾的词素位置概率,被试任务是快速报告重叠歧义词中间字的读音,结果发现,读者倾向于报告词素位置概率高的一侧字的读音。实验2操纵重叠歧义词(如“惹祸害”)首、尾的词素位置概率,被试任务是报告重叠歧义词其中的一个词,结果发现,读者倾向于报告词素位置概率高的一侧词的读音。结果表明,词素位置概率是中文词切分的有效线索,首、尾词素位置概率在词汇加工中均发挥了作用。
关键词
词素位置概率
重叠歧义词
中文阅读
词切分
Keywords
positional
frequency
overlapping
ambiguous
strings
Chinese
reading
word
segmentation
分类号
B842 [哲学宗教—基础心理学]
下载PDF
职称材料
题名
基于最大熵模型的交集型切分歧义消解
被引量:
6
2
作者
张锋
樊孝忠
机构
北京理工大学信息科学技术学院计算机科学工程系
出处
《北京理工大学学报》
EI
CAS
CSCD
北大核心
2005年第7期590-593,共4页
文摘
利用最大熵模型研究中文自动分词中交集型切分歧义的消解.模型输出的类别为两种:前两个字结合成词和后两个字结合成词.模型采用的特征为:待切分歧义字段的上下文各一个词、待切分歧义字段和歧义字段两种切分可能的词概率大小关系.通过正向最大匹配(FMM)和逆向最大匹配(BMM)相结合的分词方法,发现训练文本中的交集型歧义字段并进行标注,用于最大熵模型的训练.实验用1998年1月《人民日报》中出现的交集型歧义字段进行训练和测试,封闭测试正确率98.64%,开放测试正确率95.01%,后者比常用的词概率法提高了3.76%.
关键词
中文信息处理
汉语自动分词
交集型歧义
最大熵模型
Keywords
Chinese
information
processing
Chinese
automatic
word
segmentation
overlapping
ambigu
ity
strings
maximum
entropy
model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
融合字特征的平滑最大熵模型消解交集型歧义
被引量:
3
3
作者
任惠
林鸿飞
杨志豪
机构
大连理工大学计算机科学与技术学院
出处
《中文信息学报》
CSCD
北大核心
2010年第4期18-24,共7页
基金
国家自然科学基金资助项目(60673039
60973068)
+2 种基金
国家社科基金资助项目(08BTQ025)
国家高科技863计划资助项目(2006AA01Z151)
教育部博士点基金资助项目(20090041110002)
文摘
交集型歧义的切分问题是分词阶段需要解决难点之一。该文将交集型歧义的消解问题转化为分类问题,并利用融合丰富字特征的最大熵模型解决该问题,为了克服最大熵建模时的数据稀疏问题,该文引入了不等式平滑技术和高斯平滑技术。我们在第二届国际分词竞赛的四个数据集上比较了高斯平滑技术、不等式平滑技术和频度折扣平滑技术,测试结果表明:不等式平滑技术和高斯平滑技术比频度折扣技术有显著提高,而它们之间不分伯仲,但是不等式平滑技术能使特征选择无缝嵌入到参数估计过程中,显著压缩模型规模。该方法在四个测试集上最终获得了96.27%、96.83%、96.56%、96.52%的消歧正确率,对比实验表明:丰富的特征使消歧性能分别提高了5.87%、5.64%、5.00%、5.00%,平滑技术使消歧性能分别提高了0.99%、0.93%、1.02%、1.37%,不等式平滑使分类模型分别压缩了38.7、19.9、44.6、9.7。
关键词
计算机应用
中文信息处理
分词
交集型歧义
融合丰富字特征
最大熵模型
平滑技术
Keywords
computer
application
Chinese
information
processing
word
segmentation
overlapping
ambigu
ity
strings
character
feature
maximum
entropy
model
smoothing
technology
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种快速的交集型歧义检测方法
被引量:
3
4
作者
刘健
张维明
机构
国防科学技术大学信息系统与管理学院
出处
《计算机应用研究》
CSCD
北大核心
2008年第11期3259-3261,共3页
基金
国家自然科学基金资助项目(70371008)
文摘
中文分词中,交集型歧义检测方法采用的双向最大匹配法与全切分方法存在着各自的弊病,无法满足大规模数据的精确处理。为此,提出了一种快速的交集型歧义检测方法,引入次长词进行检测,能高效准确地检测出中文文本中的交集型歧义。经实验验证,该方法在精度与速度两方面均能满足大规模语料的处理。
关键词
中文分词
交集型歧义
最长交集字段
Keywords
Chinese
word
segmentation
crossing
ambigu
ity
maximal
overlapping
ambigu
ity
string
(MOAS)
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
词素位置概率在中文重叠歧义词识别中的作用
曹海波
任亮
韩丹
贾东立
王敬欣
《心理与行为研究》
CSSCI
北大核心
2022
2
下载PDF
职称材料
2
基于最大熵模型的交集型切分歧义消解
张锋
樊孝忠
《北京理工大学学报》
EI
CAS
CSCD
北大核心
2005
6
下载PDF
职称材料
3
融合字特征的平滑最大熵模型消解交集型歧义
任惠
林鸿飞
杨志豪
《中文信息学报》
CSCD
北大核心
2010
3
下载PDF
职称材料
4
一种快速的交集型歧义检测方法
刘健
张维明
《计算机应用研究》
CSCD
北大核心
2008
3
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部