期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于条件随机场的词结构分析方法
被引量:
4
1
作者
蒋万伟
刘娟
《武汉大学学报(理学版)》
CAS
CSCD
北大核心
2017年第3期251-258,共8页
传统的基于词边界划分的中文分词已经难以满足实际应用的需要.通过深入分析词的内部结构,提出了一种基于条件随机场的词结构分析方法.根据伪未登录词(POOV)组成成分的特点及词的内部子结构表示,提出了词的结构特征来提高未登录词(OOV)...
传统的基于词边界划分的中文分词已经难以满足实际应用的需要.通过深入分析词的内部结构,提出了一种基于条件随机场的词结构分析方法.根据伪未登录词(POOV)组成成分的特点及词的内部子结构表示,提出了词的结构特征来提高未登录词(OOV)的识别率及词结构的识别性能.从词的内部结构表示形式推导出一般化的词结构标记集,很好地统一了词边界标记和词内部结构标记.它不仅适用于传统的中文分词任务中词边界的标注,而且也适用于词结构分析任务中词的内部结构的标注.该方法能够同时分析得到词的边界和内部结构信息,解决了语料库之间分词标准不一致的问题,满足了应用的不同需求.实验结果表明,该方法在整体性能和各层次结构的识别上都比现有方法有所提高.
展开更多
关键词
词
结构
分析
条件随机场
词
结构
特征
词
结构
标记集
原文传递
利用扩展标记集的词结构分析
被引量:
2
2
作者
孙静
方艳
+1 位作者
丁彬
周国栋
《中文信息学报》
CSCD
北大核心
2014年第5期39-45,82,共8页
该文给出了一种与传统分词不同的词法分析选择,提出了一种利用扩展标记集来实现词内部结构分析的方法。首先阐述了词的内部结构特点,把结构中的前后缀视为特殊的词,进而通过识别出每一个词的前后缀来识别词的内部结构。方法是把词内部...
该文给出了一种与传统分词不同的词法分析选择,提出了一种利用扩展标记集来实现词内部结构分析的方法。首先阐述了词的内部结构特点,把结构中的前后缀视为特殊的词,进而通过识别出每一个词的前后缀来识别词的内部结构。方法是把词内部结构识别问题转换成序列标注问题,通过扩展标记集,采用CRF模型来实现词的内部结构分析。最终实验表明,无论是在总体性能上,还是在各层结构的识别上都取得了较高的准确度。
展开更多
关键词
扩展标记集
词
结构
分析
前后缀
序列标注问题
下载PDF
职称材料
题名
基于条件随机场的词结构分析方法
被引量:
4
1
作者
蒋万伟
刘娟
机构
武汉大学计算机学院
出处
《武汉大学学报(理学版)》
CAS
CSCD
北大核心
2017年第3期251-258,共8页
基金
江苏省自然科学基金(BK20161249)
软件工程国家重点实验室自主研究课题(SKLSE-2015-A-04-03)资助项目
文摘
传统的基于词边界划分的中文分词已经难以满足实际应用的需要.通过深入分析词的内部结构,提出了一种基于条件随机场的词结构分析方法.根据伪未登录词(POOV)组成成分的特点及词的内部子结构表示,提出了词的结构特征来提高未登录词(OOV)的识别率及词结构的识别性能.从词的内部结构表示形式推导出一般化的词结构标记集,很好地统一了词边界标记和词内部结构标记.它不仅适用于传统的中文分词任务中词边界的标注,而且也适用于词结构分析任务中词的内部结构的标注.该方法能够同时分析得到词的边界和内部结构信息,解决了语料库之间分词标准不一致的问题,满足了应用的不同需求.实验结果表明,该方法在整体性能和各层次结构的识别上都比现有方法有所提高.
关键词
词
结构
分析
条件随机场
词
结构
特征
词
结构
标记集
Keywords
word structure analysis
CRFs(conditional random fields)
word structure feature
word structure tag set
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
利用扩展标记集的词结构分析
被引量:
2
2
作者
孙静
方艳
丁彬
周国栋
机构
苏州大学计算机科学与技术学院
出处
《中文信息学报》
CSCD
北大核心
2014年第5期39-45,82,共8页
基金
国家自然科学基金青年项目(61202162)
教育部博士点基金新教师类课题(20123201120011)
国家863计划前沿技术研究类项目(2012AA011102)
文摘
该文给出了一种与传统分词不同的词法分析选择,提出了一种利用扩展标记集来实现词内部结构分析的方法。首先阐述了词的内部结构特点,把结构中的前后缀视为特殊的词,进而通过识别出每一个词的前后缀来识别词的内部结构。方法是把词内部结构识别问题转换成序列标注问题,通过扩展标记集,采用CRF模型来实现词的内部结构分析。最终实验表明,无论是在总体性能上,还是在各层结构的识别上都取得了较高的准确度。
关键词
扩展标记集
词
结构
分析
前后缀
序列标注问题
Keywords
extend the word tag set
words structures analysis
prefixes and suffixes
sequence tagging problem
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于条件随机场的词结构分析方法
蒋万伟
刘娟
《武汉大学学报(理学版)》
CAS
CSCD
北大核心
2017
4
原文传递
2
利用扩展标记集的词结构分析
孙静
方艳
丁彬
周国栋
《中文信息学报》
CSCD
北大核心
2014
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部