期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
面向多领域多来源文本的汉语依存句法树库构建 被引量:7
1
作者 郭丽娟 彭雪 +1 位作者 李正华 张民 《中文信息学报》 CSCD 北大核心 2019年第2期34-42,共9页
为了支持汉语句法分析研究,目前句法分析领域已经标注了多个汉语依存句法树库。然而,已有树库主要针对较规范文本,而对各种网络文本如博客、微博、微信等考虑较少。为此,该文基于近期研制的标注规范及可视化在线标注系统,开展了大规模... 为了支持汉语句法分析研究,目前句法分析领域已经标注了多个汉语依存句法树库。然而,已有树库主要针对较规范文本,而对各种网络文本如博客、微博、微信等考虑较少。为此,该文基于近期研制的标注规范及可视化在线标注系统,开展了大规模数据标注。聘请了15名兼职标注者,并采用严格的标注流程保证标注质量,目前,已经标注了约3万句的汉语依存句法树库,其中包含约1万句淘宝头条文本。该文重点介绍了数据选取、标注流程等问题,并详细分析了标注准确率、一致性和标注数据的分布情况。未来将继续对多领域多来源文本进行标注,扩大树库规模,并以合适的方式公开相应的标注数据。 展开更多
关键词 依存句法 树库构建 多领域多来源文本
下载PDF
句式结构树库的自动构建研究
2
作者 谢晨晖 胡正升 +2 位作者 杨麟儿 廖田昕 杨尔弘 《中文信息学报》 CSCD 北大核心 2023年第2期15-25,共11页
句式结构树库是以句本位语法为理论基础构建的句法资源,对汉语教学以及句式结构自动句法分析等研究具有重要意义。目前已有的句式结构树库语料主要来源于教材领域,其他领域的标注数据较为缺乏,如何高效地扩充高质量的句法树库是值得研... 句式结构树库是以句本位语法为理论基础构建的句法资源,对汉语教学以及句式结构自动句法分析等研究具有重要意义。目前已有的句式结构树库语料主要来源于教材领域,其他领域的标注数据较为缺乏,如何高效地扩充高质量的句法树库是值得研究的问题。人工标注句法树库费时费力,树库质量也难以保证,为此,该文尝试通过规则的方法,将宾州中文树库(CTB)转换为句式结构树库,从而扩大现有句式结构树库的规模。实验结果表明,该文提出的基于树库转换规则的方法是有效的。 展开更多
关键词 句式结构 短语结构 树库构建
下载PDF
基于“词——词性”匹配模式获取的古汉语树库快速构建方法 被引量:1
3
作者 何静 宋天宝 +2 位作者 彭炜明 朱淑琴 宋继华 《中文信息学报》 CSCD 北大核心 2017年第4期114-121,共8页
该文针对古汉语文本小、句简短、模式性强的结构特点,提出了一种基于"词-词性"匹配模式获取的快速树库构建方法,将句法标注过程规约为获取候选匹配模式、制定句法转换规则、自动生成句法树和最终人工校对四个步骤。该方法可... 该文针对古汉语文本小、句简短、模式性强的结构特点,提出了一种基于"词-词性"匹配模式获取的快速树库构建方法,将句法标注过程规约为获取候选匹配模式、制定句法转换规则、自动生成句法树和最终人工校对四个步骤。该方法可大大缩减人工标注工作量,节省树库构建的工程成本,且所获取的匹配规则在古汉语教学研究中具有一定的实用价值。 展开更多
关键词 古代汉语 树库构建 模式获取
下载PDF
汉语树库的构建 被引量:32
4
作者 周强 张伟 俞士汶 《中文信息学报》 CSCD 北大核心 1997年第4期42-51,共10页
本文讨论了汉语树库构建的若干基础问题,包括一个适合于自动分析和人工标注的汉语句法标记集、汉语树库加工处理规范和人机互助的树库加工模型,介绍了一个已经实现的汉语自动句法标注系统,和在此基础上进行的一些树库构建实验,最后... 本文讨论了汉语树库构建的若干基础问题,包括一个适合于自动分析和人工标注的汉语句法标记集、汉语树库加工处理规范和人机互助的树库加工模型,介绍了一个已经实现的汉语自动句法标注系统,和在此基础上进行的一些树库构建实验,最后提出了构建大规模汉语树库的设想。 展开更多
关键词 树库 语料加工模型 语料库语言学 数据库系统
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部