-
题名知网的理论发现
被引量:99
- 1
-
-
作者
董振东
董强
郝长伶
-
机构
中国科学院计算机语言信息工程研究中心
-
出处
《中文信息学报》
CSCD
北大核心
2007年第4期3-9,共7页
-
文摘
知网正式发布至今已经8年了。海内外很多人对它已不陌生了。现在该是我们为知网的理论发现做点小结的时候了。本文它们包括(1)知网的知识观,(2)关于知识的获取和表达,(3)事件类概念分类的双轴论,(4)关于语义角色,(5)知识数据描述语言(KDML)。本文还介绍了知网的计算意义的能力以及它最新发展。知网将成为一些新兴技术如自然语言搜索等的基础设施。
-
关键词
计算机应用
中文信息处理
知识系统
本体论
义原
语义角色
WORDNET
-
Keywords
computer application
chinese information processing
knowledge system
ontology
sememe
semantic relation
WordNet
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名下一站在哪里?
被引量:3
- 2
-
-
作者
董振东
董强
郝长伶
-
机构
中科院计算机与语言工程中心
Canada Keentime Inc.
-
出处
《中文信息学报》
CSCD
北大核心
2011年第6期3-11,共9页
-
文摘
该文简要回顾了中文信息处理30年的主要成果,以及近20年来中文信息处理中的计算语言学研究的状况。该文分析了汉语与英语的主要差异,讨论了语言的共性与个性。该文表示了对于中文大规模语料的词性标注、树库建设的质疑。该文提出未来的中文语言资源建设的一些设想,期望一些新的尝试,提出以语义取代现有的句法,以深度标注取代现有的浅层标注,具体将包括标注的目标的定点化,内容的多样化,步骤的阶段化,标注人员的大众化、群体化。文章还提出了未来发展的关键点:技术的融合,人本计算。
-
关键词
中文信息处理
语言数据资源
语料标注
句法
语义
-
Keywords
Chinese information processing
linguistic data resources
annotation
syntax
semantics
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于知网的中文结构排歧工具——VXY
被引量:2
- 3
-
-
作者
董强
郝长伶
董振东
-
机构
加拿大智达有限公司
-
出处
《中文信息学报》
CSCD
北大核心
2010年第1期60-64,共5页
-
文摘
该文介绍了基于知网的中文结构排歧工具系列中的一种—VXY。VXY采取了一种独到的排歧技术,对于语言难点采取"定点清除"的策略。它用来解决"V+N+的+N"类型的结构性歧义。VXY是一个自足的、可以现场考核检验的并可以真正付诸实用的系统,而不是仅仅某种方法论的表演或举例性的"游戏"。该文简要地介绍了VXY的组成部分,说明了它的意义计算的原理。同时,该文就如何更有效地利用知网进行结构和语义排歧,如何开辟不同于当前语言信息处理中的"三部曲"(语料标注、现成的计算、应试性的评测)的语言技术等问题进行讨论。
-
关键词
计算机应用
中文信息处理
语义
排歧工具
强支配
中文句法结构
知网
-
Keywords
computer application
Chinese information processing
semantics
disambiguator
strong government
Chinese syntactic structure
HowNet
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-