摘要
本文从计算机自动句法分析的角度来审视汉语词类问题,主要观点是:(一)过分强调"分布"与"分类"的严格对应关系,并不是正确的词类观,其负面作用是造成汉语词类的"不可承受之重"。(二)计算机自动句法分析要求对词语的分布特征进行非常细致的刻画。确定"词类"是为了描写词语的分布特点,但词语的分布特点并不都是靠"词类"来反映的。依靠"属性特征"描述手段,可以灵活且更细致地描述词语的分布特点。(三)现有的词语语法信息知识库主要是在两两组合的结构框架中描写词语的分布特点,而计算机自动句法分析需要在更复杂的"树"结构框架中描写词语的分布特点,即计算机自动句法分析需要颗粒度更细的词语分布知识。此外,关于词语的分布知识,还需要拓展到每个词语对其组合对象的选择限制的描述。
Based on researches of information processing,this paper endeavors to review some recent opinions on the word classification in Chinese. It argues that although syntactic function or distribution is the criterion of classification,words in the same category can not have the same functions. As in the syntactic theories such as HPSG and LFG, feature structures or so-called ‘attribute-value matrices ’ can serve a basic framework to represent linguistic knowledge. Automatic sentence parsing by computer requires two kinds of knowledge about word distribution: one is the more complicated tree structures and the other is the word-selection restrictions.
出处
《中国语文》
CSSCI
北大核心
2013年第2期178-190,192,共13页
Studies of the Chinese Language
基金
教育部人文社科基地重大项目"大规模中文树库建设及其应用研究"(课题编号:06JJD740001)
霍英东基金项目"大规模中文树库构建及其在对外汉语教学中的应用"(课题编号:111098)资助