摘要
搭配在语言教学和语言信息处理中具有一定的应用价值。汉语搭配的研究仍停留在主要以人的主观判断为标准的定性分析阶段,缺乏定量数据的支待。本文借鉴了国外在语言学和语料库语言学两个方面关于搭配的研究成果,提出了包括强度、离散度及尖峰三项统计指标在内的搭配定量评估体系,构造了相应的搭配判断算法。作为对算法的初步测试,我们以一个约710万词次的新华社新闻语料库为工作平台,利用计算机对"能力"一词可能构成的搭配进行了全面分析。实验结果显示,就该词而言,算法自动发现搭配的准确率约为33.94%。本项研究可望为语言学家客观、系统、一致地分析搭配提供定量辅助手段。
出处
《中国语文》
CSSCI
北大核心
1997年第1期29-38,共10页
Studies of the Chinese Language
基金
清华大学青年科学基金
国家自然科学基金