摘要
组块分析是一种大大降低句法分析难度的有效手段。本文针对汉语普遍规律 ,提出了一套符合汉语语言特点的汉语组块体系 ,并在此基础上设计实现了一种统计与错误驱动相结合的、能够分析有限层次的组块自动识别算法。实验证明 ,该方法能够有效地处理真实文本中的浅层分析问题 ,具有较好的准确率和鲁棒性。
Chunk parsing is an effective method to decrease the difficulty of language parsing.This paper proposes a formal description representing the characteristics of Chinese chunks.Based on the description,a statistical algorithm is accomplished to recognize definite levels of Chinese chunks.The experiments have proved that the algorithm gives a high accuracy for shallow parsing of real Chinese texts with robustness.
出处
《中文信息学报》
CSCD
北大核心
2000年第6期28-32,39,共6页
Journal of Chinese Information Processing
基金
国家 8 6 3课题!(86 3 - 30 6 -ZT0 3- 0 6 - 3
86 3 - 30 6 -ZD13 - 0 4- 4)
自然科学基金项目!(6 9775 0 17)