-
题名基于最大熵的汉语人名地名识别方法研究
被引量:26
- 1
-
-
作者
钱晶
张杰
张涛
-
机构
复旦大学计算机科学与工程系
上海财经大学信息管理与工程学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2006年第9期1761-1765,共5页
-
基金
国家自然科学基金项目(60203010)资助.
-
文摘
构建了一个基于最大熵原理的汉语人名地名自动识别混合模型.该模型分为训练和识别两个模块.先从训练语料中抽取特征,利用最大熵方法对特征进行训练.然后使用经过训练的特征,并结合动态词表和少量规则,对测试文本中的汉语人名地名进行识别.达到了比较满意的识别效果.最后对实验结果进行了分析.
-
关键词
最大熵模型
专有名词识别
特征提取
语言学规则
-
Keywords
maximum entropy (me) model
named entity recognition (NER)
feature extraction
linguistic rules
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于最大熵的汉语短语结构识别方法
被引量:3
- 2
-
-
作者
霍亚格
黄广君
-
机构
河南科技大学电子信息工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第16期206-208,211,共4页
-
基金
河南省科技攻关计划基金资助项目(102102210159)
-
文摘
为提高计算机对汉语信息的处理能力,更好地进行浅层句法分析,提出一种基于最大熵的汉语短语结构识别方法。利用词语之间的互信息知识对句子的短语结构边界进行预测,应用最大熵模型建立原子模板与复合模板,选择有效的特征构成特征集,实现对句子短语结构的识别。实例证明,基于互信息的最大熵模型能取得较好的精确率和召回率。
-
关键词
浅层句法分析
互信息
边界预测
最大熵模型
特征选择
-
Keywords
shallow parsing
Mutual Information(MI)
boundary prediction
maximum entropy(me) model
feature selection
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-