摘要
提出一种基于条件随机场(CRFs)和领域规则的业务名称识别方法。通过实验词及词性的不同组合选择特征集合,由该特征训练得到CRFs模型,利用该模型测试得到业务术语,采用2-gram及编辑距离2种度量方式进行相似度计算,利用领域规则和相似度计算方法得到业务名称。实验结果证明了该方法的有效性。
This paper presents a method for service name recognition based on Conditional Random Fields(CRFs) and domain rules.It choses a characteristic set by different combinations of experimental words and their part of speech.It obtains a CRFs model,and uses this model to the test corpus.It extracts service terms,which support the acquisition of service name recognition.In similarity measurement,2-gram and edit distance mothods are adopted.Experimental results prove the validity of the method.
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第11期200-202,共3页
Computer Engineering
基金
中国科学院计算技术研究所和NEC中国研究院合作基金资助项目(LC-2009-044)
关键词
业务名称识别
条件随机场
文本相似度
编辑距离
service name recognition
Conditional Random Fields(CRFs)
text similarity
edit distance