针对传统命名实体识别需要大量人工及规则信息的问题,提出一种基于条件随机场(conditional random field, CRF)和双向长短时记忆(bi-directional long short-term memory, BI-LSTM)神经网络的命名实体识别方法。其中,CRF模型在进行中文...针对传统命名实体识别需要大量人工及规则信息的问题,提出一种基于条件随机场(conditional random field, CRF)和双向长短时记忆(bi-directional long short-term memory, BI-LSTM)神经网络的命名实体识别方法。其中,CRF模型在进行中文分词的时候考虑到了未登录词的问题,具备较好的学习能力;双向长短期神经网络能够很好地保留上下文信息的特性。通过使用北京大学标注的1998年人民日报语料库对所提方法进行实验,结果表明:Dropout参数对命名实体识别的效果存在积极影响;同时当Dropout参数取不变时,双向LSTM模型比单向LSTM模型(long short-term memory, LSTM)在中文命名实体识别任务中取得了更好的识别效果。展开更多