期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
微博城市投诉文本中的地理位置实体识别 被引量:2
1
作者 孙赫 李淑琴 +1 位作者 吕学强 刘克会 《山东大学学报(理学版)》 CAS CSCD 北大核心 2016年第3期77-85,共9页
微博投诉文本中地理位置实体通常存在结构复杂,长度较长,描述较详细的特点。通过对投诉微博文本的分析,提出了地理位置实体自动识别的方法。该方法首先利用特征资源库对微博进行特征标注,使用条件随机场(conditional random fields,CRF... 微博投诉文本中地理位置实体通常存在结构复杂,长度较长,描述较详细的特点。通过对投诉微博文本的分析,提出了地理位置实体自动识别的方法。该方法首先利用特征资源库对微博进行特征标注,使用条件随机场(conditional random fields,CRF)模型识别地理位置实体。其次根据微博和地理位置实体的特点,对CRF识别后的数据进行二次标注。最后利用微博规则库对识别结果进行补召,修正地理位置实体,最终实现地理位置实体的识别。实验结果表明该方法有显著效果,F值可达到85.52%。 展开更多
关键词 微博城市投诉文本 地理位置实体识别 CRF 微博规则库
原文传递
微博城市投诉文本中地理位置实体的完整性研究 被引量:1
2
作者 孙赫 李淑琴 +1 位作者 吕学强 刘克会 《现代图书情报技术》 CSSCI 2016年第3期58-66,共9页
【目的】利用互动问答社区——百度知道的知识共享、更新及时的优势,弥补维护大规模地理隶属关系资源库开销大的不足,并通过百度知道自动补全缺陷地理位置实体。【方法】对缺陷地理位置实体转化为所属区域问题,并通过百度知道进行检索;... 【目的】利用互动问答社区——百度知道的知识共享、更新及时的优势,弥补维护大规模地理隶属关系资源库开销大的不足,并通过百度知道自动补全缺陷地理位置实体。【方法】对缺陷地理位置实体转化为所属区域问题,并通过百度知道进行检索;根据检索结果提取特征,计算该地理位置实体属于各个区域的得分,并构建缺陷地理位置实体的所属区域特征向量;利用规则对缺陷地理位置实体进行完整化处理,实现地理位置实体完整性表示。【结果】在完整化微博城市投诉文本中的缺陷地理位置实体时,该方法的综合精确率达到92.51%。【局限】对零地理位置实体无法完整表示。【结论】该方法对缺陷地理位置实体完整化是有效的、可行的。 展开更多
关键词 微博城市投诉文本 缺陷地理位置实体 互动问答社区 特征值计算 完整性表示
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部