-
题名基于模糊贝叶斯决策的核心概念抽取方法
- 1
-
-
作者
钟寒
徐艺嘉
鹿浩
孙旌睿
-
机构
中国人民公安大学信息网络安全学院
安全防范与风险评估公安部重点实验室
-
出处
《计算机工程与科学》
CSCD
北大核心
2022年第9期1686-1692,共7页
-
基金
国家社会科学基金(20AZD114)
公安部科技强警基础工作专项(2019GABJC01)
+1 种基金
公安部软科学理论研究计划(2021LL39)
中央高校基本科研业务费项目(2021JKF107)。
-
文摘
为了提高特定领域核心概念抽取的效率,提出一种基于模糊贝叶斯决策的核心概念抽取方法。在特定领域内随机抽取大量文本并进行分词获取候选概念;然后采用TF-IDF算法计算候选概念的各项特征值,采用概念隶属度归一化处理候选概念特征值;最终通过贝叶斯决策计算候选概念为核心概念的概率。在财经领域相关数据集上进行文本核心概念抽取的实验结果表明,所提方法的F1值相比TextRank、LDA主题模型、word2vec词聚类模型、RNN、LSTM等的F1值有所提高。综合实验结果表明,基于模糊贝叶斯决策的核心概念抽取方法在核心概念抽取方面表现较好。
-
关键词
概念抽取
概念隶属度
贝叶斯决策
-
Keywords
concept extraction
conceptual membership
Bayesian decision-making
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于动态主题模型的舆情本体概念抽取
被引量:3
- 2
-
-
作者
赵美玲
刘胜全
刘艳
郭竹为
符贤哲
-
机构
新疆大学信息科学与工程学院
新疆大学网络与信息中心
新疆大学软件学院
-
出处
《计算机工程与设计》
北大核心
2018年第4期1174-1179,共6页
-
基金
新疆自治区自然科学基金项目(2014211A016)
-
文摘
对现有领域本体学习方法不能直接移植在舆情本体学习方法上的问题进行研究,根据舆情本体的动态主题性提出一种基于动态主题模型的舆情本体概念抽取的方法。结合舆情周期内词语的前驱增速和后继增速提取主题特征词,主题度选取主题词;对主题词通过主题相关度进行聚类,形成主题词簇;对主题词簇下候选概念进行主题概念隶属度的过滤得到舆情本体概念;以上述概念作为种子词寻找左右邻接词得到复合词,过滤得到舆情本体复合概念。实验结果验证了该方法具有更高的准确率和召回率。
-
关键词
舆情本体
动态主题
舆情周期
主题相关度
主题概念隶属度
-
Keywords
public opinion ontology
dynamic topic
public opinion cycle
subject degree
subject concept membership
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-