-
题名一种基于稀疏自编码器的涉恐短文本特征提取方法
被引量:5
- 1
-
-
作者
黄炜
黄建桥
李岳峰
-
机构
湖北工业大学经济与管理学院
-
出处
《情报杂志》
CSSCI
北大核心
2019年第3期203-206,I0001,186,共6页
-
基金
国家自然科学基金项目"微博环境下实时主动感知网络舆情事件的多核方法研究"(编号:71303075)及"大数据环境下基于特征本体学习的无监督文本分类方法研究"(编号:71571064)研究成果之一
-
文摘
[目的/意义]稀疏自编码器是深度学习领域中一种较为高效的文本特征提取方法,有利于解决大规模涉恐短文本高维、稀疏难处理等问题。[方法/过程]首先经稀疏自编码器无监督学习方法降维,提取数据隐含特征,然后利用LDA主题聚类算法进行文本聚类,并通过与传统特征提取算法对比实验效果来验证该方法的有效性和高效性。[结果/结论]实验结果证明,将稀疏自编码器提取的文本特征用于LDA主题聚类,有效解决了涉恐短文本高维、稀疏、噪声大的问题,并显著提高了聚类结果的准确性。
-
关键词
涉恐文本
稀疏自编码器
特征提取
LDA主题聚类
-
Keywords
terrorism text
sparse autoencoder
feature extraction
LDA topic clustering
-
分类号
C931.6
[经济管理—管理学]
-
-
题名大数据背景下网络涉恐信息识别算法应用探析
被引量:1
- 2
-
-
作者
周晋光
赵丽娟
周正
何卓浩
-
机构
中国人民警察大学
-
出处
《武警学院学报》
2019年第8期55-60,共6页
-
文摘
伴随互联网的飞速发展与大数据时代的到来,海量数据涌入互联网,如何在海量的互联网信息中快速、准确地识别涉恐信息已经成为各国有关部门关注的热点。近年来,以强大算法为核心的人工智能技术为涉恐信息识别带来了巨大的便利,不断地改进算法成为反恐工作的新方向。以大数据背景下网络恐怖主义特征及发展趋势为基础,分析当前网络涉恐信息识别面临的困境,通过查阅相关资料文献,着重研究涉恐信息识别所用的算法,对各类涉恐信息识别算法进行整合,以期对网络涉恐信息风险识别研究有所帮助。
-
关键词
涉恐信息
信息识别
大数据
算法
涉恐文本
涉恐图像
涉恐音视频
-
Keywords
terrorismrelated information
information identification
big data
algorithm
terrorismrelated text
terrorismrelated images
terrorismrelated audio and video
-
分类号
D815
[政治法律—国际关系]
-