基于深度神经网络的配资网站识别研究被引量：4

Research on financing websites identification based on deep neural network

下载PDF

导出

摘要随着互联网金融的迅速发展,配资类网站给人们的财产安全造成的威胁日趋严重.而传统的恶意网站识别技术只适用于部分特征显著的网站识别,导致对配资网站的识别效果不佳.本文从多个维度选取特征,将识别特征归纳为域名特征、搜索引擎收录特征、标签特征、图片特征和文本特征等五大类,较好地体现了配资网站与其他类别网站的本质不同,并结合深度神经网络,建立配资网站识别模型.为验证该模型的有效性,论文设计了深度神经网络模型与决策树算法、支持向量机算法、K-邻近算法的对比实验.从实验中发现,基于深度神经网络的配资网站识别模型提高了配资网站的识别准确率,模型准确率达到95.9%,精确率达到98.7%,各类评估指标效果均优于传统的机器学习算法.实验结果表明,该方法能有效地识别配资网站. With the rapid development of Internet Finance,the existence of financing websites has become a much more serious problem for personal property safety.However,the traditional website recognition technology is only applicable to the website identification with some remarkable features,resulting in low efficiency of financing websites detection.This paper selects features from multiple dimensions and summarizes detection features into five categories:domain name features,search engines index features,tag features,image features,textual features,which greatly reflect the essential difference between the financing websites and other types of websites.Then a recognition model with deep neural network is proposed.In order to verify the validity of the model,a comparison experiment of our model with decision tree algorithm,support vector machine algorithm and K-Nearest Neighbor algorithm is designed.The experiments demonstrate that the accuracy and precision of the accuracy and precision of the proposed model is 95.9%,98.7%respectively,and all kinds of evaluation indicators are better than the traditional machine learning algorithm.The results show that the proposed method can effectively detect the financing websites.

作者何颖杨频王丛双汤娟 HE Ying;YANG Pin;WANG Cong-Shuang;TANG Juan(School of Cybersecurity,Sichuan University,Chengdu 610207,China)

机构地区四川大学网络空间安全学院

出处《四川大学学报（自然科学版）》 CAS CSCD 北大核心 2021年第3期91-97,共7页 Journal of Sichuan University(Natural Science Edition)

基金四川省科技计划项目(2020YFG0076)。

关键词配资网站网站识别深度神经网络特征工程 Financing website Website identification Deep neural network Feature engineering

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1方勇,龙啸,黄诚,刘亮.基于LSTM与随机森林混合构架的钓鱼网站识别研究[J].工程科学与技术,2018,50(5):196-201. 被引量：6
2沙泓州,刘庆云,柳厅文,周舟,郭莉,方滨兴.恶意网页识别研究综述[J].计算机学报,2016,39(3):529-542. 被引量：40
3张敏军,华庆一,贾伟,陈锐,姬翔.基于深度神经网络的个性化推荐系统研究[J].西南大学学报（自然科学版）,2019,41(11):104-109. 被引量：10
4高杨晨,方勇,刘亮,张磊.基于卷积神经网络的Android恶意软件检测技术研究[J].四川大学学报（自然科学版）,2020,57(4):673-680. 被引量：14

二级参考文献69

1Mahmoud K, Youssef I, Andrew J. Phishing detection: A literature survey. IEEE Communications Surveys & Tutorials, 2013, 15(4): 2091-2121. 被引量：1
2Paul K, Georgia K, Hector G M. Fighting spam on social Web sites a survey of approaches and future challenges. IEEE Internet Computing, 2007, 11(6): 36-45. 被引量：1
3Priya M, Sandhya L, Ciza T. A static approach to detect drive-by-download attacks on Webpages//Proceedings of the International Conference on Control Communication and Computing. Xi'an, China, 2013:298-303. 被引量：1
4Mavrommatis N P P, Monrose M A R F. All your iframes point to us//Proceedings of the 17th USENIX Security Symposium. San Jose, USA, 2008:1-22. 被引量：1
5Ma J, Saul L K, Savage S, Voetker G M. Beyond blacklists: Learning to detect malicious Web sites from suspicious URLs//Proceedings of the 15th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York, USA, 2009: 1245-1253. 被引量：1
6Ma J, Saul L K, Savage S, Voelker G M. Identifying suspi- cious URLs: An application of large-scale online learning// Proceedings of the 26th Annual International Conference on Machine Learning. Montreal, Canada, 2009:681-688. 被引量：1
7Ma J, Saul L K, Savage S, Voelker G M. Learning to detect malicious URLs. ACM Transactions on Intelligent Systems and Technology, 2011, 2(3): 1-24. 被引量：1
8Canali D, et al. Prophiler: A fast filter for the large-scale detection of malicious Web pages//Proceedings of the 20th International Conference on World Wide Web. Hyderabad, India, 2011:197-206. 被引量：1
9Thomas K, et al. Design and evaluation of a real-time URL spam filtering service//Proceedings of the IEEE Symposium on Security and Privacy. Oakland, USA, 2011:447-462. 被引量：1
10Yadav S, Reddy A K K, Reddy A L, et al. Detecting algorithmic.ally generated malicious domain names//Proeeedings of the 10th ACM SIGCOMM Conference on Internet Measurement. New York, USA, 2010:48-61. 被引量：1

共引文献65

1麻瓯勃,刘雪娇,唐旭栋,周宇轩,胡亦承.基于半监督学习的恶意URL检测方法[J].计算机系统应用,2020(11):11-20. 被引量：4
2陈星铭,赵胜祥.二次曲面截交线投影成圆的条件及应用[J].上海工程技术大学学报,2000,14(1):50-55. 被引量：1
3杨洪娇.基于机器学习的校园网恶意网页检测方法[J].信息与电脑,2016,28(11):175-176. 被引量：2
4张莉,孙丽娜,郭峰.在线社会网络中近似网页识别方法研究[J].微电子学与计算机,2017,34(2):141-144.
5胡向东,刘可,张峰,林家富,付俊,郭智慧.基于页面敏感特征的金融类钓鱼网页检测方法[J].网络与信息安全学报,2017,3(2):31-38. 被引量：8
6张茜,延志伟,李洪涛,耿光刚.网络钓鱼欺诈检测技术研究[J].网络与信息安全学报,2017,3(7):7-24. 被引量：12
7汪鑫,武杨,卢志刚.基于威胁情报平台的恶意URL检测研究[J].计算机科学,2018,45(3):124-130. 被引量：9
8丁岩,努尔布力.基于URL混淆技术识别的钓鱼网页检测方法[J].计算机工程与应用,2017,53(20):75-82. 被引量：4
9程岚岚,田文涛,汪剑.基于Spring Boot的网页健康性评级系统的设计与实现[J].电脑与信息技术,2018,26(2):45-47. 被引量：1
10张蕾,崔勇,刘静,江勇,吴建平.机器学习在网络空间安全研究中的应用[J].计算机学报,2018,41(9):1943-1975. 被引量：146

同被引文献39

1蔡从中,袁前飞,肖汉光,刘兴华,孔春阳.中药组方的计算机辅助分类与识别[J].重庆大学学报（自然科学版）,2006,29(10):42-46. 被引量：6
2黎量,杨诗龙,刘玉杰,汪云伟,钟恋,艾莉.基于相关性分析的山楂炮制过程气味变化机制研究[J].中国中药杂志,2014,39(17):3283-3286. 被引量：17
3朱黎辉,李晓宁,张莹,蒲华秀,吴纯洁.基于形状特征及纹理特征的中药材检索方法[J].计算机工程与设计,2014,35(11):3903-3907. 被引量：9
4陶欧,林兆洲,张宪宝,王耘,乔延江.基于饮片切面图像纹理特征参数的中药辨识模型研究[J].世界科学技术-中医药现代化,2014,16(12):2558-2562. 被引量：20
5解达帅,刘玉杰,杨诗龙,严丹,吴纯洁.基于“内外结合”分析马钱子的炮制火候[J].中国实验方剂学杂志,2016,22(8):1-5. 被引量：13
6王耐,卢文彪,凌秀华,梁丽金,李熙灿,李睿.牛膝和川牛膝药材的特征提取与图像识别[J].中国药房,2017,28(12):1670-1673. 被引量：21
7李婷婷,胡俊,曹雪洁,于勇.环形喷管水下气体射流夹断过程[J].化工学报,2017,68(12):4565-4575. 被引量：7
8陈远,王超群,胡忠义,吴江.基于主成分分析和随机森林的恶意网站评估与识别[J].数据分析与知识发现,2018,2(4):71-80. 被引量：8
9吴安成,何卫锋,欧阳祥波.基于OpenCV的码垛机器人手眼标定方法[J].制造技术与机床,2018(6):45-49. 被引量：14
10谭超群,温川飙,吴纯洁.基于图像处理技术的中药饮片识别研究[J].时珍国医国药,2018,29(7):1706-1709. 被引量：13

引证文献4

1王莹,沈洋,戚二帅,杨斌.基于深度学习的水下射流流型识别[J].江苏大学学报（自然科学版）,2023,44(4):437-443. 被引量：1
2谭超群,秦中翰,黄欣然,陈虎,黄永亮,吴纯洁,游志胜.基于多尺度特征深度神经网络的不同产地山楂细粒度图像识别[J].四川大学学报（自然科学版）,2024,61(1):107-118. 被引量：1
3熊凌龙,何月顺,陈杰,杜萍,韩鑫豪.基于文本⁃视觉多特征融合的非法网站识别研究[J].现代电子技术,2024,47(9):97-103.
4陈娟,陈东升,李晓宁,蒋传健.一种高空坠楼监测预警系统研究[J].四川大学学报（自然科学版）,2024,61(3):152-160.

二级引证文献2

1陈欣,王妮,郑秋菊.数字图像处理与识别系统的开发与应用[J].大数据时代,2024(2):35-38.
2李荣基.基于注意力机制的图像识别与目标检测方法[J].电脑编程技巧与维护,2024(6):149-151.

1肖凡智,张雨竹,尹耀宽,许建潮,刘钢.城市计算中的显露模式分析方法研究[J].计算机与数字工程,2021,49(4):766-770.
2万珂蓝.攻击性言论识别的研究[J].现代计算机,2021,27(6):63-67. 被引量：1
3祁紫薇.大数据时代计算机网络信息安全与防护研究[J].数码设计,2020,9(11):13-13. 被引量：2
4潘卿.访问恶意网站告警系统的设计与实现[J].科学技术创新,2020(33):77-78.
5曾宪锋.以灵活的思维解析小说人物形象[J].语文教学与研究,2021(10):114-116.
6云子航,彭文成.基于决策树基本算法的指控系统试验数据挖掘研究[J].装备维修技术,2021(10):0063-0063.
7况茜.大数据背景下的高校就业信息管理系统构建[J].信息技术,2021,45(5):74-79. 被引量：4
8郭铁成.美国五年创新规划编制方法分析[J].全球科技经济瞭望,2021,36(3):1-5. 被引量：1
9卢淑怡,魏爽,万思远.基于深度学习的智能分类垃圾桶[J].计算机与数字工程,2021,49(5):1009-1012. 被引量：13
10林宗缪,尹雪莱.基于大数据的颌骨囊性病变诊疗系统的研究[J].计算机与数字工程,2021,49(5):902-907. 被引量：1

四川大学学报（自然科学版）

2021年第3期

浏览历史

内容加载中请稍等...

基于深度神经网络的配资网站识别研究被引量：4

参考文献4

二级参考文献69

共引文献65

同被引文献39

引证文献4

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于深度神经网络的配资网站识别研究 被引量：4

参考文献4

二级参考文献69

共引文献65

同被引文献39

引证文献4

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于深度神经网络的配资网站识别研究被引量：4