应用于动态异构web服务器的相似度求解方法被引量：10

Similarity calculation method applied to dynamic heterogeneous web server system

下载PDF

导出

摘要针对经典的基于编辑距离的字符串相似度计算方法计算效率低且准确率差的不足,提出一种基于编辑距离和最长公共子串的改进字符串相似度求解方法,引入最长公共前缀和最长公共后缀,定义新的相似度计算公式。将该方法应用于基于异构平台的动态异构web服务系统模型,通过网页篡改检测实验验证,与经典算法和经典公式相比,改进的相似度计算方法能够在适应自身差异性的基础上,提高相似度计算的准确性和计算效率。 To solve the problem of low computational efficiency and poor accuracy of classical string similarity calculation method based on edit distance,an improved string similarity calculation method based on the edit distance and the longest common substring whose calculation formula was defined by introducing the longest common prefix and the longest common suffix was proposed.This method was applied to the dynamic heterogeneous Web server system model based on heterogeneous platform.Through the tamper detection experiment,results show that,compared with classical string similarity calculation method,the improved string similarity calculation method can not only adapt itself to the heterogeneous but also be used to improve the accuracy and the efficiency of the similarity calculation.

作者马博林张铮刘健雄

机构地区信息工程大学数学工程与先进计算国家重点实验室中国航天科工集团第二研究院

出处《计算机工程与设计》北大核心 2018年第1期282-287,共6页 Computer Engineering and Design

基金国家重点研发计划基金项目(2016YFB0800104) 上海科学技术委员会科研计划基金项目(14DZ1105300)

关键词编辑距离相似度动态性异构性网页防篡改 edit distance string similarity dynamic heterogeneous webpages temper-proofing

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献8

1杨林,于全编著..动态赋能网络空间防御[M].北京:人民邮电出版社,2016:244.
2韩京宇,徐立臻,董逸生.一种大数据量的相似记录检测方法[J].计算机研究与发展,2005,42(12):2206-2212. 被引量：32
3王少鹏,闻英友,赵宏.基于LCSS的数据流相似性查询处理算法研究[J].计算机研究与发展,2015,52(9):1976-1991. 被引量：3
4牛永洁,张成.多种字符串相似度算法的比较研究[J].计算机与数字工程,2012,40(3):14-17. 被引量：38
5王开云,孔思淇,付云生,潘泽友,马卫东,赵强.两种基于双向比较的最长公共子串算法[J].计算机研究与发展,2013,50(11):2444-2454. 被引量：9
6邬江兴.拟态计算与拟态安全防御的原意和愿景[J].电信科学,2014,30(7):1-7. 被引量：100
7国家计算机网络应急技术处理协调中心著..2015年中国互联网网络安全报告[M].北京:人民邮电出版社,2016:221.
8李青,尹四清.结合用户偏好和相似性的网络结构推荐算法[J].计算机工程与设计,2016,37(3):814-818. 被引量：4

二级参考文献71

1杨宗长.Windows下健壮的随机数发生器设计[J].工程地质计算机应用,2004(3):14-17. 被引量：1
2Michael J.Wise.Neweyes:A System for Comparing Biologi-cal Sequences Using the Running Karp-Rabin Greedy String-Tiling Algorithm[C]∥In Third International Conference on In-telligent Systems for Molecular Biology Ambridge,England,pages:393-401. 被引量：1
3Aho A.V.,Hirschberg D.S.,Ullman J.D.:Bounds on theComplexity of the Longest Common Subsequence Problem[J].1976,23(1):1-12. 被引量：1
4Matthew Szuskiewicz.Automatic Plagiarism Detection in Soft-ware Code[A].Information and Communications Technology,May 2003. 被引量：1
5Mauricio Hernandez, Salvatore Stolfo. The merge/purge problem for large databases. In: ACM SIGMOD Record. New York:ACM Press, 1995. 127- 138. 被引量：1
6Alvaro Monge, Charles Elkan. An efficient domain-independent algorithm for detecting approximately duplicate database records.Workshop on Research Issues on Data Mining and Knowledge Discovery (DMKD'97), Tucson, AZ, 1997. 被引量：1
7Karen Kukich. Techniques for automatically correcting words in text. ACM Computing Surveys, 1992, 24(4): 377-439. 被引量：1
8Liang Jin, Chen Li, Sharad Mehrotra. Efficient record linkage in large data sets. The 8th Int'l Conf. Database Systems for Advanced Applications, Kyoto, Japan, 2003. 被引量：1
9Surajit Chaudhuri, Kris Ganjam, Venkatesh Ganti, et al. Robust and efficient fuzzy match for online data cleaning. In: Proc. 2003 ACM SIGMOD Int'l Conf. Management of Data. New York:ACM Press, 2003. 313-324. 被引量：1
10Sunita Sarawagi, Anuradha Bhamidipaty. Interactive deduplication using active learning. In: Proc. 8th ACM SIGKDD Int'l Conf.Knowledge Discovery and Data Mining. New York: ACM Press,2002. 269- 278. 被引量：1

共引文献180

1宋志坤,徐立成,胡晓依,任海星,李强.基于改进型shapelets算法的动车组轴箱轴承故障诊断方法研究[J].仪器仪表学报,2021,42(2):66-74. 被引量：9
2张杰鑫,庞建民,张铮.拟态构造的Web服务器异构性量化方法[J].软件学报,2020,31(2):564-577. 被引量：11
3韩京宇,徐立臻,董逸生.数据质量研究综述[J].计算机科学,2008,35(2):1-5. 被引量：102
4蒋子龙,高曙.基于向量空间模型的Web服务描述相似度计算的研究与实现[J].咸阳师范学院学报,2007,22(6):52-54. 被引量：1
5曹渠江,董明.一种在高维空间中聚类检测重复记录的新方法[J].计算机工程与应用,2008,44(29):171-173. 被引量：4
6王晓原,吴芳,邢丽.交通流冗余数据识别和约简方法[J].计算机应用,2009,29(4):1110-1113.
7王颖颖,黄杜英,许多顶.向量空间中基于隐私保护的记录链接协议[J].现代电子技术,2009,32(14):138-141. 被引量：1
8庞雄文,姚占林,李拥军.大数据量的高效重复记录检测方法[J].华中科技大学学报（自然科学版）,2010,38(2):8-11. 被引量：15
9曹建军,刁兴春,汪挺,王芳潇.领域无关数据清洗研究综述[J].计算机科学,2010,37(5):26-29. 被引量：27
10叶焕倬,吴迪.相似重复记录清理方法研究综述[J].现代图书情报技术,2010(9):56-66. 被引量：21

同被引文献75

1石海鹤,揭安全,薛锦云.0-1背包问题的一种新解法[J].计算机工程,2008,34(17):37-38. 被引量：6
2王昌晶,薛锦云.一类0-1背包问题算法程序的形式化推导[J].武汉大学学报（理学版）,2009,55(6):674-680. 被引量：3
3韩进,臧斌宇.软件相异性对于系统安全的有效性分析[J].计算机应用与软件,2010,27(9):273-275. 被引量：7
4欧阳城添,王曦,郑剑.自适应一致表决算法[J].计算机科学,2011,38(7):130-133. 被引量：14
5唐海娜,林小拉,韩春静.基于移动指针的数据流冗余消除算法[J].通信学报,2012,33(2):7-14. 被引量：6
6黄亮,赵泽茂,梁兴开.基于编辑距离的Web数据挖掘[J].计算机应用,2012,32(6):1662-1665. 被引量：17
7王溢,李舟军,郭涛.防御代码注入式攻击的字面值污染方法[J].计算机研究与发展,2012,49(11):2414-2423. 被引量：18
8李晓静,张晓滨.基于LCS的用户时空行为兴趣相似性计算方法[J].计算机工程与应用,2013,49(20):251-254. 被引量：6
9姜华,韩安琪,王美佳,王峥,吴雲玲.基于改进编辑距离的字符串相似度求解算法[J].计算机工程,2014,40(1):222-227. 被引量：72
10杨益民,付必胜.仓库容量有限条件下的生产销售存贮模型[J].系统工程,2001,19(1):18-23. 被引量：34

引证文献10

1李卫超,冯俊龙.动态异构冗余的Web威胁感知技术研究[J].智能计算机与应用,2018,8(4):37-41. 被引量：3
2马博林,张铮,陈源,邬江兴.基于指令集随机化的抗代码注入攻击方法[J].信息安全学报,2020,5(4):30-43. 被引量：8
3徐飞龙,芦湘.基于远程通信教学管理系统设计的JSP技术研究[J].现代电子技术,2020,43(17):130-133. 被引量：3
4郑子君,王洪,余成.求解最长循环公共子序列问题的两个算法[J].计算机应用研究,2020,37(11):3334-3337. 被引量：3
5尤国华,刘媛,高东.CPU+MIC异构系统中动态请求处理模型研究[J].计算机应用研究,2020,37(12):3667-3670.
6马博林,张铮,刘浩,邬江兴.SQLMVED:基于多变体执行的SQL注入运行时防御系统[J].通信学报,2021,42(4):127-138. 被引量：3
7万仕贤,赵瑜,吴承荣.拟态数据库的网络攻击抵御能力评估和实证[J].计算机应用与软件,2022,39(1):319-327. 被引量：3
8周大成,陈鸿昶,程国振,何威振,商珂,扈红超.面向持久性连接的自适应拟态表决器设计与实现[J].通信学报,2022,43(6):71-84. 被引量：1
9左正康,孙欢,王昌晶,游珍,黄箐,王唱唱.命令式动态规划类算法程序推导及机械化验证[J].软件学报,2024,35(9):4218-4241.
10王灿,倪明,喻卫东,黎想.应用于拟态Web服务器的相似度求解方法[J].计算机系统应用,2019,28(1):75-80. 被引量：1

二级引证文献24

1邱琳,曾昉.人行广州分行创新开展县支行自安全网络部署试点取得成效[J].金融科技时代,2020,28(4):84-87.
2陈利跃,孙歆,成天晟,吴春明,陈双喜.面向Web隐藏后门技术的防御[J].电信科学,2020,36(5):39-46. 被引量：1
3高亚儒.基于多媒体视角下的三维思政教学系统研究[J].现代科学仪器,2021,38(1):140-144. 被引量：1
4鄂海红,张田宇,宋美娜.基于Web的数据可视化图表渲染优化方法[J].计算机科学,2021,48(3):119-123. 被引量：5
5马博林,张铮,刘浩,邬江兴.SQLMVED:基于多变体执行的SQL注入运行时防御系统[J].通信学报,2021,42(4):127-138. 被引量：3
6马博林,张铮,任权,张高斐,邬江兴.软件异构冗余执行系统的安全能力分析[J].通信学报,2021,42(9):1-11. 被引量：2
7万仕贤,赵瑜,吴承荣.拟态数据库的网络攻击抵御能力评估和实证[J].计算机应用与软件,2022,39(1):319-327. 被引量：3
8贾洪勇,潘云飞,刘文贺,曾俊杰,张建辉.基于高阶异构度的执行体动态调度算法[J].通信学报,2022,43(3):233-245. 被引量：2
9Lei He,Quan Ren,Bolin Ma,Weili Zhang,Jiangxing Wu.Anti-Attacking Modeling and Analysis of Cyberspace Mimic DNS[J].China Communications,2022,19(5):218-230. 被引量：1
10赵越,李博.计算机辅助下的健美操教学资源管理系统设计研究[J].中国管理信息化,2022,25(8):221-223.

1甘艳芬,钟君柳,郑媛裕.数字图像篡改检测关键技术研究综述[J].赤峰学院学报（自然科学版）,2017,33(24):17-19. 被引量：2
2李永.物联网技术在水产养殖监控系统中的应用研究[J].电子质量,2018(1):26-28. 被引量：1
3王禛鹏,扈红超,程国振,张传浩.软件定义网络下的拟态防御实现架构[J].网络与信息安全学报,2017,3(10):52-61. 被引量：5
4李明建.基于异构数据集成的煤与瓦斯突出监控预警系统[J].工矿自动化,2018,44(1):11-16. 被引量：10
5颜清,苗壮,艾志华,赖鑫生.递归算法的VBA模拟实验研究[J].上饶师范学院学报,2017,37(6):20-23. 被引量：1
6赵弘中,郑俊.一种基于LBS与游客特征大数据分析的旅游信息推送方法研究[J].计算机时代,2018(1):58-62. 被引量：3
7王龄苒,李登峰.基于直觉模糊相似度的逼近理想解排序方法及其应用[J].科技管理研究,2017,37(19):210-216. 被引量：7
8刘颜涛.舞台真好[J].中国书法,2018(1):138-140.
9丁岩,努尔布力.基于URL混淆技术识别的钓鱼网页检测方法[J].计算机工程与应用,2017,53(20):75-82. 被引量：4
10余梦,李慧敏.基于Android的超市冷链设备数据监测系统设计[J].自动化与仪表,2018,33(1):97-101.

计算机工程与设计

2018年第1期

浏览历史

内容加载中请稍等...

应用于动态异构web服务器的相似度求解方法被引量：10

参考文献8

二级参考文献71

共引文献180

同被引文献75

引证文献10

二级引证文献24

相关作者

相关机构

相关主题

浏览历史

应用于动态异构web服务器的相似度求解方法 被引量：10

参考文献8

二级参考文献71

共引文献180

同被引文献75

引证文献10

二级引证文献24

相关作者

相关机构

相关主题

浏览历史

应用于动态异构web服务器的相似度求解方法被引量：10