期刊文献+
共找到52篇文章
< 1 2 3 >
每页显示 20 50 100
基于人类社交行为的动态多目标优化
1
作者 伍大清 郑建国 +1 位作者 朱佳俊 孙莉 《计算机科学》 CSCD 北大核心 2015年第8期249-252,278,共5页
为了提高多目标微粒群优化算法处理多目标优化问题的性能,降低计算复杂度,改善算法的收敛性,提出了一种基于人类社交行为的多目标动态微粒群优化算法。考虑到粒子寻优过程受到环境中精英粒子与平庸粒子的影响,分别对自身产生推力与阻力... 为了提高多目标微粒群优化算法处理多目标优化问题的性能,降低计算复杂度,改善算法的收敛性,提出了一种基于人类社交行为的多目标动态微粒群优化算法。考虑到粒子寻优过程受到环境中精英粒子与平庸粒子的影响,分别对自身产生推力与阻力作用,并引入局部跳出策略,使算法具有很强的全局搜索能力和较好的鲁棒性能。通过典型的多目标优化函数对算法进行了测试验证,结果表明提出的多目标算法具有较快的收敛速度和较强的跳出局部最优能力,性能优越,可供许多领域优化问题求解借鉴。 展开更多
关键词 多目标优化算法 精英粒子 平庸粒子 局部跳出策略
下载PDF
基于迁移学习的农作物病虫害检测方法研究与应用 被引量:43
2
作者 余小东 杨孟辑 +3 位作者 张海清 李丹 唐毅谦 于曦 《农业机械学报》 EI CAS CSCD 北大核心 2020年第10期252-258,共7页
为了提高农作物病虫害严重程度(健康、一般、严重)的分类效果,采用迁移学习方式并结合深度学习提出了一种基于残差网络(ResNet 50)的CDCNNv2算法。通过对10类作物的3万多幅病虫害图像进行训练,获得了病虫害严重程度分类模型,其识别准确... 为了提高农作物病虫害严重程度(健康、一般、严重)的分类效果,采用迁移学习方式并结合深度学习提出了一种基于残差网络(ResNet 50)的CDCNNv2算法。通过对10类作物的3万多幅病虫害图像进行训练,获得了病虫害严重程度分类模型,其识别准确率可达91.51%。为了验证CDCNNv2模型的鲁棒性,分别与使用迁移学习的ResNet 50、Xception、VGG16、VGG19、DenseNet 121模型进行对比试验,结果表明,CDCNNv2模型比其他模型的平均精度提升了2.78~10.93个百分点,具有更高的分类精度,病虫害严重程度识别的鲁棒性增强。基于该算法所训练的模型,结合Android技术开发了一款实时在线农作物病虫害等级识别APP,通过拍摄农作物叶片病虫害区域图像,能够在0.1~0.5 s之内获取识别结果(物种病害种类严重程度)及防治建议。 展开更多
关键词 农作物病虫害 病虫害等级分类 深度迁移学习 ResNet 50 移动应用程序
下载PDF
“数据流动”视角下智慧旅游公共服务基本理论问题探讨 被引量:24
3
作者 黎忠文 唐建兵 《四川师范大学学报(社会科学版)》 CSSCI 北大核心 2015年第1期48-53,共6页
旅游业与信息产业的不断融合,催生了"智慧旅游"。智慧旅游公共服务的理论研究目前尚处于萌芽阶段。智慧旅游的特点在于智慧,强调主动感知和数据的积累,其公共服务的内涵、服务的内容、供给关系、供给模式等都与传统的旅游公... 旅游业与信息产业的不断融合,催生了"智慧旅游"。智慧旅游公共服务的理论研究目前尚处于萌芽阶段。智慧旅游的特点在于智慧,强调主动感知和数据的积累,其公共服务的内涵、服务的内容、供给关系、供给模式等都与传统的旅游公共服务有着较大的差别。本文的价值在于从"数据流动"的视角对智慧旅游公共服务的概念和基本理论进行了探讨,希望能为智慧旅游公共服务平台的建设提供有益的参考。 展开更多
关键词 智慧旅游 智慧旅游公共服务 数据供给模式 旅游公共服务质量评价
下载PDF
智慧旅游公共服务体系内涵及构建思考 被引量:18
4
作者 黎忠文 张学梅 +1 位作者 唐建兵 赵丽琴 《商业时代》 北大核心 2014年第30期118-120,共3页
智慧旅游公共服务的广泛社会需求和当前各地正在兴起的示范区建设,迫切需要智慧旅游公共服务体系构建理论作指导。本文从智慧旅游的视角,深入地研究了旅游公共服务概念、旅游公共服务主客体和服务供给之间的关系和供给模式选择的依据。... 智慧旅游公共服务的广泛社会需求和当前各地正在兴起的示范区建设,迫切需要智慧旅游公共服务体系构建理论作指导。本文从智慧旅游的视角,深入地研究了旅游公共服务概念、旅游公共服务主客体和服务供给之间的关系和供给模式选择的依据。提出了智慧旅游公共服务的新特点、公共服务供给流程,基于安全关键分析的公共服务供给模式的选择原理,最后给出了智慧旅游公共服务体系的构建方法。通过这一系列的研究希望为智慧旅游公共服务体系的理论研究做一些积累,同时也为当前的示范区建设提供有益的参考。 展开更多
关键词 智慧旅游 旅游公共服务体系供给模式 安全关键系统
下载PDF
一种多视角新闻信息快速检索方法
5
作者 张志强 张丽 +2 位作者 周晓清 王伟钧 黎忠文 《现代电子技术》 北大核心 2024年第18期57-64,共8页
信息检索一直是数据挖掘研究的重要领域,也是情报搜集的重要手段。如果采用人工手动搜索方式在数据库中检索信息,检索效率较低。为此,以新闻信息搜集为应用背景,以提高信息检索效率为目的,提出了一种多视角新闻信息快速检索方法。该方... 信息检索一直是数据挖掘研究的重要领域,也是情报搜集的重要手段。如果采用人工手动搜索方式在数据库中检索信息,检索效率较低。为此,以新闻信息搜集为应用背景,以提高信息检索效率为目的,提出了一种多视角新闻信息快速检索方法。该方法以用户需要检索的多视角新闻描述信息为检索依据,利用关键词权重分割法处理多视角新闻描述信息来构建词汇向量,以词汇向量在新闻信息库中的检索结果为依据来构建词汇检索向量,以向量相似度计算模型为信息筛选规则,在新闻信息库中快速检索并筛选出用户需要搜集的新闻信息。文中给出了所提方法的设计模型、涉及的关键技术实现策略、数据处理流程以及实验对比分析。实验结果表明,该方法能够根据用户指定的多视角新闻描述信息,在新闻信息库中快速高效地检索并筛选出符合用户需求的新闻文章信息。 展开更多
关键词 多视角 新闻信息 信息检索 快速检索方法 词汇向量 词汇检索向量 向量相似度计算
下载PDF
脉动顶张力作用下输流立管涡激振动主共振研究
6
作者 秦营 李世博 常学平 《中国海洋大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第7期72-78,共7页
为定量描述海洋工程中输流立管受脉动顶张力作用时的涡激振动响应,本文研究了海洋输流立管受到内部流体、脉动顶张力和涡流激励作用时的参数主共振问题。首先建立了该问题的数学模型,运用Galerkin法和多重尺度法对其进行求解,引入调谐... 为定量描述海洋工程中输流立管受脉动顶张力作用时的涡激振动响应,本文研究了海洋输流立管受到内部流体、脉动顶张力和涡流激励作用时的参数主共振问题。首先建立了该问题的数学模型,运用Galerkin法和多重尺度法对其进行求解,引入调谐参数描述输流立管第一阶固有频率同顶张力脉动频率和涡流频率的接近程度,通过改变调谐参数,研究输流立管的动力学响应。结果表明:定常顶张力作用下,立管的振幅为单值,随着调谐参数增大,立管振幅先增大后减小,且出现明显的跳跃现象,内部流体速度和张力幅值的竞争机制也会影响立管振幅;脉动顶张力作用时,在一阶锁频的条件下,随着调谐参数变化,立管的振幅呈现“多值—单值—多值”的变化规律,顶张力均值或脉动幅值越大,立管振幅的变化范围越宽。 展开更多
关键词 海洋输流立管 脉动顶张力 涡激振动 主参数共振 调谐参数 振动响应
下载PDF
考虑温度效应的覆冰导线动力学建模及舞动特征研究 被引量:5
7
作者 闵光云 刘小会 +3 位作者 蔡萌琦 孙测世 杨曙光 张春霞 《力学与实践》 北大核心 2021年第1期84-93,共10页
针对以往研究忽略了温度效应对覆冰导线舞动特性的影响,本文推导了考虑温度效应影响的覆冰导线舞动控制方程。基于悬链法、热应力理论推导了覆冰导线的偏微分舞动方程,接着通过Galerkin法将该偏微分方程转化为常微分方程。建立气动载荷... 针对以往研究忽略了温度效应对覆冰导线舞动特性的影响,本文推导了考虑温度效应影响的覆冰导线舞动控制方程。基于悬链法、热应力理论推导了覆冰导线的偏微分舞动方程,接着通过Galerkin法将该偏微分方程转化为常微分方程。建立气动载荷模型,将气动力引入到舞动方程中,随后采用多尺度求得了覆冰导线的位移响应,最后进行了参数分析、算例分析。结果表明:温度对覆冰导线面内、面外的频率影响显著,且对覆冰导线舞动的幅值也有一定的影响。可见针对覆冰导线舞动特征的影响研究,有必要考虑温度效应的影响,本文的研究成果有利于理论建模的完善,也能给予实际工程一定的参考。 展开更多
关键词 温度效应 覆冰导线 舞动特征 频率 幅值
下载PDF
基于二进小波能量自功率谱的转子碰磨故障特征提取 被引量:5
8
作者 游磊 胡俊 +1 位作者 古沐松 朱然 《煤矿机械》 北大核心 2013年第2期239-241,共3页
针对转子动静碰磨故障,通过分析转子运行时产生振动信号的时频特性,提出了一种基于二进小波能量自功率谱的故障特征提取方法。该方法利用二进小波变换得到小波能量系数谱,在小波能量系数谱中找到系数之和变化最大的能量尺度层,对该层进... 针对转子动静碰磨故障,通过分析转子运行时产生振动信号的时频特性,提出了一种基于二进小波能量自功率谱的故障特征提取方法。该方法利用二进小波变换得到小波能量系数谱,在小波能量系数谱中找到系数之和变化最大的能量尺度层,对该层进行自功率谱变换后可将碰磨故障的特征量提取出来。 展开更多
关键词 碰磨故障 二进小波 能量自功率谱 特征提取
下载PDF
基于物联网农田环境数据的安全访问控制 被引量:5
9
作者 张志强 黎忠文 +1 位作者 巫恒强 孟飞 《科学技术与工程》 北大核心 2019年第31期206-214,共9页
随着当前物联网边缘计算技术的发展,使得物联网数据安全访问的问题日益严峻,传统的基于用户权限的数据访问控制策略不能很好解决相关数据安全访问控制问题。为此,从用户身份认证和数据访问控制等方面研究物联网数据安全共享问题的解决... 随着当前物联网边缘计算技术的发展,使得物联网数据安全访问的问题日益严峻,传统的基于用户权限的数据访问控制策略不能很好解决相关数据安全访问控制问题。为此,从用户身份认证和数据访问控制等方面研究物联网数据安全共享问题的解决方案。以物联网农田环境数据安全共享系统为应用背景,提出了一种基于用户属性和用户行为的数据安全访问控制模型,该模型以用户行为构建信任机制,并结合用户属性的设置与判定共同实现系统的数据安全访问控制。给出了模型的规则定义与构建、具体结构设计、数据处理控制流程以及用户信任度评价体系设计的详细过程及实例分析。通过分析结果表明,该模型设计具有较好的动态性和扩展性,能够实现物联网中用户对农田环境数据的安全访问,从而解决物联网数据安全共享问题。 展开更多
关键词 物联网 农田环境数据 用户属性 用户行为 信任机制 数据安全访问
下载PDF
医教协同视角下医学生专创融合培养模式探索——以成都大学为例 被引量:5
10
作者 万君 《教育教学论坛》 2021年第13期79-82,共4页
在医教协同的时代背景下,专业教育与创新创业教育融合,为综合性地方院校培养医学应用型人才提供了新的视角。通过以综合院校优势平台为基础,以职业需求为导向,促进多学科交叉融合,探讨人才培养方案的修订、专创融合平台的建立、专创师... 在医教协同的时代背景下,专业教育与创新创业教育融合,为综合性地方院校培养医学应用型人才提供了新的视角。通过以综合院校优势平台为基础,以职业需求为导向,促进多学科交叉融合,探讨人才培养方案的修订、专创融合平台的建立、专创师资队伍的建设、应用型人才分类、分层次培养和结合第二课堂,拓展专创融合培养的载体,探索建立医学生专业教育与创新创业教育融合背景下的复合型应用型创新人才培养的路径。 展开更多
关键词 医教协同 医学生 专创融合 培养模式
下载PDF
面向海量空间数据的分级存储模型研究 被引量:3
11
作者 杨文晖 袁进俊 苗放 《物探化探计算技术》 CAS CSCD 2015年第6期783-789,共7页
空间信息技术和遥感遥测等技术的飞速发展,产生了海量的遥感、地灾等行业空间信息数据。如何对海量空间数据进行合理的分级存储,以满足大数据时代下空间信息、地理信息等行业应用,这已成为日益紧迫的问题。海量空间数据分级存储作为一... 空间信息技术和遥感遥测等技术的飞速发展,产生了海量的遥感、地灾等行业空间信息数据。如何对海量空间数据进行合理的分级存储,以满足大数据时代下空间信息、地理信息等行业应用,这已成为日益紧迫的问题。海量空间数据分级存储作为一种全新的存储模式,为解决该问题提出了新的思路。结合海量空间数据的特点和日常数据应用的规律,提出了基于访问热度和聚类关联的海量空间数据分级存储模型,该模型主要包括热点数据分级、关联数据分级、数据的迁移三部分。最后通过嫦娥2号遥感数据模拟访问试验,优化了数据升级阀值,证明了分级存储模型用于海量空间数据的可行性。 展开更多
关键词 空间数据 遥感遥测 分级存储 密度聚类算法 数据关联
下载PDF
可嵌入C++的脚本语言的设计与实现 被引量:4
12
作者 鄢涛 曾谊 +3 位作者 孟飞 刘永红 赵卫东 叶安胜 《成都大学学报(自然科学版)》 2018年第4期402-406,共5页
作为一种编译型程序设计语言,C++程序更新后往往需要重新编译,所以一些经常变动的业务逻辑需要搭配脚本语言.设计了一种面向对象的弱类型脚本语言,并为其开发可嵌入C++程序的解释器.该脚本语言有着与C++类似的语法,只要该脚本语言的函... 作为一种编译型程序设计语言,C++程序更新后往往需要重新编译,所以一些经常变动的业务逻辑需要搭配脚本语言.设计了一种面向对象的弱类型脚本语言,并为其开发可嵌入C++程序的解释器.该脚本语言有着与C++类似的语法,只要该脚本语言的函数被注册到解释器中,就可以随意调用C++中的函数,保证了脚本语言的强大功能,降低C++项目的维护难度. 展开更多
关键词 脚本语言 C++ 解释器 弱类型 可嵌入
下载PDF
高校计算机公共基础课实验报告改革探讨 被引量:4
13
作者 李倩 《计算机光盘软件与应用》 2013年第5期125-125,127,共2页
实验报告在高校计算机公共基础课实验教学中发挥着重要的作用。首先分析了当前实验报告存在的问题,然后针对这些问题从实验预习、实验报告模板设计、实验报告提交时间、实验报告批改规范以及采用电子实验报告进行现代化管理等方面提出... 实验报告在高校计算机公共基础课实验教学中发挥着重要的作用。首先分析了当前实验报告存在的问题,然后针对这些问题从实验预习、实验报告模板设计、实验报告提交时间、实验报告批改规范以及采用电子实验报告进行现代化管理等方面提出了一系列的改进措施,最后对实验报告的发展趋势进行了展望。 展开更多
关键词 实验报告 实验教学 实验预习 实验报告模板 电子实验报告
下载PDF
Android应用程序能耗分析与建模研究 被引量:3
14
作者 段林涛 郭兵 +3 位作者 沈艳 王毅 张文丽 熊伟 《电子科技大学学报》 EI CAS CSCD 北大核心 2014年第2期272-277,共6页
应用程序能耗分析与建模是智能移动终端能耗优化的重要组成部分。针对智能移动终端丰富的应用程序,提出了一种基于应用程序运行时间的时间能耗模型。与精度高和复杂的应用程序组件能耗模型相比,该模型使用时间变量刻画和包含终端的功耗... 应用程序能耗分析与建模是智能移动终端能耗优化的重要组成部分。针对智能移动终端丰富的应用程序,提出了一种基于应用程序运行时间的时间能耗模型。与精度高和复杂的应用程序组件能耗模型相比,该模型使用时间变量刻画和包含终端的功耗、性能等多种因素,而且运行时间容易精确测量和获取,能够快速地估算应用程序运行时移动终端产生的能耗。实验结果表明,在GT-I9108、GT-I9308和GT-P3108实验平台下,该模型的能耗估算结果与Android操作系统应用程序框架提供的组件能耗模型测量值相比平均误差分别为0.89%、1.37%和0.29%,能够为移动终端用户便捷地预测应用程序消耗的电池电能提供帮助。 展开更多
关键词 应用程序能耗模型 电池电能 能耗模型 移动终端 功耗
下载PDF
X射线光谱中特征峰漂移校正算法的研究 被引量:3
15
作者 唐琳 廖先莉 +3 位作者 刘星月 赵永鑫 李跃鹏 余松科 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2020年第11期3633-3638,共6页
针对采用数字慢三角成形算法的高性能硅漂移探测器在开关复位型前放中出现的突变脉冲以及该类脉冲在成形后因幅度受损造成的特征峰漂移问题,提出了一种基于突变脉冲修复的特征峰漂移校正算法,该算法包括以下几个流程,首先将该电路输出... 针对采用数字慢三角成形算法的高性能硅漂移探测器在开关复位型前放中出现的突变脉冲以及该类脉冲在成形后因幅度受损造成的特征峰漂移问题,提出了一种基于突变脉冲修复的特征峰漂移校正算法,该算法包括以下几个流程,首先将该电路输出的弱电流信号经CR微分电路进行转换得到负指数信号,然后负指数信号经三级放大电路放大后的幅度范围为0~2 V,该幅度范围保持在后端模数转换器的处理范围中,对放大后的负指数信号进行模数转换得到数字化的负指数脉冲序列,通过对上述负指数脉冲序列的采样点进行判断,当出现连续多个为零的采样点时就标记该脉冲为突变脉冲,最后对突变脉冲分别调用快校正和慢校正算法进行修复,并将修复后的负指数脉冲序列分别进行数字梯形成形,其成形结果存储到FIFO中进行多道成谱。实验以自制的铁矿样品为测量对象,将未进行校正的原始谱与采用不同校正方法得到的谱图进行对比,校正后铁和锶特征峰的影子峰所在道址区间的计数相比于未校正的原始谱的计数率有了明显的降低,与此同时,铁和锶两个特征峰所在道址区间的计数相比于不校正则有了明显的提高。由于特征峰计数率的漂移正是产生影子峰的根本原因,因此同一种元素在影子峰区域计数率的减小值与在特征峰区域计数率的增加值在数值上应趋于一致,实验结果中铁元素的影子峰和特征峰所在区间快校正和慢校正前后的计数率差值基本符合这一趋势,但锶元素影子峰和特征峰所在区间的快校正前后计数率差值相差较大,不符合影子峰计数减小值即为特征峰计数增加值的规律。造成这种结果的根本原因在于快校正对突变脉冲的修复不完整,而慢校正可以较好地实现所有采样点的修复,最后得出的修复效率也表明对于同样的区间,慢校正法得到的修复效率� 展开更多
关键词 特征峰漂移 X射线光谱 脉冲修复 高性能硅漂移探测器
下载PDF
Oracle分区表和分区索引在VLDB中的研究 被引量:3
16
作者 赵卫东 刘永红 +1 位作者 鄢涛 于曦 《成都大学学报(自然科学版)》 2016年第4期358-360,367,共4页
分区表和分区索引功能是数据库管理中的关键技术之一,是海量数据库管理(Very Large Databases,VLDB)中一个重要的性能提升机制.分区技术的原理是将逻辑上的一个大表拆分成多个独立的物理分区来存储,从而提高数据I/O性能.面对大数据的存... 分区表和分区索引功能是数据库管理中的关键技术之一,是海量数据库管理(Very Large Databases,VLDB)中一个重要的性能提升机制.分区技术的原理是将逻辑上的一个大表拆分成多个独立的物理分区来存储,从而提高数据I/O性能.面对大数据的存储,几乎所有Oracle数据库都用分区技术来提高查询数据的性能.通过分析一个项目案例,说明如何综合使用分区表和分区索引来提高大数据的查询速度. 展开更多
关键词 ORACLE 分区表 分区索引 VLDB
下载PDF
基于C++的高效内存池的设计与实现 被引量:3
17
作者 鄢涛 于曦 +3 位作者 刘永红 赵卫东 余悦 曾谊 《成都大学学报(自然科学版)》 2017年第3期257-261,共5页
为了高效、安全地利用计算机内存资源,在大型的软件设计中,往往要进行大量的内存分配与回收操作,为此,C++专门提供了malloc等相关函数进行操作,这些函数能够满足一般的使用,但由于它们调用了操作系统API,所以实际使用时会在操作系统中... 为了高效、安全地利用计算机内存资源,在大型的软件设计中,往往要进行大量的内存分配与回收操作,为此,C++专门提供了malloc等相关函数进行操作,这些函数能够满足一般的使用,但由于它们调用了操作系统API,所以实际使用时会在操作系统中产生大量的内存碎片,让内存分配成为效率瓶颈,从而降低系统性能.基于此,通过对循环首次适应算法进行改进,设计并实现了基于C++的高效内存池,大幅提升了内存分配与回收的效率.同时,还为内存池编写了相关的分配子,使其能与C++标准库无缝对接,提供了若干具有垃圾回收功能的智能指针,提高了内存管理与程序运行的效率. 展开更多
关键词 内存池 内存分配 循环首次适应算法 高效策略
下载PDF
一种大容量数据文件抽取算法的优化研究 被引量:3
18
作者 张志强 王伟钧 施达 《成都大学学报(自然科学版)》 2019年第1期52-55,共4页
数据挖掘过程中,对数据文件进行数据抽取是构建数据仓库的重要过程.目前在抽取大容量数据文件时会出现很多局限性问题,如抽取操作出错、数据量无法自动匹配获取及数据库写入速度较低等.为了解决这些局限性问题,对大容量数据文件抽取算... 数据挖掘过程中,对数据文件进行数据抽取是构建数据仓库的重要过程.目前在抽取大容量数据文件时会出现很多局限性问题,如抽取操作出错、数据量无法自动匹配获取及数据库写入速度较低等.为了解决这些局限性问题,对大容量数据文件抽取算法进行了优化研究,提出并设计了一种大容量数据文件抽取算法.实验结果表明,该算法能够优化常规算法的效率,并具有数据容量自适应抽取及数据库快速写入等特点. 展开更多
关键词 大容量数据 抽取算法 自适应 快速写入 优化
下载PDF
基于哈夫曼编码的多线程无损压缩库的设计与实现 被引量:3
19
作者 鄢涛 彭海峰 +3 位作者 李浩 陈超 刘永红 赵卫东 《成都大学学报(自然科学版)》 2019年第3期287-290,共4页
基于哈夫曼编码和C++多线程技术,设计并封装出C++库函数,实现了文档的无损压缩,保证了良好的压缩率和高效的压缩速度.该库函数能被其他开发语言直接调用,能够极大程度地提高开发人员在实现文件压缩时的开发效率,并在C++库函数的开发中... 基于哈夫曼编码和C++多线程技术,设计并封装出C++库函数,实现了文档的无损压缩,保证了良好的压缩率和高效的压缩速度.该库函数能被其他开发语言直接调用,能够极大程度地提高开发人员在实现文件压缩时的开发效率,并在C++库函数的开发中具有参考价值. 展开更多
关键词 C++ 多线程 哈夫曼编码 无损压缩
下载PDF
基于N-Gram和动态滑动窗口的改进余弦相似度算法研究 被引量:3
20
作者 张洪 钟凯迪 +4 位作者 柴源 魏济 吴艳 谭锦涛 叶文韬 《成都大学学报(自然科学版)》 2019年第2期163-166,共4页
为了解决余弦相似度算法进行数据清洗时重复与相似的数据会使计算量呈几何级增长的问题,提出了基于N-Gram和动态滑动窗口的改进余弦相似度算法.首先通过计算每条数据的N-Gram值,并对数据进行相似度排序,然后定义初始滑动窗口,其窗口值根... 为了解决余弦相似度算法进行数据清洗时重复与相似的数据会使计算量呈几何级增长的问题,提出了基于N-Gram和动态滑动窗口的改进余弦相似度算法.首先通过计算每条数据的N-Gram值,并对数据进行相似度排序,然后定义初始滑动窗口,其窗口值根据N-Gram值的方差动态调整,最后在每个窗口中根据相似度与阀值判断相似数据.实验结果表明,改进的余弦相似度算法在运行速度上有大幅度提高,数据清洗准确率也得到提升,且该算法适用于海量数据的情形. 展开更多
关键词 余弦相似度算法 N-Gram算法 数据清洗 动态滑动窗口
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部