期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
Using Optimized Distributional Parameters as Inputs in a Sequential Unsupervised and Supervised Modeling of Sunspots Data
1
作者 K. Mwitondi J. Bugrien K. Wang 《Journal of Software Engineering and Applications》 2013年第7期34-41,共8页
Detecting naturally arising structures in data is central to knowledge extraction from data. In most applications, the main challenge is in the choice of the appropriate model for exploring the data features. The choi... Detecting naturally arising structures in data is central to knowledge extraction from data. In most applications, the main challenge is in the choice of the appropriate model for exploring the data features. The choice is generally poorly understood and any tentative choice may be too restrictive. Growing volumes of data, disparate data sources and modelling techniques entail the need for model optimization via adaptability rather than comparability. We propose a novel two-stage algorithm to modelling continuous data consisting of an unsupervised stage whereby the algorithm searches through the data for optimal parameter values and a supervised stage that adapts the parameters for predictive modelling. The method is implemented on the sunspots data with inherently Gaussian distributional properties and assumed bi-modality. Optimal values separating high from lows cycles are obtained via multiple simulations. Early patterns for each recorded cycle reveal that the first 3 years provide a sufficient basis for predicting the peak. Multiple Support Vector Machine runs using repeatedly improved data parameters show that the approach yields greater accuracy and reliability than conventional approaches and provides a good basis for model selection. Model reliability is established via multiple simulations of this type. 展开更多
关键词 Clustering DATA Mining Density Estimation EM Algorithm SUNSPOTS Supervised modelling Support Vector Machines unsupervised modelling
下载PDF
非定常流场时程重构的深度学习方法
2
作者 战庆亮 白春锦 +1 位作者 吴智虎 葛耀君 《船舶力学》 EI CSCD 北大核心 2024年第3期319-327,共9页
高分辨率的流场数据对流动问题的研究具有重要意义。受测量方法、计算效率等多因素限制,高分辨率流场的直接获取仍有一定困难。本文基于流场时程数据的低维表征模型,提出非定常流动时程数据重构的深度学习方法。该方法直接面向样本时程... 高分辨率的流场数据对流动问题的研究具有重要意义。受测量方法、计算效率等多因素限制,高分辨率流场的直接获取仍有一定困难。本文基于流场时程数据的低维表征模型,提出非定常流动时程数据重构的深度学习方法。该方法直接面向样本时程数据,凭借一维卷积的特性提取出样本中包含的时程特征;然后,建立物理空间与表征模型编码空间之间的映射关系;最后,利用一维反卷积对低维表征进行解码,实现对流场中任意位置数据的重构。对Re_(D)=200的非定常圆柱层流绕流流场进行低维表征与验证,进而实现高分辨率流场时程数据的重构,并证明方法的准确性。本文方法是一种无监督方法,是一种时间维度上具有高精度的流场数据重构方法,适用于基于传感器的时程数据处理。 展开更多
关键词 流场重构 流场时程 深度学习 特征提取 无监督模型
下载PDF
无监督与有监督相结合的粤语分词方法
3
作者 苏振江 张仰森 +1 位作者 胡昌秀 黄改娟 《计算机工程与设计》 北大核心 2023年第8期2482-2488,共7页
为能在缺乏粤语分词语料的情况下进行粤语研究,提出一种基于无监督与有监督结合的粤语分词方法。利用多源语料完成粤语词库的构建;利用二元字典与粤语词库对初步结果进行初筛分词和二次分词;利用DAG对粤语通用句式切分错误进行分析并修... 为能在缺乏粤语分词语料的情况下进行粤语研究,提出一种基于无监督与有监督结合的粤语分词方法。利用多源语料完成粤语词库的构建;利用二元字典与粤语词库对初步结果进行初筛分词和二次分词;利用DAG对粤语通用句式切分错误进行分析并修正;将修正后的粤语分词语料利用深度学习模型固化分词效果,得到基于Bert-BiLSTM-CRF三层架构的分词模型。实验结果表明,该方法能有效克服预分词语料的缺失问题,在无需大量分词语料的情况下,F值达到74.3%。 展开更多
关键词 粤语 分词研究 词库 互信息 端到端模型 有监督模型 无监督模型
下载PDF
多特征选择与双向残差融合的无监督水下图像增强
4
作者 胡雨航 赵磊 +1 位作者 李恒 刘辉 《电子测量与仪器学报》 CSCD 北大核心 2023年第9期190-202,共13页
如今,利用合成的成对数据集训练的有监督模型泛化能力弱,在多变的实际水下环境中表现不佳,而无监督模型虽摆脱了成对数据集的依赖,但生成图像可能因缺少特征信息导致图像视觉质量较差。故以循环生成对抗网络为架构,提出多特征选择与双... 如今,利用合成的成对数据集训练的有监督模型泛化能力弱,在多变的实际水下环境中表现不佳,而无监督模型虽摆脱了成对数据集的依赖,但生成图像可能因缺少特征信息导致图像视觉质量较差。故以循环生成对抗网络为架构,提出多特征选择与双向残差融合的水下图像增强方法。一方面,设计以混合注意力为基础的多特征选择模块对水下图像的多种特征进行选择,再由双向残差融合对传统U型跳跃连接进行优化,使图像特征高效表达,有效恢复水下图像的纹理与色彩。另一方面,在判别器中引入混合注意力并提出内容感知损失和风格感知损失,保证增强图像在全局内容、局部纹理、风格特征等方面和清晰图像一致。与现有的无监督和有监督模型相比较,该模型PSNR分别提高了6%和2%,SSIM分别提高了4%和3%,对水下图像有着显著的增强效果,在色彩真实度和饱和度上相比其他现有方法更加优秀。 展开更多
关键词 无监督模型 循环生成对抗网络 多特征选择 双向残差融合 水下图像增强
下载PDF
基于时程深度学习的桥面绕流表征与重构方法
5
作者 战庆亮 白春锦 葛耀君 《工程力学》 EI CSCD 北大核心 2023年第9期13-19,共7页
流场特性的研究是结构风工程的核心问题,而高分辨率的流场数据对解决风致振动问题、探索流固耦合机理具有着重要意义。受测量方法、计算效率等因素限制,高空间分辨率的流场时程数据的直接获取仍有一定困难。该文基于流场时程数据的表征... 流场特性的研究是结构风工程的核心问题,而高分辨率的流场数据对解决风致振动问题、探索流固耦合机理具有着重要意义。受测量方法、计算效率等因素限制,高空间分辨率的流场时程数据的直接获取仍有一定困难。该文基于流场时程数据的表征模型,提出了桥面非定常流动时程重构的深度学习方法。基于一维卷积方法建立了非定常桥面绕流场的表征模型,得到了物理空间与表征模型的编码空间之间的映射关系,最后利用表征模型的解码器生成未知测点处的流场时程数据。对较低雷诺数桥梁主梁的非定常绕流流场进行了研究与验证,实现了桥面绕流的时程数据重构,验证了方法的准确性与可行性。该文所提方法基于流场的时程数据进行表征与重构,可广泛应用于工程中基于一点的传感器数据处理,是一种桥面流场数据分析的新方法。 展开更多
关键词 流场重构 流场时程 深度学习 特征提取 无监督模型
下载PDF
多尺度特征融合的双判别器残差生成对抗网络
6
作者 管凤旭 路斯棋 郑岩 《智能系统学报》 CSCD 北大核心 2023年第5期917-925,共9页
生成对抗网络(generative adversarial networks, GANs)作为一类基于深度学习的无监督生成模型,无需对数据分布进行建模便可以生成真实且质量较高的图像。标准的GANs往往训练困难,常出现梯度消失、梯度爆炸或者模式崩溃等问题,限制模型... 生成对抗网络(generative adversarial networks, GANs)作为一类基于深度学习的无监督生成模型,无需对数据分布进行建模便可以生成真实且质量较高的图像。标准的GANs往往训练困难,常出现梯度消失、梯度爆炸或者模式崩溃等问题,限制模型的性能。为解决模式崩溃问题,本文提出一种双判别器结构来提高模型生成图像的多样性。另外,本文改进了生成器模型和判别器模型,提出一种基于残差网络和多尺度特征融合的生成器和基于多尺度特征融合的判别器,在提高生成图像质量的前提下解决深层网络出现的梯度消失、梯度爆炸的问题。将其应用于MNIST、LSUN、CelebA数据集上,训练结果稳定且生成图像质量较高,取得了令人满意的FID和IS值。 展开更多
关键词 生成对抗网络 深度学习 无监督模型 模式崩溃 梯度爆炸 梯度消失 多尺度特征融合 训练稳定性
下载PDF
一种基于卷积自编码器的文档聚类模型
7
作者 冯永强 李亚军 《现代信息科技》 2018年第2期12-15,共4页
文档聚类是将文档集自动归成若干类别的过程,是对文本信息进行分类的有效方式。为了解决半结构化的文本数据转化为结构化数据时出现的数据高维性问题,本文提出了一种卷积自编码器的文档聚类模型CASC,利用卷积神经网络和自编码器的特征... 文档聚类是将文档集自动归成若干类别的过程,是对文本信息进行分类的有效方式。为了解决半结构化的文本数据转化为结构化数据时出现的数据高维性问题,本文提出了一种卷积自编码器的文档聚类模型CASC,利用卷积神经网络和自编码器的特征提取能力,在尽可能保留原始数据内部结构的同时,将其嵌入到低维潜在空间,然后使用谱聚类算法进行聚类。实验表明,CASC模型在保证聚类准确率不降低的前提下减少了算法运行时间,同时也降低了算法时间复杂度。 展开更多
关键词 聚类 卷积神经网络 自编码器 无监督模型
下载PDF
机器学习在物联网虚假用户识别中的运用 被引量:12
8
作者 张溶芳 许丹丹 +2 位作者 王元光 潘思宇 李正茂 《电信科学》 2019年第7期136-144,共9页
随着通信技术的发展,物联网卡和5G技术将得到大规模应用,但存在个别企业利用物联网卡资费便宜、没有实名制等特点从中非法牟利、破坏社会稳定的问题,不利于行业健康发展。因此如何识别虚假用户成为物联网行业研究的重要课题。主要研究... 随着通信技术的发展,物联网卡和5G技术将得到大规模应用,但存在个别企业利用物联网卡资费便宜、没有实名制等特点从中非法牟利、破坏社会稳定的问题,不利于行业健康发展。因此如何识别虚假用户成为物联网行业研究的重要课题。主要研究了在实时海量的物联网终端数据中,如何运用机器学习模型高效地识别疑似虚假用户。具体来看,通过研究相关数据的特征,采用基于正样本和未标记样本的半监督式学习模型建立实时监控异常行为的模型,达到识别物联网行业中潜在虚假用户的目的。本研究成果体现在节约大量人力物力的同时,可以帮助相关部门、人员及时发现用户的异常行为,采取相应的措施避免产生较大损失,具有广泛的行业应用前景。 展开更多
关键词 物联网 半监督式学习模型 朴素贝叶斯分类器 随机森林 支持向量机 SPY分类器
下载PDF
中文微博情感分析研究与实现 被引量:28
9
作者 李勇敢 周学广 +1 位作者 孙艳 张焕国 《软件学报》 EI CSCD 北大核心 2017年第12期3183-3205,共23页
中文微博的大数据、指数传播和跨媒体等特性,决定了依托人工方式监控和处理中文微博是不现实的,迫切需要依托计算机开展中文微博情感自动分析研究.该项研究可分为3个任务:中文微博观点句识别、情感倾向性分类和情感要素抽取.为完成上述... 中文微博的大数据、指数传播和跨媒体等特性,决定了依托人工方式监控和处理中文微博是不现实的,迫切需要依托计算机开展中文微博情感自动分析研究.该项研究可分为3个任务:中文微博观点句识别、情感倾向性分类和情感要素抽取.为完成上述任务,研制了一个评测系统:通过构建多级词库、制定成词规则、开展串频统计等给出一种基于规则和统计的新词识别方法,在情感词和评价对象的依存模式的基础上给出基于词语特征的观点句识别算法;以词序流表示文本的LDA-Collocation模型,采用吉布斯抽样法推导了算法,实现中文微博情感倾向性自动分类;针对中文微博情感要素抽取召回率较低的问题,利用依存关系分析理论,按主语类和宾语类把依存模式分为两类,建立了6个优先级的评价对象和情感词汇的依存模式,通过评价对象归并算法实现计算机自动抽取情感要素.实验包括两个部分:一是参加NLP&CC2012的公开评测,所提方法在微博观点句识别任务中的准确率为第2,在中文微博情感要素抽取任务中的准确率和F值均为第2,验证了该算法的实用性;二是在分析公开评测结果的基础上,分别比较了参加公开评测的各类算法在处理中文微博情感分析时的效率,给出了相关结论. 展开更多
关键词 中文微博 情感分析 依存分析 情感倾向性分类 情感要素抽取 无监督主题情感模型
下载PDF
基于无监督学习的电力系统网络潜在多步攻击实时检测方法 被引量:1
10
作者 苏江文 宋立华 《电气自动化》 2023年第2期15-17,共3页
针对网络潜在攻击行为检测率和准确率较低、误报率较高的问题,提出基于无监督学习的电力系统网络潜在多步攻击实时检测方法。通过提取攻击流量特征、输入训练好的无监督学习模型,判断攻击流量是否产生攻击行为,同时检测潜在多步攻击类... 针对网络潜在攻击行为检测率和准确率较低、误报率较高的问题,提出基于无监督学习的电力系统网络潜在多步攻击实时检测方法。通过提取攻击流量特征、输入训练好的无监督学习模型,判断攻击流量是否产生攻击行为,同时检测潜在多步攻击类别。使用网络模拟器,模拟电力系统网络环境,采用攻击工具进行网络流量攻击。试验结果表明,设计方法检测网络攻击流时,检测率和准确率较高,误报率较低。方法可以有效抵挡网络多步攻击行为,保证电力系统安全。 展开更多
关键词 无监督学习模型 电力系统网络 潜在多步攻击 攻击流量 流量特征 攻击类别
下载PDF
语义空间下基于情感表达的生成式文本隐写方法
11
作者 刘玉玲 王翠林 付章杰 《通信学报》 EI CSCD 北大核心 2023年第4期176-186,共11页
针对现有生成式文本隐写方法存在的“过度优化”文本质量以及生成的隐写文本在语义表达上缺乏约束等问题,提出了一种在语义空间下基于情感表达的生成式文本隐写方法。该方法利用新媒体平台提供的情景融合的伪装场景,研究如何利用无监督... 针对现有生成式文本隐写方法存在的“过度优化”文本质量以及生成的隐写文本在语义表达上缺乏约束等问题,提出了一种在语义空间下基于情感表达的生成式文本隐写方法。该方法利用新媒体平台提供的情景融合的伪装场景,研究如何利用无监督抽取模型从原始数据集中抽取情感表达组合候选集合,并基于改进的二部图排序算法对情感表达组合候选集合进行排序,得到情感表达组合集合;然后将其映射到语义空间,实现基于情感表达组合生成用户观点的同时嵌入秘密信息。实验结果表明,与同类语义空间下生成式文本隐写方法相比,所提方法生成的含密商品评论的困惑度最低可达10.536,且含密商品评论与主题具有较强相关性,进一步保证了隐写文本的认知隐蔽性,同时所提方法还可有效地用于安全保密通信领域,能够避免发送方被追踪溯源和关联分析。 展开更多
关键词 生成式文本隐写 语义空间 无监督抽取模型 情感表达
下载PDF
基于DNA微阵列数据的基因聚类方法 被引量:1
12
作者 肖静 王学枫 徐辰武 《生物医学工程学杂志》 EI CAS CSCD 北大核心 2008年第3期729-733,共5页
聚类分析并不是一个新的统计问题,但是微阵列实验产生的大量复杂多元数据集对聚类的计算方法提出了新的挑战。本文对微阵列基因表达数据分析的多种聚类方法及其优缺点作了详细的介绍,包括监督聚类、非监督聚类以及基于模型的聚类。由于... 聚类分析并不是一个新的统计问题,但是微阵列实验产生的大量复杂多元数据集对聚类的计算方法提出了新的挑战。本文对微阵列基因表达数据分析的多种聚类方法及其优缺点作了详细的介绍,包括监督聚类、非监督聚类以及基于模型的聚类。由于各种方法的有效性和适用场合不同,探索开发更为适用、聚类效果更为理想的专用于微阵列表达谱数据的聚类新方法显得尤其重要。 展开更多
关键词 微阵列 监督聚类 非监督聚类 基于模型聚类
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部