期刊文献+
共找到1,853篇文章
< 1 2 93 >
每页显示 20 50 100
数据挖掘综述 被引量:264
1
作者 王光宏 蒋平 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第2期246-252,共7页
从人工智能、统计分析和数据库技术3个方面对数据挖掘技术进行了总结;从模式识别的角度讨论了数据挖掘技术的主要任务,包括分类、聚类、回归、关联、序列和偏差6种模式的识别.详细介绍了数据挖掘技术的常用方法,包括模糊理论、粗糙集理... 从人工智能、统计分析和数据库技术3个方面对数据挖掘技术进行了总结;从模式识别的角度讨论了数据挖掘技术的主要任务,包括分类、聚类、回归、关联、序列和偏差6种模式的识别.详细介绍了数据挖掘技术的常用方法,包括模糊理论、粗糙集理论、云理论、证据理论、人工神经网络、遗传算法以及归纳学习.列举了当前数据挖掘技术的实际应用场合,并指出其今后的发展趋势以及急需关注的问题. 展开更多
关键词 数据挖掘 数据库中知识发现 人工智能 模式
下载PDF
人工免疫系统:原理、模型、分析及展望 被引量:209
2
作者 肖人彬 王磊 《计算机学报》 EI CSCD 北大核心 2002年第12期1281-1293,共13页
目前 ,受生物免疫系统启发而产生的人工免疫系统 (Artificial Im mune System,AIS)正在兴起 ,它作为计算智能研究的新领域 ,提供了一种强大的信息处理和问题求解范式 .该文侧重以 AIS的基本原理框架为线索 ,对其研究状况加以系统综述 .... 目前 ,受生物免疫系统启发而产生的人工免疫系统 (Artificial Im mune System,AIS)正在兴起 ,它作为计算智能研究的新领域 ,提供了一种强大的信息处理和问题求解范式 .该文侧重以 AIS的基本原理框架为线索 ,对其研究状况加以系统综述 .首先从 AIS的生物原型入手 ,归纳提炼出其仿生机理 ,主要包括免疫识别、免疫学习、免疫记忆、克隆选择、个体多样性、分布式和自适应等 ,进而对几种典型的 AIS模型和算法分门别类地进行了细致讨论 ,随后介绍了 AIS在若干具有代表性的领域中的应用情况 .最后通过对 AIS的特性和存在问题的分析 ,展望了今后的研究重点和发展趋势 . 展开更多
关键词 人工免疫系统 原理 模型 展望 生物免疫系统 计算智能 仿生机理 算法模型
下载PDF
基于常问问题集的中文问答系统研究 被引量:96
3
作者 秦兵 刘挺 +2 位作者 王洋 郑实福 李生 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2003年第10期1179-1182,共4页
首先根据用户的提问建立一个候选问题集,然后通过计算句子语义相似度,在候选问题集中找到相似的问句,并将答案返回给用户.该系统还能够自动地更新和维护FAQ库.实验表明,与基于关键词的句子相似度计算相比,基于语义的句子相似度计算提高... 首先根据用户的提问建立一个候选问题集,然后通过计算句子语义相似度,在候选问题集中找到相似的问句,并将答案返回给用户.该系统还能够自动地更新和维护FAQ库.实验表明,与基于关键词的句子相似度计算相比,基于语义的句子相似度计算提高了问题匹配的准确率. 展开更多
关键词 常问问题集 中文问答系统 候选问题集 句子相似度 数据库 数据结构 TFIDF方法
下载PDF
地理学时空数据分析方法 被引量:121
4
作者 王劲峰 葛咏 +7 位作者 李连发 孟斌 武继磊 柏延臣 杜世宏 廖一兰 胡茂桂 徐成东 《地理学报》 EI CSCD 北大核心 2014年第9期1326-1345,共20页
随着地理空间观测数据的多年积累,地球环境、社会和健康数据监测能力的增强,地理信息系统和计算机网络的发展,时空数据集大量生成,时空数据分析实践呈现快速增长。本文对此进行了分析和归纳,总结了时空数据分析的7类主要方法,包括:时空... 随着地理空间观测数据的多年积累,地球环境、社会和健康数据监测能力的增强,地理信息系统和计算机网络的发展,时空数据集大量生成,时空数据分析实践呈现快速增长。本文对此进行了分析和归纳,总结了时空数据分析的7类主要方法,包括:时空数据可视化,目的是通过视觉启发假设和选择分析模型;空间统计指标的时序分析,反映空间格局随时间变化;时空变化指标,体现时空变化的综合统计量;时空格局和异常探测,揭示时空过程的不变和变化部分;时空插值,以获得未抽样点的数值;时空回归,建立因变量和解释变量之间的统计关系;时空过程建模,建立时空过程的机理数学模型;时空演化树,利用空间数据重建时空演化路径。通过简述这些方法的基本原理、输入输出、适用条件以及软件实现,为时空数据分析提供工具和方法手段。 展开更多
关键词 时空数据 时空格局 时空过程 时空机理 样本 对象总体 大数据
原文传递
在FP-树中挖掘频繁模式而不生成条件FP-树 被引量:56
5
作者 范明 李川 《计算机研究与发展》 EI CSCD 北大核心 2003年第8期1216-1222,共7页
FP growth算法是目前已发表的最有效的频繁模式挖掘算法之一 然而 ,由于在挖掘频繁模式时需要递归地生成大量的条件FP 树 ,其时空效率仍然不够高 改进了FP 树结构 ,提出了一种基于被约束子树挖掘频繁项集的有效算法 改进的FP 树是单向... FP growth算法是目前已发表的最有效的频繁模式挖掘算法之一 然而 ,由于在挖掘频繁模式时需要递归地生成大量的条件FP 树 ,其时空效率仍然不够高 改进了FP 树结构 ,提出了一种基于被约束子树挖掘频繁项集的有效算法 改进的FP 树是单向的 ,每个结点只保留指向父结点的指针 ,这大约节省了三分之一的树空间 通过引入被约束子树(可以用 3个很小的数组表示 ) ,算法在挖掘频繁模式时不生成条件FP 树 ,从而大大提高了频繁模式挖掘的时空效率 实验表明 ,与FP growth算法相比 ,算法的挖掘速度提高了 1倍以上 ,而所需的存储空间减少了一半 此外 ,随着数据库规模的增大 ,算法具有很好的可伸缩性 对于稠密数据集 ,算法也具有良好的性能 . 展开更多
关键词 数据挖掘 频繁模式 FP-树
下载PDF
大数据挖掘的粒计算理论与方法 被引量:97
6
作者 梁吉业 钱宇华 +1 位作者 李德玉 胡清华 《中国科学:信息科学》 CSCD 北大核心 2015年第11期1355-1369,共15页
大数据往往呈现出大规模性、多模态性以及快速增长性等特征.粒计算是智能信息处理领域中大规模复杂问题求解的有效范式.从推动大数据挖掘研究角度,本文首先概要地讨论了大数据的特征对可计算性、有效性与高效性提出的3大挑战;其次,结合... 大数据往往呈现出大规模性、多模态性以及快速增长性等特征.粒计算是智能信息处理领域中大规模复杂问题求解的有效范式.从推动大数据挖掘研究角度,本文首先概要地讨论了大数据的特征对可计算性、有效性与高效性提出的3大挑战;其次,结合粒计算的思维模式特点,概述了已有研究成果,分析论述了以粒计算应对大数据挖掘挑战的可行性,认为粒计算有望为大数据挖掘提供一条极具前途的崭新途径;最后,对大数据挖掘的粒计算理论与方法中的若干科学问题进行了梳理与展望,以期抛引这一领域的学术思考与研究工作. 展开更多
关键词 大数据 数据挖掘 模式发现 粒计算 信息粒化 多粒度
原文传递
企业数据集成模式的研究 被引量:33
7
作者 殷晓岚 付远彬 李京 《计算机工程与应用》 CSCD 北大核心 2002年第12期253-255,共3页
企业管理信息化,就是在企业管理的各个环节和各个方面,通过利用计算机和网络技术来实现物流、资金流、信息流和工作流的集成和综合。它导致了企业应用集成(EAI)的发展,企业数据集成是现有企业应用集成解决方案中最普遍的一个形式。文章... 企业管理信息化,就是在企业管理的各个环节和各个方面,通过利用计算机和网络技术来实现物流、资金流、信息流和工作流的集成和综合。它导致了企业应用集成(EAI)的发展,企业数据集成是现有企业应用集成解决方案中最普遍的一个形式。文章主要对企业数据集成模式做一些探讨和研究,并给出了应用案例。 展开更多
关键词 数据集成模式 企业管理信息化 计算机
下载PDF
Web日志中挖掘用户浏览模式的研究 被引量:34
8
作者 施建生 伍卫国 +2 位作者 陆丽娜 Yang Yiling 杨怡玲 《西安交通大学学报》 EI CAS CSCD 北大核心 2001年第6期621-624,共4页
研究了Web日志挖掘的机理 ,提出了使用频繁遍历路径作为用户浏览模式 ,并在分析挖掘频繁遍历路径的问题特征和对其进行形式化描述的基础上 ,进一步提出了一种在Web日志中挖掘频繁遍历路径的类Apriori算法 ,该算法能够正确、快速地从Web... 研究了Web日志挖掘的机理 ,提出了使用频繁遍历路径作为用户浏览模式 ,并在分析挖掘频繁遍历路径的问题特征和对其进行形式化描述的基础上 ,进一步提出了一种在Web日志中挖掘频繁遍历路径的类Apriori算法 ,该算法能够正确、快速地从Web日志中抽取频繁遍历路径 . 展开更多
关键词 数据挖掘 WEB挖掘 用户浏览模式
下载PDF
时间序列数据挖掘综述 被引量:77
9
作者 贾澎涛 何华灿 +1 位作者 刘丽 孙涛 《计算机应用研究》 CSCD 北大核心 2007年第11期15-18,29,共5页
在综合分析近年来时间序列数据挖掘相关文献的基础上,讨论了时间序列数据挖掘的最新进展,对各种学术观点进行了比较归类,并预测了其发展趋势。内容涵盖了时间序列数据变换、相似性搜索、预测、分类、聚类、分割、可视化等方面,为研究者... 在综合分析近年来时间序列数据挖掘相关文献的基础上,讨论了时间序列数据挖掘的最新进展,对各种学术观点进行了比较归类,并预测了其发展趋势。内容涵盖了时间序列数据变换、相似性搜索、预测、分类、聚类、分割、可视化等方面,为研究者了解最新的时间序列数据挖掘研究动态、新技术及发展趋势提供了参考。 展开更多
关键词 时间序列 数据挖掘 相似性搜索 模式发现
下载PDF
三维人脸识别研究综述 被引量:64
10
作者 王跃明 潘纲 吴朝晖 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2008年第7期819-829,共11页
近二十多年来,虽然基于图像的人脸识别已取得很大进展,并可在约束环境下获得很好的识别性能,但仍受光照、姿态、表情等变化的影响很大,其本质原因在于图像是三维物体在二维空间的简约投影.因此,利用脸部曲面的显式三维表达进行人脸识别... 近二十多年来,虽然基于图像的人脸识别已取得很大进展,并可在约束环境下获得很好的识别性能,但仍受光照、姿态、表情等变化的影响很大,其本质原因在于图像是三维物体在二维空间的简约投影.因此,利用脸部曲面的显式三维表达进行人脸识别正成为近几年学术界的研究热点.文中分析了三维人脸识别的产生动机、概念与基本过程;根据特征形式,将三维人脸识别算法分为基于空域直接匹配、基于局部特征匹配、基于整体特征匹配三大类进行综述;对二维和三维的双模态融合方法进行分类阐述;列出了部分代表性的三维人脸数据库;对部分方法进行实验比较,并分析了方法有效性的原因;总结了目前三维人脸识别技术的优势与困难,并探讨了未来的研究趋势. 展开更多
关键词 人脸识别 三维人脸识别 深度数据 模式分类
下载PDF
中药指纹图谱中的数据挖掘技术 被引量:40
11
作者 冯雪松 董鸿晔 《药学进展》 CAS 2002年第4期198-201,共4页
随着中药分析手段和信息技术的发展 ,指纹图谱技术已成为中药质量控制的重要手段之一。综述中药指纹图谱的特点 。
关键词 中药指纹图谱 数据挖掘技术 模式识别
下载PDF
模糊多类支持向量机及其在入侵检测中的应用 被引量:49
12
作者 李昆仑 黄厚宽 +2 位作者 田盛丰 刘振鹏 刘志强 《计算机学报》 EI CSCD 北大核心 2005年第2期274-280,共7页
针对支持向量机理论中现存的问题:多类分类问题和对于噪音数据的敏感性,提出了一种模糊多类支持向量机算法.该算法是在Weston等人提出的多类SVM分类器的直接构造方法中引入模糊成员函数,针对每个输入数据对分类结果的不同影响,该模糊成... 针对支持向量机理论中现存的问题:多类分类问题和对于噪音数据的敏感性,提出了一种模糊多类支持向量机算法.该算法是在Weston等人提出的多类SVM分类器的直接构造方法中引入模糊成员函数,针对每个输入数据对分类结果的不同影响,该模糊成员函数得到相应的值,由此可以得到不同的惩罚值,并且在构造分类超平面时,可以忽略那些对分类结果影响很小的数据.在充分的数值实验基础上,将文中提出的方法应用于当前一个重要的应用领域———计算机网络入侵检测问题,并得到了较好的实验结果.理论分析与数值实验都表明,该算法是切实可行的,并具有良好的鲁棒性. 展开更多
关键词 多类分类问题 支持向量机(SVM) 模糊成员函数 入侵检测
下载PDF
戴维南等值跟踪的参数漂移问题研究 被引量:67
13
作者 李来福 于继来 柳焯 《中国电机工程学报》 EI CSCD 北大核心 2005年第20期1-5,共5页
导出了戴维南等值参数的分式解析表达式;探讨了跟踪戴维南等值的参数漂移问题,并揭示了其本质原因;指出了在解析表达式中,分子分母真值与误差数量级间的关系决定参数漂移起伏的幅度,并据此提出了抑制参数漂移跌宕起伏的策略和候选采样... 导出了戴维南等值参数的分式解析表达式;探讨了跟踪戴维南等值的参数漂移问题,并揭示了其本质原因;指出了在解析表达式中,分子分母真值与误差数量级间的关系决定参数漂移起伏的幅度,并据此提出了抑制参数漂移跌宕起伏的策略和候选采样运行点优选的方法:P-V关系检验和运行模式检验。该策略和方法能保证戴维南等值参数跟踪的结果,比较贴近实际。 展开更多
关键词 电力系统 电压稳定 戴维南等值 参数漂移 数据处理 模式识别
下载PDF
Web使用挖掘技术研究 被引量:37
14
作者 涂承胜 陆玉昌 《小型微型计算机系统》 CSCD 北大核心 2004年第7期1177-1184,共8页
简要介绍了 WEB挖掘的基本概念及其分类 ,讨论了 Web使用挖掘的有关理论及其应用 .重点分析了 Web使用挖掘的主要研究对象和研究方法 ,包括 :挖掘的数据对象、数据的采集、数据预处理、模式发现、模式分析及其相关技术 .展望了
关键词 WEB挖掘 Web网络使用挖掘 数据预处理 模式发现 模式分析
下载PDF
数据流通市场中数据产品的特性及其交易模式 被引量:60
15
作者 黄丽华 窦一凡 +2 位作者 郭梦珂 汤奇峰 李根 《大数据》 2022年第3期3-14,共12页
数据的流通交易是数据要素市场化配置的关键环节。我国前期的数据市场探索过程中暴露出一系列问题,迫切需要从理论角度对数据市场基本逻辑进行重新梳理。从交易成本理论、电子市场框架和电子交易模式等不同视角分析了数据产品流通过程,... 数据的流通交易是数据要素市场化配置的关键环节。我国前期的数据市场探索过程中暴露出一系列问题,迫切需要从理论角度对数据市场基本逻辑进行重新梳理。从交易成本理论、电子市场框架和电子交易模式等不同视角分析了数据产品流通过程,并提出数据的可计算性给数据交易带来了两类影响:一方面,可计算性使得数据能够被不断分析从而更加符合垂直领域的需求;另一方面,可计算性也会推动数据交易过程离开市场,呈现去平台化的趋势。基于电子市场经典理论框架将数字产品分为4个象限并进行相应分析,提出了对数据供方和数据市场管理者的建议。 展开更多
关键词 数据要素 数据产品 电子市场 交易模式 去平台化
下载PDF
解读教育大数据的文化意蕴 被引量:60
16
作者 祝智庭 孙妍妍 彭红超 《电化教育研究》 CSSCI 北大核心 2017年第1期28-36,共9页
尽管大数据概念已经耳熟能详,而且在教育之外许多领域已经得到诸多成功应用,但在教育中的应用仍处探索阶段。本文对大数据科学、数据智慧、文化及其模式与计算进行了梳理,并探讨了它们在教育中的应用(包括大数据在教育领域的应用需求与... 尽管大数据概念已经耳熟能详,而且在教育之外许多领域已经得到诸多成功应用,但在教育中的应用仍处探索阶段。本文对大数据科学、数据智慧、文化及其模式与计算进行了梳理,并探讨了它们在教育中的应用(包括大数据在教育领域的应用需求与挑战、教育中的文化过程等)。在此基础上,构建了基于大数据文化的教育策略框架,并设计了基于微文化模式的个性化学习适配处方模型,以期在一定程度上为支持个性化学习服务。最后,本文也指出利用教育大数据的机遇与挑战。 展开更多
关键词 教育大数据 数据智慧 文化模式 微文化 个性化 学习处方
下载PDF
基于数据挖掘的入侵检测系统框架 被引量:21
17
作者 卢勇 曹阳 +1 位作者 凌军 李莉 《武汉大学学报(理学版)》 CAS CSCD 北大核心 2002年第1期63-66,共4页
提出了基于分布式数据挖掘的入侵检测系统框架 .详细讨论了该系统的实现方案、模块结构和关键技术 ,最后给出了系统训练和评价方法 .该系统以基于关联规则方法的分布式数据挖掘技术为核心 ,从而实现了规则库的自动生成和更新 ,并能有效... 提出了基于分布式数据挖掘的入侵检测系统框架 .详细讨论了该系统的实现方案、模块结构和关键技术 ,最后给出了系统训练和评价方法 .该系统以基于关联规则方法的分布式数据挖掘技术为核心 ,从而实现了规则库的自动生成和更新 ,并能有效检测大规模协同攻击 . 展开更多
关键词 入侵检测系统 数据挖掘 关联规则 模式识别 分布式系统 网络安全 规则库
下载PDF
多目标多传感器模糊双门限航迹相关算法 被引量:38
18
作者 何友 彭应宁 陆大 《电子学报》 EI CAS CSCD 北大核心 1998年第3期15-19,9,共6页
本文提出两种适合于分布式多传感器数据融合的模糊双门限航迹相关算法.文中研究了模糊因素集的构成、隶属度函数的选择、权向量的动态分配、航迹相关质量设计、多义性处理方法、模糊双门限航迹相关准则及模糊经典分配问题,并通过仿真... 本文提出两种适合于分布式多传感器数据融合的模糊双门限航迹相关算法.文中研究了模糊因素集的构成、隶属度函数的选择、权向量的动态分配、航迹相关质量设计、多义性处理方法、模糊双门限航迹相关准则及模糊经典分配问题,并通过仿真与两个经典方法进行了比较.仿真结果表明,在密集目标环境下和/或交叉、分岔及机动航迹较多的场合,模糊双门限航迹相关算法的性能与传统方法相比获得了明显的改善,其正确相关率与传统方法相比提高了约35%. 展开更多
关键词 信息融合 航迹相关 雷达网 模式识别 模糊集
下载PDF
基于DMSP-OLS与NPP-VIIRS整合数据的中国三大城市群城市空间扩展时空格局 被引量:53
19
作者 董鹤松 李仁杰 +1 位作者 李建明 李帅 《地球信息科学学报》 CSCD 北大核心 2020年第5期1161-1174,共14页
通过拟合最优幂函数模型,将NPP-VIIRS影像模拟为DMSP-OLS影像,构建了京津冀、长江三角洲(简称长三角)和珠江三角洲(简称珠三角)三大城市群1992-2017年长时间序列夜间灯光影像集。参考城市建成区统计数据确定夜间灯光最佳阈值提取城市范... 通过拟合最优幂函数模型,将NPP-VIIRS影像模拟为DMSP-OLS影像,构建了京津冀、长江三角洲(简称长三角)和珠江三角洲(简称珠三角)三大城市群1992-2017年长时间序列夜间灯光影像集。参考城市建成区统计数据确定夜间灯光最佳阈值提取城市范围,有效剥离统计数据中包含的经济活力不足的城市空间,识别出不属于统计范围的低等级、高活力城镇区,创新了数据应用视角。研究表明:①县级城镇和市级以上城市对三大城市群城市范围的贡献度不同。京津冀腹地广阔,县级城镇是区域经济活力的重要组成部分,整体上贡献度最大;1990s初期长三角部分县级城镇经济活力较强,大量撤县设市后县级城镇数量减少,逐渐在2005年后低于京津冀;珠三角受到社会经济发展条件和行政单元划分的影响,县级城镇对城市范围的贡献在3个城市群中始终最小。②三大城市群城市扩展非均衡性特征存在差异。京津冀城市扩展为京、津主导下的"双核"模式,非均衡性显著,尚未形成完善的城市规模体系;长三角和珠三角城市集聚特征明显,均衡性更强。重心迁移的路径、方向和距离反映各城市群不同的扩展强度和作用模式。③城市空间扩展格局整体均呈现热点区不断扩大、冷点区不断缩小的特征。其中京津冀热点和冷点区相对稳定,热点区向心集聚作用较强;长三角和珠三角空间格局变化较大,区域核心城市带动作用较强。 展开更多
关键词 夜间灯光数据 数据整合 三大城市群 建成区 时空格局 扩展强度 重心指数 热点分析
原文传递
数据流频繁模式挖掘研究进展 被引量:34
20
作者 潘云鹤 王金龙 徐从富 《自动化学报》 EI CSCD 北大核心 2006年第4期594-602,共9页
现实世界和工程实践产生了大量的数据流,这种数据不同于传统的静态数据,对其进行有效处理和挖掘遇到了极大的挑战.如何使用有限存储空间进行快速和近似的频繁模式挖掘是数据流挖掘的基本问题,具有非常重要的研究价值和实践意义,已经引... 现实世界和工程实践产生了大量的数据流,这种数据不同于传统的静态数据,对其进行有效处理和挖掘遇到了极大的挑战.如何使用有限存储空间进行快速和近似的频繁模式挖掘是数据流挖掘的基本问题,具有非常重要的研究价值和实践意义,已经引起了国内外研究者的广泛关注.本文深入分析数据流中的频繁模式挖掘,对其特点和算法进行较为全面的总结和分类论述,并讨论了存在的主要问题和未来的研究方向. 展开更多
关键词 数据挖掘 数据流 频繁模式 近似算法
下载PDF
上一页 1 2 93 下一页 到第
使用帮助 返回顶部