期刊文献+
共找到1,222篇文章
< 1 2 62 >
每页显示 20 50 100
大数据相关分析综述 被引量:237
1
作者 梁吉业 冯晨娇 宋鹏 《计算机学报》 EI CSCD 北大核心 2016年第1期1-18,共18页
大数据时代,相关分析因其具有可以快捷、高效地发现事物间内在关联的优势而受到广泛的关注,并有效地应用于推荐系统、商业分析、公共管理、医疗诊断等领域.面向非线性、高维性等大数据的复杂特征,结合现有相关分析方法的语义分析,文中... 大数据时代,相关分析因其具有可以快捷、高效地发现事物间内在关联的优势而受到广泛的关注,并有效地应用于推荐系统、商业分析、公共管理、医疗诊断等领域.面向非线性、高维性等大数据的复杂特征,结合现有相关分析方法的语义分析,文中从统计相关分析、互信息、矩阵计算、距离4个方面对大数据相关分析的现有研究成果进行了梳理.在对统计学中的经典相关分析理论进行归纳、总结的基础上,文中从大规模数据的通用性和均等性视角阐述了基于互信息的两个变量间非线性相关分析理论,从高维数据可计算的角度分析了基于矩阵计算的相关系数,从非线性、高维性数据的复杂结构方面解析了基于距离的相关系数.进一步地,该文在对已有相关分析方法进行分析与比较的基础上,围绕高维数据、多变量数据、大规模数据、增长性数据及其可计算方面探讨了大数据相关分析的研究挑战. 展开更多
关键词 大数据 相关分析 相关系数 信息熵
下载PDF
基于邻域粗糙集的多标记分类特征选择算法 被引量:109
2
作者 段洁 胡清华 +2 位作者 张灵均 钱宇华 李德玉 《计算机研究与发展》 EI CSCD 北大核心 2015年第1期56-65,共10页
多标记学习是一类复杂的决策任务,同一个对象可能同时属于多个类别.此类任务在文本分类、图像识别、基因功能分析等领域广泛存在.多标记分类任务往往由高维特征描述,存在大量无关和冗余的信息.目前已经提出了大量的单标记特征选择算法... 多标记学习是一类复杂的决策任务,同一个对象可能同时属于多个类别.此类任务在文本分类、图像识别、基因功能分析等领域广泛存在.多标记分类任务往往由高维特征描述,存在大量无关和冗余的信息.目前已经提出了大量的单标记特征选择算法以应对维数灾难问题,但对于多标记的属性约简和特征选择却鲜有研究.将粗糙集应用于多标记数据的特征选择中,针对多标记分类任务,重新定义了邻域粗糙集的下近似和依赖度计算方法,探讨了这一模型的性质,进而构造了基于邻域粗糙集的多标记分类任务的特征选择算法,并给出了在公开数据上的实验结果.实验分析证明算法的有效性. 展开更多
关键词 多标记分类 特征选择 邻域粗糙集 依赖度
下载PDF
大数据挖掘的粒计算理论与方法 被引量:93
3
作者 梁吉业 钱宇华 +1 位作者 李德玉 胡清华 《中国科学:信息科学》 CSCD 北大核心 2015年第11期1355-1369,共15页
大数据往往呈现出大规模性、多模态性以及快速增长性等特征.粒计算是智能信息处理领域中大规模复杂问题求解的有效范式.从推动大数据挖掘研究角度,本文首先概要地讨论了大数据的特征对可计算性、有效性与高效性提出的3大挑战;其次,结合... 大数据往往呈现出大规模性、多模态性以及快速增长性等特征.粒计算是智能信息处理领域中大规模复杂问题求解的有效范式.从推动大数据挖掘研究角度,本文首先概要地讨论了大数据的特征对可计算性、有效性与高效性提出的3大挑战;其次,结合粒计算的思维模式特点,概述了已有研究成果,分析论述了以粒计算应对大数据挖掘挑战的可行性,认为粒计算有望为大数据挖掘提供一条极具前途的崭新途径;最后,对大数据挖掘的粒计算理论与方法中的若干科学问题进行了梳理与展望,以期抛引这一领域的学术思考与研究工作. 展开更多
关键词 大数据 数据挖掘 模式发现 粒计算 信息粒化 多粒度
原文传递
随机QoS感知的可靠Web服务组合 被引量:69
4
作者 范小芹 蒋昌俊 +1 位作者 王俊丽 庞善臣 《软件学报》 EI CSCD 北大核心 2009年第3期546-556,共11页
在面向服务的环境下,单个Web服务往往不能满足用户的要求,这时就需将已有的单个Web服务进行组合,以便产生满足用户需求的、增值的组合服务.已有的服务组合方法都很少考虑Web服务的随机性和Internet环境的动态性,从而在服务选择过程中产... 在面向服务的环境下,单个Web服务往往不能满足用户的要求,这时就需将已有的单个Web服务进行组合,以便产生满足用户需求的、增值的组合服务.已有的服务组合方法都很少考虑Web服务的随机性和Internet环境的动态性,从而在服务选择过程中产生的规划都是静态规划,结果导致在服务组合时都以较大概率出现组合失败.针对上述问题,提出了Web服务各随机QoS指标的度量方法和自适应QoS管理体系结构,并利用随机型离散事件系统唯一的动态控制方法——马尔可夫决策过程(MDP),设计出随机QoS感知的可靠Web服务组合算法.实验结果表明,考虑随机性的QoS度量方法和QoS管理体系结构,以及平衡了"风险"与"报酬"的MDP有效地提高了服务组合成功率. 展开更多
关键词 WEB服务组合 马尔可夫决策过程(MDP) Qos随机性 WEB服务 可靠组合
下载PDF
基于概念格的规则产生集挖掘算法 被引量:57
5
作者 梁吉业 王俊红 《计算机研究与发展》 EI CSCD 北大核心 2004年第8期1339-1344,共6页
传统的规则提取算法产生的规则集合相当庞大 ,其中包含许多冗余的规则 使用闭项集可以减少规则的数目 ,而概念格结点间的泛化和例化关系非常适用于规则提取 基于概念格理论和闭项集的概念 ,提出了一种新的更有利于规则提取的格结构 ,... 传统的规则提取算法产生的规则集合相当庞大 ,其中包含许多冗余的规则 使用闭项集可以减少规则的数目 ,而概念格结点间的泛化和例化关系非常适用于规则提取 基于概念格理论和闭项集的概念 ,提出了一种新的更有利于规则提取的格结构 ,给出了相应的基于闭标记的渐进式构造算法和规则提取算法 最后提供给用户的是直观的、易理解的规则子集 ,用户可以有选择地从中推导出其他的规则 展开更多
关键词 概念格 闭项集 规则产生集 规则提取
下载PDF
关键词抽取方法的研究 被引量:41
6
作者 郑家恒 卢娇丽 《计算机工程》 EI CAS CSCD 北大核心 2005年第18期194-196,共3页
考虑了词频和位置两个因素,并采用非线性函数和“成对比较法”相结合的方法来计算候选词的权重,最终改进了候选词权值的计算,提高了关键词抽取的精度。
关键词 非线性函数 成对比较法 关键词抽取
下载PDF
从人类智能到机器实现模型——粒计算理论与方法 被引量:61
7
作者 苗夺谦 张清华 +7 位作者 钱宇华 梁吉业 王国胤 吴伟志 高阳 商琳 顾沈明 张红云 《智能系统学报》 CSCD 北大核心 2016年第6期743-757,共15页
人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,是对人的意识、思维过程的模拟。粒计算是当前智能信息处理领域中一种新的概念和计算范式,是研究基于多层次粒结构的思维方式、复杂... 人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,是对人的意识、思维过程的模拟。粒计算是当前智能信息处理领域中一种新的概念和计算范式,是研究基于多层次粒结构的思维方式、复杂问题求解、信息处理模式及其相关理论、技术和工具的方法论。本文首先分析了人工智能模拟人脑智能的粒计算模式与方法,其次总结了粗糙集、商空间、模糊集、云模型、三支决策等几种典型的粒计算基本构架与数学模型,然后分析知识的多粒度解析表示与不确定性度量的研究现状,最后展望了粒计算求解模式在大数据时代所面临的机遇与挑战。 展开更多
关键词 人工智能 大数据 不确定性 粒计算 多粒度 粗糙集 商空间 模糊集 云模型 三支决策
下载PDF
偏序集、包含度与形式概念分析 被引量:52
8
作者 曲开社 翟岩慧 《计算机学报》 EI CSCD 北大核心 2006年第2期219-226,共8页
在形式背景上建立了3个偏序集:G偏序集、M偏序集和GM偏序集,并将包含度的概念引入到3个偏序集上.讨论了偏序集上的偏序关系和包含度与概念格之间的联系,并且证实了形式概念分析中的内涵、外延和蕴涵规则均可归结为偏序集上的序表示及包... 在形式背景上建立了3个偏序集:G偏序集、M偏序集和GM偏序集,并将包含度的概念引入到3个偏序集上.讨论了偏序集上的偏序关系和包含度与概念格之间的联系,并且证实了形式概念分析中的内涵、外延和蕴涵规则均可归结为偏序集上的序表示及包含度表示,这将有助于人们深刻理解形式概念分析中概念的含义及概念格的结构,为从定量分析角度研究形式概念分析提供了依据. 展开更多
关键词 形式概念分析 概念格 偏序集 包含度 概念
下载PDF
基于离散微粒群算法的动态Web服务选择 被引量:48
9
作者 范小芹 蒋昌俊 +1 位作者 方贤文 丁志军 《计算机研究与发展》 EI CSCD 北大核心 2010年第1期147-156,共10页
Web服务作为一种新型的Web应用模式近年来得到了迅速的发展.如何高效动态地把现存的各种Web服务整合起来以形成新的满足不同用户需求的增值的复杂服务,已成为新的应用需求和研究热点.针对服务选择问题,设计了一种面向动态Web服务选择的... Web服务作为一种新型的Web应用模式近年来得到了迅速的发展.如何高效动态地把现存的各种Web服务整合起来以形成新的满足不同用户需求的增值的复杂服务,已成为新的应用需求和研究热点.针对服务选择问题,设计了一种面向动态Web服务选择的离散微粒群算法,并结合服务选择研究背景,提出了3种速度计算算子和一种位置进化方程.针对进化算法容易陷入局部极值这一共同缺陷,定义了微粒无希望/重希望准则,以保证微粒群的多样性,增强全局搜索能力.理论分析和实验结果表明,该算法不仅具有较快的收敛速度,而且具有较好的全局收敛性能;同时说明Max运算在服务选择中具有较好的综合性能. 展开更多
关键词 WEB服务 服务选择 服务质量 微粒群算法 离散微粒群算法
下载PDF
汉语框架语义知识库及软件描述体系 被引量:50
10
作者 郝晓燕 刘伟 +1 位作者 李茹 刘开瑛 《中文信息学报》 CSCD 北大核心 2007年第5期96-100,138,共6页
汉语框架网络工程是以框架语义学为理论基础的基于语料库的计算词典编纂工程,用于语言学、计算语言学研究及自然语言处理研究。该工程的结果包括两部分:汉语框架语义知识库(即词典资源)和相关软件。其中,汉语框架网络知识库包括框架库... 汉语框架网络工程是以框架语义学为理论基础的基于语料库的计算词典编纂工程,用于语言学、计算语言学研究及自然语言处理研究。该工程的结果包括两部分:汉语框架语义知识库(即词典资源)和相关软件。其中,汉语框架网络知识库包括框架库、句子库和词元库三部分,相关软件主要包括汉语框架语义知识库管理系统和基于Web的展示系统。本文介绍了汉语框架语义知识库的语义描述体系以及软件描述体系。 展开更多
关键词 计算机应用 中文信息处理 汉语框架网络 框架语义 描述体系 软件
下载PDF
信息系统中的信息粒与熵理论 被引量:51
11
作者 梁吉业 钱宇华 《中国科学(E辑)》 CSCD 北大核心 2008年第12期2048-2065,共18页
信息粒度与熵理论是两种有效进行信息系统中不确定性研究的重要工具,已有许多成功的应用范例.文中研究了不同二元关系下信息系统中信息粒的刻画和表示,给出了信息系统中信息粒度的公理化定义,证实了一些已有的信息粒度度量都是其特殊形... 信息粒度与熵理论是两种有效进行信息系统中不确定性研究的重要工具,已有许多成功的应用范例.文中研究了不同二元关系下信息系统中信息粒的刻画和表示,给出了信息系统中信息粒度的公理化定义,证实了一些已有的信息粒度度量都是其特殊形式.发展了信息系统中的熵理论,证明了这些熵度量的粒化单调性.同时,在信息系统意义下,建立了信息粒度与熵之间的互补关系.这些研究统一了完备信息系统与非完备信息系统中不确定性度量的相关结果. 展开更多
关键词 信息系统 信息粒 信息粒度 粗糙集
原文传递
基于新的距离度量的K-Modes聚类算法 被引量:46
12
作者 梁吉业 白亮 曹付元 《计算机研究与发展》 EI CSCD 北大核心 2010年第10期1749-1755,共7页
传统的K-Modes聚类算法采用简单的0-1匹配差异方法来计算同一分类属性下两个属性值之间的距离,没有充分考虑其相似性.对此,基于粗糙集理论,提出了一种新的距离度量.该距离度量在度量同一分类属性下两个属性值之间的差异时,克服了简单0-... 传统的K-Modes聚类算法采用简单的0-1匹配差异方法来计算同一分类属性下两个属性值之间的距离,没有充分考虑其相似性.对此,基于粗糙集理论,提出了一种新的距离度量.该距离度量在度量同一分类属性下两个属性值之间的差异时,克服了简单0-1匹配差异法的不足,既考虑了它们本身的异同,又考虑了其他相关分类属性对它们的区分性.并将提出的距离度量应用于传统K-Modes聚类算法中.通过与基于其他距离度量的K-Modes聚类算法进行实验比较,结果表明新的距离度量是更加有效的. 展开更多
关键词 聚类算法 分类属性数据 粗糙集 粗糙隶属度 距离度量
下载PDF
基于框架语义分析的汉语句子相似度计算 被引量:46
13
作者 李茹 王智强 +2 位作者 李双红 梁吉业 Collin Baker 《计算机研究与发展》 EI CSCD 北大核心 2013年第8期1728-1736,共9页
句子相似度计算在自然语言处理的许多领域中发挥着重要作用.已有的汉语句子相似度计算方法由于考虑句子的语义不全面,使得相似度计算结果不够准确,为此提出一种新的汉语句子相似度计算方法.该方法基于汉语框架网语义资源,通过多框架语... 句子相似度计算在自然语言处理的许多领域中发挥着重要作用.已有的汉语句子相似度计算方法由于考虑句子的语义不全面,使得相似度计算结果不够准确,为此提出一种新的汉语句子相似度计算方法.该方法基于汉语框架网语义资源,通过多框架语义分析、框架的重要度度量、框架的相似匹配、框架间相似度计算等关键步骤来实现句子语义的相似度量.其中多框架语义分析是从框架角度对句子中的所有目标词进行识别、框架选择及框架元素标注,从而达到全面刻画句子语义的目的;在此基础上根据句子中框架的语义覆盖范围对不同框架的重要度进行区分,能够使得相似度结果更准确.在包含多目标词的句子集上的实验结果显示,基于多框架语义分析的句子相似度计算方法相对传统方法获得了更好的测试结果. 展开更多
关键词 汉语框架网 多框架语义分析 句子语义相似度 框架相似度 框架重要度
下载PDF
一种基于信息熵的混合数据属性加权聚类算法 被引量:42
14
作者 赵兴旺 梁吉业 《计算机研究与发展》 EI CSCD 北大核心 2016年第5期1018-1028,共11页
同时兼具数值型和分类型属性的混合数据在实际应用中普通存在,混合数据的聚类分析越来越受到广泛的关注.为解决高维混合数据聚类中属性加权问题,提出了一种基于信息熵的混合数据属性加权聚类算法,以提升模式发现的效果.工作主要包括:首... 同时兼具数值型和分类型属性的混合数据在实际应用中普通存在,混合数据的聚类分析越来越受到广泛的关注.为解决高维混合数据聚类中属性加权问题,提出了一种基于信息熵的混合数据属性加权聚类算法,以提升模式发现的效果.工作主要包括:首先为了更加准确客观地度量对象与类之间的差异性,设计了针对混合数据的扩展欧氏距离;然后,在信息熵框架下利用类内信息熵和类间信息熵给出了聚类结果中类内抱团性及一个类与其余类分离度的统一度量机制,并基于此给出了一种属性重要性度量方法,进而设计了一种基于信息熵的属性加权混合数据聚类算法.在10个UCI数据集上的实验结果表明,提出的算法在4种聚类评价指标下优于传统的属性未加权聚类算法和已有的属性加权聚类算法,并通过统计显著性检验表明本文提出算法的聚类结果与已有算法聚类结果具有显著差异性. 展开更多
关键词 聚类分析 混合数据 属性加权 信息熵 相异性度量
下载PDF
采用优先选择策略的中文人称代词的指代消解 被引量:33
15
作者 李国臣 罗云飞 《中文信息学报》 CSCD 北大核心 2005年第4期24-30,共7页
指代是自然语言中常见的语言现象,指代消解是文本信息处理中的一个重要任务。随着篇章处理相关应用日益广泛,指代消解也显示出前所未有的重要性。本文针对中文人称代词的指代特点,提出了一种基于语料库的,运用决策树机器学习算法并结合... 指代是自然语言中常见的语言现象,指代消解是文本信息处理中的一个重要任务。随着篇章处理相关应用日益广泛,指代消解也显示出前所未有的重要性。本文针对中文人称代词的指代特点,提出了一种基于语料库的,运用决策树机器学习算法并结合优先选择策略,进行指代消解的方法。该方法充分考虑了与指代相关的若干属性,及相互之间的影响。实验表明,对中文人称代词的消解特别是第三人称的消解获得了一定的效果。 展开更多
关键词 计算机应用 中文信息处理 语料库 人称代词 指代消解 最优选择
下载PDF
汉语框架语义角色的自动标注 被引量:41
16
作者 李济洪 王瑞波 +1 位作者 王蔚林 李国臣 《软件学报》 EI CSCD 北大核心 2010年第4期597-611,共15页
基于山西大学自主开发的汉语框架语义知识库(CFN),将语义角色标注问题通过IOB策略转化为词序列标注问题,采用条件随机场模型,研究了汉语框架语义角色的自动标注.模型以词为基本标注单元,选择词、词性、词相对于目标词的位置、目标词及... 基于山西大学自主开发的汉语框架语义知识库(CFN),将语义角色标注问题通过IOB策略转化为词序列标注问题,采用条件随机场模型,研究了汉语框架语义角色的自动标注.模型以词为基本标注单元,选择词、词性、词相对于目标词的位置、目标词及其组合为特征.针对每个特征设定若干可选的窗口,组合构成模型的各种特征模板,基于统计学中的正交表,给出一种较优模板选择方法.全部实验在选出的25个框架的6692个例句的语料上进行.对每一个框架,分别按照其例句训练一个模型,同时进行语义角色的边界识别与分类,进行2-fold交叉验证.在给定句子中的目标词以及目标词所属的框架情况下,25个框架交叉验证的实验结果的准确率、召回率、F1-值分别达到74.16%,52.70%和61.62%. 展开更多
关键词 汉语框架语义知识库 语义角色标注 正交表 特征选择 条件随机场
下载PDF
融合社交网络信息的协同过滤推荐算法 被引量:40
17
作者 郭兰杰 梁吉业 赵兴旺 《模式识别与人工智能》 EI CSCD 北大核心 2016年第3期281-288,共8页
在推荐系统中,协同过滤推荐算法往往面临数据集的高度稀疏性和推荐精度有限的问题.为了解决上述问题,在基于物品的协同过滤推荐框架下,分别在物品相似度的计算和用户对物品的评分预测阶段,利用社交网络中朋友关系信息选择性地填充评分... 在推荐系统中,协同过滤推荐算法往往面临数据集的高度稀疏性和推荐精度有限的问题.为了解决上述问题,在基于物品的协同过滤推荐框架下,分别在物品相似度的计算和用户对物品的评分预测阶段,利用社交网络中朋友关系信息选择性地填充评分矩阵中的缺失值,最大化利用评分矩阵中的已有信息,提出融合社交网络信息的协同过滤推荐算法.最后,在Epinions数据集上的实验表明,文中算法在一定程度上缓解数据稀疏性问题,同时在评分误差和分类准确率两个指标上优于其它协同过滤算法. 展开更多
关键词 协同过滤 社交网络 缺失值填充 数据稀疏性
下载PDF
基于短语模式的文本情感分类研究 被引量:35
18
作者 李钝 曹付元 +1 位作者 曹元大 万月亮 《计算机科学》 CSCD 北大核心 2008年第4期132-134,共3页
文本倾向识别的研究在诸多领域有着广阔的发展前景,短语模式的文本情感分类是问答系统、信息安全、网上调查等研究的基础。本文从语言学角度出发,首先,分析词典中对词语义定义的特点,采用"情感倾向定义"权重优先的计算方法获... 文本倾向识别的研究在诸多领域有着广阔的发展前景,短语模式的文本情感分类是问答系统、信息安全、网上调查等研究的基础。本文从语言学角度出发,首先,分析词典中对词语义定义的特点,采用"情感倾向定义"权重优先的计算方法获得短语中各词的语义倾向度,然后分析短语中各词组合方式的特点,提出中心词概念来对各词的倾向性进行计算来识别短语的倾向性和倾向强度。实验表明,本文的方法对短语的倾向分类识别效果较好,可为更大粒度的文本倾向识别打好基础,具有一定的实用价值。 展开更多
关键词 文本分类 情感倾向 语义倾向度 知网 短语结构 中心词
下载PDF
基于同义词的词汇情感倾向判别方法 被引量:36
19
作者 王素格 李德玉 +1 位作者 魏英杰 宋晓雷 《中文信息学报》 CSCD 北大核心 2009年第5期68-74,共7页
词汇的情感倾向直接影响短语、句子、段落、篇章等更高层次语言粒度的情感倾向。对于基准词选取问题,该文提出了基于类别区分能力与情感词词表相结合的方法。考虑到词汇与其同义词很大程度上具有相同的情感倾向,我们提出了基于同义词的... 词汇的情感倾向直接影响短语、句子、段落、篇章等更高层次语言粒度的情感倾向。对于基准词选取问题,该文提出了基于类别区分能力与情感词词表相结合的方法。考虑到词汇与其同义词很大程度上具有相同的情感倾向,我们提出了基于同义词的词汇情感倾向判别方法,这种方法一定程度上避免了数据稀疏问题。实验结果表明,基于同义词的词汇情感倾向判别方法优于仅采用目标词与基准词的词汇情感倾向判别方法。 展开更多
关键词 计算机应用 中文信息处理 词汇情感倾向 基准词 关联强度 同义词
下载PDF
基于职教云平台的线上线下混合式教学模式 被引量:38
20
作者 王晓芳 崔军 《电子技术与软件工程》 2018年第13期124-125,共2页
利用职教云平台进行线上线下混合式教学模式改革已经成为高职院校信息化教学的新思路。本文在分析当前高职院校《计算机应用基础》课程教学现状的基础上,进行了线上线下混合式教学模式的探索和实践,强调了知识的传递和吸收内化,极大地... 利用职教云平台进行线上线下混合式教学模式改革已经成为高职院校信息化教学的新思路。本文在分析当前高职院校《计算机应用基础》课程教学现状的基础上,进行了线上线下混合式教学模式的探索和实践,强调了知识的传递和吸收内化,极大地提高了学生自主学习能力,提升了计算机应用基础课程的教学质量和教学效果。 展开更多
关键词 线上线下 混合式教学 计算机应用基础 碎片化 自主学习
下载PDF
上一页 1 2 62 下一页 到第
使用帮助 返回顶部