期刊文献+
共找到29篇文章
< 1 2 >
每页显示 20 50 100
基于MapReduce的并行PLSA算法及在文本挖掘中的应用 被引量:7
1
作者 李宁 罗文娟 +2 位作者 庄福振 何清 史忠植 《中文信息学报》 CSCD 北大核心 2015年第2期79-86,共8页
PLSA(Probabilistic Latent Semantic Analysis)是一种典型的主题模型。复杂的建模过程使其难以处理海量数据,针对串行PLSA难以处理海量数据的问题,该文提出一种基于MapReduce计算框架的并行PLSA算法,能够以简洁的形式和分布式的方案来... PLSA(Probabilistic Latent Semantic Analysis)是一种典型的主题模型。复杂的建模过程使其难以处理海量数据,针对串行PLSA难以处理海量数据的问题,该文提出一种基于MapReduce计算框架的并行PLSA算法,能够以简洁的形式和分布式的方案来解决大规模数据的并行处理问题,并把并行PLSA算法运用到文本聚类和语义分析的文本挖掘应用中。实验结果表明该算法在处理较大数据量时表现出了很好的性能。 展开更多
关键词 概率主题模型 MAPREDUCE 并行 语义分析
下载PDF
游戏地图中的分层动态路径搜索算法 被引量:4
2
作者 李艳 陈彩 +1 位作者 李铁松 苏兰明 《计算机工程》 CAS CSCD 2012年第2期288-289,共2页
在大型游戏地图环境中,玩家必须对动态地形做出即时反应,而动态寻路算法对改变节点的位置非常敏感。为此,结合增量路径搜索(LPA*)算法和分层路径搜索(HPA*)算法,提出一种分层动态路径搜索(HPLPA*)算法。对地图分层形成抽象图,并在动态... 在大型游戏地图环境中,玩家必须对动态地形做出即时反应,而动态寻路算法对改变节点的位置非常敏感。为此,结合增量路径搜索(LPA*)算法和分层路径搜索(HPA*)算法,提出一种分层动态路径搜索(HPLPA*)算法。对地图分层形成抽象图,并在动态环境中及时更新,采用LPA*搜索,找到抽象路径再细化,以此形成本地路径。实验结果证明,与LPA*和HPA*相比,该算法更有效。 展开更多
关键词 路径搜索 分层动态地形 HPLPA*算法 重规划
下载PDF
游戏场景中基于势场的交互寻路方法 被引量:2
3
作者 余帅 李艳 +1 位作者 王熙照 赵鹤玲 《计算机科学》 CSCD 北大核心 2014年第2期131-135,共5页
在即时战略游戏中,路径规划是一种重要且常见的任务。游戏的实时性要求玩家能够快速寻找一条进攻的路径,而且游戏单元之间普遍存在的交互作用对寻路质量有着重要的影响。传统的寻路算法如Dijkstra算法虽然能够找到最优路径,但是耗时较多... 在即时战略游戏中,路径规划是一种重要且常见的任务。游戏的实时性要求玩家能够快速寻找一条进攻的路径,而且游戏单元之间普遍存在的交互作用对寻路质量有着重要的影响。传统的寻路算法如Dijkstra算法虽然能够找到最优路径,但是耗时较多,而且未体现真实游戏中的交互。为此选取RTS游戏中一种典型的攻防场景,提出基于人工势场的快速高效动态寻路方法,同时为了体现RTS中游戏单元之间的交互性,将模糊测度引入到势场寻路中。实验结果表明,采用人工势场法寻路较Dijkstra算法耗时少、路径平滑;而引入模糊测度体现了真实游戏中单元之间的交互影响作用,与真实的游戏场景更为接近。 展开更多
关键词 即时战略游戏 DIJKSTRA算法 A*算法 人工势场法 模糊测度 模糊积分
下载PDF
一种基于相对海明距离的地图复杂性度量 被引量:2
4
作者 李艳 李铁松 +1 位作者 陈彩 苏兰明 《计算机工程》 CAS CSCD 2012年第7期10-12,共3页
提出一种适用于分层路径搜索算法的地图复杂性度量方法。针对不同规模的地图,将其实际复杂度与可达到的最大复杂度之比作为相对复杂度,提出基于相对海明距离的度量方法,并引入地图区域间方差,从而更好地计算障碍物分布不均匀地图的复杂... 提出一种适用于分层路径搜索算法的地图复杂性度量方法。针对不同规模的地图,将其实际复杂度与可达到的最大复杂度之比作为相对复杂度,提出基于相对海明距离的度量方法,并引入地图区域间方差,从而更好地计算障碍物分布不均匀地图的复杂度。实验结果证明,该方法能准确地反映不同规模与障碍物分布不均的地图复杂程度,并与HPA*算法的搜索效率有较强关联性。 展开更多
关键词 地图复杂性 海明复杂度 相对海明复杂度 路径搜索 HPA*算法
下载PDF
一种考虑地图分布信息的分层路径搜索算法 被引量:1
5
作者 李艳 周振华 赵文举 《小型微型计算机系统》 CSCD 北大核心 2013年第11期2607-2611,共5页
目前存在大量的路径搜索算法,但大多数如传统的A*,Dijkstra等算法没有考虑地图中障碍物的分布信息,造成不必要的存储和时间耗费.实际上,搜索空间的分布在很大程度上影响着算法的性能,因此提出一种结合障碍物分布信息和抽象图思想的分层... 目前存在大量的路径搜索算法,但大多数如传统的A*,Dijkstra等算法没有考虑地图中障碍物的分布信息,造成不必要的存储和时间耗费.实际上,搜索空间的分布在很大程度上影响着算法的性能,因此提出一种结合障碍物分布信息和抽象图思想的分层路径搜索算法CDHPA*.该算法首先依据障碍物的分布将地图划分为不均等的子区域,划分区域的数目由可调阈值确定;然后将子区域边界上的非障碍点作为抽象节点来构成完整的抽象图.根据障碍分布,抽象节点之间的最短路径采用曼哈顿距离或自底向上融合算法来计算;最后在抽象图上找到抽象路径并进行细化,得到实际路径.CDHPA*在同一幅地图上进行多次寻路时仅需一次预处理,在线寻路相比同类方法 M-A*、HPA*更快,并且得出的路径为最优路径. 展开更多
关键词 路径搜索 地图分布 抽象图 自底向上 细化路径 最优路径
下载PDF
基于正则化的相关熵平均近邻最大间距特征提取方法
6
作者 马琳娜 《电脑编程技巧与维护》 2014年第6期17-20,共4页
针对传统的平均近邻最大间距特征提取方法对噪声敏感的缺点,提出了基于正则化的相关熵平均近邻最大间距(RCANMM)特征提取方法,使用相关熵衡量数据间的相似程度,提高了原方法的鲁棒性。在目标函数中添加正则化项,提高了泛化性。在AR、YAL... 针对传统的平均近邻最大间距特征提取方法对噪声敏感的缺点,提出了基于正则化的相关熵平均近邻最大间距(RCANMM)特征提取方法,使用相关熵衡量数据间的相似程度,提高了原方法的鲁棒性。在目标函数中添加正则化项,提高了泛化性。在AR、YALE-B和ORL人脸数据库上的实验结果表明,RCANMM相比传统ANMM方法有较好的性能。 展开更多
关键词 特征提取 正则化相关熵 半二次优化技术 ANMM方法
下载PDF
图像特征提取研究 被引量:73
7
作者 翟俊海 赵文秀 王熙照 《河北大学学报(自然科学版)》 CAS 北大核心 2009年第1期106-112,共7页
图像特征提取是图像识别的关键步骤,图像特征提取的效果如何直接决定着图像识别的效果.如何从原始图像中提取具有较强表示能力的图像特征是智能图像处理的一个研究热点.本文旨在介绍各种图像特征提取方法的基本思想、特点和研究发展现状... 图像特征提取是图像识别的关键步骤,图像特征提取的效果如何直接决定着图像识别的效果.如何从原始图像中提取具有较强表示能力的图像特征是智能图像处理的一个研究热点.本文旨在介绍各种图像特征提取方法的基本思想、特点和研究发展现状,以引起国内学者的进一步关注. 展开更多
关键词 图像 图像识别 特征提取 小波变换 软计算
下载PDF
基于粗糙集技术的决策树归纳 被引量:12
8
作者 翟俊海 王熙照 张沧生 《计算机工程与应用》 CSCD 北大核心 2009年第18期45-47,共3页
ID3算法是一种典型的决策树归纳算法,它以信息增益作为选择扩展属性根结点的标准,并递归地生成决策树。但ID3算法倾向于选取属性取值较多的属性作为根结点,而且它假设训练集中各类别样例的比例应与实际问题领域里各类别样例的比例相同... ID3算法是一种典型的决策树归纳算法,它以信息增益作为选择扩展属性根结点的标准,并递归地生成决策树。但ID3算法倾向于选取属性取值较多的属性作为根结点,而且它假设训练集中各类别样例的比例应与实际问题领域里各类别样例的比例相同。提出一种新的基于粗糙集技术的决策树归纳算法,它是一种完全数据驱动的归纳算法,可以克服ID3算法的上述不足。 展开更多
关键词 决策树 ID3算法 粗糙集 上近似 下近似
下载PDF
最小相关性最大依赖度属性约简 被引量:11
9
作者 翟俊海 万丽艳 王熙照 《计算机科学》 CSCD 北大核心 2014年第12期148-150,154,共4页
在经典粗糙集中,基于重要度的决策表属性约简算法只考虑了决策属性与条件属性之间的依赖度,没有考虑约简中条件属性之间的相关性,由此求出的约简中可能依然包含冗余属性。针对这一问题,提出了一种改进算法,它利用最小相关性和最大依赖... 在经典粗糙集中,基于重要度的决策表属性约简算法只考虑了决策属性与条件属性之间的依赖度,没有考虑约简中条件属性之间的相关性,由此求出的约简中可能依然包含冗余属性。针对这一问题,提出了一种改进算法,它利用最小相关性和最大依赖度准则求决策表属性约简。与基于重要度的决策表属性约简算法相比,本算法求出的约简包含的属性个数少、冗余小。实验结果显示,本算法优于基于重要度的决策表属性约简算法。 展开更多
关键词 粗糙集 决策表 属性约简 最小相关性 最大依赖度
下载PDF
改进的基于排序熵的有序决策树算法 被引量:10
10
作者 陈建凯 王熙照 高相辉 《模式识别与人工智能》 EI CSCD 北大核心 2014年第2期134-140,共7页
由于基于排序熵的有序决策树在扩展属性选取时,需计算每个条件属性的每个割点处的排序互信息,并通过对比这些排序互信息的大小来确定最大值(最大值对应的属性为扩展属性),计算复杂度较高.针对此问题,文中将割点分为平衡割点和非平衡割... 由于基于排序熵的有序决策树在扩展属性选取时,需计算每个条件属性的每个割点处的排序互信息,并通过对比这些排序互信息的大小来确定最大值(最大值对应的属性为扩展属性),计算复杂度较高.针对此问题,文中将割点分为平衡割点和非平衡割点两部分,建立一个数学模型,从理论上证明排序互信息最大值不会在平衡割点处达到,而只能在非平衡割点处达到.这说明在计算排序互信息时只需遍历非平衡割点,而无需再计算平衡割点处的值,从而使决策树构建的计算效率得到较大程度提高.数值实验验证此结果. 展开更多
关键词 有序分类 有序决策树 非平衡割点
下载PDF
基于模拟退火的SVDD特征提取和参数选择 被引量:6
11
作者 邢红杰 赵浩鑫 《计算机科学》 CSCD 北大核心 2013年第1期302-305,共4页
支持向量数据描述(Support Vector Data Description,SVDD)被认为是用于异常检测的典型方法。众所周之,参数的设置和特征的品质是影响SVDD性能的两个关键点。将SVDD的特征提取和参数选择问题结合在一起,提出了一种基于模拟退火的SVDD特... 支持向量数据描述(Support Vector Data Description,SVDD)被认为是用于异常检测的典型方法。众所周之,参数的设置和特征的品质是影响SVDD性能的两个关键点。将SVDD的特征提取和参数选择问题结合在一起,提出了一种基于模拟退火的SVDD特征提取和参数选择方法(SA-SVDD)。在模拟退火的过程中,自动选择最优核参数、折衷参数以及抽取特征的维数。在UCI基准数据集上的实验结果表明,与传统的参数选择方法相比,SA-SVDD取得了更优的性能。 展开更多
关键词 特征提取 模拟退火 参数选择 SVDD 异常检测
下载PDF
基于模糊积分的多模糊决策树融合 被引量:4
12
作者 翟俊海 王熙照 张素芳 《计算机研究与发展》 EI CSCD 北大核心 2009年第3期470-477,共8页
给定一个模糊信息系统,可能找到多个重要的模糊属性子集,而且这些重要的模糊属性子集对决策有不同的贡献,会产生不同的影响.如果仅选择其中一个模糊属性子集进行决策,即使是最重要的一个,也会丢失隐含在其他重要的模糊属性子集中的可用... 给定一个模糊信息系统,可能找到多个重要的模糊属性子集,而且这些重要的模糊属性子集对决策有不同的贡献,会产生不同的影响.如果仅选择其中一个模糊属性子集进行决策,即使是最重要的一个,也会丢失隐含在其他重要的模糊属性子集中的可用信息.为了充分利用模糊信息系统中每个重要的模糊属性子集所提供的信息,提出了一种基于模糊积分的多模糊决策树融合方法.这种方法分3个步骤:1)通过模糊等价关系找到几个重要的模糊属性子集;2)对每个模糊属性子集,利用模糊ID3算法生成一棵模糊决策树;3)用模糊积分融合几棵模糊决策树.实验结果证明了用多模糊决策树融合方法比单模糊决策树分类效果更好. 展开更多
关键词 模糊信息系统 模糊决策树 模糊ID3算法 模糊熵 模糊积分 信息融合
下载PDF
密度加权近似支持向量机 被引量:6
13
作者 王熙照 崔芳芳 鲁淑霞 《计算机科学》 CSCD 北大核心 2012年第1期182-184,共3页
标准的近似支持向量机(PSVM)用求解正则化最小二乘问题代替了求解二次规划问题,它可以得到一个解析解,从而减少训练时间。但是标准的PSVM没有考虑数据集中正、负样本的分布情况,对所有的样本都赋予了相同的惩罚因子。而在实际问题中,数... 标准的近似支持向量机(PSVM)用求解正则化最小二乘问题代替了求解二次规划问题,它可以得到一个解析解,从而减少训练时间。但是标准的PSVM没有考虑数据集中正、负样本的分布情况,对所有的样本都赋予了相同的惩罚因子。而在实际问题中,数据集中样本的分布是不平衡的。针对此问题,在PSVM的基础上提出了一种基于密度加权的近似支持向量机(DPSVM),其先计算样本的密度指标,不同的样例有不同的密度信息,因此对不同的样例给予不同的惩罚因子,并将原始优化问题中的惩罚因子由数值变为一个对角矩阵。在UCI数据集上用这种方法进行了实验,并与SVM和PSVM方法进行了比较,结果表明,DPSVM在正负类样本分布不平衡的数据集上有较好的分类性能。 展开更多
关键词 支持向量机 近似支持向量机 密度加权 不平衡数据
下载PDF
基于不平衡学习的分类器博弈模型及其在中国象棋中的应用 被引量:5
14
作者 苏攀 王熙照 李艳 《计算机研究与发展》 EI CSCD 北大核心 2011年第5期841-847,共7页
计算机博弈是人工智能领域中的热点研究课题.传统计算机博弈模型使用极大极小搜索与评估函数相结合的方式,棋力高低依赖于搜索的深度.在计算性能较低的平台上,搜索深度加深会延长反应时间.因此,提出了一种应用不平衡学习技术使用专家谱... 计算机博弈是人工智能领域中的热点研究课题.传统计算机博弈模型使用极大极小搜索与评估函数相结合的方式,棋力高低依赖于搜索的深度.在计算性能较低的平台上,搜索深度加深会延长反应时间.因此,提出了一种应用不平衡学习技术使用专家谱训练分类器的机器博弈解决方案,反应时间只相当于一层搜索,且更能体现学习的特性.使用3种经典的不平衡学习方法训练神经网络,并对结果进行了比较.验证了使用分类器模拟中国象棋策略的可能性,以及不平衡学习技术在该策略建模过程中起到的关键作用. 展开更多
关键词 不平衡学习 计算机博弈 中国象棋机器博奕 分类器博弈模型 人工神经网络
下载PDF
基于近邻熵的主动学习算法 被引量:5
15
作者 王珍钰 王熙照 《模式识别与人工智能》 EI CSCD 北大核心 2011年第1期97-102,共6页
在主动学习中,采用近邻熵(Neighborhood Entropy)作为样例的挑选标准,熵值最大的样例体现基于近邻分类规则,最无法确定该样例的类标.而标注不确定性高的样例可用尽量少的样例获得较高的分类性能.文中提出一种基于近邻熵的主动学习算法.... 在主动学习中,采用近邻熵(Neighborhood Entropy)作为样例的挑选标准,熵值最大的样例体现基于近邻分类规则,最无法确定该样例的类标.而标注不确定性高的样例可用尽量少的样例获得较高的分类性能.文中提出一种基于近邻熵的主动学习算法.该算法首先计算未标注样例的近邻样例类别熵,然后挑选熵值最大样例的进行标注.实验表明,基于近邻熵挑选样例进行标注,较基于最大距离(Maximal Distance)挑选和随机样例挑选可获得更高的分类性能. 展开更多
关键词 主动学习 最近邻 最大熵 样例选择
原文传递
有序决策树的比较研究 被引量:5
16
作者 王鑫 王熙照 +1 位作者 陈建凯 翟俊海 《计算机科学与探索》 CSCD 2013年第11期1018-1025,共8页
有序分类是现实生活中广泛存在的一种分类问题。基于排序熵的有序决策树算法是处理有序分类问题的重要方法之一,这种方法是以排序互信息作为启发式来构建有序决策树。基于这项工作,通过引入模糊有序熵,并以模糊有序互信息作为启发式构... 有序分类是现实生活中广泛存在的一种分类问题。基于排序熵的有序决策树算法是处理有序分类问题的重要方法之一,这种方法是以排序互信息作为启发式来构建有序决策树。基于这项工作,通过引入模糊有序熵,并以模糊有序互信息作为启发式构建模糊有序决策树,对有序决策树进行了扩展。这两种算法在实际应用中各有自己的优劣之处,从四个方面对这两种算法进行了详细的比较,并指出了这两种算法的异同及优缺点。 展开更多
关键词 有序分类 模糊有序互信息 有序决策树
下载PDF
基于优势-等价关系的几种约简及规则抽取方法 被引量:4
17
作者 李艳 孙娜欣 +1 位作者 赵津 王华超 《计算机科学》 CSCD 北大核心 2011年第11期220-224,共5页
考虑了条件属性引入优势关系而决策属性上引入等价关系的不协调目标信息系统。分析了这种基于优势-等价关系的相容约简、最大分布约简及正域约简三者之间的关系。此外,结合劣势关系抽取规则以提高规则的覆盖率,改进了基于优势关系的正... 考虑了条件属性引入优势关系而决策属性上引入等价关系的不协调目标信息系统。分析了这种基于优势-等价关系的相容约简、最大分布约简及正域约简三者之间的关系。此外,结合劣势关系抽取规则以提高规则的覆盖率,改进了基于优势关系的正域约简抽取规则(PDRIS)的方法。最后给出算例,并在UCI数据集上进行了大量的试验,以与PDRIS进行比较。 展开更多
关键词 粗糙集 优势关系 等价关系 正域约简 规则抽取
下载PDF
基于小波变换和2DPCA的人脸识别 被引量:4
18
作者 翟俊海 翟梦尧 王华超 《河北大学学报(自然科学版)》 CAS 北大核心 2010年第5期574-579,共6页
主成分分析(principal component analysis:PCA)已成功用于人脸识别,但基于主成分分析的人脸识别方法需要将图像数据向量化,而向量化后的图像样本维数非常大,计算代价非常高.二维主成分分析(2 di mension principal component analysis:... 主成分分析(principal component analysis:PCA)已成功用于人脸识别,但基于主成分分析的人脸识别方法需要将图像数据向量化,而向量化后的图像样本维数非常大,计算代价非常高.二维主成分分析(2 di mension principal component analysis:2DPCA)直接处理图像数据,不需要向量化的过程,2DPCA降低了计算复杂度,但是2DPCA与PCA相比,需要存储更多的系数,即要占用更多的存储空间.本文提出了一种基于小波变换和2DPCA的人脸识别方法,可以克服上述缺点,实验结果证明了该方法的有效性. 展开更多
关键词 小波变换 人脸识别 主成分分析 特征脸 特征提取
下载PDF
基于模糊积分的不完全小波包子空间集成人脸识别 被引量:2
19
作者 翟俊海 王熙照 张素芳 《模式识别与人工智能》 EI CSCD 北大核心 2014年第9期794-801,共8页
提出一种基于模糊积分的不完全小波包子空间集成人脸识别方法,并与五种相关方法进行实验比较.首先对人脸图像做不完全小波包分解,对双向低频子空间图像直接进行特征提取,对含有一个方向低频成分的高频子空间图像先求平均,再进行提取特征... 提出一种基于模糊积分的不完全小波包子空间集成人脸识别方法,并与五种相关方法进行实验比较.首先对人脸图像做不完全小波包分解,对双向低频子空间图像直接进行特征提取,对含有一个方向低频成分的高频子空间图像先求平均,再进行提取特征;然后用得到的不同子空间图像训练模糊分类器;最后用模糊积分融合训练的模糊分类器.该方法能够充分利用不同频率小波子空间图像中包含的有用信息,从而提高人脸识别的精度.在ORL、YALE、JAFFE和FERET这4个人脸数据库上进行实验,实验结果表明该方法在识别精度方面均优于五种相关方法. 展开更多
关键词 人脸识别 小波包变换 子空间集成 二维主成分分析 二维线性判别分析
下载PDF
基于概率神经网络和K-L散度的样例选择 被引量:2
20
作者 翟俊海 李畅 +1 位作者 李塔 王熙照 《计算机应用研究》 CSCD 北大核心 2014年第1期63-65,69,共4页
提出了一种基于概率神经网络和K-L散度的样例选择算法。该算法利用概率神经网络估计训练样例的概率分布,利用K-L散度作为启发式来进行样例选择,用该方法选出的样例大多分布在分类边界附近。与五个著名的样例选择算法CNN、ENN、RNN、MCS... 提出了一种基于概率神经网络和K-L散度的样例选择算法。该算法利用概率神经网络估计训练样例的概率分布,利用K-L散度作为启发式来进行样例选择,用该方法选出的样例大多分布在分类边界附近。与五个著名的样例选择算法CNN、ENN、RNN、MCS和ICF进行了实验比较,实验结果显示,算法的选择比更低,训练出分类器具有更好的泛化能力,提出的方法是有效的。 展开更多
关键词 概率神经网络 样例选择 K-L散度 最近邻分类
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部