期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
感知器学习算法研究 被引量:8
1
作者 刘建伟 申芳林 罗雄麟 《计算机工程》 CAS CSCD 北大核心 2010年第7期190-192,共3页
介绍感知器学习算法及其变种,给出各种感知器算法的伪代码,指出各种算法的优点。给出感知器算法在线性可分和线性不可分情况下的误差界定理,讨论各种感知器学习算法的误差界理论,给出各种算法的误差界。介绍感知器学习算法在在线优化场... 介绍感知器学习算法及其变种,给出各种感知器算法的伪代码,指出各种算法的优点。给出感知器算法在线性可分和线性不可分情况下的误差界定理,讨论各种感知器学习算法的误差界理论,给出各种算法的误差界。介绍感知器学习算法在在线优化场景、强化学习场景和赌博机算法中的应用,并对未解决的问题进行讨论。 展开更多
关键词 感知器 错误界 赌博机算法 强化学习
下载PDF
针对新用户冷启动问题的改进Epsilon-greedy算法 被引量:1
2
作者 王素琴 张洋 +1 位作者 蒋浩 朱登明 《计算机工程》 CAS CSCD 北大核心 2018年第11期172-177,共6页
在解决新用户冷启动问题时,固定不变的Epsilon参数会使传统Epsilon-greedy算法收敛缓慢。为此,提出一种改进的Epsilon-greedy算法。利用免疫反馈模型动态调整Epsilon参数,从而使算法快速收敛。使用蒙特卡罗模拟方法对算法进行实验验证,... 在解决新用户冷启动问题时,固定不变的Epsilon参数会使传统Epsilon-greedy算法收敛缓慢。为此,提出一种改进的Epsilon-greedy算法。利用免疫反馈模型动态调整Epsilon参数,从而使算法快速收敛。使用蒙特卡罗模拟方法对算法进行实验验证,结果表明,该算法能够在用户与推荐系统交互较少的情况下为用户进行有效推荐,且推荐效果优于传统的Epsilon-greedy、Softmax和UCB算法。 展开更多
关键词 推荐系统 冷启动 Epsilon-greedy算法 免疫反馈模型 bandit算法
下载PDF
利用Bandit算法解决推荐系统E&E问题 被引量:1
3
作者 高海宾 《韶关学院学报》 2017年第9期22-26,共5页
当前推荐系统开发应用过程中普遍存在着E&E问题,笔者指出了推荐系统中E&E问题的产生和分类,提出用Bandit算法解决这一问题的思路,重点探讨Bandit算法的数学模型和用UCB策略建立的Bandit算法模型,用MATLAB编写了核心仿真程序,并... 当前推荐系统开发应用过程中普遍存在着E&E问题,笔者指出了推荐系统中E&E问题的产生和分类,提出用Bandit算法解决这一问题的思路,重点探讨Bandit算法的数学模型和用UCB策略建立的Bandit算法模型,用MATLAB编写了核心仿真程序,并指出了这种算法模型存在的优点和不足. 展开更多
关键词 bandit算法 推荐系统 E&E问题
下载PDF
融合协同过滤的神经Bandits推荐算法 被引量:2
4
作者 张婷婷 欧阳丹彤 +1 位作者 孙成林 白洪涛 《吉林大学学报(理学版)》 CAS 北大核心 2024年第1期92-99,共8页
针对数据稀疏性和“冷启动”对协同过滤的限制以及现有的协同多臂老虎机算法不适用于非线性奖励函数的问题,提出一种融合协同过滤的神经Ba ndits推荐算法COEENet.首先,采用双神经网络结构学习预期奖励及潜在增益;其次,考虑邻居协同作用... 针对数据稀疏性和“冷启动”对协同过滤的限制以及现有的协同多臂老虎机算法不适用于非线性奖励函数的问题,提出一种融合协同过滤的神经Ba ndits推荐算法COEENet.首先,采用双神经网络结构学习预期奖励及潜在增益;其次,考虑邻居协同作用;最后,构造决策器进行最终决策.实验结果表明,该方法在累积遗憾上优于4种基线算法,推荐效果较好. 展开更多
关键词 协同过滤 多臂老虎机算法 推荐系统 冷启动
下载PDF
基于多臂赌博机算法的推荐系统研究 被引量:1
5
作者 陈珂 《长江信息通信》 2021年第3期43-46,共4页
随着各类移动端应用与网页端应用技术的不断发展,各类推荐系统与人类生活联系逐渐变得更为密切;用户对于推荐系统的推荐效果要求日益提高,持续单一的推荐内容已经不能满足用户不断提高的要求,因此如何精准对接用户需求,解决数据稀疏问... 随着各类移动端应用与网页端应用技术的不断发展,各类推荐系统与人类生活联系逐渐变得更为密切;用户对于推荐系统的推荐效果要求日益提高,持续单一的推荐内容已经不能满足用户不断提高的要求,因此如何精准对接用户需求,解决数据稀疏问题并提供给用户更为精确的推荐效果都已经成为推荐问题中亟待解决的问题。同时各种推荐系统技术不断发展,文章对近年来各种基于MAB算法的推荐系统的研究动态和最新进展进行了综述,对其基本概念和算法的核心思想以及评价指标诸如点击率,运行时长以及累积遗憾等方面进行了分析比较,并对推荐系统技术的发展趋势和应用前景进行了预测。 展开更多
关键词 多臂赌博机算法 UCB算法 Lin-UCB算法 推荐系统 汤普森抽样算法
下载PDF
考虑时变奖励的多摇臂算法在动态定价中的应用 被引量:1
6
作者 乔勋双 毕文杰 《计算机工程与应用》 CSCD 北大核心 2021年第12期237-242,共6页
考虑到动态定价是一个非固定性的多摇臂(Multi-Armed Bandit,MAB)问题,即厂商的利润会随时间变化,因此在相关研究基础上,研究了需求不确定情况下考虑时变奖励的置信区间上界(Upper Confidence Bound,UCB)算法在动态定价问题上的应用。... 考虑到动态定价是一个非固定性的多摇臂(Multi-Armed Bandit,MAB)问题,即厂商的利润会随时间变化,因此在相关研究基础上,研究了需求不确定情况下考虑时变奖励的置信区间上界(Upper Confidence Bound,UCB)算法在动态定价问题上的应用。将商品定价问题描述为一个多摇臂问题,并构建利润最大化模型求得最优解。仿真结果表明,通过将考虑时变奖励的置信区间上界算法与基础的多摇臂算法进行对比分析,所提出的算法学得的奖励更加接近真实奖励,收敛速度更快。相较于前人研究,该模型考虑了时变因素,更加符合现实场景中的动态定价,为厂商定价提供了相应的决策支持。 展开更多
关键词 多摇臂算法 动态定价 置信区间上界算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部