期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
6
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
感知器学习算法研究
被引量:
8
1
作者
刘建伟
申芳林
罗雄麟
《计算机工程》
CAS
CSCD
北大核心
2010年第7期190-192,共3页
介绍感知器学习算法及其变种,给出各种感知器算法的伪代码,指出各种算法的优点。给出感知器算法在线性可分和线性不可分情况下的误差界定理,讨论各种感知器学习算法的误差界理论,给出各种算法的误差界。介绍感知器学习算法在在线优化场...
介绍感知器学习算法及其变种,给出各种感知器算法的伪代码,指出各种算法的优点。给出感知器算法在线性可分和线性不可分情况下的误差界定理,讨论各种感知器学习算法的误差界理论,给出各种算法的误差界。介绍感知器学习算法在在线优化场景、强化学习场景和赌博机算法中的应用,并对未解决的问题进行讨论。
展开更多
关键词
感知器
错误界
赌博机算法
强化学习
下载PDF
职称材料
针对新用户冷启动问题的改进Epsilon-greedy算法
被引量:
1
2
作者
王素琴
张洋
+1 位作者
蒋浩
朱登明
《计算机工程》
CAS
CSCD
北大核心
2018年第11期172-177,共6页
在解决新用户冷启动问题时,固定不变的Epsilon参数会使传统Epsilon-greedy算法收敛缓慢。为此,提出一种改进的Epsilon-greedy算法。利用免疫反馈模型动态调整Epsilon参数,从而使算法快速收敛。使用蒙特卡罗模拟方法对算法进行实验验证,...
在解决新用户冷启动问题时,固定不变的Epsilon参数会使传统Epsilon-greedy算法收敛缓慢。为此,提出一种改进的Epsilon-greedy算法。利用免疫反馈模型动态调整Epsilon参数,从而使算法快速收敛。使用蒙特卡罗模拟方法对算法进行实验验证,结果表明,该算法能够在用户与推荐系统交互较少的情况下为用户进行有效推荐,且推荐效果优于传统的Epsilon-greedy、Softmax和UCB算法。
展开更多
关键词
推荐系统
冷启动
Epsilon-greedy算法
免疫反馈模型
bandit
算法
下载PDF
职称材料
利用Bandit算法解决推荐系统E&E问题
被引量:
1
3
作者
高海宾
《韶关学院学报》
2017年第9期22-26,共5页
当前推荐系统开发应用过程中普遍存在着E&E问题,笔者指出了推荐系统中E&E问题的产生和分类,提出用Bandit算法解决这一问题的思路,重点探讨Bandit算法的数学模型和用UCB策略建立的Bandit算法模型,用MATLAB编写了核心仿真程序,并...
当前推荐系统开发应用过程中普遍存在着E&E问题,笔者指出了推荐系统中E&E问题的产生和分类,提出用Bandit算法解决这一问题的思路,重点探讨Bandit算法的数学模型和用UCB策略建立的Bandit算法模型,用MATLAB编写了核心仿真程序,并指出了这种算法模型存在的优点和不足.
展开更多
关键词
bandit
算法
推荐系统
E&E问题
下载PDF
职称材料
融合协同过滤的神经Bandits推荐算法
被引量:
2
4
作者
张婷婷
欧阳丹彤
+1 位作者
孙成林
白洪涛
《吉林大学学报(理学版)》
CAS
北大核心
2024年第1期92-99,共8页
针对数据稀疏性和“冷启动”对协同过滤的限制以及现有的协同多臂老虎机算法不适用于非线性奖励函数的问题,提出一种融合协同过滤的神经Ba ndits推荐算法COEENet.首先,采用双神经网络结构学习预期奖励及潜在增益;其次,考虑邻居协同作用...
针对数据稀疏性和“冷启动”对协同过滤的限制以及现有的协同多臂老虎机算法不适用于非线性奖励函数的问题,提出一种融合协同过滤的神经Ba ndits推荐算法COEENet.首先,采用双神经网络结构学习预期奖励及潜在增益;其次,考虑邻居协同作用;最后,构造决策器进行最终决策.实验结果表明,该方法在累积遗憾上优于4种基线算法,推荐效果较好.
展开更多
关键词
协同过滤
多臂老虎机算法
推荐系统
冷启动
下载PDF
职称材料
基于多臂赌博机算法的推荐系统研究
被引量:
1
5
作者
陈珂
《长江信息通信》
2021年第3期43-46,共4页
随着各类移动端应用与网页端应用技术的不断发展,各类推荐系统与人类生活联系逐渐变得更为密切;用户对于推荐系统的推荐效果要求日益提高,持续单一的推荐内容已经不能满足用户不断提高的要求,因此如何精准对接用户需求,解决数据稀疏问...
随着各类移动端应用与网页端应用技术的不断发展,各类推荐系统与人类生活联系逐渐变得更为密切;用户对于推荐系统的推荐效果要求日益提高,持续单一的推荐内容已经不能满足用户不断提高的要求,因此如何精准对接用户需求,解决数据稀疏问题并提供给用户更为精确的推荐效果都已经成为推荐问题中亟待解决的问题。同时各种推荐系统技术不断发展,文章对近年来各种基于MAB算法的推荐系统的研究动态和最新进展进行了综述,对其基本概念和算法的核心思想以及评价指标诸如点击率,运行时长以及累积遗憾等方面进行了分析比较,并对推荐系统技术的发展趋势和应用前景进行了预测。
展开更多
关键词
多臂赌博机算法
UCB算法
Lin-UCB算法
推荐系统
汤普森抽样算法
下载PDF
职称材料
考虑时变奖励的多摇臂算法在动态定价中的应用
被引量:
1
6
作者
乔勋双
毕文杰
《计算机工程与应用》
CSCD
北大核心
2021年第12期237-242,共6页
考虑到动态定价是一个非固定性的多摇臂(Multi-Armed Bandit,MAB)问题,即厂商的利润会随时间变化,因此在相关研究基础上,研究了需求不确定情况下考虑时变奖励的置信区间上界(Upper Confidence Bound,UCB)算法在动态定价问题上的应用。...
考虑到动态定价是一个非固定性的多摇臂(Multi-Armed Bandit,MAB)问题,即厂商的利润会随时间变化,因此在相关研究基础上,研究了需求不确定情况下考虑时变奖励的置信区间上界(Upper Confidence Bound,UCB)算法在动态定价问题上的应用。将商品定价问题描述为一个多摇臂问题,并构建利润最大化模型求得最优解。仿真结果表明,通过将考虑时变奖励的置信区间上界算法与基础的多摇臂算法进行对比分析,所提出的算法学得的奖励更加接近真实奖励,收敛速度更快。相较于前人研究,该模型考虑了时变因素,更加符合现实场景中的动态定价,为厂商定价提供了相应的决策支持。
展开更多
关键词
多摇臂算法
动态定价
置信区间上界算法
下载PDF
职称材料
题名
感知器学习算法研究
被引量:
8
1
作者
刘建伟
申芳林
罗雄麟
机构
中国石油大学(北京)自动化研究所
出处
《计算机工程》
CAS
CSCD
北大核心
2010年第7期190-192,共3页
文摘
介绍感知器学习算法及其变种,给出各种感知器算法的伪代码,指出各种算法的优点。给出感知器算法在线性可分和线性不可分情况下的误差界定理,讨论各种感知器学习算法的误差界理论,给出各种算法的误差界。介绍感知器学习算法在在线优化场景、强化学习场景和赌博机算法中的应用,并对未解决的问题进行讨论。
关键词
感知器
错误界
赌博机算法
强化学习
Keywords
perceptron
mistake
bound
bandit
algorithm
reinforcement
learning
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
针对新用户冷启动问题的改进Epsilon-greedy算法
被引量:
1
2
作者
王素琴
张洋
蒋浩
朱登明
机构
华北电力大学控制与计算机工程学院
中国科学院计算技术研究所
出处
《计算机工程》
CAS
CSCD
北大核心
2018年第11期172-177,共6页
基金
国家自然科学基金"逼真稳定的服装动画方法研究"(61300131)
北京市共建项目(2014JG48)
文摘
在解决新用户冷启动问题时,固定不变的Epsilon参数会使传统Epsilon-greedy算法收敛缓慢。为此,提出一种改进的Epsilon-greedy算法。利用免疫反馈模型动态调整Epsilon参数,从而使算法快速收敛。使用蒙特卡罗模拟方法对算法进行实验验证,结果表明,该算法能够在用户与推荐系统交互较少的情况下为用户进行有效推荐,且推荐效果优于传统的Epsilon-greedy、Softmax和UCB算法。
关键词
推荐系统
冷启动
Epsilon-greedy算法
免疫反馈模型
bandit
算法
Keywords
recommendation
system
cold-start
Epsilon-greedy
algorithm
immune
feedback
model
bandit
algorithm
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
利用Bandit算法解决推荐系统E&E问题
被引量:
1
3
作者
高海宾
机构
淮南联合大学计算机系
出处
《韶关学院学报》
2017年第9期22-26,共5页
基金
安徽省高等学校省级自然科学研究项目(KJ2017A585)
文摘
当前推荐系统开发应用过程中普遍存在着E&E问题,笔者指出了推荐系统中E&E问题的产生和分类,提出用Bandit算法解决这一问题的思路,重点探讨Bandit算法的数学模型和用UCB策略建立的Bandit算法模型,用MATLAB编写了核心仿真程序,并指出了这种算法模型存在的优点和不足.
关键词
bandit
算法
推荐系统
E&E问题
Keywords
bandit
algorithm
recommended
system
E&E
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
融合协同过滤的神经Bandits推荐算法
被引量:
2
4
作者
张婷婷
欧阳丹彤
孙成林
白洪涛
机构
吉林大学计算机科学与技术学院
吉林大学符号计算与知识工程教育部重点实验室
吉林大学白求恩第一医院内分泌与代谢科
出处
《吉林大学学报(理学版)》
CAS
北大核心
2024年第1期92-99,共8页
基金
吉林省自然科学基金(批准号:20210101181JC)。
文摘
针对数据稀疏性和“冷启动”对协同过滤的限制以及现有的协同多臂老虎机算法不适用于非线性奖励函数的问题,提出一种融合协同过滤的神经Ba ndits推荐算法COEENet.首先,采用双神经网络结构学习预期奖励及潜在增益;其次,考虑邻居协同作用;最后,构造决策器进行最终决策.实验结果表明,该方法在累积遗憾上优于4种基线算法,推荐效果较好.
关键词
协同过滤
多臂老虎机算法
推荐系统
冷启动
Keywords
collaborative
filtering
multi-armed
bandit
algorithm
recommendation
system
cold
start
分类号
TP301 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于多臂赌博机算法的推荐系统研究
被引量:
1
5
作者
陈珂
机构
南京邮电大学通信与信息工程学院
出处
《长江信息通信》
2021年第3期43-46,共4页
文摘
随着各类移动端应用与网页端应用技术的不断发展,各类推荐系统与人类生活联系逐渐变得更为密切;用户对于推荐系统的推荐效果要求日益提高,持续单一的推荐内容已经不能满足用户不断提高的要求,因此如何精准对接用户需求,解决数据稀疏问题并提供给用户更为精确的推荐效果都已经成为推荐问题中亟待解决的问题。同时各种推荐系统技术不断发展,文章对近年来各种基于MAB算法的推荐系统的研究动态和最新进展进行了综述,对其基本概念和算法的核心思想以及评价指标诸如点击率,运行时长以及累积遗憾等方面进行了分析比较,并对推荐系统技术的发展趋势和应用前景进行了预测。
关键词
多臂赌博机算法
UCB算法
Lin-UCB算法
推荐系统
汤普森抽样算法
Keywords
Multi-Armed
bandit
algorithm
UCB
Lin-UCB
algorithm
Thompson
Sampling
algorithm
分类号
TN929.5 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
考虑时变奖励的多摇臂算法在动态定价中的应用
被引量:
1
6
作者
乔勋双
毕文杰
机构
中南大学商学院
出处
《计算机工程与应用》
CSCD
北大核心
2021年第12期237-242,共6页
基金
国家自然科学基金重大研究计划-培育项目(91646115)。
文摘
考虑到动态定价是一个非固定性的多摇臂(Multi-Armed Bandit,MAB)问题,即厂商的利润会随时间变化,因此在相关研究基础上,研究了需求不确定情况下考虑时变奖励的置信区间上界(Upper Confidence Bound,UCB)算法在动态定价问题上的应用。将商品定价问题描述为一个多摇臂问题,并构建利润最大化模型求得最优解。仿真结果表明,通过将考虑时变奖励的置信区间上界算法与基础的多摇臂算法进行对比分析,所提出的算法学得的奖励更加接近真实奖励,收敛速度更快。相较于前人研究,该模型考虑了时变因素,更加符合现实场景中的动态定价,为厂商定价提供了相应的决策支持。
关键词
多摇臂算法
动态定价
置信区间上界算法
Keywords
multi-armed
bandit
algorithm
dynamic
pricing
upper
confidence
bound
分类号
C93 [经济管理—管理学]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
感知器学习算法研究
刘建伟
申芳林
罗雄麟
《计算机工程》
CAS
CSCD
北大核心
2010
8
下载PDF
职称材料
2
针对新用户冷启动问题的改进Epsilon-greedy算法
王素琴
张洋
蒋浩
朱登明
《计算机工程》
CAS
CSCD
北大核心
2018
1
下载PDF
职称材料
3
利用Bandit算法解决推荐系统E&E问题
高海宾
《韶关学院学报》
2017
1
下载PDF
职称材料
4
融合协同过滤的神经Bandits推荐算法
张婷婷
欧阳丹彤
孙成林
白洪涛
《吉林大学学报(理学版)》
CAS
北大核心
2024
2
下载PDF
职称材料
5
基于多臂赌博机算法的推荐系统研究
陈珂
《长江信息通信》
2021
1
下载PDF
职称材料
6
考虑时变奖励的多摇臂算法在动态定价中的应用
乔勋双
毕文杰
《计算机工程与应用》
CSCD
北大核心
2021
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部