期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
融合标签相似度的k近邻Slope One算法 被引量:7
1
作者 张鹏 葛小青 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2016年第4期518-524,共7页
Slope One协同过滤算法被广泛应用于个性化推荐系统中。标签是一种描述项目特性的重要形式,针对Slope One算法推荐精度不足的问题,将标签信息融合到Slope One算法当中。同时参考k近邻算法思想,选取阈值过滤后的k近邻项目参与平均评分偏... Slope One协同过滤算法被广泛应用于个性化推荐系统中。标签是一种描述项目特性的重要形式,针对Slope One算法推荐精度不足的问题,将标签信息融合到Slope One算法当中。同时参考k近邻算法思想,选取阈值过滤后的k近邻项目参与平均评分偏差计算,提高计算效率的同时增加预测精度。使用评分相似度和标签相似度作为权重修正线性回归模型。通过线性加权融合预测结果,进一步提升推荐质量。将算法应用于Movie Lens数据集,与传统加权Slope One算法相比,平均绝对偏差下降4.8%,召回率和准确率分别提高32.1%和26.3%。 展开更多
关键词 协同过滤 推荐系统 标签相似度 K近邻 SLOPE One算法
下载PDF
融合标签相似度的差分隐私矩阵分解推荐算法 被引量:5
2
作者 郑剑 王啸乾 《计算机应用研究》 CSCD 北大核心 2020年第3期851-855,共5页
推荐系统需要利用到大量的用户行为数据,这些数据极有可能暴露用户的喜好,给人们关心的隐私问题带来巨大的挑战。为保证推荐精度与用户隐私,提出一种结合差分隐私与标签信息的矩阵分解推荐模型。该模型首先将标签信息加入到项目相似度... 推荐系统需要利用到大量的用户行为数据,这些数据极有可能暴露用户的喜好,给人们关心的隐私问题带来巨大的挑战。为保证推荐精度与用户隐私,提出一种结合差分隐私与标签信息的矩阵分解推荐模型。该模型首先将标签信息加入到项目相似度的计算过程;随后融入到矩阵分解推荐模型中提高推荐精度;最后运用随机梯度下降法求解模型最优值。为解决用户隐私问题,将拉普拉斯噪声划分成两部分,分别加入项目相似度与梯度求解过程中,使得整个推荐过程满足ε-差分隐私,并在一个真实的数据集上分析验证算法的有效性。实验表明,提出的方法在保证用户隐私的情况下,仍具有较高的推荐精度。 展开更多
关键词 推荐系统 矩阵分解 标签相似度 差分隐私 隐私保护
下载PDF
基于相似度的中文网页正文提取算法 被引量:3
3
作者 熊子奇 张晖 林茂松 《西南科技大学学报》 CAS 2010年第1期80-84,共5页
网页正文提取是WEB挖掘的重要步骤。传统网页正文提取方法都需要经过分块这一步骤之后来识别网页正文块,提出了利用行文本之间的内容相似度和标签相似度结合的方法来提取网页正文。该算法避免了传统网页提取算法的分块步骤,在规范网页之... 网页正文提取是WEB挖掘的重要步骤。传统网页正文提取方法都需要经过分块这一步骤之后来识别网页正文块,提出了利用行文本之间的内容相似度和标签相似度结合的方法来提取网页正文。该算法避免了传统网页提取算法的分块步骤,在规范网页之后,先提取网页的最大文本行,然后计算每行文本与最大行的内容相似度和标签相似度,再结合内容相似度与标签相似度来提取网页正文。实验中,利用随机抽取的网页进行了测试,其测试精度接近95%,表明该算法在实际中是有效的。 展开更多
关键词 内容相似度 标签相似度 分块 文本挖掘
下载PDF
基于超网络的社会化标签相似性研究
4
作者 潘旭伟 曾雪梅 李涛 《运筹与管理》 CSSCI CSCD 北大核心 2023年第9期215-221,共7页
社会化标签的相似性评估是基于标签的链路预测和个性化推荐的基础。针对以向量空间矩阵和基于图或网络的标签共现关系来度量标签之间相似性的现有方法存在的割裂社会化标签系统“用户-资源-标签”三元内在关系及语义联系丢失问题,本文... 社会化标签的相似性评估是基于标签的链路预测和个性化推荐的基础。针对以向量空间矩阵和基于图或网络的标签共现关系来度量标签之间相似性的现有方法存在的割裂社会化标签系统“用户-资源-标签”三元内在关系及语义联系丢失问题,本文引入能系统刻画“用户-资源-标签”三元内在关系的超网络模型,提出基于超网络的社会化标签相似性评估方法。该方法从用户的社会化标注行为入手,将标签表示为节点,把用户对资源标注表示为超边,构建社会化标签超网络。在此基础上,建立基于超网络的社会化标签相似性度量的两个基本原则:共有超边原则和超边包含节点数原则,并据此构建基于超网络的系列社会化标签相似性度量指标。选取代表性社会化标签应用数据集,利用链路预测的AUC和Precision评价方法对构建的相似性指标进行实验评估,实验结果表明,基于单纯共超边原则以及综合共超边与超边包含节点数原则构建的标签相似性指标优于基于标签共现网络构建的标签相似性度量指标,特别是在Precision评价方面提升明显。 展开更多
关键词 社会化标签 超网络 标签相似性 链路预测 相似性度量
下载PDF
一种基于社会化标注的查询扩展方法 被引量:2
5
作者 王健 李志斌 林鸿飞 《郑州大学学报(工学版)》 CAS 北大核心 2012年第5期114-117,共4页
利用互联网上的社会化标注信息来改善查询扩展效果,是目前信息检索领域的一个研究热点.根据社会化标注系统中数据的特点,提出了一种改进的加权社会化相似度算法,称作Weighted Sim-Rank(WSR)算法,用于改善查询扩展效果.WSR方法在计算标... 利用互联网上的社会化标注信息来改善查询扩展效果,是目前信息检索领域的一个研究热点.根据社会化标注系统中数据的特点,提出了一种改进的加权社会化相似度算法,称作Weighted Sim-Rank(WSR)算法,用于改善查询扩展效果.WSR方法在计算标签和网页之间边的权值时,既考虑与标签和网页共现的用户数量,又兼顾到被同一标签所标注过的不同网页数.所有的实验都是在从del.icio.us网站上抽取的真实标注数据集上进行的.实验结果表明,WSR方法能够有效地衡量标签之间的相似度,与其他几种基于社会化标注的方法相比,可以获得更有用的查询扩展信息,明显地改善了查询扩展的效果. 展开更多
关键词 查询扩展 社会化标注 SimRank算法 标签相似度
下载PDF
基于超网络中共有邻居的标签相似性CJaccard指标
6
作者 李志华 《特区经济》 2019年第2期122-124,共3页
针对以往社会化标签超网络中仅仅基于局部信息构建标签相似性指标而遇到的局部信息不足或信息稀疏的问题,本文首先阐述了社会化标签超网络的构建方法,然后从全局角度出发,提出基于超网络的标签综合相似度的标签相似性CJaccard指标。选... 针对以往社会化标签超网络中仅仅基于局部信息构建标签相似性指标而遇到的局部信息不足或信息稀疏的问题,本文首先阐述了社会化标签超网络的构建方法,然后从全局角度出发,提出基于超网络的标签综合相似度的标签相似性CJaccard指标。选取来自Deli-cious和Last.fm两个社会化标注应用平台的数据集开展谱聚类实验,结果表明,基于超网络的标签综合相似度构建的CJaccard标签相似性指标比基于超网络的标签个体相似度的标签相似性指标具有更高的准确性。 展开更多
关键词 社会化标签 超网络 标签相似性
下载PDF
基于标签相似度的协作者推荐研究 被引量:1
7
作者 陈翔 邱秀珍 《中国科技论文》 CAS 北大核心 2013年第10期974-980,共7页
针对目前虚拟协作社区中重视交互行为研究,缺乏协作行为研究的问题,从项目和协作者的角度出发研究社区的标签关系,提出根据协作者与项目的发生关系和项目标签集合获取基于协作者的标签共生信息,并用该共生信息来计算标签之间相似度,然... 针对目前虚拟协作社区中重视交互行为研究,缺乏协作行为研究的问题,从项目和协作者的角度出发研究社区的标签关系,提出根据协作者与项目的发生关系和项目标签集合获取基于协作者的标签共生信息,并用该共生信息来计算标签之间相似度,然后提出一种新的协作者工作偏好模型。结合协作者工作偏好和标签相似度研究协作者之间的关系,以及协作者与项目之间的关系,预测可能参与项目的协作者,提出协作者推荐算法。通过使用开源社区www.codeplex.com的数据进行实验,并与其他推荐算法进行比较,证明本文提出的推荐算法能较好地应用于协作者推荐。 展开更多
关键词 标签相似度 虚拟协作 协作者推荐 开源社区
下载PDF
融合用户标签相似度的矩阵分解算法 被引量:5
8
作者 武聪 马文明 +1 位作者 王冰 朱建豪 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第1期143-152,共10页
随着互联网时代的到来,推荐系统已经成为人们在网络上筛选资源的得力助手,传统推荐系统通过用户的评分信息来计算用户相似度并为用户进行资源的推荐,但仍存在冷启动、数据稀疏性等各种问题,极大地影响推荐质量.近年来,标签的出现带给推... 随着互联网时代的到来,推荐系统已经成为人们在网络上筛选资源的得力助手,传统推荐系统通过用户的评分信息来计算用户相似度并为用户进行资源的推荐,但仍存在冷启动、数据稀疏性等各种问题,极大地影响推荐质量.近年来,标签的出现带给推荐系统新的机遇,它能够具体准确地描述用户的兴趣偏好,使推荐系统可以通过标签属性来更准确地了解用户喜好,从而为用户进行个性化推荐,极大提高了推荐精度和用户满意度.结合标签属性与评分的关系来计算用户标签相似度,结合用户和资源信息来计算用户相似度,将两者同时融入矩阵分解模型中,从而加强了推荐依据,提升了推荐的准确性.实验结果表明,在ml-latest-small数据集上,提出的算法UTagJMF的尺MSE降低2%左右;在Hetrec2011-movielens-2k数据集上,UTagJMF的RMSE降低2.2%左右.证明提出的算法模型明显优于其他算法的预测效果. 展开更多
关键词 推荐系统 标签 兴趣偏好 用户标签相似度矩阵 Jaccard相似度矩阵
下载PDF
一种基于网页分割的Web信息检索方法 被引量:3
9
作者 俞扬信 严云洋 《图书情报工作》 CSSCI 北大核心 2009年第3期108-110,114,共4页
提出一种基于网页内容分割的Web信息检索算法。该算法根据网页半结构化的特点,按照HTML标记和网页的内容将网页进行区域分割。在建立HTML标记树的基础上,利用内容相似性和视觉相似性进行节点的整合。在检索和排序中,根据用户的查询,充... 提出一种基于网页内容分割的Web信息检索算法。该算法根据网页半结构化的特点,按照HTML标记和网页的内容将网页进行区域分割。在建立HTML标记树的基础上,利用内容相似性和视觉相似性进行节点的整合。在检索和排序中,根据用户的查询,充分利用区域信息来对相关的检索结果进行排序。 展开更多
关键词 网页分割 信息检索 HTML标记 相似性
原文传递
基于用户-商品关联的社会化资源描述框架构建研究
10
作者 周朴雄 卢颖诗 《情报杂志》 CSSCI 北大核心 2017年第9期185-191,共7页
[目的/意义]网络商品的极大丰富和网购用户的指数级增长使得商品与用户之间的描述和关联成为了目前学界和实践亟需解决的问题。[方法/过程]选用社会化标注的方式分别设计了用户社会化资源描述框架与商品社会化资源描述框架;使用《知网... [目的/意义]网络商品的极大丰富和网购用户的指数级增长使得商品与用户之间的描述和关联成为了目前学界和实践亟需解决的问题。[方法/过程]选用社会化标注的方式分别设计了用户社会化资源描述框架与商品社会化资源描述框架;使用《知网》语义词典分别对用户框架和商品框架内的标签进行相似度计算,再使用UCINet6工具对标签进行聚类实现框架的降维,最后计算两个框架间的相关度,达到对接用户资源和商品资源的目的。[结果/结论]选用豆瓣读书中的标签资源作为实证分析的对象,构建了商品和用户的社会化资源描述框架并实现了框架间的关联,为实现电子商务环境下网络商品和网络用户之间的良好对接提供了新思路。 展开更多
关键词 社会化标注 资源描述 标签相似度 框架相关度
下载PDF
基于关联规则与标签的好友推荐算法 被引量:25
11
作者 胡文江 胡大伟 +1 位作者 高永兵 郝斌 《计算机工程与科学》 CSCD 北大核心 2013年第2期109-113,共5页
针对用户在社交网络中添加哪些用户为自己好友的问题,采用好友之间的关系推荐和喜好标签的相似度推荐相结合的方法,提出了改进的推荐算法。首先,通过用户之间的好友关系推荐出目标用户共同好友最多的Top-N用户,其次,通过目标用户和推荐... 针对用户在社交网络中添加哪些用户为自己好友的问题,采用好友之间的关系推荐和喜好标签的相似度推荐相结合的方法,提出了改进的推荐算法。首先,通过用户之间的好友关系推荐出目标用户共同好友最多的Top-N用户,其次,通过目标用户和推荐出的Top-N用户间标签的相似性推荐分数最高的用户,再给定他们相应的权重,进行打分,选取分数最高的Top-N用户进行推荐。实验结果表明,运用相结合的算法是有效的,在准确率和召回率上优于同类的好友推荐算法。 展开更多
关键词 关联规则 好友推荐 标签 相似性
下载PDF
基于复杂网络的社会化标签语义相似度分析 被引量:3
12
作者 张昌利 龚建国 闫茂德 《电子科技大学学报》 EI CAS CSCD 北大核心 2012年第5期642-648,共7页
针对社会化标签系统所对应的标签共现复杂网络,引入标签语义相似度权值和抽象权值算子,建立了标签语义相似度计算模型。相比基于"用户-对象-标签"三元组的统计性计算公式或基于复杂网络拓扑结构的节点相似性计算公式,本模型... 针对社会化标签系统所对应的标签共现复杂网络,引入标签语义相似度权值和抽象权值算子,建立了标签语义相似度计算模型。相比基于"用户-对象-标签"三元组的统计性计算公式或基于复杂网络拓扑结构的节点相似性计算公式,本模型可以在标签语义相似度计算中将标签标注行为的统计特性与复杂网络的拓扑特性有机地结合起来,形成一个具有良好数学性质的形式化系统。仿照模糊逻辑中T范数、S范数给出了抽象权值算子的具体化实现,形成具体化算子簇,可以通过调节参数(如参数h和阶数l)形成不同类型或不同全局性的具体化算子。设计实验方案,利用复杂网络链路预测的AUC指标、Precision指标对典型算子及算子簇进行了综合分析。分析结果表明,这些具体化算子同时具有"语义补充"、"语义破坏"两种相反作用,在算子阶数较低(如2≤l≤5)时能明显提高标签语义相似度计算的准确性,在社会化标签系统的高精确性个性化推荐算法设计中具有应用价值。 展开更多
关键词 复杂网络 链路预测 算子 社会化标签系统 标签语义相似度
下载PDF
自动提取布局结构相似网页的结构化信息 被引量:1
13
作者 赵靖 王侨文 +1 位作者 管马周 单传佳 《安徽科技学院学报》 2010年第6期37-42,共6页
数据库驱动的Web站点根据查询产生的Web页结构布局都是极其相似的;现有的Web提取方法忽视或者忽略了这种相似性,因而在提取效率性能和通用性上都有较大的限制。本文提出一种基于标签树相似度的模板自动学习方法;进而根据模板来提取这类... 数据库驱动的Web站点根据查询产生的Web页结构布局都是极其相似的;现有的Web提取方法忽视或者忽略了这种相似性,因而在提取效率性能和通用性上都有较大的限制。本文提出一种基于标签树相似度的模板自动学习方法;进而根据模板来提取这类网页的数据;并利用Eclipse和开源HTML Parser对算法进行了实现;实验结果表明该算法具有较快的提取速度和较好的准确率。 展开更多
关键词 深层Web 标签树-相似度模型 结构化信息提取
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部