期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
学术博客链接结构及其交流特性分析 被引量:20
1
作者 史新艳 肖仙桃 《图书情报知识》 CSSCI 北大核心 2009年第5期79-83,89,共6页
本文给出了学术博客的定义和特征,分析了学术博客这种网络交流形式中存在的链接行为,从链接在页面中的具体位置所体现出的链接动机进行分类,着重对首页、博客文章页面的链接位置从其页面形式和源代码中查看,做好博客链接分析工作,并根... 本文给出了学术博客的定义和特征,分析了学术博客这种网络交流形式中存在的链接行为,从链接在页面中的具体位置所体现出的链接动机进行分类,着重对首页、博客文章页面的链接位置从其页面形式和源代码中查看,做好博客链接分析工作,并根据本文给出的博客交流结构讨论了学术博客在学术交流中的特性,为深入研究学术博客交流传播特征作好准备。 展开更多
关键词 学术博客 链接位置 链接动机 链接分类
下载PDF
基于RReliefF特征选择算法的复杂网络链接分类 被引量:7
2
作者 伍杰华 《计算机工程》 CAS CSCD 北大核心 2017年第8期208-214,共7页
研究基于复杂网络特征的链接分类问题,针对原始特征噪声信息多、冗余度大的现象,在RRelief F特征选择算法的基础上,提出一种改进的链接分类模型。从局部和全局2个维度构建与链接相关联的特征信息,引入RRelief F算法对特征进行选择并采... 研究基于复杂网络特征的链接分类问题,针对原始特征噪声信息多、冗余度大的现象,在RRelief F特征选择算法的基础上,提出一种改进的链接分类模型。从局部和全局2个维度构建与链接相关联的特征信息,引入RRelief F算法对特征进行选择并采用偏最小二乘法实现回归分类。在人工数据集和真实数据集上的实验结果表明,该模型能筛选出具有判别性的特征,提高链接分类质量,为监督学习的复杂网络链接分类提供一种新思路。 展开更多
关键词 复杂网络 链接分类 关系分类 特征选择 偏最小二乘法
下载PDF
基于网页链接分类的PageRank并行算法 被引量:6
3
作者 陈诚 战荫伟 李鹰 《计算机应用》 CSCD 北大核心 2015年第1期48-52,共5页
针对串行PageRank算法在处理海量网页数据时效率低下的问题,提出一种基于网页链接分类的PageRank并行算法。首先,将网页按照网页所属网站分类,为来自不同站点的网页设置不同的权重;其次,利用Hadoop并行计算框架,结合MapReduce分而治之... 针对串行PageRank算法在处理海量网页数据时效率低下的问题,提出一种基于网页链接分类的PageRank并行算法。首先,将网页按照网页所属网站分类,为来自不同站点的网页设置不同的权重;其次,利用Hadoop并行计算框架,结合MapReduce分而治之的特点,并行计算网页排名;最后,采用一种包含3层:数据层、预处理层、计算层的数据压缩方法,对并行算法进行优化。实验结果表明,与串行PageRank算法相比,所提算法在最好情况下结果准确率提高了12%,计算效率提高了33%。 展开更多
关键词 链接分类 HADOOP PAGERANK MAPREDUCE 数据压缩
下载PDF
基于博客的链接分类体系设计 被引量:2
4
作者 孙建军 屈良 《情报科学》 CSSCI 北大核心 2012年第3期321-326,346,共7页
从链接动机入手,综合国内外学者们有关链接分类的研究,再结合图林博客网络自身的特点,总结出链接分类标准,并划分出了基于不同层次的链接类型,并以此构建了三级链接分类体系;利用层次分析方法确定体系中每个不同子类的不同权重,并对数... 从链接动机入手,综合国内外学者们有关链接分类的研究,再结合图林博客网络自身的特点,总结出链接分类标准,并划分出了基于不同层次的链接类型,并以此构建了三级链接分类体系;利用层次分析方法确定体系中每个不同子类的不同权重,并对数据结果作出分析。 展开更多
关键词 链接 链接分类 体系 链接类型
原文传递
社群网络中基于链接分类的研究与应用 被引量:1
5
作者 肖丁 万里 +1 位作者 吴斌 陈平 《广西师范大学学报(自然科学版)》 CAS 北大核心 2006年第4期155-158,共4页
由于在互联网、电信、生物信息、社会网络分析等领域可获得的链接丰富的数据日益增多,链接挖掘已经成为数据挖掘的研究热点。基于链接分类是链接挖掘的一个重要方向。在此以电信领域用户通话特征数据为对象,研究了基于链接分类技术及其... 由于在互联网、电信、生物信息、社会网络分析等领域可获得的链接丰富的数据日益增多,链接挖掘已经成为数据挖掘的研究热点。基于链接分类是链接挖掘的一个重要方向。在此以电信领域用户通话特征数据为对象,研究了基于链接分类技术及其在电信客户流失预测的应用方法,在提取并分析大规模客户呼叫图的极大团、结点膨胀率、结点聚集度等与节点稳定性相关的链接属性及其时变特征的基础上,提出了一种适合海量数据的基于链接的电信客户流失预测算法。实验结果表明,此算法较传统分类算法能提高客户流失预测性能,实现了基于链接分类方法的成功应用。 展开更多
关键词 社群网络分析 链接分类 极大团 膨胀率 聚集度
下载PDF
加权入链数:对链接分析中绝对入链数的修正 被引量:2
6
作者 孙建军 屈良 《情报科学》 CSSCI 北大核心 2012年第2期161-165,172,共6页
在研究中事先充分获取了图林博客圈所有博客首页的实际链接数据,并对这十几万条链接数据进行了详细统计和归类,为后面分析研究奠定了基础;利用链接分类体系对整理统计后的实际数据进行实际分类并计算它们各自的比例,提出了"加权入... 在研究中事先充分获取了图林博客圈所有博客首页的实际链接数据,并对这十几万条链接数据进行了详细统计和归类,为后面分析研究奠定了基础;利用链接分类体系对整理统计后的实际数据进行实际分类并计算它们各自的比例,提出了"加权入链数"的概念,以此来修正以往链接分析研究中所采用的绝对入链数;同时以图林博客为例,以两种不同的方式进行博客排名,最后分析测试结果。并通过统计工具SPSS进行假设检验,以验证两种排序结果的相关度,并给出相应结论。 展开更多
关键词 链接 链接分类 入链数 加权入链数
原文传递
基于文本内容的超链接分类研究 被引量:1
7
作者 陈丽 于浩 +1 位作者 郑德权 赵铁军 《哈尔滨商业大学学报(自然科学版)》 CAS 2004年第2期153-156,共4页
针对目前网页分类以及相关研究的问题,提出了基于文本内容的超链接分类思想,为下一步进行信息抽取、话题追踪等互联网信息应用研究做了更好的准备.通过对特定领域内应用两种分类方法对其进行对比研究,取得了较好的效果.
关键词 文本内容 链接 网页 互联网 链接分类
下载PDF
基于迁移成分分析的多层社交网络链接分类 被引量:2
8
作者 伍杰华 沈静 周蓓 《数据分析与知识发现》 CSSCI CSCD 北大核心 2018年第9期88-99,共12页
【目的】解决多层次社交网络链接分类算法无法有效获取各层次间子网络的关联信息,从而提高分类性能的问题。【方法】定义反映各子网络间关联的共性特征和反映各子网络自身属性结构的特性特征,提出一种基于迁移成分分析的多层次社交网络... 【目的】解决多层次社交网络链接分类算法无法有效获取各层次间子网络的关联信息,从而提高分类性能的问题。【方法】定义反映各子网络间关联的共性特征和反映各子网络自身属性结构的特性特征,提出一种基于迁移成分分析的多层次社交网络链接分类算法,获取反映层次间相互关联特征的组件,使得不同层次的子网络能够相互学习。【结果】通过在真实多层次数据集You Tube和Query Log上与基准分类算法、基于特征学习的分类算法和基准迁移分类算法进行比较,在AUC和ROC曲线的评价指标上有1.57%-33.2%的提升。【局限】未能处理超大规模的网络数据,同时尚未深入探讨特征定义的维度和性能之间的关系。【结论】本文方法能够有效地将迁移学习思想应用到多层次社交网络链接分类场景,为该类模型的研究提供一种新的方案。 展开更多
关键词 多层次网络 社交网络 链接分类 成分分析 迁移学习
原文传递
基于异构特征的符号社交网络关系分类 被引量:1
9
作者 伍杰华 朱岸青 《计算机应用与软件》 CSCD 2015年第12期42-45,58,共5页
符号社交网络关系分类是研究社交关系挖掘领域中一个崭新的研究方向。传统基于同构社交网络的关系分类模型在进行特征提取时,并未考虑符号社交网络中存在异构边(正、负边),提取特征需要代表网络的异构属性这一问题,同时也忽略了异构特... 符号社交网络关系分类是研究社交关系挖掘领域中一个崭新的研究方向。传统基于同构社交网络的关系分类模型在进行特征提取时,并未考虑符号社交网络中存在异构边(正、负边),提取特征需要代表网络的异构属性这一问题,同时也忽略了异构特征中所蕴含的社交平衡理论。针对以上不足,提出一种新颖的基于异构网络特征的关系分类模型,在特征提取方面主要通过引入朴素贝叶斯模型度量相邻异构关系的影响和结合社会化平衡理论形成的三角关系构建获得,并采用SVM等三类经典的有监督模型进行分类,验证特征的有效性。实验结果表明,改进后异构特征选择算法优化了特征的提取,显著提高了分类效果,从而证明了异构特征提取算法的有效性,为符号社会网络关系特征提取及关系分类提供一种新的思路。 展开更多
关键词 符号网络 社交网络 异构特征 链接分类 关系分类
下载PDF
多维相似度特征的社交网络链接分类 被引量:1
10
作者 伍杰华 沈静 周蓓 《小型微型计算机系统》 CSCD 北大核心 2017年第6期1323-1328,共6页
深入挖掘社交网络的特征信息对链接的分类具有重要作用.然而已有的特征均基于单维网络构建,忽视了社交网络的多维复杂性及特征之间的冗余信息问题.为解决此问题,提出一种基于RReliefF特征选择模型的多维社交网络链接分类算法.该方法首... 深入挖掘社交网络的特征信息对链接的分类具有重要作用.然而已有的特征均基于单维网络构建,忽视了社交网络的多维复杂性及特征之间的冗余信息问题.为解决此问题,提出一种基于RReliefF特征选择模型的多维社交网络链接分类算法.该方法首先在单维相似度特征模型的框架下给出维度关联因子的定义,然后通过改进基于加权传播的的相似度指标,构造多维特征相似度,最后引入RReliefF算法对特征进行选择,有效处理了特征间的冗余信息和噪音信息.在YouTube数据集的实验结果表明,引入的维度关联因子提高了特征的多维度属性,对多维特征信息分析和选择有助于筛选判别性的特征,提高链接分类的质量,验证该方法的有效性. 展开更多
关键词 社交网络 多维网络 关系分类 链接分类 特征选择 RRelief F算法
下载PDF
一种双重特征选择的不平衡复杂网络链接分类模型
11
作者 伍杰华 徐宏 《计算机应用研究》 CSCD 北大核心 2018年第1期88-92,共5页
基于有监督学习思想的链接分类是复杂网络分析领域的主要研究问题,该思想的核心在于把网络分成训练网络和目标网络,通过分类模型学习训练集合并对目标集合进行预测。然而在复杂网络链接分类这一场景中,正类别样本和负类别样本的分布是... 基于有监督学习思想的链接分类是复杂网络分析领域的主要研究问题,该思想的核心在于把网络分成训练网络和目标网络,通过分类模型学习训练集合并对目标集合进行预测。然而在复杂网络链接分类这一场景中,正类别样本和负类别样本的分布是不平衡的,特征之间会存在冗余信息,这一现象往往制约着分类性能的有效提升。针对该问题,提出了一种双重特征选择的分类模型。该方法借助Relief赋予特征权重并使用K-means聚类算法对不平衡样本进行采样,解决数据不平衡问题,然后引入极小冗余—极大相关(mRMR)衡量特征与特征之间和特征与类别之间的相关性,同时最大限度地减少冗余。在多个真实复杂网络数据集上的实验结果表明,相较于目前主流的链接分类模型,该方法能够明显地提升分类的性能。 展开更多
关键词 链接分类 RELIEF K-均值 特征选择 mRMR 不平衡问题
下载PDF
基于深度LSTM的端到端的语音识别 被引量:14
12
作者 张瑞珍 韩跃平 张晓通 《中北大学学报(自然科学版)》 CAS 2020年第3期244-248,共5页
基于长短时记忆(LSTM)神经网络在语音识别方面的良好性能,本文引入了一种新的深度LSTM方法.该方法利用深度控制门控函数连接多层LSTM单元,在循环神经网络中引入了上下层之间的线性相关性,可以更深层地构建语音模型.同时利用链接时序分... 基于长短时记忆(LSTM)神经网络在语音识别方面的良好性能,本文引入了一种新的深度LSTM方法.该方法利用深度控制门控函数连接多层LSTM单元,在循环神经网络中引入了上下层之间的线性相关性,可以更深层地构建语音模型.同时利用链接时序分类的训练准则进行模型训练,搭建端到端语音识别系统,解决了隐马尔可夫模型需要将标签和序列强制对齐的问题.实验表明,深度LSTM可以提高语音建模的性能,相比使用标准LSTM的模型,在准确率方面提高约4%. 展开更多
关键词 语音识别 深度LSTM 链接时序分类 端到端
下载PDF
基于门控卷积网络与CTC的端到端语音识别 被引量:14
13
作者 杨德举 马良荔 +1 位作者 谭琳珊 裴晶晶 《计算机工程与设计》 北大核心 2020年第9期2650-2654,共5页
针对传统声学模型存在模型组件复杂且不能统一进行训练,数据必须进行预对齐的问题,提出基于一维门控卷积神经网络与CTC的中文端到端语音识别模型。通过堆叠多层一维卷积神经网络进行声学建模,提取包含上下文信息的高层抽象特征,融合门... 针对传统声学模型存在模型组件复杂且不能统一进行训练,数据必须进行预对齐的问题,提出基于一维门控卷积神经网络与CTC的中文端到端语音识别模型。通过堆叠多层一维卷积神经网络进行声学建模,提取包含上下文信息的高层抽象特征,融合门控线性单元减少梯度弥散,利用CTC算法实现以汉字字符作为建模基元的端到端训练和解码。在公开数据集上的实验结果表明,与基线模型相比,该模型语音识别性能有明显提升,字错误率降低了3.3%以上。 展开更多
关键词 语音识别 端到端 卷积神经网络 门控线性单元 链接时序分类
下载PDF
基于端到端技术的藏语语音识别 被引量:8
14
作者 王庆楠 郭武 解传栋 《模式识别与人工智能》 EI CSCD 北大核心 2017年第4期359-364,共6页
现阶段基于链接时序分类技术的端到端的大规模连续语音识别成为研究热点,文中将其应用于藏语识别中,取得优于主流的双向长短时记忆网络性能.在基于端到端的语音识别中,不需要发音字典等语言学知识,识别性能无法得到保证.文中提出将已有... 现阶段基于链接时序分类技术的端到端的大规模连续语音识别成为研究热点,文中将其应用于藏语识别中,取得优于主流的双向长短时记忆网络性能.在基于端到端的语音识别中,不需要发音字典等语言学知识,识别性能无法得到保证.文中提出将已有的语言学知识结合至端到端的声学建模中,采用绑定的三音子作为建模单元,解决建模单元的稀疏性问题,大幅提高声学建模的区分度和鲁棒性.在藏语测试集上,通过实验证明文中方法提高基于链接时序分类技术的声学模型的识别率,并验证语言学知识和基于端到端声学建模技术结合的有效性. 展开更多
关键词 端到端 藏语 自动语音识别 链接时序分类
下载PDF
基于DFCNN-CTC端到端的藏族学生普通话发音偏误检测 被引量:8
15
作者 甘振业 周世华 +1 位作者 曾浩 杨鸿武 《西北师范大学学报(自然科学版)》 CAS 北大核心 2020年第5期49-53,108,共6页
计算机辅助语音训练系统需要检测非母语者的错误发音,并提供详细的指导性反馈,有助于第二语言学习者更有效地提高发音水平.利用深度全序列卷积神经网络(Deep full convolutional neural network,DFCNN)和链接时序分类(Connectionist tem... 计算机辅助语音训练系统需要检测非母语者的错误发音,并提供详细的指导性反馈,有助于第二语言学习者更有效地提高发音水平.利用深度全序列卷积神经网络(Deep full convolutional neural network,DFCNN)和链接时序分类(Connectionist temporal classification,CTC)技术,建立了一种用于发音偏误检测和诊断任务的端到端语音识别方法.该方法不需要音位信息,也不需要强制对齐,以扩展声韵母为偏误基元,设计了64种偏误类型.实验结果表明,该方法能够有效地检测出错误发音,检测正确率为87.07%,错误拒绝率为7.83%,错误接收率为25.97%. 展开更多
关键词 发音偏误检测 卷积神经网络 链接时序分类 端到端
下载PDF
基于改进混合CTC/attention架构的端到端普通话语音识别 被引量:6
16
作者 杨鸿武 周刚 《西北师范大学学报(自然科学版)》 CAS 北大核心 2019年第3期48-53,共6页
端到端的语音识别通过用单个深度网络架构表示复杂模块,减少了构建语音识别系统的难度.文中对传统的混合链接时序分类(Connectionist temporal classification, CTC)模型和基于注意力机制(Attention-based)模型的端到端语音识别架构进... 端到端的语音识别通过用单个深度网络架构表示复杂模块,减少了构建语音识别系统的难度.文中对传统的混合链接时序分类(Connectionist temporal classification, CTC)模型和基于注意力机制(Attention-based)模型的端到端语音识别架构进行了改进,通过引入动态调整参数对CTC模型和基于注意力机制模型进行线性插值,从而实现混合架构的端到端语音识别.将改进后的方法应用在中文普通话语音识别中,选择带投影层的双向长短时记忆网络(Bidirectional long short-term memory projection, BLSTMP)作为编码器网络模型,声学特征选取80维的梅尔尺度滤波器组系数和基频共83维特征.实验结果表明,与传统的端到端语音识别方法比较,文中方法在普通话语音识别上能够降低3.8%的词错误率. 展开更多
关键词 语音识别 链接时序分类 注意力机制 混合CTC/attention 端到端系统
下载PDF
基于不同单元的端到端语音识别
17
作者 张岩 艾斯卡尔·艾木都拉 米吉提·阿不里米提 《中文信息学报》 CSCD 北大核心 2024年第1期166-172,共7页
端到端语音识别技术不需要文本和语音序列的强制对齐过程,且比传统语音识别系统有着更为简单直观的结构和更好的适应能力,它不需要精准的发音词典,在资源匮乏语言的语音识别研究中有更好的发展前景。该文在循环神经网络(RNN)和链接时序... 端到端语音识别技术不需要文本和语音序列的强制对齐过程,且比传统语音识别系统有着更为简单直观的结构和更好的适应能力,它不需要精准的发音词典,在资源匮乏语言的语音识别研究中有更好的发展前景。该文在循环神经网络(RNN)和链接时序分类(CTC)的基础上,实现维吾尔语不同粒度的端到端的语音识别系统,且在较少的语料库(THUYG公开语料库)上将该方法和传统的HMM语音识别框架进行比较。单音素基础上端到端方法的表现超过传统HMM-GMM框架,CER下降10.6%,而且经过稍微减少冗余后的以单字符作为建模单元的端到端语音识别系统对比基于三音素的HMM-GMM系统CER下降2.23%。对于资源匮乏语言,粒度单元的优化方法将是提高性能的下一个研究目标。 展开更多
关键词 端到端技术 语音识别 维吾尔语 链接时序分类
下载PDF
基于注意力多分支卷积和Transformer的手写文本识别
18
作者 郑晓旭 舒珊珊 文成玉 《成都信息工程大学学报》 2023年第6期649-655,共7页
手写体识别技术作为自动阅卷的关键一环受到广泛研究。针对中文手写文本字迹复杂的问题,提出一种文本定位和识别的手写汉字文本识别方法。在文本定位信息中使用透视变化纠正倾斜的文本,特征提取阶段使用注意力多分支卷积层提取文本图像... 手写体识别技术作为自动阅卷的关键一环受到广泛研究。针对中文手写文本字迹复杂的问题,提出一种文本定位和识别的手写汉字文本识别方法。在文本定位信息中使用透视变化纠正倾斜的文本,特征提取阶段使用注意力多分支卷积层提取文本图像关键区域特征以及多尺度特征融合,语义提取阶段通过时间卷积网络和Transformer编码器构建序列信息和建模上下文语义信息,最后以链接时序分类函数,实现序列特征和字符序列标签对齐。所提方法在公开数据集CASIA-HWDB上进行实验,结果表明,注意力分支卷积层和语义提取层有效提升算法性能,证明所提方法的可行性。 展开更多
关键词 手写文本识别 TRANSFORMER 注意力机制 链接时序分类
下载PDF
基于链接的Web网页分类 被引量:3
19
作者 郭景峰 张健 邹晓红 《计算机应用研究》 CSCD 北大核心 2008年第11期3271-3274,共4页
基于链接的特点,提出了获取链接信息的模型,将得到的链接信息结合对象本身的属性来共同训练分类规则。针对网页链接的特殊性,对链接有向图重新建模。实验证明链接信息的加入可以有效地改善分类的结果,链接有向图的重新建模同样提高了分... 基于链接的特点,提出了获取链接信息的模型,将得到的链接信息结合对象本身的属性来共同训练分类规则。针对网页链接的特殊性,对链接有向图重新建模。实验证明链接信息的加入可以有效地改善分类的结果,链接有向图的重新建模同样提高了分类的准确性。 展开更多
关键词 链接挖掘 基于链接分类 逻辑回归模型
下载PDF
基于链接时序分类的日语语音识别 被引量:3
20
作者 孙健 郭武 《小型微型计算机系统》 CSCD 北大核心 2018年第10期2129-2133,共5页
目前,端到端的语音识别系统因其简洁性和高效性成为大规模连续语音识别的发展趋势.本文将基于链接时序分类的端到端技术应用到日语语音识别上,考虑到日语中平假名、片假名和日语汉字多种书写形式的特性,通过在日语数据集上的实验,探讨... 目前,端到端的语音识别系统因其简洁性和高效性成为大规模连续语音识别的发展趋势.本文将基于链接时序分类的端到端技术应用到日语语音识别上,考虑到日语中平假名、片假名和日语汉字多种书写形式的特性,通过在日语数据集上的实验,探讨了不同建模单元对识别性能的影响;进一步将音素信息应用到模型的初始网络训练中,改善语音识别系统性能,最终效果优于基于隐马尔可夫模型和双向长短时记忆网络的主流语音识别系统. 展开更多
关键词 语音识别 日语 链接时序分类 端到端
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部