期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
智能变电站继电保护智能运维系统自动配置技术研究 被引量:38
1
作者 许尧 马欢 +3 位作者 许旵鹏 于和林 杨经超 毛玉荣 《电力系统保护与控制》 EI CSCD 北大核心 2022年第11期160-168,共9页
为提高继电保护智能运维信息采集配置的效率及正确性,提出一种基于知识图谱的智能运维系统信息采集自动配置技术。基于继电保护相关规范建立继电保护装置数据输出端口的标准化模型,依据专家知识按照IED类型建立智能运维系统信息采集点... 为提高继电保护智能运维信息采集配置的效率及正确性,提出一种基于知识图谱的智能运维系统信息采集自动配置技术。基于继电保护相关规范建立继电保护装置数据输出端口的标准化模型,依据专家知识按照IED类型建立智能运维系统信息采集点与继电保护装置标准化数据输出端口的关联关系,形成智能运维系统信息采集配置知识图谱本体。结合智能运维系统的历史配置数据进行知识学习,建立智能运维系统信息采集配置知识图谱。基于二次设备数据输出端口地址信息与继电保护装置数据输出端口的标准化模型的相似性计算,自动将二次设备数据输出端口地址匹配到标准信息端口地址实现知识融合,并引入CBOW模型增强语义理解,提高实体相似性算法的精度。实例验证结果表明,基于知识图谱的智能运维系统信息采集自动配置技术可有效提高智能运维系统配置效率,保证配置的正确性。 展开更多
关键词 智能运维 信息采集 自动配置 知识图谱 编辑距离 cbow模型
下载PDF
中文领域情感词典自适应学习方法 被引量:13
2
作者 叶霞 曹军博 +2 位作者 许飞翔 郭鸿燕 尹列东 《计算机工程与设计》 北大核心 2020年第8期2231-2237,共7页
针对领域情感词典的局限性,提出一种中文领域情感词典自适应学习方法。从中文基础情感词典中选取少量种子词,采用基于CBOW模型和基于句法规则两种抽取方法,对领域语料库进行候选情感词的抽取,通过改进的SO_PMI算法对得到的候选情感词进... 针对领域情感词典的局限性,提出一种中文领域情感词典自适应学习方法。从中文基础情感词典中选取少量种子词,采用基于CBOW模型和基于句法规则两种抽取方法,对领域语料库进行候选情感词的抽取,通过改进的SO_PMI算法对得到的候选情感词进行情感极性判定,形成领域正负情感词典。实验结果表明,该方法能够自适应生成领域情感词典,情感词识别准确率较高,该模型在中文情感分析应用中取得了较好的效果。 展开更多
关键词 情感分析 领域情感词典 情感极性 cbow连续词袋模型 PMI算法
下载PDF
基于Item2Vec负采样优化的专题地图产品个性化推荐方法研究 被引量:6
3
作者 毛文山 赵红莉 +3 位作者 孙凤娇 蒋云钟 姜倩 朱彦儒 《地球信息科学学报》 CSCD 北大核心 2020年第11期2128-2139,共12页
建立适用于专题地图产品检索的用户偏好推荐模型是提高专题地图质量的有效方式之一,在专题地图产品推荐场景中,存在严重的内容冷启动和评论数据稀疏问题,现有的推荐算法无法为特定类用户推荐不同特征的专题地图产品,导致用户从专题地图... 建立适用于专题地图产品检索的用户偏好推荐模型是提高专题地图质量的有效方式之一,在专题地图产品推荐场景中,存在严重的内容冷启动和评论数据稀疏问题,现有的推荐算法无法为特定类用户推荐不同特征的专题地图产品,导致用户从专题地图中获取偏好信息受到限制。因此,本文构建基于负采样的连续词袋模型和基于Word2Vec的Item2Vec相结合的用户偏好推荐方法,用于专题地图产品推荐。①计算用户行为日志文件中交互行为数据的隐性评分,以代替专题地图推荐信息流场景中稀疏的用户评论数据;②基于负采样的连续词袋模型提取目标专题地图的前后地图序列感知特征信息,通过控制正负样本比例为1:2,提升目标专题地图潜在评分的预测精度;③通过Item2Vec将带有用户行为特征信息的专题地图映射到向量空间,计算用户对专题地图的相似度矩阵,根据用户偏好程度完成推荐。在构建的专题地图评分实验数据集Thematic CMaps和4个公开验证数据集MovieLens上的测试结果表明:与LFM、Personal Rank、Content Based和SVD 4种传统推荐算法相比,本文所提方法可有效提高潜在评分的预测精度,推荐性能最高达到27.85%;与以霍夫曼采样方式的Item2Vec基础方法和YouTubeNet 2种神经网络推荐算法相比,评分预测精度有一定提高,且推荐性能不断提升,最高达到2.97%和5.78%。以经典算法奇异值分解(SVD)为例,将MovieLens-20M数据集切分后,在数据量不断增大的数据子集中,本文所用方法的评分预测精度和性能均优于SVD方法。 展开更多
关键词 地图个性化推荐 专题地图产品检索 深度学习 负采样 Item2Vec cbow模型 用户事件行为 隐性评分
原文传递
蒙古语词向量评测研究 被引量:1
4
作者 乌云塔那 王斯日古楞 《广西科学院学报》 2018年第1期68-71,共4页
词向量具有良好的语义特性,可用于改善和简化许多自然语言信息处理应用。本研究利用CBOW和Skip-gram两种模型架构在不同数据和不同维度下训练蒙古语词向量,然后结合蒙古语特征设计一个语义语法综合测试集,并在此测试集上用语义和语法相... 词向量具有良好的语义特性,可用于改善和简化许多自然语言信息处理应用。本研究利用CBOW和Skip-gram两种模型架构在不同数据和不同维度下训练蒙古语词向量,然后结合蒙古语特征设计一个语义语法综合测试集,并在此测试集上用语义和语法相似度来评测词向量质量。研究结果表明,蒙古语语义和语法相似性任务上,Skip-gram模型优于CBOW模型,Skip-gram模型的窗口大小为5的情况下,词向量质量最好,且随着词向量维度或训练数据的增大,词向量质量有明显的提高。 展开更多
关键词 词向量 cbow模型 Skip-gram模型 词向量质量 语义语法相似度
下载PDF
基于深度学习的甲骨文分类算法研究 被引量:1
5
作者 涂淳宁 王贵 +2 位作者 田吉 李汇嘉 李婷 《现代计算机》 2021年第26期67-72,共6页
传统的甲骨文识别由学者人工识别效率较低。为对未识别甲骨文字符进行预测,基于深度学习对甲骨文图像及语料进行研究。按照造字“六书”原则对字符图像分类,图像分类基于迁移学习及InceptionV3模型,实验综合分类准确度为77.3%。基于CBO... 传统的甲骨文识别由学者人工识别效率较低。为对未识别甲骨文字符进行预测,基于深度学习对甲骨文图像及语料进行研究。按照造字“六书”原则对字符图像分类,图像分类基于迁移学习及InceptionV3模型,实验综合分类准确度为77.3%。基于CBOW模型进行甲骨文语料分析,即利用语料特征词的前后两个词对特征词作预测并计算词向量间的余弦距离得到特征词的相似词。将图像与语料预测结果结合后根据数据库中的字符属性对未识别字符的词性及其它特征作预测。 展开更多
关键词 甲骨文 深度学习 图像分类 cbow模型
下载PDF
基于深度学习LSTM算法的社会网络的舆情监测 被引量:1
6
作者 王民昆 王浩 苏博 《现代计算机》 2020年第33期20-24,共5页
互联网正在成为舆论的传播平台。重要的是要尽可能准确地模拟互联网舆论活动。对谣言、假新闻、误导的信息与不正确的信息等网络舆情的监测,是解决当今网络安全问题的关键,因为上述信息的传播可能会对我们的社会稳定发展产生严重的后果... 互联网正在成为舆论的传播平台。重要的是要尽可能准确地模拟互联网舆论活动。对谣言、假新闻、误导的信息与不正确的信息等网络舆情的监测,是解决当今网络安全问题的关键,因为上述信息的传播可能会对我们的社会稳定发展产生严重的后果。为了解决该问题,提出一种基于LSTM(长短期记忆)的深度学习的社会网络舆情监测。该模型使用Word2Vec算法中的CBOW模型,该模型能将单词序列转换为向量序列,然后将向量序列输入到LSTM模型中。最后,在LSTM模型的最后一个时间输出的预测类作为舆情监测的判断依据。实验结果表明,本文在舆情监测上提出的模型在精准度、召回率和F1分数等方面优于其他先进的网络舆情监测方法。本文方法的准确率较本实验中表现最好的方法提升10%,且时效性大大增加。 展开更多
关键词 舆情监测 长短期记忆 Word2Vec cbow模型 向量序列 深度学习
下载PDF
基于元路径加权融合的异构网络相似性度量
7
作者 赵宇红 薛维佳 《计算机工程与设计》 北大核心 2021年第2期309-315,共7页
针对PathSim算法只能度量异构网络同类节点和预设元路径的问题,提出可度量任意类型节点的加权融合元路径的相似性度量算法Multi-WPathSim。基于随机游走与CBOW模型进行元路径的表示学习,获得路径集合及权重,在元路径融合算法的基础上进... 针对PathSim算法只能度量异构网络同类节点和预设元路径的问题,提出可度量任意类型节点的加权融合元路径的相似性度量算法Multi-WPathSim。基于随机游走与CBOW模型进行元路径的表示学习,获得路径集合及权重,在元路径融合算法的基础上进行相似性度量,解决PathSim算法需要预设元路径的不足,通过双向游走克服PathSim算法只能度量同类节点相似性的局限性。在真实数据集中进行Top-K查询、相似性度量和聚类实验对比,Multi-WPathSim算法在对称和非对称元路径上,相似度准确率和聚类精度都有明显提升。 展开更多
关键词 异构信息网络 元路径 相似性度量 cbow模型 PathSim算法
下载PDF
基于社交网络分析的学生异常轨迹检测方法研究
8
作者 梁庆伟 马健 林泽东 《信息与电脑》 2021年第10期30-33,共4页
随着智能终端的普及,校园网已成为一个庞大的信息承载体,包含了高校学生的各种行为轨迹,也能够准确反映出学生的日程行为规律。在这样的背景下,笔者以校园大数据为核心,首先构建每个学生的轨迹序列,利用CBOW(Continuous Bag-of-Word Mod... 随着智能终端的普及,校园网已成为一个庞大的信息承载体,包含了高校学生的各种行为轨迹,也能够准确反映出学生的日程行为规律。在这样的背景下,笔者以校园大数据为核心,首先构建每个学生的轨迹序列,利用CBOW(Continuous Bag-of-Word Model)模型得到学生轨迹向量,使用Louvain算法搭建社交网络,在此基础上构建基于社交网络分析的学生异常轨迹监测预警方法。实验结果表明,本文提出的方法能有效检测出异常的学生轨迹。 展开更多
关键词 社交网络 cbow模型 Louvain算法 轨迹检测
下载PDF
改进词向量和kNN的中文文本分类算法 被引量:8
9
作者 丁正生 马春洁 《现代电子技术》 2022年第1期100-103,共4页
为提高中文文本分类的效率和准确率,针对汉字象形字的特点和数据量剧增的大数据背景,建立基于深度学习的中文文本分类算法。首先根据汉字子字符(字形、偏旁、笔画等)象形字即形状自带含义的特点,建立基于子字符和上下文特征的双通道CBO... 为提高中文文本分类的效率和准确率,针对汉字象形字的特点和数据量剧增的大数据背景,建立基于深度学习的中文文本分类算法。首先根据汉字子字符(字形、偏旁、笔画等)象形字即形状自带含义的特点,建立基于子字符和上下文特征的双通道CBOW模型实现中文文本向量化;其次基于大数据的背景,针对传统的kNN算法分类速度慢的缺点,提出一种基于LSC聚类和多目标数据筛选的快速kNN分类算法;最后运用快速kNN算法对文本数据转化的特征词向量数据进行分类。实验结果表明,改进后的中文文本分类算法增加了算法的使用范围,能够更精确地处理中文文本数据,更快地处理大数据问题,在分类速率和效果上都有一定程度的提升。 展开更多
关键词 中文文本分类 文本向量化 快速kNN算法 词向量 双通道cbow模型 特征向量 数据分类
下载PDF
中文微博情感分析模型SR-CBOW 被引量:4
10
作者 刘秋慧 柴玉梅 刘箴 《小型微型计算机系统》 CSCD 北大核心 2018年第8期1693-1699,共7页
中文微博情感分析旨在挖掘文本中用户所要表达的观点及情感倾向,被应用于政治、商业等诸多领域.考虑到微博数据的口语化和不规范性等特点以及中文标注数据相对匮乏的现状,对词向量训练模型CBOW进行拓展,提出情感分析模型SR-CBOW.首先利... 中文微博情感分析旨在挖掘文本中用户所要表达的观点及情感倾向,被应用于政治、商业等诸多领域.考虑到微博数据的口语化和不规范性等特点以及中文标注数据相对匮乏的现状,对词向量训练模型CBOW进行拓展,提出情感分析模型SR-CBOW.首先利用基于语义相似度的数据平衡方法来均衡数据集;然后采用否定扩散的手段,协助模型对包含否定词的微博进行情感转移;最后模型利用大量无标注的微博语料进行无监督的词向量训练;同时对构建的微博的向量表示进行情感分类.在细粒度的情绪识别和粗粒度的情感倾向性分析中,都取得了较好的结果,较于NLP&CC2013情绪识别评测任务中最好的结果,其微平均F值提高了14.9%. 展开更多
关键词 情感分析 SR-cbow模型 数据平衡 否定扩散
下载PDF
改进的CBOW情感信息获取研究 被引量:6
11
作者 曹军博 叶霞 +1 位作者 许飞翔 尹列东 《计算机工程与应用》 CSCD 北大核心 2020年第9期142-147,共6页
大数据时代,文本的情感倾向对于文本潜在价值挖掘具有重要意义,然而人工方法很难有效挖掘网络上评论文本的潜在价值,随着计算机技术的快速发展,这一问题得到了有效解决。在文本情感分析中,获取词语的情感信息对于情感分析至关重要,词向... 大数据时代,文本的情感倾向对于文本潜在价值挖掘具有重要意义,然而人工方法很难有效挖掘网络上评论文本的潜在价值,随着计算机技术的快速发展,这一问题得到了有效解决。在文本情感分析中,获取词语的情感信息对于情感分析至关重要,词向量方法一般仅对词语的语法语义进行建模,但是忽略了词语的情感信息,无法更好地进行情感分析。通过TF-IDF算法模型获得赋权矩阵,构建停用词表,同时根据赋权矩阵生成Huffman树作为改进的CBOW算法的输入,引入情感词典生成情感标签辅助词向量生成,使词向量具有情感信息。实验结果表明,提出的方法对评论文本中获得的词向量能够较好地表达情感信息,情感分类结果优于传统模型。因此,该模型在评论文本情感分析中可以有效提升文本情感分类效果。 展开更多
关键词 词向量 cbow模型 TF-IDF模型 情感分析
下载PDF
Improved Dota2 Lineup Recommendation Model Based on a Bidirectional LSTM 被引量:7
12
作者 Lei Zhang Chenbo Xu +3 位作者 Yihua Gao Yi Han Xiaojiang Du Zhihong Tian 《Tsinghua Science and Technology》 SCIE EI CAS CSCD 2020年第6期712-720,共9页
In recent years,e-sports has rapidly developed,and the industry has produced large amounts of data with specifications,and these data are easily to be obtained.Due to the above characteristics,data mining and deep lea... In recent years,e-sports has rapidly developed,and the industry has produced large amounts of data with specifications,and these data are easily to be obtained.Due to the above characteristics,data mining and deep learning methods can be used to guide players and develop appropriate strategies to win games.As one of the world’s most famous e-sports events,Dota2 has a large audience base and a good game system.A victory in a game is often associated with a hero’s match,and players are often unable to pick the best lineup to compete.To solve this problem,in this paper,we present an improved bidirectional Long Short-Term Memory(LSTM)neural network model for Dota2 lineup recommendations.The model uses the Continuous Bag Of Words(CBOW)model in the Word2 vec model to generate hero vectors.The CBOW model can predict the context of a word in a sentence.Accordingly,a word is transformed into a hero,a sentence into a lineup,and a word vector into a hero vector,the model applied in this article recommends the last hero according to the first four heroes selected first,thereby solving a series of recommendation problems. 展开更多
关键词 Word2vec mutiplayer online battle arena games Continuous Bag Of Words(cbow)model Long Short-Term Memory(LSTM)
原文传递
基于在线文本情感分析的“唐文化”目的地形象挖掘研究 被引量:1
13
作者 张成元 刘云珂 +2 位作者 赵炳清 柴建 姜福鑫 《计量经济学报》 CSCD 2023年第2期387-407,共21页
如何挖掘历史文化资源促进精准营销以高效吸引游客,是我国诸多文化旅游资源富集的景区亟需解决的问题.本文以西安“唐文化”旅游目的地形象挖掘为研究对象,通过15,683条在线文本评论的高频词提取、语义网络分析、主题词挖掘和情感分析,... 如何挖掘历史文化资源促进精准营销以高效吸引游客,是我国诸多文化旅游资源富集的景区亟需解决的问题.本文以西安“唐文化”旅游目的地形象挖掘为研究对象,通过15,683条在线文本评论的高频词提取、语义网络分析、主题词挖掘和情感分析,识别出消费者“唐文化”目的地形象的关注点.研究结果表明,首先,前100个高频词可分为遗产资源、旅游活动和游客情绪三类;其次,游客较为关注西安著名景区、建筑、文化及“大唐盛世”文化氛围;再次,通过文本评论情感分析获取负面情感高频词,并挖掘负面评论出现的原因;最后,通过隐含狄利克雷分布(latent Dirichlet allocation,LDA)模型确定评论主题,同时,利用K近邻算法验证LDA主题分类.本文的研究结果可为西安市旅游目的地形象改进和潜在“唐文化”旅游创意策划提供有力支撑,同时也可为其他历史文化名城提高旅游吸引力提供借鉴. 展开更多
关键词 文本挖掘 情感分析 连续词袋(cbow)模型 隐含狄利克雷分布(LDA)模型
原文传递
基于CBOW-LDA主题模型的Stack Overflow编程网站热点主题发现研究 被引量:4
14
作者 张景 朱国宾 《计算机科学》 CSCD 北大核心 2018年第4期208-214,共7页
Stack Overflow是一个热门的国外编程问答网站,通过对该网站编程提问帖的问题文本进行文本语义挖掘,能获析用户关注的编程热点。由于研究对象所代表的短文本信息具有高维性及分布不均的特点,易导致主题获取不明晰。文中提出一种基于LDA(... Stack Overflow是一个热门的国外编程问答网站,通过对该网站编程提问帖的问题文本进行文本语义挖掘,能获析用户关注的编程热点。由于研究对象所代表的短文本信息具有高维性及分布不均的特点,易导致主题获取不明晰。文中提出一种基于LDA(Latent Dirichlet Allocation)主题模型的CBOW-LDA建模方法,该方法对目标语料进行相似词聚类后再完成主题建模,能有效降低文本输入维度,使主题分布更明确。采集Stack Overflow网站上2010-2015年的问题帖数据集POST,并对其进行实验,同等主题数下采用文本建模中衡量模型性能的评价指标困惑度(Perplexity)来度量算法在不同数据集容量维度下的性能。结果表明,与现有的基于词频权重的词量化主题建模TFLDA方法相比,CBOW-LDA方法的困惑度更低,在实验语料下的困惑度降低约4.87%,证明了所提算法的性能更好。采用CBOW-LDA方法对Stack Overflow进行热点挖掘,同时使用TF-LDA方法进行对比实验,建立手工标注的标准评测集对两种方法获取的热门主题和热搜词汇进行查全率、查准率及F1值的判定,结果证实CBOW-LDA表现更佳,其热点挖掘效果较好。由实验结果可知,Java为该编程网站提问帖中最热门的主题,而C和Javascript则为该网站用户提问中被提及得最频繁的词汇。 展开更多
关键词 STACK OVERFLOW LDA-cbow语言模型 主题发现 热门主题 困惑度
下载PDF
word2vec基础上的配电网恶意控制指令检测
15
作者 李静 戴越 《单片机与嵌入式系统应用》 2019年第10期22-24,36,共4页
提出了一种根据上下文数据关系建立的word2vec算法。针对大量访问数据来建立白名单模型,通过对配电网上下文测量信息和控制信息的挖掘和数据驱动实现恶意控制指令的快速检测,获得白名单模型中的不符合项作为异常。利用孤立森林算法建立... 提出了一种根据上下文数据关系建立的word2vec算法。针对大量访问数据来建立白名单模型,通过对配电网上下文测量信息和控制信息的挖掘和数据驱动实现恶意控制指令的快速检测,获得白名单模型中的不符合项作为异常。利用孤立森林算法建立上下文关系的孤立树,从而实现对各测试样本的分类和训练,采用CBOW神经网络模型将中心词汇后验概率作为输出层,获得不同样本集下的监测精确度和准确率。最后在建立的配电网仿真平台上对word2vec进行了数据挖掘和计算,验证了算法具有高准确率和低误警率。 展开更多
关键词 word2vec 配电网 恶意控制指令 cbow神经网络模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部