期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
融合单词贡献度与Word2Vec词向量的文档表示 被引量:15
1
作者 谷雨 +1 位作者 张震 耿小航 《计算机工程》 CAS CSCD 北大核心 2021年第4期62-67,共6页
针对现有文档向量表示方法受噪声词语影响和重要词语语义不完整的问题,通过融合单词贡献度与Word2Vec词向量提出一种新的文档表示方法。应用数据集训练Word2Vec模型,计算数据集中词语的贡献度,同时设置贡献度阈值,提取贡献度大于该阈值... 针对现有文档向量表示方法受噪声词语影响和重要词语语义不完整的问题,通过融合单词贡献度与Word2Vec词向量提出一种新的文档表示方法。应用数据集训练Word2Vec模型,计算数据集中词语的贡献度,同时设置贡献度阈值,提取贡献度大于该阈值的单词构建单词集合。在此基础上,寻找文档与集合中共同存在的单词,获取其词向量并融合单词贡献度生成文档向量。实验结果表明,该方法在搜狗中文文本语料库和复旦大学中文文本分类语料库上分类的平均准确率、召回率和F1值均优于TF-IDF、均值Word2Vec、PTF-IDF加权Word2Vec模型等传统方法,同时其对英文文本也能进行有效分类。 展开更多
关键词 单词贡献度 Word2Vec词向量 词嵌入 文档表示 文本分类
下载PDF
基于LDA-TF-IDF和Word2vec文档表示 被引量:2
2
作者 王少泫 +1 位作者 陆正球 李兴远 《浙江纺织服装职业技术学院学报》 2023年第2期91-96,共6页
针对自然语言处理中传统文档表示方法上下文语义信息不全,干扰词多等问题,提出了一种基于LDA-TFIDF和Word2vec的文档表示方法。首先对数据集进行分词、去停用词等预处理;其次,利用LDA主题模型和TF-IDF抽取文档中具有表征性的特征词,并... 针对自然语言处理中传统文档表示方法上下文语义信息不全,干扰词多等问题,提出了一种基于LDA-TFIDF和Word2vec的文档表示方法。首先对数据集进行分词、去停用词等预处理;其次,利用LDA主题模型和TF-IDF抽取文档中具有表征性的特征词,并计算对应权重;最后,应用数据集训练Word2vec模型获取词向量,并将抽取的特征词权重融入Word2vec词向量构建文档语义向量。通过分类任务对该方法进行验证,实验结果表明,与已有方法相比该方法在垃圾短信数据集上表现效果更佳,验证了方法的有效性。 展开更多
关键词 LDA主题模型 TF-IDF word2vec 文档表示
下载PDF
探讨大数据下云计算的人工智能创新 被引量:1
3
作者 王少泫 《数字技术与应用》 2023年第4期46-48,共3页
近些年大数据、云计算和人工智能不断发展,显著改变了社会发展模式,并且获得科技企业的重视,在各个领域广泛利用,同时成为整个行业的发展趋势。在这一背景下,很多行业和项目希望通过大数据实现云计算的人工智能创新,进一步提高整体生产... 近些年大数据、云计算和人工智能不断发展,显著改变了社会发展模式,并且获得科技企业的重视,在各个领域广泛利用,同时成为整个行业的发展趋势。在这一背景下,很多行业和项目希望通过大数据实现云计算的人工智能创新,进一步提高整体生产效率。在信息改革的背景下,大数据更是和人们的生活工作密不可分,一些企业利用大数据充分挖掘用户的需求,从而可以推动企业和平台的可持续发展,并且可以提高企业的运行效率和竞争力。本文分析了大数据下云计算的人工智能创新,对于实际研究提供参考作用,以期推动行业健康发展。大数据时代,人们的生活方式发生了显著改变. 展开更多
关键词 人工智能 大数据 云计算 社会发展模式 可持续发展 发展趋势 行业健康发展 运行效率
下载PDF
融合语义与事件特征的重大事件趋势预测 被引量:4
4
作者 博远 冬亮 +1 位作者 谷雨 《计算机工程与应用》 CSCD 北大核心 2020年第17期173-180,共8页
针对当前基于海量公开新闻数据的重大事件趋势预测研究在特征选择上的局限性问题,结合人工智能相关技术对现有方法进行优化改进,提出一种融合语义与事件特征的重大事件趋势预测方法。利用网络爬虫技术辅助数据采集;利用主题模型与事件... 针对当前基于海量公开新闻数据的重大事件趋势预测研究在特征选择上的局限性问题,结合人工智能相关技术对现有方法进行优化改进,提出一种融合语义与事件特征的重大事件趋势预测方法。利用网络爬虫技术辅助数据采集;利用主题模型与事件抽取技术辅助海量新闻数据的特征集构建与向量表示,并针对LDA主题模型在特征词提取上存在偏向性的问题,提出一种改进模型IDFLDA;利用机器学习分类模型进行预测结果输出。以朝鲜核行为预测为例对提出方法进行验证,预测结果表明,该方法的预测性能优于依赖专家知识进行特征集构建的传统方法,能有效进行重大事件的趋势预测,为战略决策提供辅助支持。 展开更多
关键词 重大事件 趋势预测 主题模型 事件抽取 特征融合
下载PDF
云存储数据安全技术研究
5
作者 王少泫 《网络安全技术与应用》 2023年第6期69-72,共4页
云计算能降低应用成本、提高计算效率而受到企业及个人用户的青睐,但云数据的安全问题频出,影响了云计算的发展。本文依托于数据安全三要点,将主流的云存储数据安全技术从数据加密、访问控制及安全审计三个方向进行了评述。其中数据加... 云计算能降低应用成本、提高计算效率而受到企业及个人用户的青睐,但云数据的安全问题频出,影响了云计算的发展。本文依托于数据安全三要点,将主流的云存储数据安全技术从数据加密、访问控制及安全审计三个方向进行了评述。其中数据加密按照位置以及技术进行分类探讨;访问控制领域、安全审计方向将主流的技术、模型进行介绍和评述。并通过对近两年的技术路线分析发现,区块链技术已经逐渐和云存储安全结合起来,实现了依托于区块链的访问控制和安全审计模型。 展开更多
关键词 云存储 数据安全 安全审计 访问控制
原文传递
基于改进LDA特征抽取的重大事件趋势预测 被引量:1
6
作者 博远 冬亮 +1 位作者 谷雨 《杭州电子科技大学学报(自然科学版)》 2020年第2期61-67,共7页
为克服大数据背景下的重大事件趋势预测研究在特征选择上的局限性问题,提出一种基于改进潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)特征抽取的重大事件趋势预测方法。首先,利用网络爬虫辅助新闻数据采集;其次,利用主题模型取... 为克服大数据背景下的重大事件趋势预测研究在特征选择上的局限性问题,提出一种基于改进潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)特征抽取的重大事件趋势预测方法。首先,利用网络爬虫辅助新闻数据采集;其次,利用主题模型取代专家知识进行特征抽取与向量表示,并针对LDA主题模型存在的主题噪声以及在特征词偏向性问题,设计了一种改进模型NR-IDF-LDA;最后,利用机器学习分类模型进行预测结果输出。以朝核行为趋势预测为例进行验证,提出方法的全时间段预测准确率达到80.56%,召回率达到75.3%,预测结果与基于专家知识进行特征构建的传统方法相当,证实了方法的可行性和有效性。 展开更多
关键词 大数据 重大事件 趋势预测 主题模型 机器学习
下载PDF
基于HC-TC-LDA的重大事件趋势预测 被引量:1
7
作者 谷雨 +1 位作者 张震 耿小航 《指挥信息系统与技术》 2019年第5期40-46,共7页
提出了一种基于海量公开新闻数据的重大事件趋势预测框架.首先,对使用网络爬虫爬取的专题新闻数据进行时间片划分和趋势等级划分等处理;然后,考虑到数据有较大噪声和稀疏性强等特点,提出了一种融合层次聚类、单词贡献度和潜在Dirichlet... 提出了一种基于海量公开新闻数据的重大事件趋势预测框架.首先,对使用网络爬虫爬取的专题新闻数据进行时间片划分和趋势等级划分等处理;然后,考虑到数据有较大噪声和稀疏性强等特点,提出了一种融合层次聚类、单词贡献度和潜在Dirichlet分布(LDA)主题模型的特征抽取方法,抽取具有表征性的单词为特征,构建特征集合;最后,采用多项式逻辑回归方法构建重大事件趋势预测模型.以朝鲜核活动预测为例,验证了该框架的性能和有效性. 展开更多
关键词 重大事件 趋势预测 单词贡献度 LDA主题模型
下载PDF
基于EE与改进DBN的国家双边关系预测
8
作者 姜晓夏 +1 位作者 张震 谷雨 《计算机工程与设计》 北大核心 2021年第7期2044-2051,共8页
为获得国家间双边关系预测的因果关系模型,提出一种融合事件抽取(event extraction,EE)、时序贡献度(time contributions,TCs)与动态贝叶斯网络(dynamic Bayesian networks,DBN)的国家双边关系预测方法。基于事件抽取技术对爬取的新闻... 为获得国家间双边关系预测的因果关系模型,提出一种融合事件抽取(event extraction,EE)、时序贡献度(time contributions,TCs)与动态贝叶斯网络(dynamic Bayesian networks,DBN)的国家双边关系预测方法。基于事件抽取技术对爬取的新闻数据抽取事件句、事件类型等要素。按月划分新闻数据,提取特征词,根据频次等计算每月的时序贡献度。基于专家制定的事件分值表与事件抽取结果构建国家双边关系数据集,将其输入融合时序贡献度的DBN模型训练结构和参数。以南海争端为例,构建了中国与其他参与国的双边关系预测模型,实验结果表明了方法的可行性。 展开更多
关键词 国家双边关系 动态贝叶斯网络 事件抽取 单词贡献度 时序贡献度
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部