期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
网络热点事件发现系统的设计 被引量:30
1
作者 刘星星 何婷婷 +1 位作者 龚海军 陈龙 《中文信息学报》 CSCD 北大核心 2008年第6期80-85,共6页
该文设计了一个热点事件发现系统。该系统面向互联网新闻报道流,能自动发现任意一段时间内网络上的热点事件,并给出描述事件发展过程的曲线图。针对网络新闻语料具有数据规模大和时间特征明显两个特性,系统将语料按时间(天)分组,对每天... 该文设计了一个热点事件发现系统。该系统面向互联网新闻报道流,能自动发现任意一段时间内网络上的热点事件,并给出描述事件发展过程的曲线图。针对网络新闻语料具有数据规模大和时间特征明显两个特性,系统将语料按时间(天)分组,对每天的语料采用凝聚聚类得到微类,选取某段时间内的所有微类,再做Single-pass聚类得到事件列表,利用事件热度计算公式,把候选事件按热度进行排序。采用该系统对2007年新闻语料进行实验,结果表明该系统能取得较好的效果。 展开更多
关键词 计算机应用 中文信息处理 事件发现 凝聚聚类 Single-pass聚类 热度计算
下载PDF
面向互联网舆情的热词分析技术 被引量:17
2
作者 李渝勤 孙丽华 《中文信息学报》 CSCD 北大核心 2011年第1期48-53,59,共7页
热词是一种网络词汇现象,反映了某一特定时空范围内人们普遍关注的问题。该文对热词分析的两项关键技术——热词发现和热词关联技术进行了深入的研究。在热词发现阶段,首先采用命名实体识别技术和高频串统计技术进行短语串的挖掘,继而... 热词是一种网络词汇现象,反映了某一特定时空范围内人们普遍关注的问题。该文对热词分析的两项关键技术——热词发现和热词关联技术进行了深入的研究。在热词发现阶段,首先采用命名实体识别技术和高频串统计技术进行短语串的挖掘,继而采用基础权值和波动权值两项指标进行热度权值的计算。在热词关联阶段,按热词权值高低进行热词类的划分,通过同现率的原则确定热词类之间的关联计算。该文所采用的方法已经成功应用到TRS舆情监测系统的热点发现模块。 展开更多
关键词 热词 命名实体识别 热度计算 波动权值 词群关系
下载PDF
基于Heatmap的地理对象空间分布热度计算方法 被引量:10
3
作者 杨微 刘纪平 王勇 《测绘通报》 CSCD 北大核心 2012年第S1期391-393,398,共4页
为了更加直观地表达地理对象某一特征空间分布态势,研究Heatmap现有的计算方法,并对其进行改进形成快速生成Heatmap的方法,用来直观表达地理对象某特征的空间态势;然后利用全国居民小区价格热度分布实例验证利用Heatmap进行空间分布热... 为了更加直观地表达地理对象某一特征空间分布态势,研究Heatmap现有的计算方法,并对其进行改进形成快速生成Heatmap的方法,用来直观表达地理对象某特征的空间态势;然后利用全国居民小区价格热度分布实例验证利用Heatmap进行空间分布热度计算方法的可行性。试验表明本文提出的方法能有效直观地反映地理对象的空间分布态势,为人们工作生活中的重要决策提供依据。 展开更多
关键词 Heatmap 热度计算 地理对象 空间分布
下载PDF
基于农业网络信息分类的热词自动提取方法 被引量:8
4
作者 段青玲 张璐 +1 位作者 刘怡然 王沙沙 《农业机械学报》 EI CAS CSCD 北大核心 2018年第7期160-167,共8页
热词提取对于监控和分析农业舆情具有重要意义,目前已有一定研究基础,但仍存在针对性差等问题,无法满足农业领域不同产业用户群的个性化需求,为此,提出一种基于农业网络信息分类的热词自动提取方法。首先采用多标记分类算法对文本语料... 热词提取对于监控和分析农业舆情具有重要意义,目前已有一定研究基础,但仍存在针对性差等问题,无法满足农业领域不同产业用户群的个性化需求,为此,提出一种基于农业网络信息分类的热词自动提取方法。首先采用多标记分类算法对文本语料进行分类,按分类类别构建语料库,然后采用基于信息熵的方法对每个类别分别提取热词候选词,最后采用基于时间变化的方法进行候选词热度计算,根据候选词热度排序结果得到热词。本文抽取农业网站上的15 354条文本进行实验,结果表明,热词提取准确率达到0.9以上,能够较高质量地提取农业热词,为不同农业用户群体发现和分析产业热点提供帮助。 展开更多
关键词 农业网络信息 农业舆情监测 热词 多标记分类 热度计算
下载PDF
基于多源数据的专业领域热点探测模型研究 被引量:5
5
作者 王晓光 王宏宇 黄菡 《图书情报工作》 CSSCI 北大核心 2019年第14期52-61,共10页
[目的/意义]面向出版业进行专业领域出版时的选题决策问题,对互联网上公开的资讯动态进行多源整合,通过多维度的情报分析探测专业领域内的热点,实现数据驱动的出版选题决策,为出版业的数字化转型与发展奠定坚实基础。[方法/过程]设计一... [目的/意义]面向出版业进行专业领域出版时的选题决策问题,对互联网上公开的资讯动态进行多源整合,通过多维度的情报分析探测专业领域内的热点,实现数据驱动的出版选题决策,为出版业的数字化转型与发展奠定坚实基础。[方法/过程]设计一个情报分析模型,面向出版选题决策进行专业领域的热点探测。模型包含热点发现与热度评价两个过程。热点发现过程,通过词频统计和词增长速度算法对专业领域内的热点进行识别;热度评价过程,从内容层面和传播层面两个维度设计并计算一系列指标,对识别到的热点进行热度评价与排序。[结果/结论]以2018年1月至4月的36550条信息、通讯和技术领域多源中文信息为样本进行热点探测实验,实验结果表明,设计的热点探测模型可以有效地探测专业领域内的热点,辅助出版业科学地进行专业领域选题决策。 展开更多
关键词 选题决策 热点探测 热点发现 热度计算 热度评价
原文传递
基于实时词共现网络的微博话题发现 被引量:5
6
作者 李亚星 王兆凯 +2 位作者 冯旭鹏 刘利军 黄青松 《计算机应用》 CSCD 北大核心 2016年第5期1302-1306,共5页
针对微博的实时性、稀疏性和海量性特点,提出基于实时词共现网络的话题发现模型。首先,从原始语料中筛选出主题词集合,再利用时间参数计算共现主题词的关系权重以实现词共现网络的构建,通过该网络推算出与话题关联性强的潜在特征词以解... 针对微博的实时性、稀疏性和海量性特点,提出基于实时词共现网络的话题发现模型。首先,从原始语料中筛选出主题词集合,再利用时间参数计算共现主题词的关系权重以实现词共现网络的构建,通过该网络推算出与话题关联性强的潜在特征词以解决微博特征词的稀疏性;其次,采用改进Single-Pass算法实现话题增量聚类;最后,对每个话题的主题词按热度计算进行排序,获得最具代表性的话题主题词。实验结果表明,该模型与经典Single-Pass聚类算法相比,话题发现准确率约提高6%,综合指标提高8%。实验结果证明所提模型的有效性和准确性。 展开更多
关键词 话题发现 实时共现网络 短文本 Single-Pass聚类 热度计算
下载PDF
混合挂号模式下基于专家热度的号源分配研究 被引量:4
7
作者 王梁 吴坤 姚刚 《中国数字医学》 2020年第11期87-89,共3页
目的:在混合挂号模式下,进一步促进医疗资源的合理使用。方法:从挂号难的角度分析了混合挂号模式存在的合理性,定义专家热度并据此提出一种调整专家预约挂号和现场挂号号源数量的方法。结果:利用2019年1—3月份某医院某类门诊号源的挂... 目的:在混合挂号模式下,进一步促进医疗资源的合理使用。方法:从挂号难的角度分析了混合挂号模式存在的合理性,定义专家热度并据此提出一种调整专家预约挂号和现场挂号号源数量的方法。结果:利用2019年1—3月份某医院某类门诊号源的挂号数据,展示了根据热度进行号源调整的过程。结论:通过增加热度较低专家的预约号源数量,减少预约患者候诊时长,同时降低热度较高专家的预约号源数量,为疑难杂症患者保留更多现场号源,降低挂号难度。该方法为如何确定各专家不同种类号源数量提供了决策支持。 展开更多
关键词 热度计算 预约挂号 现场挂号 号源分配
下载PDF
基于聚类的网络新闻热点发现研究 被引量:3
8
作者 万晓霞 赵佳 《现代计算机(中旬刊)》 2015年第9期36-39,共4页
随着互联网的迅速发展,网络已成为各大媒体发布新闻和人们获取信息的主要渠道。而网络新闻复杂多样,并不是每一条新闻都是人们关注的热点。为了快速准确地获得用户关注的热点事件,提出将三种聚类算法相结合的话题发现算法和热度计算公式... 随着互联网的迅速发展,网络已成为各大媒体发布新闻和人们获取信息的主要渠道。而网络新闻复杂多样,并不是每一条新闻都是人们关注的热点。为了快速准确地获得用户关注的热点事件,提出将三种聚类算法相结合的话题发现算法和热度计算公式,并通过实验验证利用上述方法进行热点发现的可行性。 展开更多
关键词 热点事件 聚类算法 热度计算 可行性
下载PDF
网络热点信息识别方法研究
9
作者 邓爱萍 《微计算机信息》 2010年第19期188-189,共2页
热点信息识别是网络舆情分析与监控领域内的一项基本工作。分析了用于衡量网络事件热度的性能指标,提出通过计算事件热度的方式来识别出当前网络热点信息。
关键词 事件热度 指标 事件合并 热度计算
下载PDF
面向藏文WEB的话题发现系统的设计
10
作者 韩小斌 于洪志 曹晖 《甘肃科技纵横》 2011年第6期17-19,共3页
针对互联网上新闻网站和论坛、博客等发布的海量自然语言文本,本文设计了一个面向藏文的话题发现系统,将大量藏语文本分类整理并聚合成各个话题。本文采用两层聚类策略对文本进行聚类,实验结果表明文本聚类取得了不错的结果,具有较高的... 针对互联网上新闻网站和论坛、博客等发布的海量自然语言文本,本文设计了一个面向藏文的话题发现系统,将大量藏语文本分类整理并聚合成各个话题。本文采用两层聚类策略对文本进行聚类,实验结果表明文本聚类取得了不错的结果,具有较高的应用价值。 展开更多
关键词 话题发现 凝聚聚类 Single—pass聚类 热度计算
下载PDF
数据挖掘的网络热点话题演化动态预测
11
作者 陈洁 李刚 《自动化技术与应用》 2023年第8期78-81,99,共5页
为了及时发现网络热点话题走向,提出基于数据挖掘技术的网络热点话题演化动态预测算法。首先运用基于块的单遍聚类算法,将网络热点话题划分成不同文本集,根据特征划分到不同块中,进行网络热点话题的数据挖掘,然后计算页面话题热度值,利... 为了及时发现网络热点话题走向,提出基于数据挖掘技术的网络热点话题演化动态预测算法。首先运用基于块的单遍聚类算法,将网络热点话题划分成不同文本集,根据特征划分到不同块中,进行网络热点话题的数据挖掘,然后计算页面话题热度值,利用热度值描述报道获得的先后顺序,判断能否产生新的网络热点话题,实现网络热点话题预测。经实验验证算法网络热点话题动态预测运行时间少;热点话题预测漏检率低,可精准描述热度值变化趋势。 展开更多
关键词 数据挖掘技术 网络热点话题 动态预测 热度计算
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部