期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
基于多特征融合的微博主题情感挖掘 被引量:61
1
作者 黄发良 冯时 +1 位作者 王大玲 于戈 《计算机学报》 EI CSCD 北大核心 2017年第4期872-888,共17页
微博情感分析是社会媒体挖掘中的重要任务之一,在恐怖组织识别、个性化推荐、舆情分析等方面具有重要的理论和应用价值.但与传统文本数据不同,微博消息短小而凌乱,包含着大量诸如微博表情符号之类的特有信息,同时微博情感是与其讨论主... 微博情感分析是社会媒体挖掘中的重要任务之一,在恐怖组织识别、个性化推荐、舆情分析等方面具有重要的理论和应用价值.但与传统文本数据不同,微博消息短小而凌乱,包含着大量诸如微博表情符号之类的特有信息,同时微博情感是与其讨论主题是密切相关的.多数现有的微博情感分析方法都没有将微博主题与微博情感进行协同分析,或者在微博主题情感分析过程中没有考虑将用户关系、用户性格情绪等特征数据,从而导致微博情感分析与主题检测的效果难尽人意.为此,提出了一个基于多特征融合的微博主题情感挖掘模型TSMMF(Topic Sentiment Model based on Multi-feature Fusion),该模型将情感表情符号与微博用户性格情绪特征纳入到图模型LDA中实现微博主题与情感的同步推导.实验结果表明,与当前用于短文本情感主题挖掘的最优模型(JST,SLDA与DPLDA)相比较,TSMMF具有更优的微博主题情感检测性能. 展开更多
关键词 情感分析 主题检测 LDA 微博短文本 社会媒体处理 自然语言处理
下载PDF
基于社交关系的微博主题情感挖掘 被引量:19
2
作者 黄发良 于戈 +3 位作者 张继连 李超雄 元昌安 卢景丽 《软件学报》 EI CSCD 北大核心 2017年第3期694-707,共14页
微博情感分析是社交媒体挖掘中的重要任务之一,在个性化推荐、舆情分析等方面具有重要的理论和应用价值.挖掘性能良好且可同步进行文档主题分析与情感分析的主题情感模型,近年来在以微博为代表的社交媒体情感分析中备受关注.然而,绝大... 微博情感分析是社交媒体挖掘中的重要任务之一,在个性化推荐、舆情分析等方面具有重要的理论和应用价值.挖掘性能良好且可同步进行文档主题分析与情感分析的主题情感模型,近年来在以微博为代表的社交媒体情感分析中备受关注.然而,绝大多数现有主题情感模型都只简单地假设不同微博的情感极性是互相独立的,这与微博生态的现实状况不相一致,从而导致这些模型无法对用户的真实情感进行有效建模.基于此,综合考虑了微博用户相互关联的事实,提出了基于LDA和微博用户关系的主题情感模型SRTSM(social relation topic sentiment model).该模型在LDA中加入情感层与微博用户关系参数,利用微博用户关系与微博主题学习微博的情感极性.针对新浪微博真实数据集上的大量实验结果表明:与代表性算法JST,Sentiment-LDA及DPLDA相比较,SRTSM模型能够对用户真实情感与讨论主题进行更加有效的分析建模. 展开更多
关键词 情感分析 微博情感分析 主题情感模型 社交关系 社会媒体处理
下载PDF
基于汉语篇章框架语义分析的阅读理解问答研究 被引量:18
3
作者 王智强 李茹 +3 位作者 梁吉业 张旭华 武娟 苏娜 《计算机学报》 EI CSCD 北大核心 2016年第4期795-807,共13页
答案句检索和答案抽取是阅读理解中的两个核心技术.针对汉语阅读理解,该文提出一种新的基于篇章框架语义分析的答案句检索和答案抽取方法.答案句检索是基于框架相似性、框架关系及篇章框架关系来实现.其中,基于框架相似性的方法是通过... 答案句检索和答案抽取是阅读理解中的两个核心技术.针对汉语阅读理解,该文提出一种新的基于篇章框架语义分析的答案句检索和答案抽取方法.答案句检索是基于框架相似性、框架关系及篇章框架关系来实现.其中,基于框架相似性的方法是通过计算背景材料与问句之间语义场景(框架)的相似度来进行答案句检索;基于框架关系和篇章框架关系的方法可以从语义相关角度获得与问句语义相关的答案句.在答案抽取时,提出基于框架语义相似性、有定零形式线索及框架关系的答案抽取方法.基于框架语义相似性可以从语义相似的答案句中抽取出充当问句疑问角色的框架元素作为答案;有定零形式线索能够在篇章范围定位答案句中充当答案的缺失语义成分;框架关系则能够通过建立框架元素之间的关系,抽取相关度高的框架元素作为答案.针对15个领域的552个阅读理解问题,该方法在答案句检索时相比传统基于相似度的方法能够获得更好的答案句检索结果;相比基于框架相似性的Baseline实验,加入篇章框架关系、框架关系及有定零形式线索的篇章级框架语义特征,能够获得更优的答案句检索与答案抽取结果. 展开更多
关键词 框架语义分析 阅读理解 框架关系 有定零形式 篇章框架关系 社会媒体 社交网络 自然语言处理
下载PDF
基于词向量语义分类的微博实体链接方法 被引量:12
4
作者 冯冲 石戈 +2 位作者 郭宇航 龚静 黄河燕 《自动化学报》 EI CSCD 北大核心 2016年第6期915-922,共8页
微博实体链接是把微博中给定的指称链接到知识库的过程,广泛应用于信息抽取、自动问答等自然语言处理任务(Natural language processing,NLP).由于微博内容简短,传统长文本实体链接的算法并不能很好地用于微博实体链接任务.以往研究大... 微博实体链接是把微博中给定的指称链接到知识库的过程,广泛应用于信息抽取、自动问答等自然语言处理任务(Natural language processing,NLP).由于微博内容简短,传统长文本实体链接的算法并不能很好地用于微博实体链接任务.以往研究大都基于实体指称及其上下文构建模型进行消歧,难以识别具有相似词汇和句法特征的候选实体.本文充分利用指称和候选实体本身所含有的语义信息,提出在词向量层面对任务进行抽象建模,并设计一种基于词向量语义分类的微博实体链接方法.首先通过神经网络训练词向量模板,然后通过实体聚类获得类别标签作为特征,再通过多分类模型预测目标实体的主题类别来完成实体消歧.在NLPCC2014公开评测数据集上的实验结果表明,本文方法的准确率和召回率均高于此前已报道的最佳结果,特别是实体链接准确率有显著提升. 展开更多
关键词 词向量 实体链接 社会媒体处理 神经网络 多分类
下载PDF
基于自然语言处理的城市公园生态系统文化服务感知 被引量:9
5
作者 党辉 李晶 《陕西师范大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第4期92-102,共11页
生态系统文化服务是生态系统保护和人类福祉的核心组成部分,但因其主观性特质难以定量评估,而社交媒体评论数据具有记录每个城市公园文化服务类型及其差异的感知能力,可以用作生态系统文化服务感知的数据源。因此,基于网络爬虫,获取西... 生态系统文化服务是生态系统保护和人类福祉的核心组成部分,但因其主观性特质难以定量评估,而社交媒体评论数据具有记录每个城市公园文化服务类型及其差异的感知能力,可以用作生态系统文化服务感知的数据源。因此,基于网络爬虫,获取西安市主城区城市公园评论数据,借助自然语言处理进行主题建模,挖掘数据中的潜在主题,基于文档-主题概率进行文化服务感知分类,分析城市公园的生态系统文化服务。结果表明:城市公园的生态系统文化服务可以分为美学体验、文化遗产、科学教育、观光娱乐和精神满足5种类型;各生态系统文化服务在空间维度呈现出极大的多样性,部分城市公园的服务类别具有相似性;城市公园的规模和特征决定着游客的文化服务感知水平,不同城市公园的评论数存在差距,不同城市公园的热度不同。 展开更多
关键词 生态系统文化服务 城市公园 社交媒体 自然语言处理 主题模型
下载PDF
社交媒体数据对台风灾害的预警研究——以利奇马台风为例 被引量:9
6
作者 郑苏晋 郭海若 +1 位作者 宋姝凝 胡海涛 《管理评论》 CSSCI 北大核心 2021年第10期340-352,共13页
巨灾事件的发生日益频繁,社交网络的即时性特点有助于灾情的迅速评估和灾后重建。本文以2019年9号台风"利奇马"为例,在新浪微博平台上收集了2019年8月9日—14日的260万条微博短文本数据,使用机器学习和优化情感词典两种方法... 巨灾事件的发生日益频繁,社交网络的即时性特点有助于灾情的迅速评估和灾后重建。本文以2019年9号台风"利奇马"为例,在新浪微博平台上收集了2019年8月9日—14日的260万条微博短文本数据,使用机器学习和优化情感词典两种方法分别对微博短文本进行分析。发现在相同的时间成本下,采用机器学习进行自然语言处理的效果远不如情感词典,机器学习的分析精度受主题与语料库的影响很大。在此基础上,本文利用台风主题下的情感词典对微博短文本进行情绪分析,发现灾损严重的省市情绪曲线会出现更大的波动,人身损失造成的情绪波动远大于财产损失造成的情绪波动。在浙江临海事件中,"好"的情绪曲线与"惧"的情绪曲线存在两个小时的时间差,表明"庆幸"的情绪达到峰值预示着未来很快可能有更重大的灾情发生,这其中的时间差为灾情预警提供了新的思路。 展开更多
关键词 社交媒体 自然语言处理 利奇马台风 灾损预警
原文传递
社交媒体平台用户参与的行为谱与行为层级模型构建 被引量:8
7
作者 孙悦 黄微 《图书情报工作》 CSSCI 北大核心 2022年第9期40-52,共13页
[目的/意义]通过梳理现阶段社交媒体平台用户参与行为研究成果,结合信息生成理论和信息加工理论,建立社交媒体平台用户参与的行为谱,从而构建社交媒体平台用户参与行为层级模型,以发现社交媒体平台用户在面对不同事件类型时可能产生的... [目的/意义]通过梳理现阶段社交媒体平台用户参与行为研究成果,结合信息生成理论和信息加工理论,建立社交媒体平台用户参与的行为谱,从而构建社交媒体平台用户参与行为层级模型,以发现社交媒体平台用户在面对不同事件类型时可能产生的一种或多种参与行为,为社交媒体平台建立基于用户参与行为的用户画像侧写、识别其对某一类型话题活跃度和参与度以及预测用户参与行为奠定理论基础。[方法/过程]以主流社交媒体平台结构功能为基础,以灵长类动物行为谱制定过程为依据,应用观察实验法,通过邀请有不同学科背景的双观察员形式发现用户在使用社交媒体平台时产生的参与行为,构建包括8个类别、21个特定参与行为的社交媒体平台用户参与的行为谱。[结果/结论]以社交媒体平台用户参与的行为谱为核心,以认知努力量为衡量单位,构建结构为主动参与行为和被动参与行为、积极参与行为和消极参与行为、深度参与行为与浅表参与行为的三因素两水平层级模型。 展开更多
关键词 社交媒体平台 信息加工理论 用户参与的行为谱 认知努力
原文传递
基于微博的灾害信息快速提取方法研究 被引量:6
8
作者 郑嵘 张晨晓 +1 位作者 乐鹏 梁哲恒 《测绘地理信息》 2020年第5期133-137,共5页
提出了一个灾害微博的实时处理框架,框架基于Spark流计算平台,利用从灾害历史微博数据中提取的信息对获取到的灾害微博进行实时分类统计。以2017年九寨沟地震和林芝地震为例,基于爬虫、文本预处理、文本分类模型等方法实现了灾害微博实... 提出了一个灾害微博的实时处理框架,框架基于Spark流计算平台,利用从灾害历史微博数据中提取的信息对获取到的灾害微博进行实时分类统计。以2017年九寨沟地震和林芝地震为例,基于爬虫、文本预处理、文本分类模型等方法实现了灾害微博实时处理原型系统,并通过实验验证了原型系统的可用性。 展开更多
关键词 灾害应急响应 社交媒体 实时处理 文本分类 流计算平台
原文传递
面向社交媒体的幽默计算理论与实践
9
作者 林鸿飞 吐妮可·吐尔逊 张冬瑜 《外国语文》 北大核心 2024年第4期45-59,共15页
幽默是人类独有的语言表达方式,具有幽默感的人可以构建和谐的交际氛围。如何识别社交媒体上的海量幽默文本和评价用户幽默感成为计算语言学领域面临的重大挑战。因此,我们从认知语言学的视角,提出从资源建设、幽默识别到幽默感评价的... 幽默是人类独有的语言表达方式,具有幽默感的人可以构建和谐的交际氛围。如何识别社交媒体上的海量幽默文本和评价用户幽默感成为计算语言学领域面临的重大挑战。因此,我们从认知语言学的视角,提出从资源建设、幽默识别到幽默感评价的社交媒体幽默计算框架。首先,参照幽默的语义脚本理论,构建面向社交媒体的中文幽默语料库。然后,利用情感倾向性、语义不一致性及模糊性特征,对文本进行幽默识别。最后,从创作和欣赏两个维度进行用户的幽默感评价。幽默计算将有助于提升语言智能的水平,有助于提高阅读理解、人机对话、机器翻译等领域的应用性能。 展开更多
关键词 幽默计算 社交媒体处理 语料库构建
下载PDF
基于社交媒体评论的广州市中心区综合公园游客感知
10
作者 任娴 赵冠伟 《园林》 2024年第6期141-150,共10页
综合公园是城市中重要的绿色基础设施之一,获取游客对公园的感知特征及其影响因素,有助于为优化公园配置提供依据。使用2006–2022年的大众点评网数据,通过自然语言处理技术分析游客对广州市中心区10个综合公园的感知特征。结果发现:珠... 综合公园是城市中重要的绿色基础设施之一,获取游客对公园的感知特征及其影响因素,有助于为优化公园配置提供依据。使用2006–2022年的大众点评网数据,通过自然语言处理技术分析游客对广州市中心区10个综合公园的感知特征。结果发现:珠江公园的游客评分最高,东风公园最低;春、夏季的游客评论量更大,春、冬季的满意度最高;水体、植物、健身设施、古迹建筑、游乐设施、休憩场所类的景点更易被游客感知,而雕塑或科普类的景点感知较少;区位交通、门票、空气质量、内部设施及活动等是游客赋予公园积极评价的主要因素。建议采取完善园内服务配套设施、严格把关环境卫生、加大园内景点宣传、加强园区日常管理等措施,以提升公园空间品质。研究结果对广州市综合公园优化设施配置和提升服务水平具有重要意义。 展开更多
关键词 城市公园 社交媒体评论 情感分析 游客公园感知 自然语言处理
下载PDF
基于树到串模型强化的层次短语机器翻译解码方法 被引量:5
11
作者 肖桐 朱靖波 《计算机学报》 EI CSCD 北大核心 2016年第4期808-821,共14页
文中研究了利用树到串模型对层次短语模型进行强化的统计机器翻译解码方法.其基本框架是把层次短语模型作为基础模型,而把树到串模型作为层次短语模型的补充,增加翻译推导空间大小.文中重点研究了在该框架下的统计机器翻译解码技术,并... 文中研究了利用树到串模型对层次短语模型进行强化的统计机器翻译解码方法.其基本框架是把层次短语模型作为基础模型,而把树到串模型作为层次短语模型的补充,增加翻译推导空间大小.文中重点研究了在该框架下的统计机器翻译解码技术,并提出了多种解码策略,包括基于树的精确解码策略、基于树的模糊解码策略和基于串的解码策略.通过NIST汉英翻译任务上的实验结果显示,文中所研究的方法可以十分有效地提升基线层次短语系统的翻译性能,比如在newswire和web数据上分别提高了1.3和1.2个BLEU点.此外,文中分析了若干影响翻译性能的因素,并给出了对比实验结果. 展开更多
关键词 统计机器翻译 层次短语模型 树到串模型 规则抽取 解码 社会媒体 社交网络 自然语言处理 机器翻译
下载PDF
中英文突发事件话题演化对比研究--以H7N9微博为例 被引量:4
12
作者 赵华 章成志 《情报资料工作》 CSSCI 北大核心 2016年第3期19-27,共9页
文章从新浪微博和Twitter抓取突发事件语料,根据主题模型确定候选话题,通过对候选话题进行聚类确定更为合适的话题数,然后根据主题模型结果计算相邻时间片话题之间的相似度,在此基础上分析话题的演化,最终完成中英文话题演化的比较分析... 文章从新浪微博和Twitter抓取突发事件语料,根据主题模型确定候选话题,通过对候选话题进行聚类确定更为合适的话题数,然后根据主题模型结果计算相邻时间片话题之间的相似度,在此基础上分析话题的演化,最终完成中英文话题演化的比较分析。文章针对H7N9微博的实证结果表明:新浪微博话题数目较多,话题面更为广泛;国内对H7N9禽流感事件的爆发反应更为强烈;两个平台在话题内容方面也存在一些差异;另外,两个平台话题演化的可视化结果可以描述H7N9禽流感事件新话题的产生、旧话题的消亡以及话题内容随时间的变化。 展开更多
关键词 话题演化 突发事件舆情分析 社会化媒体 多语言信息处理
原文传递
一种分布式Twitter数据处理方案及应用 被引量:3
13
作者 张振华 吴开超 《计算机应用研究》 CSCD 北大核心 2015年第7期2073-2077,2091,共6页
针对社交媒体数据的特点及其分析的挑战性,提出了一种基于实时计算框架Storm、批处理框架Hadoop和高效可水平扩展的No SQL数据库Mongo DB的分布式社交媒体数据处理方案,并依此指导实现基于Twitter流式数据的流感疫情可视化分析系统。实... 针对社交媒体数据的特点及其分析的挑战性,提出了一种基于实时计算框架Storm、批处理框架Hadoop和高效可水平扩展的No SQL数据库Mongo DB的分布式社交媒体数据处理方案,并依此指导实现基于Twitter流式数据的流感疫情可视化分析系统。实验证明,该分布式方案能较好支持Twitter流式数据的高效处理和储存,使之满足系统的性能需求。 展开更多
关键词 社交媒体 分布式处理框架 Twitter流式数据 流感疫情侦测 分布式计算
下载PDF
开发商业智能应用 小心大数据“陷阱” 被引量:2
14
作者 黄锦辉 《大数据》 2017年第2期26-30,共5页
大数据的应用和研究是信息爆炸时代的热点话题。就如何更智能地发现大数据中的有用信息展开讨论,探讨了大数据中的"陷阱"和其引发的社会危害,提出一种面向社交文本的智能应用系统,以有效规避大数据中的"陷阱"并自... 大数据的应用和研究是信息爆炸时代的热点话题。就如何更智能地发现大数据中的有用信息展开讨论,探讨了大数据中的"陷阱"和其引发的社会危害,提出一种面向社交文本的智能应用系统,以有效规避大数据中的"陷阱"并自动提取有用信息;基于提到的框架,展示了笔者研究组近些年在社交媒体上的事件检测、自动摘要和谣言检测方面的研究成果。 展开更多
关键词 大数据 自然语言处理 社交媒体 数据处理
下载PDF
利用结构化特征解决面向社交媒体信息情感分析的研究 被引量:1
15
作者 苏育挺 王慧晶 《小型微型计算机系统》 CSCD 北大核心 2017年第12期2625-2629,共5页
情感分析是自然语言处理领域中的一项重要研究任务.本文针对Twitter等社交媒体平台的文本信息,对有监督类和无监督类情感分析方法进行了调查研究,设计了一个利用结构化语言学特征实现基于词典的无监督类情感分析系统.系统由三部分组成:... 情感分析是自然语言处理领域中的一项重要研究任务.本文针对Twitter等社交媒体平台的文本信息,对有监督类和无监督类情感分析方法进行了调查研究,设计了一个利用结构化语言学特征实现基于词典的无监督类情感分析系统.系统由三部分组成:精准且带有情感感知的预处理保证了从情感词典中成功检索词语的情感分值和识别各类表情及其对应极性;结构化的语言学特征对情感分值进行逐级优化;最后通过情感分值计算器得到文本情感分值从而实现情感分析.模块独立性使其便于被单独修正、完善及扩展,此外,系统允许改变特征提取模块的配置进行情感分值计算从而优化在不同应用环境下的情感分析. 展开更多
关键词 社交媒体信息 自然语言处理 情感分析 观点挖掘
下载PDF
社交媒体数据的获取与处理分析研究 被引量:1
16
作者 黄秋雨 耿继原 《测绘与空间地理信息》 2019年第2期141-144,共4页
带有地理空间信息的社交媒体数据是由众多专业和非专业用户主观发布并通过社交媒体向公众或组织提供的一种开放地理空间数据。为了高效地获取签到数据以及保证签到数据的正确性、可靠性、完整性,满足数据挖掘算法的需要,本文以微博签到... 带有地理空间信息的社交媒体数据是由众多专业和非专业用户主观发布并通过社交媒体向公众或组织提供的一种开放地理空间数据。为了高效地获取签到数据以及保证签到数据的正确性、可靠性、完整性,满足数据挖掘算法的需要,本文以微博签到数据为例,提出了获取数据的关键技术,包括调用微博API的方法、研究区域格网化的获取方法,提高了数据的获取效率。并且针对获取的原始数据提出了对其处理的方案并对获取的数据结果进行了相关的统计描述。 展开更多
关键词 社交媒体数据 微博API 数据获取与处理
下载PDF
Applying Machine Learning Techniques for Religious Extremism Detection on Online User Contents
17
作者 Shynar Mussiraliyeva Batyrkhan Omarov +1 位作者 Paul Yoo Milana Bolatbek 《Computers, Materials & Continua》 SCIE EI 2022年第1期915-934,共20页
In this research paper,we propose a corpus for the task of detecting religious extremism in social networks and open sources and compare various machine learning algorithms for the binary classification problem using ... In this research paper,we propose a corpus for the task of detecting religious extremism in social networks and open sources and compare various machine learning algorithms for the binary classification problem using a previously created corpus,thereby checking whether it is possible to detect extremist messages in the Kazakh language.To do this,the authors trained models using six classic machine-learning algorithms such as Support Vector Machine,Decision Tree,Random Forest,K Nearest Neighbors,Naive Bayes,and Logistic Regression.To increase the accuracy of detecting extremist texts,we used various characteristics such as Statistical Features,TF-IDF,POS,LIWC,and applied oversampling and undersampling techniques to handle imbalanced data.As a result,we achieved 98%accuracy in detecting religious extremism in Kazakh texts for the collected dataset.Testing the developed machine learningmodels in various databases that are often found in everyday life“Jokes”,“News”,“Toxic content”,“Spam”,“Advertising”has also shown high rates of extremism detection. 展开更多
关键词 EXTREMISM religious extremism machine learning social media social network natural language processing NLP
下载PDF
供应商参与新产品设计:社交媒体使用与企业能力的调节作用 被引量:3
18
作者 焦媛媛 吴业鹏 《预测》 CSSCI 北大核心 2021年第1期1-8,共8页
本文探讨在新产品设计阶段,供应商参与对新产品创新绩效的影响,以及社交媒体使用与两种关键的企业能力(社交媒体网络能力和知识处理能力)对供应商参与和新产品创新绩效关系的调节作用。结果表明:供应商参与能促进新产品创新绩效;社交媒... 本文探讨在新产品设计阶段,供应商参与对新产品创新绩效的影响,以及社交媒体使用与两种关键的企业能力(社交媒体网络能力和知识处理能力)对供应商参与和新产品创新绩效关系的调节作用。结果表明:供应商参与能促进新产品创新绩效;社交媒体使用促进了供应商参与对新产品创新绩效的影响;企业的社交媒体网络能力和知识处理能力进一步增强了社交媒体使用对二者的调节作用。研究证实了社交媒体和企业能力在供应商参与新产品设计中的关键作用,并为制造企业更好地使用社交媒体提供启示。 展开更多
关键词 新产品设计 供应商参与 社交媒体使用 社交媒体网络能力 知识处理能力
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部