-
题名一种面向旅游评论的情感特征识别方法
被引量:1
- 1
-
-
作者
陈耀东
彭蝶飞
-
机构
长沙师范学院信息与工程系
长沙师范学院科研与学科建设处
-
出处
《计算机技术与发展》
2018年第11期107-110,114,共5页
-
基金
湖南省教育科学研究项目优秀青年项目(16B025)
湖南省科技重点研发项目(2016SK2042)
-
文摘
情感分析的一大难点是如何获取主题相关的情感特征信息。首先给出了"有效"情感特征的定义,然后提出了一种基于语义角色标注的有效情感特征抽取方法。该方法先依据评论库的主题元数据得到候选主题特征项,并标注主题句,然后执行主题句的语义角色标注,基于情感特征所在的角色类型判断该特征语义是否指向主题项。该方法的特点在于过滤与指定主题无关的噪声特征。实验面向旅游景区游客评论在不同规模的标注集环境下对比了三种特征抽取方法,即基于词袋的方法、基于主题的方法和文中基于有效情感特征的方法,结果显示文中方法对于短文本的情感分类较词袋方法有3%的性能提升,而对于长文本的情感分类其性能较前面两种方法优势突显,总体达到了84.81%的准确率。
-
关键词
情感分析
情感特征
主题项
语义角色标注
语义指向
游客评论
-
Keywords
sentiment analysis
sentiment feature
topic term
semantic role labeling
semantic orientation
tour reviews
-
分类号
TP30
[自动化与计算机技术—计算机系统结构]
-
-
题名专利多学科演进及对知识产权人才培养的启示
被引量:4
- 2
-
-
作者
栾春娟
贺高红
卢中昌
任毅
-
机构
大连理工大学公共管理与法学学院
大连理工大学盘锦校区国家知识产权培训辽宁基地
大连理工大学盘锦校区管理委员会
-
出处
《技术与创新管理》
2018年第6期682-688,720,共8页
-
基金
国家自然科学基金项目(71473028)
大连理工大学教学改革基金重点项目(ZD201509)
-
文摘
探索专利研究多学科发展演进,对我国知识产权人才的培养和国家知识产权战略的实施,具有重要的理论意义和实践意义。研究中揭示了全球专利研究由法学学科为主导演进为商业与经济学科为主导的发展趋势。提出我国知识产权人才的培养应加大创新创业、风险投资等商业运营和技术创新相关的知识产权课程设置,培养的知识产权人才队伍应为懂技术、懂管理、懂法律和经济以及商业运营模式的高层次、复合型人才队伍。
-
关键词
专利研究
多学科演进
知识产权
人才培养
主题词共现分析
-
Keywords
patent study
multidisciplinary evolution
intellectual property
talents cultivation
topic term co-occurrence analysis
-
分类号
G306
[文化科学]
N18
[自然科学总论]
-
-
题名基于VSM和LDA模型的FAQ问答系统
被引量:3
- 3
-
-
作者
郑诚
刘娇丽
项珑
-
机构
安徽大学计算机科学与技术学院
-
出处
《计算机技术与发展》
2014年第1期133-135,共3页
-
基金
安徽省自然科学基金资助项目(11040606M133)
-
文摘
传统的搜索引擎返回的数据太过庞大,很多情况下用户不能快速地找到自己要的答案。在这种情况下,文中引入FAQ系统。FAQ中如何找到最佳匹配答案,是文中的研究重点。改进了传统的VSM模型,使得它能更好地体现问题中词的权重。重点引入了LDA模型,并用计算机故障领域内的文档资料对它进行训练,得到主题-词的概率分布。通过主题-词中词的概率分布,计算词与词的相关度,提出通过词与词间相关度计算句子与句子间相似度的算法。对两个算法进行综合,得到最终的相似度算法。文中对FAQ进行整理,得到了FAQ问答系统的雏形。通过实验分析,说明相似度算法有很好的效果。
-
关键词
VSM
相似度计算
LDA(Latent
DIRICHLET
Allocation)
主题-词分布
-
Keywords
VSM
similarity calculation
LDA ( Latent Dirichlet Allocation)
topic-term distribution
-
分类号
TP31
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于边权重的主题核心术语抽取
- 4
-
-
作者
薛涵
秦兵
刘挺
-
机构
哈尔滨工业大学计算机科学与技术学院
哈尔滨工程大学图书馆
-
出处
《智能计算机与应用》
2015年第4期115-118,共4页
-
基金
国家自然科学基金重点项目(61133012)
国家自然科学基金面上项目(61273321)
国家863前沿技术研究项目(2015AA015407)
-
文摘
术语抽取是层次体系构建的首要子任务。目前的术语抽取研究主要集中在文本语料并且混合多个主题,存在知识获取的瓶颈和术语表述的模糊与歧义的问题。为了解决这些问题,本文提出一种基于边权重的主题核心术语抽取方法,从社会化标签中抽取主题核心术语。考虑到社会化标签丰富的语义关联特征,本文提出结合具体主题的局部共现和资源集合中所有主题的全局语义相似度的边权重。新颖的边权重将传统的随机游走方法分解成多个主题相关的随机游走,并针对每个具体主题排序相关的候选术语。排序靠前的术语被抽取作为主题核心术语。实验结果表明本文提出的方法显著优于前人的相关工作。
-
关键词
术语抽取
社会化标签
主题核心术语抽取
主题相关的随机游走
-
Keywords
term Extraction
Folksonomy
topic Key term Extraction
topic-Sensitive Random Walk
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-