汉语主观性词典创建方法

Creation method of Chinese subjective lexicon

下载PDF

导出

摘要根据汉语情感分析现状和需求,分析和研究了从目标语料库自动获取汉语主观性词典,提出了一种主观性词典创建方法,定义了主观性词典和语言模型,设计了自适应主观性自举算法和主观性属性特征模型,实现了主观性词条中情感倾向、主观性强度和词汇主客观自动判别。采用机器学习方法证明,提出的汉语主观性词典自动创建方法高效,性能优良。 Based on the current situation of and demand for Chinese sentiment analysis,the method of automatically ob-taining subjective lexicon from the target corpus was studied.A creation method of subjective lexicon was presented,the subjective lexicon and language model were defined,a self-adaptive subjectivity bootstrapping algorithm and the charac-teristic model of subjectivity attribute were designed,and all these lead to the realization of the automatic judgment of sentiment polarity,subjectivity intensity and the subjectivity and objectivity of a word in the subjectivity entry.Experi-ments prove that by using machine learning the proposed method of automatic creation of Chinese subjective lexicon is highly efficient and with excellent performance.

作者张靖金浩

机构地区攀枝花学院网络中心南京大学计算机科学与技术系

出处《通信学报》 EI CSCD 北大核心 2010年第S1期172-176,共5页 Journal on Communications

基金四川省科技基金资助项目(2009zr0159)~~

关键词情感分析主观性词典创建方法机器学习模型算法 sentiment analysis subjective lexicon creation method machine learning models algorithms

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献11

1杨超,冯时,王大玲,杨楠,于戈.基于情感词典扩展技术的网络舆情倾向性分析[J].小型微型计算机系统,2010,31(4):691-695. 被引量：68
2夏云庆,杨莹,张鹏洲,刘宇飞.基于情感向量空间模型的歌词情感分析[J].中文信息学报,2010,24(1):99-103. 被引量：21
3宋鸿彦,刘军,姚天昉,刘全升,黄高辉.汉语意见型主观性文本标注语料库的构建[J].中文信息学报,2009,23(2):123-128. 被引量：10
4徐琳宏,林鸿飞,赵晶.情感语料库的构建和分析[J].中文信息学报,2008,22(1):116-122. 被引量：110
5BANEA C,MIHALCEA R,WIEBE J.A bootstrapping method forbuilding subjectivity lexicons for languages with scarce resources. Proceedings of the Learning Resources Evaluation Conference . 2008 被引量：1
6VALENTIA J,KATJA H.Task-based Evaluation Report:Building aDutch Subjectivity Lexicon. . 2008 被引量：1
7WILSON T A.Fine-grained Subjectivity and Sentiment Analysis:Recognizing the Intensity,Polarity,and Attitudes of Private States. . 2008 被引量：1
8MICHAEL C.Head-driven statistical models for natural languageparsing. Computational Linguistics . 2003 被引量：1
9KANAYAMAH,NASUKAWA T.Fully automatic lexicon expan-sion for domain-oriented sentiment analysis. Proceedings of Empirical Methods in Natural Language Processing . 2006 被引量：1
10P.Turney.Thumbs Up or Thumbs Down? Semantic Orientation Applied to Unsupervised Classfication of Reviews. . 2002 被引量：1

二级参考文献27

1徐琳宏,林鸿飞.基于语义特征和本体的语篇情感计算[J].计算机研究与发展,2007,44(z2):356-360. 被引量：13
2张普.关于大规模真实文本语料库的几点理论思考[J].语言文字应用,1999(1):35-44. 被引量：49
3胡百华,李行德,汤志祥.香港的语料库和相关研究概况[J].语言文字应用,1997(2):51-56. 被引量：8
4刘连元.现代汉语语料库研制[J].语言文字应用,1996(3):3-9. 被引量：28
5周明,黄昌宁.面向语料库标注的汉语依存体系的探讨[J].中文信息学报,1994,8(3):35-52. 被引量：39
6朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：326
7徐琳宏,林鸿飞,杨志豪.基于语义理解的文本倾向性识别机制[J].中文信息学报,2007,21(1):96-100. 被引量：120
8董振东（著）,董强（著）,胡光华.HowNet与意义的计算[J].国外科技新书评介,2006(12):8-9. 被引量：9
9T. McEnery, A. Wilson Corpus linguistics[M]. Britain: Edinburgh University Press 1996. 被引量：1
10Lun-Wei Ku, Tung-Ho Wu, Li-Ying Lee and Hsin-Hsi Chen. Construction of an Evaluation Corpus for Opinion Extraction[C]//Proceedings of NTCIR-5 Workshop Meeting, Tokyo, Japan: 2005. 被引量：1

共引文献200

1刘璐,张小明.白银景泰“5·22”黄河石林百公里越野赛舆情情感分析:基于新浪微博的研究[J].中国应急管理科学,2022(2):91-104. 被引量：1
2司震飞.高校B站账号内容发布特点和提升策略——基于20所高校发布视频的分析[J].新媒体研究,2023,9(2):62-66. 被引量：1
3孙成志.基于语料库的汉日新闻语篇转述话语对比研究——以“英国脱欧”为例[J].日语教育与日本学,2020(2):1-11. 被引量：1
4徐翔,董洁芸.社交网络内容生产中用户“信息茧房”的情感偏向研究[J].全球传媒学刊,2022,9(4):78-99. 被引量：9
5王曰芬,吴鹏,丁晟春,陈芬.社会舆情分析研究与进展综述[J].情报学进展,2016(1):132-185. 被引量：1
6包乾辉,李佳利,石淑珍,戴引,刘雪.基于DSLML的鸡蛋消费在线评论情感分析[J].农业机械学报,2021,52(S01):496-503. 被引量：5
7贾巴春阳.微博上粉丝脱粉回踩偶像现象的心理学思考——以“陈学冬被脱粉回踩事件”为例[J].东南传播,2019(12):106-109.
8佘正炜,钱松荣.基于神经网络的文本倾向性分析系统的研究[J].微型电脑应用,2011(12):20-23. 被引量：2
9宋鸿彦,刘军,姚天昉,刘全升,黄高辉.汉语意见型主观性文本标注语料库的构建[J].中文信息学报,2009,23(2):123-128. 被引量：10
10陈建美,林鸿飞,杨志豪.基于语法的情感词汇自动获取[J].智能系统学报,2009,4(2):100-106. 被引量：26

1周彩霞,易江义.基于改进BP网络的人脸检测与定位[J].科学技术与工程,2008,8(6):1605-1609. 被引量：2
2陈亮,秦前清.基于SVM的遥感影像目标检测中的样本选取[J].计算机工程与应用,2006,42(9):212-214. 被引量：3
3甘玲,朱江.复杂背景下提取人脸方法的改进[J].计算机仿真,2010,27(3):211-214. 被引量：1
4徐斌,张玉峰.基于语义准则函数的中文评论性文本极性聚类算法研究[J].情报学报,2011,30(5):451-455. 被引量：1
5徐戈,蒙新泛,王厚峰.采用无标注语料的动词和形容词主观性评级[J].软件学报,2013,24(5):1036-1050.
6许世峰,曾义.基于Adaboost算法的人眼状态检测[J].计算机仿真,2007,24(7):214-216. 被引量：6
7张靖,金浩.汉语词汇主观性提取研究[J].计算机工程与设计,2010,31(4):915-917. 被引量：1
8胡凯,费耀平.基于自举算法和支持向量机的人脸检测系统[J].计算机工程与应用,2008,44(12):199-203.
9张志飞,凌志浩,高冲.终端协同过程的中心节点自举算法研究[J].自动化仪表,2014,35(5):4-8.
10韩冬煦,常宝宝.中文分词模型的领域适应性方法[J].计算机学报,2015,38(2):272-281. 被引量：59

通信学报

2010年第S1期

浏览历史

内容加载中请稍等...

汉语主观性词典创建方法

参考文献11

二级参考文献27

共引文献200

相关作者

相关机构

相关主题

浏览历史