期刊文献+

基于日志分析的中文输入法用户行为研究 被引量:2

Research on User Input Behavior Based on Log Analysis of a Chinese Input Method Editor
下载PDF
导出
摘要 与拼音文字不同,用户在进行中文输入时需要借助输入法软件完成从拼音串到汉字串的转换过程,输入法因此成为中文用户进行人机交互的基础性工具,而输入法的相关技术研发也一直是学术界与产业界的关注热点。在中文输入法技术的研究中,用户的行为特点对输入法软件的词库建立、算法设计、交互方式设计与性能评价等多方面都有着至关重要的作用,但由于数据获取与分析的困难,这方面的相关研究尚不多见。该文利用某中文输入法在用户许可下收集的超过4.1亿条用户输入行为记录,进行了中文输入法用户行为的分析研究,针对不同类别应用程序的输入词频差异,不同用户在同类应用程序中的不同候选词条的选择等行为特点进行了挖掘分析,研究结果会对深入了解中文输入法用户行为,进而改进输入法软件性能具有一定的指导意义。 Different from alphabetic languages,input software is required to transform PinYin strings into characters for Chinese language.Input software therefore plays an important role in HCI process for Chinese users.In the research field of Chinese input method,it is important to look into users' behavior information to improve the qualityof dictionary construction,the algorithm,the interaction design as well as the performance evaluation.However,there lacks such works due to the difficulties in collecting corresponding behavior data.With the help of a widely-used Chinese input software company,we collected user input logs under users' agreement which contain 410 million input strings.With analysis into these input logs,we focused on the following behavior features: input string length distribution,character/word/phrase selection for different kinds of application software and the adoption of abbreviations.Conclusions help us to better understand users' input behavior and show possible ways to improve input software designation.
出处 《中文信息学报》 CSCD 北大核心 2011年第2期44-48,71,共6页 Journal of Chinese Information Processing
基金 国家自然科学基金资助项目(60736044,60903107) 高等学校博士学科点专项科研基金资助项目(20090002120005)
关键词 中文输入法 用户行为 日志分析 Chinese input software user behavior log analysis
  • 相关文献

参考文献7

  • 1中国互联网络信息中心(CNNIC),第25次中国互联网络发展状况统计报告[EB/OL],2010年1月,http://www.cnnic, net. cn/uploadfiles/pdf/2010/1/18/ 141029. pdf. 被引量:6
  • 2Z. Chen and K. Lee. A new statistical approach to Chinese pinyin input[C]//The 38th Annual Meeting of the Association for Computational Linguistics, 241- 247, Hong Kong, 2000. 被引量:1
  • 3CD Manning, H Schutze. Foundations of Statistical Natural Language Processing [M]. The MIT Press, Cambridge, Massachusetts, 1999. 被引量:1
  • 4D Downey, et al. Understanding the relationship between searchers' queries and information goals[C]// CIKM'08, 449-458, California, 2008. 被引量:1
  • 5张玮,孙乐,冯元勇,等.一种结合分类模型的中文输入法[c]//中国中文信息学会二十五周年学术会议,2006:586-593. 被引量:1
  • 6R Cen, et al. Study Language Models with Specific User Goals[C]//The 19^th international conference on World Wide Web, 1073-1074, USA, 2010. 被引量:1
  • 7J Lin. Divergence measures based on the Shannon entropy[J]. IEEE Transactions on Information Theory, 1991, 37:145-151. 被引量:1

共引文献5

同被引文献9

引证文献2

二级引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部