期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于EM算法的混合正态分布的参数求解及定阶问题的探讨 被引量:2
1
作者 郭靖 张磊 《现代计算机》 2009年第12期21-25,共5页
对金融资产的收益率的分布的精确拟合是证券市场的风险管理和价格趋势预测的基础。由于收益率数据的分布具有尖峰厚尾性,一般的分布函数较难对其进行拟合,混合正态分布被学者认为能较好地拟合这种情况,但混合正态分布中有较多的待求参数... 对金融资产的收益率的分布的精确拟合是证券市场的风险管理和价格趋势预测的基础。由于收益率数据的分布具有尖峰厚尾性,一般的分布函数较难对其进行拟合,混合正态分布被学者认为能较好地拟合这种情况,但混合正态分布中有较多的待求参数,准确求解这些参数是一个难题,另一个需要探讨的问题是定阶问题。基于EM算法求解参数,并且对定阶问题进行实证分析。将混合正态分布与其他各种分布(正态分布、韦布尔分布、广义误差分布、拉普拉斯分布和Logistic分布)进行横向对比。 展开更多
关键词 混合正态分布 定阶问题 EM算法
下载PDF
基于投诉文本记录的数据挖掘系统 被引量:1
2
作者 林波 丁东辉 +2 位作者 郭靖 林伟佳 黄翰 《中国科技信息》 2015年第21期51-54,共4页
本文研究开发了一套基于广东移动投诉文本记录的数据挖掘系统。系统主要分为聚类分析、情感分析和匹配文本记录三个功能模块,处理的数据是大量的广东移动的投诉文本记录。广东移动呼叫中心平均每天需要为用户提供超过70万人次的人工话... 本文研究开发了一套基于广东移动投诉文本记录的数据挖掘系统。系统主要分为聚类分析、情感分析和匹配文本记录三个功能模块,处理的数据是大量的广东移动的投诉文本记录。广东移动呼叫中心平均每天需要为用户提供超过70万人次的人工话务支撑,这是一个十分庞大的数字,这些大数据背后隐藏了无限的挖掘潜力。这些待挖掘的潜力无论是在公司应对消费者投诉处理方面还是在改善服务质量方面都有很重要的意义。本文是使用JSP动态网页技术开发完成。系统采用了MVC设计模式,基于Oracle 11g数据库和Tomcat7.0服务器开发平台。 展开更多
关键词 数据挖掘系统 文本数据 情感词 TOMCAT 功能模块 动态网页技术 导航栏 管理模块 业务逻辑 外键
下载PDF
基于双层语料过滤器的短语抽取方法
3
作者 林波 林伟佳 +2 位作者 郭靖 丁东辉 黄翰 《计算机与现代化》 2015年第12期7-14,共8页
文本主题提取技术能够有效地精炼文本消息,传统的中文文本由最基本的词语组成,由于词汇本身的信息粒度过小,针对词语进行中文信息抽取不能完整表达文本片段的语义信息。短语本身包含较为丰富的细粒度语义信息,更能表达出文本片段的主题... 文本主题提取技术能够有效地精炼文本消息,传统的中文文本由最基本的词语组成,由于词汇本身的信息粒度过小,针对词语进行中文信息抽取不能完整表达文本片段的语义信息。短语本身包含较为丰富的细粒度语义信息,更能表达出文本片段的主题性。本文提出基于双层语料过滤器(词性过滤器与短语扩展规则过滤器)的方法来进行文本语料的冗余信息过滤并抽取文本主题短语信息。实验证明,本文的方法具有一定的可靠性和应用性。 展开更多
关键词 短语抽取 信息提取 规则挖掘
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部