期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于Ngram信息的中文文档分类研究 被引量:23
1
作者 周水庚 关佶红 +1 位作者 俞红奇 胡运发 《中文信息学报》 CSCD 北大核心 2001年第1期34-39,共6页
传统文档分类系统都是基于文档的词属性 ,分类过程需要庞大的词典支持和复杂的切词处理。本文研究基于N gram信息的中文文档分类 ,使中文文档分类系统摆脱对词典和切词处理的依赖 ,从而实现中文文档分类的领域无关性和时间无关性。利用... 传统文档分类系统都是基于文档的词属性 ,分类过程需要庞大的词典支持和复杂的切词处理。本文研究基于N gram信息的中文文档分类 ,使中文文档分类系统摆脱对词典和切词处理的依赖 ,从而实现中文文档分类的领域无关性和时间无关性。利用kNN分类方法 ,实现了一个基于N gram信息的中文文档分类系统。 展开更多
关键词 N-GRAM信息 属性选择 knn 中文文档分类系统 领域无关性 时间无关性
下载PDF
无需词典支持和切词处理的中文文档分类 被引量:1
2
作者 周水庚 关佶红 胡运发 《高技术通讯》 EI CAS CSCD 2001年第3期31-35,共5页
利用中文文本的N gram信息进行中文文档分类 ,使中文文档分类摆脱了对词典和切词处理的依赖。实验结果表明 。
关键词 中文文档分类 N-gram信息 属性选择 贝叶斯分类 knn
下载PDF
用于特征筛选的最近邻(KNN)法 被引量:6
3
作者 姚莉秀 杨杰 +1 位作者 叶晨洲 陈念贻 《计算机与应用化学》 CAS CSCD 北大核心 2001年第2期135-138,共4页
把基于分类的最近邻 (KNN)算法用于模式识别的特征筛选过程 ,并与传统的基于线性分析的模式识别特征筛选方法主成分回归 (PCA)、偏最小二乘法 (PLS)和K-W检验等做比较 ,证明KNN方法对包容型数据的特征变量筛选尤其有效。为包容型数据的... 把基于分类的最近邻 (KNN)算法用于模式识别的特征筛选过程 ,并与传统的基于线性分析的模式识别特征筛选方法主成分回归 (PCA)、偏最小二乘法 (PLS)和K-W检验等做比较 ,证明KNN方法对包容型数据的特征变量筛选尤其有效。为包容型数据的特征筛选提供了一种有力的工具。 展开更多
关键词 knn 特征筛选 包容型数据 模式识别 最邻近
原文传递
基于相邻字对信息的中文文档分类研究 被引量:2
4
作者 周水庚 俞红奇 +2 位作者 胡江滔 付辛 胡运发 《小型微型计算机系统》 CSCD 北大核心 2001年第4期462-466,共5页
本文首次提出利用相邻字对信息进行中文文档分类 ,使中文文档分类摆脱了对词典和切词处理的依赖 ,实现中文文档分类的领域无关性和时间无关性 .分别利用 Naive Bayes和 k NN分类方法建立了基于相邻字对信息的中文文档分类系统 .
关键词 文档分类 属性选择 相邻宇对 knn 中文文档分类 信息处理
下载PDF
改进的KNN实时校正方法在山区中小流域的应用 被引量:1
5
作者 霍文博 高源 +2 位作者 李致家 金双彦 杨明祥 《河海大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第4期27-32,共6页
为提高山区中小流域实时洪水预报精度,提出了一种基于历史洪水学习的KNN实时校正方法(KNN-H法),并选择陕北黄土高原地区2个山区中小流域为研究区域,将其与传统KNN法和AR法进行对比,验证该方法的校正效果。结果表明:KNN法和KNN-H法的校... 为提高山区中小流域实时洪水预报精度,提出了一种基于历史洪水学习的KNN实时校正方法(KNN-H法),并选择陕北黄土高原地区2个山区中小流域为研究区域,将其与传统KNN法和AR法进行对比,验证该方法的校正效果。结果表明:KNN法和KNN-H法的校正精度总体高于AR法;KNN法和AR法不能有效降低预报结果的峰现时间误差,而KNN-H法校正结果峰现时间误差比校正前有明显降低;KNN-H法通过对历史洪水预报误差的学习,可有效解决KNN法在实时校正中因为预热期资料不足导致的校正精度不高问题;当预报洪水过程处于涨洪或退水阶段时,KNN-H法能够快速定位到历史洪水的相同阶段,分析历史预报误差后迅速对当前预报值做出校正;总体上KNN-H法校正精度高于传统KNN法。 展开更多
关键词 knn实时校正 洪水预报 山区中小流域 超渗产流模型 陕北地区
下载PDF
采用非参数方法建模的短时话者识别 被引量:1
6
作者 靳玉红 《小型微型计算机系统》 CSCD 北大核心 2012年第5期1131-1134,共4页
在与文本无关的声纹识别研究中,目前性能较好而且较成熟的系统均是基于训练并在测试数据时长较长的情况下获得的,如NIST评测中的核心测试环境下训练和测试语音时长约5分钟.而在实际应用中,由于声纹识别的特殊性,用户一般都不太配合,通... 在与文本无关的声纹识别研究中,目前性能较好而且较成熟的系统均是基于训练并在测试数据时长较长的情况下获得的,如NIST评测中的核心测试环境下训练和测试语音时长约5分钟.而在实际应用中,由于声纹识别的特殊性,用户一般都不太配合,通常很难获得足够多的训练语音数据,从而限制了经典的话者识别系统,大大降低了其性能.本文针对与实际应用直接相关的短时话者识别,提出了一种采用Parzen Window的非参数估计方法,对目标话者的短时数据进行建模,从而达到提高话者模型推广能力的目标.该方法在NIST SRE2006的短时任务10s训练,测试的实验结果与传统的GMM-UBM得分融合后,在等错误率EER下比基线系统相对降低了10.76%. 展开更多
关键词 短时声纹识别 Parzen窗估计 knn近邻
下载PDF
一种对无统计环境测量模型缺省值进行预测的新方法 被引量:1
7
作者 李梦龙 王智猛 +2 位作者 马宁 王晃 郁凌庄 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2003年第4期736-739,共4页
采用模式识别中的K最近邻法(KNN方法)对不满足于统计模型的数据阵中的缺省值进行预测,预测以样本值作为预测参照 由于原始数据阵没有训练集,故采用对原始数据进行最大似然主成分分析(MPCA),获得的结论与KNN方法处理后的数据的主成分分... 采用模式识别中的K最近邻法(KNN方法)对不满足于统计模型的数据阵中的缺省值进行预测,预测以样本值作为预测参照 由于原始数据阵没有训练集,故采用对原始数据进行最大似然主成分分析(MPCA),获得的结论与KNN方法处理后的数据的主成分分析结论相比较,结果表明,两套数据分析得出的主因子数、因子负载阵基本一致,而因子得分阵有细微的差别。 展开更多
关键词 knn最邻近 最大似然主成分分析 缺省值预测 环境数据
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部