期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于K-means和TF-IDF的中文药名聚类分析
被引量:
2
1
作者
黄运高
王妍
+2 位作者
邱武松
向林泓
赵学良
《计算机应用》
CSCD
北大核心
2014年第A01期173-174,210,共3页
针对药名聚类中药物命名特殊性导致的命名准确率低的问题,提出了基于TF-IDF和K-means的药名聚类方法。药物命名具有一定的规律性且中西药名命名形式不同等特点,基于字词共现频率的方法难以取得较好的聚类效果,因此,使用TF-IDF方法计算...
针对药名聚类中药物命名特殊性导致的命名准确率低的问题,提出了基于TF-IDF和K-means的药名聚类方法。药物命名具有一定的规律性且中西药名命名形式不同等特点,基于字词共现频率的方法难以取得较好的聚类效果,因此,使用TF-IDF方法计算药名相似的方法并采用K-means聚类算法进行药名的聚类。实验结果表明,TFIDF的聚类准确率高于TF的聚类方法,按字切分的聚类准确率高于分词后的聚类准确率,基于字和TF-IDF的聚类准确率最高且稳定,准确率达到96.77%。
展开更多
关键词
TF-IDF
K-MEANS
中文药名聚类
药名分析
字词
共
现
频率
下载PDF
职称材料
题名
基于K-means和TF-IDF的中文药名聚类分析
被引量:
2
1
作者
黄运高
王妍
邱武松
向林泓
赵学良
机构
重庆药品交易所股份有限公司
中国科学院重庆绿色智能技术研究院高性能计算应用研究中心
出处
《计算机应用》
CSCD
北大核心
2014年第A01期173-174,210,共3页
基金
国家科技支撑计划项目(2012BAH19F01)
文摘
针对药名聚类中药物命名特殊性导致的命名准确率低的问题,提出了基于TF-IDF和K-means的药名聚类方法。药物命名具有一定的规律性且中西药名命名形式不同等特点,基于字词共现频率的方法难以取得较好的聚类效果,因此,使用TF-IDF方法计算药名相似的方法并采用K-means聚类算法进行药名的聚类。实验结果表明,TFIDF的聚类准确率高于TF的聚类方法,按字切分的聚类准确率高于分词后的聚类准确率,基于字和TF-IDF的聚类准确率最高且稳定,准确率达到96.77%。
关键词
TF-IDF
K-MEANS
中文药名聚类
药名分析
字词
共
现
频率
Keywords
TF-IDF
K- means
Chinese drug name clustering
drug name analysis
word co-occurrence frequency
分类号
TP311.1 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于K-means和TF-IDF的中文药名聚类分析
黄运高
王妍
邱武松
向林泓
赵学良
《计算机应用》
CSCD
北大核心
2014
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部