多标记中医问诊数据的症状选择被引量：9

Symptom selection for multi-label data of inquiry diagnosis in traditional Chinese medicine

导出

摘要中医诊断中,一个患者可能兼有多个证型标记,其计算机辅助诊断是高维数据多标记学习的一个典型应用.中医问诊过程中往往会产生大量症状,这影响诊断算法建模的效果.特征选择旨在寻求最小的相关症状特征子集,且能使模型泛化能力达到最大.目前有关多标记数据特征选择的研究还很少,本文提出使用一种组合的优化技术进行中医问诊多标记数据的症状选择,通过多标记k近邻等4个算法进行建模.本文所提算法与当前流行的多种多标记数据降维算法如MEFS(多标记嵌入式特征选择方法)、MDDM(多标记特征降维方法)进行了比较,在UCI酵母多标记数据集和一个冠心病问诊数据上的实验结果显示本文算法较之已有多种算法有明显提高,在average precision上对分类器的提高可达10.62%和14.54%.论文实现了冠心病问诊症候模型的建立,为冠心病的诊断和其他多标记数据分析提供了有效的参考. In traditional Chinese medicine （TCM） diagnosis, a patient may be associated with more than one syndrome tags, and its computer-aided diagnosis is a typical application in the domain of multi-label learning of high-dimensional data. It is common that a great deal of symptoms can occur in traditional Chinese medical diagnosis, which affects the modeling of diagnostic Mgorithm. Feature selection entails choosing the smallest feature subset of relevant symptoms, and maximizing the generalization performance of the model. At present there are rare researches on feature selection on multi-label data. A hybrid optimization technique is introduced to symptom selection for multi-label data in TCM diagnosis in this paper, and modeling is made by means of four multi-label learning algorithms like k nearest neighbors, etc. We compare the performance of the algorithm with the current popular dimension reduction algorithms like MEFS （embedded feature selection for multi-Label learning）, MDDM （multi-label dimensionality reduction via dependence maximization） on the UCI Yeast gene functional data set and an inquiry diagnosis dataset of coronary heart disease （CHD）. Experimental results show that the algorithm we present has significantly improved the performance. In particular, the improvement on the average precision for the classifier is up to 10.62% and 14.54%. Syndrome inquiry modeling of CHD in TCM is realized in this paper, providing effective reference for the diagnosis of CHD and analysis of other multi-label data.

作者邵欢李国正刘国萍王忆勤

机构地区上海大学计算机工程与科学学院同济大学控制科学与工程系教育部服务计算与嵌入式系统重点实验室上海中医药大学中医四诊信息化综合实验室

出处《中国科学：信息科学》 CSCD 2011年第11期1372-1387,共16页 Scientia Sinica(Informationis)

基金国家自然科学基金(批准号:60873129 30901897 61005006) 上海市重点学科(批准号:S30302 B004) 模式识别国家重点实验室开放课题资助项目

关键词多标记学习特征选择高维中医问诊冠心病 multi-label learning, feature selection, high-dimensionality, inquiry of traditional Chinese medicine coronary heart disease

分类号 R241 [医药卫生—中医诊断学] TP181 [医药卫生—中医临床基础]

引文网络
相关文献

参考文献22

1葛雷,李国正,尤鸣宇.多标记学习的嵌入式特征选择[J].南京大学学报（自然科学版）,2009,45(5):671-676. 被引量：12
2王阶,邢雁伟,姚魁武,李军.冠心病心绞痛中医证候要素研究及临床应用[J].湖北中医学院学报,2009,11(3):3-5. 被引量：21
3李国春,李春婷,黄蓝平,单兆伟,陈启光.结构方程模型探讨慢性萎缩性胃炎证候分型规律[J].南京中医药大学学报,2006,22(4):217-220. 被引量：27
4田琳,阎英杰,朱建贵,王映辉.数据挖掘及其在中医药领域中的应用[J].中国中医基础医学杂志,2005,11(9):710-712. 被引量：25
5Ji S W,Ye J P.Linear dimensionality reduction for multi-label classification. Proceedings of the21st InternationalConference on Artificial Intelligence . 2009 被引量：1
6Liu G P,Li G Z,Wang Y L,et al.Modeling of inquiry diagnosis for coronary heart disease in traditional Chinesemedicine by using multi-label learning. BMC Complem Altern Med . 2010 被引量：1
7Sokolov A,Whitley D.Unbiased tournament selection. Proceedings of the2005Conference on Genetic andEvolutionary Computation . 2005 被引量：1
8Zhang M L,Zhou Z H.ML-KNN:A lazy learning approach to multi-label learning. Pattern Recognition . 2007 被引量：1
9Zhang M L,Zhou Z H.Multilabel neural networks with applications to functional genomics and text categorization. IEEE Transactions on Knowledge and Data Engineering . 2006 被引量：1
10Elisseeff A,Weston J.A kernel method for multi-labelled classification. Advances in Neural Information Processing Systems . 2002 被引量：1

二级参考文献43

1陈启光,申春悌,张华强,符为民,闵捷,王澄淑,郦永平,朱佳,史锁方,朱学云,陈晓虎,石磊,徐丽华,常惠.结构方程模型在中医证候规范标准研究中的应用[J].中国卫生统计,2005,22(1):2-4. 被引量：67
2李国春,陈文垲,梅晓云,彭昌孝,周玲.中医宏观辨证指标量化方法研究探讨[J].中国中医基础医学杂志,2005,11(9):650-652. 被引量：23
3李丹,李国正,陆文聪.用于药物活性预报的Co-Training方法[J].计算机科学,2006,33(12):159-161. 被引量：3
4Schapire R E, Singer Y. Boostexter: A boosting-based system for text categorization. Machine Learning, 2000, 39 (2--3):135-168. 被引量：1
5McCallum A. Multi-label text classification with a mixture model trained by EM. Working Notes of the AAAI' 99 Workshop on Text Learning. Orlando: AAAI, 1999. 被引量：1
6Boutell M R, Luo J, Shen X, et al. Learning multi-label scene classification. Pattern Recognition, 2004, 37(9): 1757-1771. 被引量：1
7Yin Z, Zhou Z H. Multi-label dimensionality reduction via dependency maximization. Proceedings of the 23^rd AAAI Conference on Artificial Intelligence, Chicago, IL: AAAI, 2008, 1503-1505. 被引量：1
8Yu K, Yu S P, Tresp V. Multi-label informed latent semantic indexing. Proceedings of the 28^th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, New York, NY:ACM, 2005, 258--265. 被引量：1
9Moody J, Utans J. Principled architecture selection for neural networks: Application to corporate bond rating prediction. Moody J E, Hanson S J, Lippmann R P. Neural Information Processing Systems 4. Morgan Kaufmann Publishers, Inc. 1992, 683-690. 被引量：1
10Guyon I, Elisseeff A. An introduction to variable and feature selection. Journal of Machine Learning Research, 2003, 3:1157-1182. 被引量：1

共引文献81

1徐晓惠,孙易娜,杨琼,周姝含,万莹,高清华,吕文亮.基于代谢组学技术的慢性胃炎脾胃湿热证病机转化规律研究[J].世界科学技术-中医药现代化,2021,23(8):2607-2615. 被引量：10
2汪倍蕾.葛酮通络胶囊治疗冠心病心绞痛的临床疗效分析[J].世界临床医学,2017,11(3):168-168. 被引量：2
3李志更,王天芳,任婕,杜彩凤.中医科研中几种常用数据挖掘方法浅析[J].中医药学报,2008,36(2):29-32. 被引量：32
4秦雪君,施诚.数据挖掘技术在中医药领域的应用[J].医学信息（西安上半月）,2006,19(6):945-947. 被引量：15
5于川.信息技术在中医药领域的应用评述[J].医学信息（西安上半月）,2006,19(12):2073-2075. 被引量：5
6李力恒.浅谈KDD技术在中医药领域的应用[J].黑龙江科技信息,2007(07X):194-194. 被引量：2
7吕宾,黄宣.浅谈治疗慢性萎缩性胃炎及其癌前病变研究中存在的问题[J].江苏中医药,2007,39(8):8-9. 被引量：3
8温淑云,郦永平.中医证候量化分析研究述略[J].实用中医内科杂志,2007,21(5):5-6. 被引量：6
9宇文亚,谢雁鸣,耿直,翁维良,王永炎.基于因果模型的中医证候研究探讨[J].世界科学技术-中医药现代化,2007,9(5):30-33. 被引量：6
10朱飞叶,石灯汉,王丽,徐珊.慢性胃炎中医证候研究进展[J].浙江中医药大学学报,2008,32(5):692-693. 被引量：3

同被引文献209

1潘思行,林育,周苏娟,黄展鹏.基于神经网络和支持向量机的中医体质辨识模型研究[J].世界科学技术-中医药现代化,2020,22(4):1341-1347. 被引量：14
2殷彬,方思行.脾虚证诊断的数学模型[J].暨南大学学报（自然科学与医学版）,2006,27(3):363-367. 被引量：4
3李志更,王天芳,任婕,杜彩凤.中医科研中几种常用数据挖掘方法浅析[J].中医药学报,2008,36(2):29-32. 被引量：32
4徐燕,李锦涛,王斌,孙春明,张森.不均衡数据集上文本分类的特征选择研究[J].计算机研究与发展,2007,44(z2):58-62. 被引量：20
5刘建香.复杂网络及其在国内研究进展的综述[J].系统科学学报,2009,17(4):31-37. 被引量：72
6崔蒙,李海燕,雷蕾,胡雪琴.“大数据”时代与中医药“知识密集型”数据[J].中国中医药图书情报杂志,2013(3). 被引量：17
7陈伟青.浅论人工神经网络在中医学上的应用[J].河南中医学院学报,2004,19(4):12-13. 被引量：6
8张丽新,王家钦,赵雁南,杨泽红.机器学习中的特征选择[J].计算机科学,2004,31(11):180-184. 被引量：18
9徐蕾,贺佳,孟虹,王忆勤,贺宪民,范思昌,郎庆波.基于信息熵的决策树在慢性胃炎中医辨证中的应用[J].中国卫生统计,2004,21(6):329-331. 被引量：6
10王学伟,瞿海斌,王阶.一种基于数据挖掘的中医定量诊断方法[J].北京中医药大学学报,2005,28(1):4-7. 被引量：40

引证文献9

1郑舞,刘国萍.常见数据挖掘方法在中医诊断领域的应用概况[J].中国中医药信息杂志,2013,20(4):103-107. 被引量：16
2徐玮斐,刘国萍,王忆勤,燕海霞,郭睿.近5年中医证候诊断客观化研究述评[J].中医杂志,2016,57(5):442-445. 被引量：26
3马梦羽,沈璐,文天才,夏勇.数据挖掘技术在中医诊疗数据分析中的应用[J].中国中医药信息杂志,2016,23(7):132-136. 被引量：33
4潘晔,徐思慧,许峰巍,许丽璇.冠心病四诊信息客观化研究进展[J].山西中医学院学报,2016,17(4):78-78.
5吕庆莉,郭哲.数据挖掘在中医体质分析中的应用研究[J].陕西中医药大学学报,2018,41(3):93-97. 被引量：3
6赵文,张佳,徐佳君,辛基梁,周常恩,李绍滋,李灿东.四诊合参智能化发展现状及实现路径[J].中医杂志,2020,61(1):58-62. 被引量：28
7陈瑞,刘璐,张春柯,王忆勤,燕海霞,郭睿.问诊症状特征选择方法[J].中华中医药杂志,2021,36(4):2161-2164. 被引量：4
8周慧颖,汪廷华,张代俐.多标签特征选择研究进展[J].计算机工程与应用,2022,58(15):52-67. 被引量：6
9刘金垒,胡骏,刘咏梅,查玉玲,王阶.基于证候要素探讨中医人工智能诊疗系统设计[J].国际中医中药杂志,2023,45(10):1201-1206. 被引量：2

二级引证文献115

1占梦玲,曹明卓,李秀敏,苗明三.基于中西医临床病症特点的癫痫动物模型分析[J].中药药理与临床,2022,38(3):177-181. 被引量：1
2石康乐,孟庆刚.基于贝叶斯推理的中医诊疗小数据构建设想[J].中华中医药学刊,2022,40(5):104-107. 被引量：3
3Ya'nan Song,Jianpeng Hu,Haiyan Wang,Lina Wang,Xiaojuan Li,Yun Pan,Feifei Bu,Jian Wang.Research on the modern clinical herbal administration rules in TCM treatment of ovarian cysts based on data mining[J].Journal of Traditional Chinese Medical Sciences,2017,4(2):222-231.
4云才,黄健,吴一民,刘浩江,张平平,李力.足底内侧岛状皮瓣转位修复足跟部皮肤缺损[J].内蒙古医学杂志,2000,32(2):85-86.
5施弘.基于模糊数学理论的互联网疾病食疗系统设计[J].中国医学创新,2014,11(14):122-125. 被引量：1
6张孟之,高洁,李文,秦忠,罗振亮,陈云志.人工智能时代下的中医四诊客观化研究初探[J].贵阳中医学院学报,2019,41(1):100-102. 被引量：13
7耿翠翠,孙立哲,王希胜.基于中医体质理论分析放射性肠炎的防治[J].现代中医药,2019,39(1):23-25.
8张恒艳,叶建州,周也,杨雪松.灰色马尔可夫模型在中医证候预测中的应用进展[J].辽宁中医杂志,2019,46(1):6-9. 被引量：2
9孙颖伟,眭蕴慧,张磊,陈亚光,殷海波.数据挖掘技术在中医病证规律研究中的应用进展[J].北京中医药,2015,34(1):70-74. 被引量：4
10仝武宁,王亚丽,李宏斌.基于Apriori算法的“证-症-方-药”关联模型的研究与设计[J].计算机与数字工程,2015,43(4):548-550. 被引量：1

1谢石.互联网孤独症候群[J].青年博览,2016,0(20):6-7.
2刘晓莉,杨灵娥,宋春玲.提高多目标输出神经网络模型泛化能力和预测精度的方法[J].佛山科学技术学院学报（自然科学版）,2008,26(1):31-33. 被引量：4
3刘维娜.基于Java ME和J2EE的小儿中医问诊系统的设计[J].计算机光盘软件与应用,2011(21):193-193.
4赵熙临,刘辉.粗糙集理论在故障诊断中的问题分析[J].计算机技术与发展,2008,18(1):132-135. 被引量：1
5夏虎,庄健,周璠,于德弘.采用多目标进化模型的无监督故障特征选择算法[J].振动与冲击,2014,33(8):61-65. 被引量：4
6丁克北.基于模糊-小波神经网络的轴心轨迹识别方法[J].石油机械,2005,33(6):14-16. 被引量：4
7何明,周莹清,叶文勇,黄伟.人工神经网络故障诊断系统可靠性和聚类能力的分析[J].上海电力学院学报,2001,17(4):37-42. 被引量：1
8韦昌法,黄惠勇,罗铁清,占艳,晏峻峰.中医诊疗信息数据元构建初探[J].湖南中医药大学学报,2013,33(1):69-71. 被引量：3
9张永涛,梁嵘.关于研制中医数字问诊系统的构想[J].中国医学影像技术,2003,19(z1):138-139. 被引量：5
10孙广玲,董勇,刘志.伪特权信息和SVM+[J].西安电子科技大学学报,2016,43(6):103-108. 被引量：1

中国科学：信息科学

2011年第11期

浏览历史

内容加载中请稍等...

多标记中医问诊数据的症状选择被引量：9

参考文献22

二级参考文献43

共引文献81

同被引文献209

引证文献9

二级引证文献115

相关作者

相关机构

相关主题

浏览历史

多标记中医问诊数据的症状选择 被引量：9

参考文献22

二级参考文献43

共引文献81

同被引文献209

引证文献9

二级引证文献115

相关作者

相关机构

相关主题

浏览历史

多标记中医问诊数据的症状选择被引量：9