基于标志词的正向自适应长度匹配的地址分词算法与缺失地址要素补充方法被引量：1

Address Segmentation Algorithm Based on Forward Adaptive Length Matching by Mark Words and Supplementary Method of Missing Address Elements

下载PDF

导出

摘要目的将电子病历中患者的非结构化地址信息转化成结构化地址信息,并补充地址中缺失的地址要素。方法构建存储标准地址数据集的标准地址库和自定义的地址匹配规则库。依托标准地址库,采用基于地址要素标志的正向自适应匹配算法将地址进行分词。将分词得到的地址要素根据构建的自定义地址匹配规则库从后往前查找,得到完整的地址。结果该方法实现了病历中地址数据的自动分词,同时补充了地址数据中缺失的地址要素,完成地址标准化的工作。结论本研究极大地方便了临床病案首页中地址信息的自动获取、各类机构数据上报和数据统计分析工作,大幅减少人工数据处理的工作量,为后续其他信息的提取和标化打下坚实基础。 Objective To transform the unstructured address information of patients in electronic medical record into structured address information, and supplement the missing address element in the address. Methods A standard address library for storing standard address data sets and a custom address matching rule library were built in this paper. Based on the standard address library, the address was segmented by a forward adaptive matching algorithm based on address elements. Then the address elements obtained by word segmentation were looked up from back to front according to the custom address matching rule base constructed to obtain the complete address. Results The automatic word segmentation of address data in medical records was realized, and the missing address elements in address data was complemented to complete the work of address standardization. Conclusion This study not only greatly facilitates the automatic acquisition of address information on the first page of clinical medical records, but also facilitates the data reporting and statistical analysis of various institutions. It can greatly reduce the workload of manual data processing and lay a solid foundation for subsequent extraction and standardization of other information.

作者李净朱贵鲜周亮郑西川 LI Jing;ZHU Guixian;ZHOU Liang;ZHENG Xichuan(Computer Center, East Hospital of the Sixth Affiliated People’s Hospital of Shanghai Health Medical College, Shanghai 201306, China)

机构地区上海健康医学院附属第六人民医院东院计算机中心

出处《中国医疗设备》 2019年第4期112-114,130,共4页 China Medical Devices

基金上海市申康临床管理优化项目(SHDC12017638)

关键词地址分词正向自适应长度匹配缺失地址要素补充结构化地址 address description forward adaptive matching missing address element supplement address structuring

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献20

1韦隆莉,孙其凤,杨帅.骨科护理结构化电子病历分析与基于国际护理实践分类的对照研究[J].中国医学创新,2018,15(1):92-95. 被引量：7
2李波.基于B/S架构的医院电子病历管理系统设计与研究[J].电子设计工程,2017,25(5):46-49. 被引量：8
3曹宇,蔡宏伟,赵博,胡开进,张林林,胡曼,曹小敏.电子病历自动划价系统的设计与应用[J].中国卫生质量管理,2015,22(1):100-102. 被引量：2
4赵阳阳,王亮,仇阿根.地址要素识别机制的地名地址分词算法[J].测绘科学,2013,38(5):74-76. 被引量：26
5钱里程.门诊电子病历管理系统的设计与实现[J].现代电子技术,2014,37(22):78-80. 被引量：2
6宋安..基于电子病历的医疗诊断模型的研究与应用[D].浙江理工大学,2018:
7程昌秀,于滨.一种基于规则的模糊中文地址分词匹配方法[J].地理与地理信息科学,2011,27(3):26-29. 被引量：48
8周程远,朱敏,杨云.基于词典的中文分词算法研究[J].计算机与数字工程,2009,37(3):68-71. 被引量：22
9刘韬.设立切分标志法在中文地址自动分词中的改进与应用[J].电脑知识与技术,2009,0(4Z):2828-2829. 被引量：3
10马照亭,李志刚,孙伟,印洁.一种基于地址分词的自动地理编码算法[J].测绘通报,2011(2):59-62. 被引量：28

二级参考文献132

1庄东,陈英.基于加权近似支持向量机的文本分类[J].清华大学学报（自然科学版）,2005,45(S1):1787-1790. 被引量：16
2李丹宁,李丹,王保华,马新强.几种基于词典的中文分词算法评价[J].贵州科学,2008,26(3):1-8. 被引量：4
3朱建伟,王泽民.地理编码原理及其本地化解决方案[J].北京测绘,2004,18(2):24-27. 被引量：17
4文庭孝,邱均平,侯经川.汉语自动分词研究展望[J].现代图书情报技术,2004(7):6-10. 被引量：20
5王凌云,李琦,江洲.国内地理编码数据库系统开发与研究[J].计算机工程与应用,2004,40(21):167-168. 被引量：33
6孙茂松,邹嘉彦.汉语自动分词研究评述[J].当代语言学,2001,3(1):22-32. 被引量：101
7陈细谦,迟忠先,金妮.城市地理编码系统应用与研究[J].计算机工程,2004,30(23):50-52. 被引量：29
8张春霞,郝天永.汉语自动分词的研究现状与困难[J].系统仿真学报,2005,17(1):138-143. 被引量：60
9费洪晓,康松林,朱小娟,谢文彪.基于词频统计的中文分词的研究[J].计算机工程与应用,2005,41(7):67-68. 被引量：68
10梁以敏,黄德根.基于完全二阶隐马尔可夫模型的汉语词性标注[J].计算机工程,2005,31(10):177-179. 被引量：25

共引文献184

1吴欢,应俊,王逸飞,胡华宇,徐洪丽,郑一琼.乳腺癌病理文本的结构化信息提取[J].解放军医学院学报,2020,41(7):746-751. 被引量：10
2刘一宁,郭功举,林木棵,王琳.基于位置描述的地理实体信息融合方法[J].测绘通报,2021(S01):65-69. 被引量：7
3时贵英,吕洪涛.可扩展数据库搜索引擎的研究和实现[J].长江大学学报（自科版）（上旬）,2010,7(1):216-218.
4徐济成,李绍稳,张友华,辜丽川.面向茶学领域本体的概念自动提取方法研究[J].农业网络信息,2010(8):13-15.
5吴小兰.基于有效反馈结果的元搜索引擎调度策略[J].科技信息,2010(12):11-12. 被引量：4
6毕明霞,黄汉明,边银菊,李锐,陈银燕,赵静.天然地震与人工爆破波形信号HHT特征提取和SVM识别研究[J].地球物理学进展,2011,26(4):1157-1164. 被引量：27
7任剑锋,梁雪,李淑红.基于非线性流形学习和支持向量机的文本分类算法[J].计算机科学,2012,39(1):261-263. 被引量：10
8羊毛卓玛,欧珠.一种改进的藏文分词交集型歧义消解方法[J].西藏科技,2012(1):66-68. 被引量：3
9徐远方,李成城.基于SVM和词间特征的新词识别研究[J].计算机技术与发展,2012,22(5):134-136. 被引量：4
10WANG Yingjie,LI Hongsheng,YU Zhuoyuan,LUO Bin.Approaches to Census Mapping:Chinese Solution in 2010 Rounded Census[J].Chinese Geographical Science,2012,22(3):356-366. 被引量：5

同被引文献13

1王缓缓,郭敬义,张警灿,余肖生.基于Hadoop的数据仓库构建模式研究[J].重庆理工大学学报（自然科学）,2015,29(7):69-73. 被引量：7
2魏玲,魏永江,高长元.基于Bigtable与MapReduce的Apriori算法改进[J].计算机科学,2015,42(10):208-210. 被引量：22
3常建秋,沈炜.基于字符串匹配的中文分词算法的研究[J].工业控制计算机,2016,29(2):115-116. 被引量：19
4汪洋,刘师培,王峥.基于Trie树和有限状态自动机的中文地址解析模型[J].计算机与现代化,2016(7):60-67. 被引量：3
5王洪亮.基于词向量聚类的中文微博产品命名实体识别[J].兰州理工大学学报,2017,43(1):104-110. 被引量：8
6任智慧,徐浩煜,封松林,周晗,施俊.基于LSTM网络的序列标注中文分词法[J].计算机应用研究,2017,34(5):1321-1324. 被引量：69
7谢婷婷,严柯.基于统计的中文地址位置语义解析方法研究[J].软件导刊,2017,16(10):19-21. 被引量：8
8杨观赐,杨静,李少波,胡建军.基于Dopout与ADAM优化器的改进CNN算法[J].华中科技大学学报（自然科学版）,2018,46(7):122-127. 被引量：113
9方玉萍,万荣,方达.中文分词中歧义字段处理的研究[J].电子世界,2019,0(12):54-55. 被引量：3
10王浩畅,周锦程.中文语法自动纠错系统的研究与实现[J].企业科技与发展,2020,0(2):81-84. 被引量：6

引证文献1

1余俊,于文年,彭艳兵.基于ELMo-BiLSTM-CRF模型的中文地址分词[J].电子设计工程,2021,29(20):72-76. 被引量：5

二级引证文献5

1肖海艳.基于深度学习的在线教师课程评论情感分析模型[J].电子设计工程,2023,31(6):39-42. 被引量：1
2兰庆炜,樊宁.结合MacBERT与多层次特征协同网络的音乐社交评论情感分析模型[J].电子设计工程,2023,31(7):36-41.
3陈丽春.结合ERNIE2.0和多尺度网络的数字图书馆文本分类研究[J].电子设计工程,2023,31(19):1-5.
4刘啸婵,丁宗玮,戴煜炜,刘晓川.中文地名地址匹配方法综述[J].测绘与空间地理信息,2023,46(9):64-67. 被引量：2
5苗佳池,陈颖,生龙,魏忠诚,王巍.基于RoBERTa-BiLSTM-SelfAttention-CRF的中文地址解析方法[J].河北省科学院学报,2024,41(6):25-34.

1王伟.上海市地址数据采集更新方法研究[J].矿山测量,2018,46(6):113-116. 被引量：1
2刘扬.小学体育课堂运用过程性评价对学生的积极影响[J].小学生（教学实践）,2019(3):35-35. 被引量：1
3杨光.找准标志词学好现在完成时[J].初中生学习指导（九年级冲刺版）,2018(9):31-32.
4谢婷婷,严柯.基于统计的中文地址位置语义解析方法研究[J].软件导刊,2017,16(10):19-21. 被引量：8
5庞宇.基于中文NLP的计算机语言学关键问题的研究[J].计算机产品与流通,2019,8(1):236-236. 被引量：1
6智慧时空基础设施建设有序推进[J].中国建设信息化,2019(1):46-47.
7陈佳暄,狄江丽,赵艳霞,吴久玲.我国妇女常见病筛查数据上报现状调查[J].中国妇产科临床杂志,2019,20(2):143-145. 被引量：5
8李宏龙.新时代下自然博物馆藏品的日常管理和统计分析工作[J].博物馆研究,2019(1):56-62. 被引量：1
9唐静,左小清,欧朝蓉.基于地籍数据库的中文地址标准化[J].地理空间信息,2019,17(1):119-122.
10张利军.阐述PCB设计中差分信号等长要求实施细则[J].科学与信息化,2018,0(31):11-12.

中国医疗设备

2019年第4期

浏览历史

内容加载中请稍等...

基于标志词的正向自适应长度匹配的地址分词算法与缺失地址要素补充方法被引量：1

参考文献20

二级参考文献132

共引文献184

同被引文献13

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于标志词的正向自适应长度匹配的地址分词算法与缺失地址要素补充方法 被引量：1

参考文献20

二级参考文献132

共引文献184

同被引文献13

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

基于标志词的正向自适应长度匹配的地址分词算法与缺失地址要素补充方法被引量：1