审判案例自动抽取与标注模型研究被引量：19

Study on the Model of Automatic Extraction and Annotation of Trail Cases

导出

摘要针对刑事判决书文本,结合刑事审判本体,构建基于本体的案例自动抽取与标注模型。基于法律案例文本的半结构化特征,依据文档组织结构和线索词,运用正则表达式构建抽取规则模板;同时结合自然语言处理技术进行相关语义信息的精准抽取。运用语义标注技术构建刑事审判本体实例库,实现大量案例文本向语义信息网络的转化,便于运用语义信息进行相似案例检索和审判推荐。实验证明,该模型的抽取结果基本达到预期效果。 This paper constructs an Ontology - based automatic extraction and annotation model for the massive texts of criminal judgments combined with the case - Ontology. It uses regular expressions to construct extraction rules and templates for the semi - structured characteristics of the texts of legal cases, according to the structure of the documents and the clue words. Besides, it applies natural language processing techniques for the accurate information extraction, then gives semantic annotation of the results of extraction for building an Ontology knowledge base of legal cases, to realize the transformation of case texts to semantic information Web, for the further similar case retrieval and judge recommendation.And the experiment shows a good result.

作者佘贵清张永安

机构地区北京工业大学经济与管理学院

出处《现代图书情报技术》 CSSCI 北大核心 2013年第6期23-29,共7页 New Technology of Library and Information Service

关键词语义标注本体规则抽取自然语言处理 Semantic annotation Ontology Rule extraction Natural language processing

分类号 D926.2 [政治法律—法学] TP391.3 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1Uschold M, Gruninger M. Ontologies and Semantics for Seamless Connectivity [ J ]. ACM SIGMOD Record,2004,33 (4) :58 - 64. 被引量：1
2Berners - Lee T, Hendler J, Lassila O. The Semantic Web [ J ]. Sci-entific American Magazine, 2001,284 ( 5 ) : 28 - 37. 被引量：1
3Cardie C. Empirical Methods in Information Extraction[ J]. AI Mag- azine, 1997,18 (4) :65 - 78. 被引量：1
4Popov B, Kiryakov A, Kirilov A, et al. KIM - Semantic Annotation Platform[ C ]. In: Proceedings of the 2nd International Semantic Web Conference ( ISWC' 2003 ) , Florida, USA. 2003 : 834 - 849. 被引量：1
5荆涛,左万利,孙吉贵,车海燕.中文网页语义标注：由句子到RDF表示[J].计算机研究与发展,2008,45(7):1221-1231. 被引量：31
6高琦..基于Bootstrapping的本体标注方法研究[D].重庆大学,2010:
7Pandit S. Ontology - guided Extraction of Structured Information from Unstructured Text: Identifying and Capturing Complex Rela- tionships [ D ] Ames : Iowa State University,2010. 被引量：1
8章勇,吕俊白.基于Protege的本体建模研究综述[J].福建电脑,2011,27(1):43-45. 被引量：24
9刘克强.2009共享版ICTCLAS的分析与使用[J].科教文汇,2009(22):271-271. 被引量：17

二级参考文献28

1王睿,张洁,张由仪,于禛,姚天昉.基于混合模型的中文命名实体抽取系统[J].清华大学学报（自然科学版）,2005,45(S1):1908-1914. 被引量：10
2刘群,张华平,俞鸿魁,程学旗.基于层叠隐马模型的汉语词法分析[J].计算机研究与发展,2004,41(8):1421-1429. 被引量：198
3俞鸿魁,张华平,刘群,吕学强,施水才.基于层叠隐马尔可夫模型的中文命名实体识别[J].通信学报,2006,27(2):87-94. 被引量：155
4崔世起,刘群,孟遥,于浩,西野文人.基于大规模语料库的新词检测[J].计算机研究与发展,2006,43(5):927-932. 被引量：32
5周俊生,戴新宇,尹存燕,陈家骏.基于层叠条件随机场模型的中文机构名自动识别[J].电子学报,2006,34(5):804-809. 被引量：112
6杜小勇,李曼,王珊.本体学习研究综述[J].软件学报,2006,17(9):1837-1847. 被引量：241
7向阳,王敏,马强.基于Jena的本体构建方法研究[J].计算机工程,2007,33(14):59-61. 被引量：33
8何克清.本体元建模理论与方法及其应用[M].科学出版社.2006. 被引量：1
9韩婕,向阳.本体构建研究综述[J].计算机应用与软件,2007,24(9):21-23. 被引量：50
10Berners-Lee T, Hendler J, Lassila O. The Semantic Web [J]. Scientific American Magazine, 2001, 284(5):28-37 被引量：1

共引文献69

1郭崇慧,许蒙.一种基于众包模式的试题知识点标注方法[J].信息与管理研究,2019,0(6):64-72. 被引量：3
2盛泳潘,付雪峰,吴天星.基于开放域抽取的多文档概念图构建研究[J].计算机应用研究,2020,37(1):19-25. 被引量：2
3张玉峰,蔡皎洁.基于数据挖掘的Web文本语义分析与标注研究[J].情报理论与实践,2010,33(2):85-88. 被引量：7
4常平梅,李冠宇,张俊.基于本体集成的语义标注模型设计[J].计算机工程与设计,2010,31(5):1125-1129. 被引量：6
5金灿.面向不同结构化程度数据源的本体学习方法研究[J].计算机时代,2010(8):10-13. 被引量：1
6刘鹏博,车海燕,陈伟.知识抽取技术综述[J].计算机应用研究,2010,27(9):3222-3226. 被引量：15
7牟冬梅,范轶,王丽伟.数字资源语义互联研究(Ⅲ)——语义标注子系统的设计与实现[J].现代图书情报技术,2010(9):13-17. 被引量：2
8何正国.AntConc在机器翻译的译前处理中的应用[J].经济研究导刊,2011(15):227-228. 被引量：1
9李慧颖,瞿裕忠.基于关键词的语义网数据查询研究综述[J].计算机科学,2011,38(7):18-23. 被引量：7
10陈阳,赵跃华,程显毅.基于用字共现频率统计的外国译名自动识别[J].计算机工程与设计,2012,33(1):362-366. 被引量：1

同被引文献225

1唐琳,郭崇慧,陈静锋.中文分词技术研究综述[J].数据分析与知识发现,2020,4(2):1-17. 被引量：43
2李妮,关焕梅,杨飘,董文永.基于BERT-IDCNN-CRF的中文命名实体识别方法[J].山东大学学报（理学版）,2020,55(1):102-109. 被引量：53
3郑昌济.数学模型在量刑中的应用——量刑精确化的探索[J].中南政法学院学报,1986,4(1):61-68. 被引量：3
4刘群,张华平,俞鸿魁,程学旗.基于层叠隐马模型的汉语词法分析[J].计算机研究与发展,2004,41(8):1421-1429. 被引量：198
5周钦强,孙炳达,王义.文本自动分类系统文本预处理方法的研究[J].计算机应用研究,2005,22(2):85-86. 被引量：15
6刘飞飞,刘军万.数字图书馆中基于神经网络的汉语文本分析方法的研究[J].情报杂志,2005,24(5):74-76. 被引量：1
7孙茂松,黄昌宁,高海燕,方捷.中文姓名的自动辨识[J].中文信息学报,1995,9(2):16-27. 被引量：87
8张庆国,张宏伟,张君玉.一种基于k最近邻的快速文本分类方法[J].中国科学院研究生院学报,2005,22(5):554-559. 被引量：14
9俞鸿魁,张华平,刘群,吕学强,施水才.基于层叠隐马尔可夫模型的中文命名实体识别[J].通信学报,2006,27(2):87-94. 被引量：155
10张晓艳,王挺,陈火旺.基于混合统计模型的汉语命名实体识别方法[J].计算机工程与科学,2006,28(6):135-139. 被引量：19

引证文献19

1苏晓红.建立统一的国债回购市场[J].金融理论与实践,2000(3):18-19.
2许鑫,郭金龙.基于领域本体的专题库构建——以中华烹饪文化知识库为例[J].现代图书情报技术,2013(12):2-9. 被引量：18
3郭金龙,洪韵佳,许鑫.中华烹饪文化领域本体构建及其应用[J].现代图书情报技术,2013(12):10-18. 被引量：7
4吴珊燕,许鑫.基于案例推理的菜谱推荐系统研究[J].现代图书情报技术,2013(12):34-41. 被引量：5
5佘贵清,张永安.基于本体的刑事审判案例推理方案研究[J].图书情报工作,2014,58(13):118-124. 被引量：3
6张琳,秦策,叶文豪.基于条件随机场的法言法语实体自动识别模型研究[J].数据分析与知识发现,2017,1(11):46-52. 被引量：10
7吕宾,侯伟亮.基于主题模型的法院文本典型案例推荐[J].微电子学与计算机,2018,35(2):128-132. 被引量：3
8汪海鹏,郑扬飞.基于特征值的律师推荐算法及改进方案[J].计算机与现代化,2018(10):18-21.
9吴路路,刘卫东,肖胜辉,陈炳松,聂文滨.基于词向量和神经网络融合的过程构成要素信息抽取方法[J].南昌大学学报（理科版）,2018,42(3):274-282. 被引量：2
10陈彦光,刘海顺,李春楠,刘静,孙媛媛.基于刑事案例的知识图谱构建技术[J].郑州大学学报（理学版）,2019,51(3):85-90. 被引量：11

二级引证文献123

1张书铭.大数据赋能减刑、假释检察研究[J].国家检察官学院学报,2023,31(4):61-76. 被引量：5
2刘若男.司法人工智能的障碍分析与优化路径[J].网络信息法学研究,2021(2):27-48.
3刘雨可,周申培,石英,杜家宝.面向配网一次设备缺陷文本命名实体识别研究[J].武汉理工大学学报,2022,44(10):93-101. 被引量：2
4李书琴,张明美,刘斌.融合字词语义信息的猕猴桃种植领域命名实体识别研究[J].农业机械学报,2022,53(12):323-331. 被引量：5
5张宗毅.农机“卡脖子”技术识别:综述与展望[J].农业农村部管理干部学院学报,2022(2):34-40.
6许鑫,郭金龙.基于领域本体的专题库构建——以中华烹饪文化知识库为例[J].现代图书情报技术,2013(12):2-9. 被引量：18
7郭金龙,洪韵佳,许鑫.中华烹饪文化领域本体构建及其应用[J].现代图书情报技术,2013(12):10-18. 被引量：7
8洪韵佳,许鑫.基于领域本体的知识库多层次文本聚类研究——以中华烹饪文化知识库为例[J].现代图书情报技术,2013(12):19-26. 被引量：9
9金碧漪,郭金龙,许鑫.利用领域本体优化文档检索的研究——基于KIM平台的设计与实现[J].现代图书情报技术,2013(12):27-33. 被引量：3
10吴珊燕,许鑫.基于案例推理的菜谱推荐系统研究[J].现代图书情报技术,2013(12):34-41. 被引量：5

1陈涛,赵静洁.简述执法机构中的计算机信息系统[J].警察技术,2002(4):17-17.
2革继胜.中消协警示:不要轻易参与短信竞猜活动[J].农民文摘,2005,0(4):11-11.
3宋双,吴宏涛,高强,刘翼光.数字电影发行相似案例快速检索方法[J].计算机工程与设计,2011,32(2):638-641.
4谷长昱,刘建.正则文法在数据分析中的应用[J].计算机时代,2015(10):33-35.
5刘志勇,高军.基于案例推理的型号研制项目风险评估系统[J].兵工自动化,2007,26(7):16-16. 被引量：1
6佘贵清,张永安.基于本体的刑事审判案例推理方案研究[J].图书情报工作,2014,58(13):118-124. 被引量：3
7哈进兵,肖连杰,王婷婷.一种基于属性重用度的案例检索权重确定方法[J].情报学报,2015,34(5):501-507.
8黄素琴,曾文忠.法学实践教学之刑事审判程序设计的既存问题与改革完善[J].中国科技纵横,2010(9):257-257.
9官礼和,杨刚,李永礼.基于词典的法律案例自动归类系统的开发[J].重庆交通学院学报,2004,23(1):116-120.
10陈璟.思想政治工作对自然保护区作用的探讨[J].资治文摘（管理版）,2009(7):36-36. 被引量：1

现代图书情报技术

2013年第6期

浏览历史

内容加载中请稍等...

审判案例自动抽取与标注模型研究被引量：19

参考文献9

二级参考文献28

共引文献69

同被引文献225

引证文献19

二级引证文献123

相关作者

相关机构

相关主题

浏览历史

审判案例自动抽取与标注模型研究 被引量：19

参考文献9

二级参考文献28

共引文献69

同被引文献225

引证文献19

二级引证文献123

相关作者

相关机构

相关主题

浏览历史

审判案例自动抽取与标注模型研究被引量：19