-
题名面向政治新闻领域的中文文本校对方法研究
被引量:12
- 1
-
-
作者
张仰森
唐安杰
张泽伟
-
机构
北京信息科技大学智能信息处理研究所
-
出处
《中文信息学报》
CSCD
北大核心
2014年第6期79-84,128,共7页
-
基金
国家自然科学基金(61070119
61370139)
+1 种基金
北京市属高等学校创新团队建设与教师职业发展计划项目(IDHT20130519)
北京市教委专项基金(PXM2012-014224-000020)
-
文摘
政治新闻领域内文本错误多为语义级错误。在研究新闻领域文本政治性差错的语言表述特征的基础上,分析了报刊新闻中政治性差错的表现类型,构建了面向各类错误侦测的词库和知识库。通过研究政治新闻文本的语言学特征,提出了一个政治性差错文本错误侦测规则的一般形式化模型,采用统计与规则相结合的策略实现政治新闻领域文本的语义校对。实验结果显示,该方法的召回率为65.5%,精确率为80.5%,具有较好的应用前景。
-
关键词
政治新闻
文本校对
查错模型
-
Keywords
political news
text proofreading
error detecting model
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名面向法律文书的中文文本校对方法研究
被引量:4
- 2
-
-
作者
刘明洁
梁毅
艾中良
贾高峰
-
机构
北京工业大学计算机学院
中国司法大数据研究院有限公司
-
出处
《计算机工程与应用》
CSCD
北大核心
2020年第24期274-278,共5页
-
基金
国家重点研发计划(No.2018YFC0831200,No.2018YFC0831605)。
-
文摘
在研究法律文书书写错误的语言表述特征后,将法律文书中的文本错误分为叙事陈述时的直接错误和行文书写时的隐含错误,并构建一组正则匹配规则和字词识别规则来进行错字错词识别。通过对法律文书语言学特征的研究,提出一种规则与概率统计相结合的方法实现对法律文书的文本校对。实验结果显示,该方法的召回率和准确率均达到80%,具有较好的使用前景。
-
关键词
法律文书
文本校对
正则匹配
纠错模型
-
Keywords
legal document
text proofreading
regular expression matching
error detecting model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-