期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于统计的汉英句子对齐研究 被引量:15
1
作者 吕学强 李清 +2 位作者 黄志丹 沈嫣娜 姚天顺 《小型微型计算机系统》 CSCD 北大核心 2004年第6期990-992,共3页
翻译比较规范的汉英语料适合用统计方法实现句子对齐 .但评价函数中的参数计算不能采用处理印欧语种的方法 ,而要针对汉英语种的特点进行调整 .在已有两种评价函数的基础上又提出五种评价函数 ,并进行了对比研究 .
关键词 双语语料 句子对齐 评价函数 参数计算
下载PDF
基于统计的汉英法律文献亚句子级对齐 被引量:7
2
作者 吕学强 李清 +1 位作者 任飞亮 姚天顺 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第1期23-26,共4页
基于统计的句子对齐是根据双语句子的长度在所有可能的对齐中找出概率最大的一个·提出两种对齐汉英语料的参数计算方法,使对齐模型中的评价函数满足标准正态分布·参数s2的值是对训练语料中的所有点(l1,(l2-cl1)2)进行线性回... 基于统计的句子对齐是根据双语句子的长度在所有可能的对齐中找出概率最大的一个·提出两种对齐汉英语料的参数计算方法,使对齐模型中的评价函数满足标准正态分布·参数s2的值是对训练语料中的所有点(l1,(l2-cl1)2)进行线性回归分析所得直线的斜率,s2的另一种求法是直接计算方差·实验结果表明汉英法律文献亚句子级对齐的正确率为98 8%,召回率为99 2%· 展开更多
关键词 双语语料库 汉英法律文献 亚句子级对齐 统计方法 评价函数 参数计算 标准正态分布 汉语 英语 机器翻译
下载PDF
汉英法律文献的子条级自动索引和对齐 被引量:2
3
作者 吕学强 李清 +1 位作者 陈文亮 姚天顺 《中文信息学报》 CSCD 北大核心 2002年第4期52-59,共8页
本文提出了基于结构标识的法律文献层次结构模型 ,该模型描述了汉英法律文献的层次结构特征及章、条、子条的连续性和对应性。根据该模型实现了汉英法律文献的子条级自动索引和对齐 ,系统具有纠错和容错能力。实验结果表明每篇文献的平... 本文提出了基于结构标识的法律文献层次结构模型 ,该模型描述了汉英法律文献的层次结构特征及章、条、子条的连续性和对应性。根据该模型实现了汉英法律文献的子条级自动索引和对齐 ,系统具有纠错和容错能力。实验结果表明每篇文献的平均索引时间为 3 31ms ,对齐准确率为 98 6 %。与基于词汇的方法结合后 ,对齐准确率为 99 3%。 展开更多
关键词 法律文献 子条级自动索引 文本索引 文本对齐 结构标识 层次结构模型 汉语 英语
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部