语法错误纠正,面临着较为严重的数据稀疏问题,这给机器翻译方法在该任务上的应用带来了直接的困难。本文首次提出在back-translation阶段采用sampling解码策略,并对比基于不同解码策略合成的伪平行句对给训练语法错误纠正模型带来的影...语法错误纠正,面临着较为严重的数据稀疏问题,这给机器翻译方法在该任务上的应用带来了直接的困难。本文首次提出在back-translation阶段采用sampling解码策略,并对比基于不同解码策略合成的伪平行句对给训练语法错误纠正模型带来的影响。在标准数据集CoNLL-2014 Test Set上的实验结果表明,本文提出的方法能显著提升语法错误纠正的性能。展开更多
文摘语法错误纠正,面临着较为严重的数据稀疏问题,这给机器翻译方法在该任务上的应用带来了直接的困难。本文首次提出在back-translation阶段采用sampling解码策略,并对比基于不同解码策略合成的伪平行句对给训练语法错误纠正模型带来的影响。在标准数据集CoNLL-2014 Test Set上的实验结果表明,本文提出的方法能显著提升语法错误纠正的性能。