帮助 关于我们

返回检索结果

汉维统计机器翻译中的形态学处理
Morphology Processing in Chinese-Uyghur Statistical Machine Translation

查看参考文献8篇

文摘 针对汉语和维吾尔语语序差别(前者是主-谓-宾结构,后者是主-宾-谓结构)及形态差别较大的问题,通过编写调序规则将汉语调整为主-宾-谓结构,将维吾尔语单词切分为词干、词缀等更小的词素单元来训练统计模型,同时测试词素的切分粒度对翻译性能的影响。实验结果表明,对汉语句法结构的调整及以词干、词缀等更小的词素形式参与训练可以有效提高翻译质量。
其他语种文摘 For the large differences of syntactic structure between Chinese and Uyghur,it composes rules to reorder the structure of Chinese sentences to that of Uyghur.For the large morphological differences between Chinese and Uyghur,it splits Uyghur words into stems and affixes,that is,morphemes,to train the statistical model.Meanwhile,it tests the effects of splitting granularities on translation performance.Experimental results show Chinese sentence reordering and splitting Uyghur words into morphemes can effectively improve the performance of translation system.
来源 计算机工程 ,2011,37(12):150-152 【核心库】
关键词 汉维 ; 统计机器翻译 ; 词素 ; 调序
地址

1. 中国科学院新疆理化技术研究所, 乌鲁木齐, 830011  

2. 中国科学院新疆分院, 乌鲁木齐, 830011

语种 中文
文献类型 研究性论文
ISSN 1000-3428
学科 系统科学
基金 中国科学院知识创新工程西部行动计划项目
文献收藏号 CSCD:4225918

参考文献 共 8 共1页

1.  Arianna B. Morphological Pre-processing for Turkish to English Statistical Machine Translation. Proc.of IWSLT'09,2009 被引 1    
2.  Durgar E K. Initial Explorations in English to Turkish Statistical Machine Translation. Proc.of IEEE Int'l Conf.on Statistical Machine Translation,2006 被引 1    
3.  Oflazer K. Exploring Different Representational Units in English to Statistical Machine Translation. Proc.of the 2nd Workshop on Statistical Machine Translation,2007 被引 1    
4.  Habash N. Arabic Preprocessing Schemes for Statistical Machine Translation. Proc.of the Human Language Technology Conference,2006 被引 1    
5.  Zollmann A. Bridging the Inflection Morphology Gap for Arabic Statistical Machine Translation. Proc.of the Human Language Technology Conference,2006 被引 1    
6.  李国臣. 利用主语和谓语的句法关系识别谓语中心词,2005 被引 1    
7.  Mathias C. Unsupervised Morpheme Segmentation and Morphology Induction from Text Corpora Using Morfessor 1.0.Publications,2005 被引 1    
8.  董兴华. 基于短语的汉维/维汉统计机器翻译. 计算机工程,2011,37(9):16-18 被引 10    
引证文献 3

1 潘一荣 面向汉维机器翻译的调序表重构模型 计算机应用,2018,38(5):1283-1288
被引 3

2 吐尔根·依布拉音 中亚语言自然语言处理综述 中文信息学报,2018,32(5):1-13,21
被引 1

显示所有3篇文献

论文科学数据集
PlumX Metrics
相关文献

 作者相关
 关键词相关
 参考文献相关

版权所有 ©2008 中国科学院文献情报中心 制作维护:中国科学院文献情报中心
地址:北京中关村北四环西路33号 邮政编码:100190 联系电话:(010)82627496 E-mail:cscd@mail.las.ac.cn 京ICP备05002861号-4 | 京公网安备11010802043238号