侵权投诉
焊接机器人 喷涂机器人 搬运机器人 装配机器人 切割机器人 其它机器人
订阅
纠错
加入自媒体

【专访】机器之心独家对话百度 NLP:先解决语义理解,再谈机器翻译取代人类

2016-12-05 16:08
kumsing
关注

  机器之心:不同语言的语料规模的差别较大,英语可能会多一些,小语种会少一些。如何将NMT的研究成果,应用于不同语言语料的构建中?

  答:这其实是语料稀疏问题。语料稀疏是NLP一直在面对的问题,以前有一些解决方案,比如说:Transfer Learning(转移性学习)、机器翻译的Pivot-Language(枢轴语言)技术、标签传播等技术。从一种语言翻译到另外一种语言,即使同一种语言在不同领域的语料也是不一样的,从这个领域迁移到另外一个领域,都需要解决语料的构建问题。

  NMT是可以应用于此的,因为NMT本质是把一种语言翻译成另外一种语言。它的好处在于,不同语言之间可以互相学习他们的语义表示,比如中文的「看」,和英文的「See」(看见)或者「Read」(看书)。以相似度来计算,相似度高的就认为它们拥有同样的语义,可以用在不同语言的标注上。

 

  用来解决语料稀疏问题的多任务学习框架,来自《Multi-Task Learning for Multiple Language Translation》

  这样说可能有些抽象,举例来说我们去年在NLP领域国际会议ACL上发表了一篇文章,讲述用NMT解决语料稀疏的问题。中文和英文之间的句对很多,但中文和其他语言如日文、泰文、西班牙文的句对就很少。怎么办?我们同时学习。中文翻译成英文、日文、韩文、泰语的句对都一起学习,这样就能充分利用中文在源语言端的表示。此外,还学习关联知识,韩语-日语之间结构类似,从日语中学习到的结构性信息适用于韩语翻译。

  后来Bengio团队还在我们论文的基础上做了类似的工作,他们在我们的研究基础上扩展成多(语言)对多(语言),其实思想是类似的。后来他们还把这个工作开源了。

  机器翻译能否取代人工翻译?

  机器之心:很多人可能就会问,人工翻译会不会被机器取代?您怎么看这个想法?

  答:从很长一段时间来看,完全取代还是不太可能的。

  现在基于互联网大数据的机器翻译的优势在于,突破了原来编辑规则的局限。与人工翻译相比的好处是能迅速翻译很多语言。同时它解决了一些问题,比如几个场景:出门旅游的沟通、写E-mail借鉴机器翻译用词、小孩利用机器翻译扩充词汇。这种形式解决了用户的一些问题,也达到了实用的程度。

  但是翻译最终的目标是「信、达、雅」,「信」至少是忠于原文,「达」就是译文通畅,符合目标语言用语习惯,「雅」是在这个基础上表达生动、形象。尤其在「雅」上,目前机器翻译远远不够。

  就像我们说英文,能说但不一定达到「达」的标准。「达」的意思是用语非常「native」(地道),我想机器翻译也没到。更不用说「雅」,即使人工翻译也只有少数人能达到雅的标准。

  机器之心:达到「信、达、雅」的关键是什么?

  答:主要是语义理解问题。我们现在的翻译方法,没有做到「理解」。深度学习只是在模式识别这个手段上更加高明一点,但还没有理解语言。

  与专业的人工翻译相比,机器翻译有很多不足。首先,机器翻译是以句子为单位,即使是篇章翻译也是不看上下文,翻译完一句算一句。人工翻译是以篇章为单位,翻译前要先通读一遍,抓住意境和主旨。

  其次,翻译需要常识背景。口语交流、会议翻译、随意聊天、正式作文等所需的文体是不同的,而同一个词在不同的文体上翻译也不同,这也是机器翻译的缺点。尤其是意译,比如翻译诗歌。如果没有知识背景,将中国的诗翻译成英文就会显得直白而没有韵味。跨语言的「信、达、雅」,连人都很难做到。

  事实上,机器翻译需要综合多学科,包括计算机学、语言学、认知学等等。机器翻译,看似简单,实则很难。因此我认为,机器翻译的道路还任重道远。 

<上一页  1  2  3  
声明: 本文由入驻维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

发表评论

0条评论,0人参与

请输入评论内容...

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

文章纠错
x
*文字标题:
*纠错内容:
联系邮箱:
*验 证 码:

粤公网安备 44030502002758号