本篇文章1274字,读完约3分钟
新华网北京12月23日电基于统计机器翻译技术的网络翻译系统用了15年时间才得以大规模应用。神经网络翻译(nmt)技术于2014年9月提出,百度于2015年5月推出首个神经网络机器翻译系统,只用了8个月时间。
12月21日,百度技术委员会联合主席、自然语言处理部技术总监吴华博士表示,nmt技术带来了翻译质量的飞跃,极大地改善了用户体验。“与以前的传统方法相比,百度翻译在中英文测试集中的翻译质量提高了7个百分点以上。”
众所周知,机器翻译已经有70年的历史了。自20世纪40年代以来,基于规则、实例和统计的机器翻译方法逐渐出现,并相互领先。在过去的两年里,神经网络机器翻译技术如雨后春笋般遍地开花,并在翻译质量上取得了巨大的飞跃。在2016年的顶级学术会议上,几乎所有的人都关注与高考相关的创新。今年9月,谷歌、微软等公司也相继发布了nmt系统。
为什么追求nmt技术?吴华认为,该方法克服了传统的将句子分成不同片段进行翻译的缺点,而是充分利用语境信息对句子进行整体编码和解码,从而使翻译更加流畅。
“如果你想在翻译中非常准确,你必须有一些背景知识和偏向知识。”例如,吴华说,当我们读一篇文章时,只有把文章读透了才能知道一个句子的意思。例如,在阅读英语文学作品时,我们可能知道每一个英语单词,但如果我们缺乏英语文学或当地文化背景的积累,我们就不能深刻理解作品的内涵。
吴华说,这是机器翻译要解决的下一个问题,即通读课文,掌握这段或课文,逐字翻译,而不是像现在这样逐句翻译。基于神经网络技术本身,它在处理长句方面优于一些翻译,并且翻译质量有了很大的提高。她说,作为翻译工具,核心是翻译质量。未来几年,百度将进一步扩大基于神经网络技术的领先优势,提高翻译内容的准确性。
虽然神经网络翻译技术极大地提高了翻译质量,但吴华认为,如果用“信、达、雅”的翻译原则来衡量目前的机器翻译水平,仍处于“信”的水平,或处于相对直译的阶段。
随着百度、谷歌等科技公司相继推出神经网络机器翻译系统,翻译行业会被淘汰吗?这场辩论引起了很多关注。对此,吴华的观点是,机器翻译长期以来没有达到人工翻译的精度水平,尤其是在要求高精度的专业翻译领域。她认为,如果机器翻译要取代人工翻译,其准确率至少要达到90%,而目前只有70%。
然而,吴华指出,机器翻译也有其自身的优势。它就像一个便携式的翻译器,在翻译质量不太严格的时候,它可以帮助你解决生活中的一些实际问题。以百度翻译为例,她说公交车售票员使用百度翻译帮助巴基斯坦男孩寻找失物,游客使用“对话翻译”和“照片翻译”功能在国外自由交流,这些都表明百度翻译越来越融入生活。
据报道,百度翻译目前在全球支持28种语言和756个翻译方向,每天响应超过1亿个翻译请求。此外,百度翻译(Baidu Translation)也开放了其api接口,已有超过2万个第三方应用被访问。华为、oppo、中兴、三星等手机也接入了百度翻译api。世界知识产权组织(wipo)还将百度翻译api集成到官方网站上,供用户将专利信息翻译成不同语言进行查询。
标题:吴华:神经网络机器翻译技术大幅提升翻译质量
地址:http://www.pyldsnkxy.com/pyxw/13857.html