预约
因为人类语言不通,《圣经》故事中的“巴别塔”没能建成,以失败告终。如何打破人类语言之间的围墙,让人类能无障碍沟通,也成为了人类一直希望解决的问题。
得益于统计和深度学习技术,让机器理解语言,进而实现不同语言的无缝沟通,正逐渐成为可能。
在今年《MIT科技评论》推出的十大突破技术中,巴别鱼耳塞成功入选。它可以做到双方交流时,会对所讲的话进行翻译,并在智能手机上大声播放。手持手机的人回应后,回答被翻译,然后在耳塞中播放,该技术还能实时翻译,适用于多种语言,使用方便。
工业界对于机器翻译已经开始摩拳擦掌。近日,微软宣布自己的机器翻译系统达到了人类专业翻译的水平。谷歌、百度、Facebook,包括其他一些科技公司也都在布局机器翻译,并推出了在线翻译系统。
可见,随着技术的发展,机器翻译在教育、旅游、社交、跨境交易等领域将有更大的应用空间。那么,机器翻译究竟是如何对人类语言进行“理解”,进而进行翻译输出的;如果机器翻译水平越来越高,从事语言翻译的人是否会因此丢了工作;如果人类之间的语言障碍被清除,那时候的世界又会是什么样的?
机器翻译的三大飞跃
微软技术院士黄学东告诉澎湃新闻(www.thepaper.cn),机器翻译达到目前的水平,经过了几十年的发张,并经历了三次飞跃。
早在1954年,人类就开始尝试过让机器能识别人类的语言,但直到上世纪80年代,才有人摸索出方法。当时,IBM做了研究,利用一些规则方法,句法分析,语意分析等传统方法让机器看懂人类语言。但由于当时的人工智能发展处于“凛冬时期”,效果一直不好,翻译质量也一直上不去。
机器翻译的第一个飞跃也是IBM做出的。IBM的研究人员用了统计的方法来做机器翻译。那时,语音识别从传统的人工智能方法专家系统转为统计学习的方法,尤以隐马尔科夫模型为代表。统计学方法的应用让机器翻译在上世纪90年代有了质的飞跃。
进入21世纪,机器翻译迎来了自己的第二次飞跃。这次的进步主要依靠深度学习神经网络的方法。这种方法也称为神经机器翻译(Neural Machine Translation),这个技术先是用到了语音识别中,再推广到图像识别和机器翻译上。
神经机器翻译,简要的说,就是对源语言的句子进行编码,即转化为计算机可以“理解”的形式,编码的结果会形成很多隐含变量,每个隐含变量代表从句首到当前词汇为止的语义信息。然后通过一个解码的过程,一个词、一个词输出译文。
到了2018年,由微软亚洲研究院与雷德蒙研究院研发的机器翻译系统,解决了NMT方法的一些局限,并借鉴了人类翻译过程中的一些方式。例如:对偶学习(Dual Learning)、推敲网络(Deliberation Networks)、一致性规范(Agreement Regularization)、联合训练(Joint Training)等,让机器翻译水平得到了大大提升。
从机器翻译的三次飞跃上不难看出,一家公司构建的翻译系统效果如何,主要取决与两点:一是算法是否足够好,二是数据是否够全、够多。
这样看,对于微软、谷歌、百度等大公司来说,他们有足够优秀的人才来搭建神经网络,也有足够多的搜索数据可供自己搭建的网络进行训练。国内的科大讯飞和搜狗公司,由于本身在语音识别上有较长时间的积累,自然语言资料库上有优势。
人类会被机器替代,机器翻译能否改变世界?
机器翻译技术领域的进步,也让人们看到了消除语言鸿沟,构建“巴别塔”的新希望。但这样的突破也引发了部分人的担忧:人类是否会被机器替代?
关于这个问题,黄学东在接受澎湃新闻采访时称,举了一个马车与汽车的例子。当汽车被发明出来的时候,英国为了保障马车夫的生存,曾立法规定汽车行驶速度不能超过马车。尽管最后马车还是被淘汰了,但是出了很多司机,产生了新的职业。
“所以很多事情不用担心。其实我们只是把很多枯燥的工作让计算机做了。就像以前是打字机,现在有计算机,现在计算机写出来的文章想修改都很方便。30年前你要写一篇文章,打错了,得让秘书用修改液去涂,但现在机器解放了秘书的工作,而他们也没有消失,只是去做更复杂,更专业的工作了。”黄学东说。
实际上,大多数的专业公司不但不担心自己的放碗会被抢走,甚至还非常拥抱技术带来的便利。
美国语言公司协会与欧洲语言行业协会首次发布的“2015语言行业调查报告”称,大多数公司在调查机器翻译带来的影响的时候,都选择了“显著影响”(5分权重下选择4或者5),表明机器翻译技术已经开始发挥作用。这份报告还指出,在2014年,大量欧洲公司已经开始使用机器翻译,美国公司有21%的项目用到了机器翻译,为有史以来最高值。机器翻译系统也越来越普及,50%的欧洲公司和36%的美国公司拥有机器翻译引擎。
值得注意的是,该报告是基于对欧美主流中小翻译公司得出的结果,可见除了日常使用,机器翻译已经在专业翻译领域发挥着越来越大的应用。
这样的市场也让许多科技公司看到了价值,包括谷歌、微软、Facebook、百度、科大讯飞、搜狗等公司都已纷纷布局翻译机。
目前,谷歌已经开发出了耳机Pixel Buds,可以实时翻译,并存储有40种语言,使用时就像有名翻译家在你耳边说悄悄话。只是,这款耳机还只能和Pixel智能手机联用。
微软也积极布局,除了开发有自己的小冰系统外,微软近期还与小米合作,推出了魔芋AI翻译机。它用了微软的认知服务技术,就像iPod一样,有一个双键,可以做远场翻译,支持60种语言的机器翻译,并整合了智能助理。
国内公司对于巨大的消费市场也是虎视眈眈。科大讯飞和搜狗均在去年推出了自己的手持翻译机。科大讯飞的晓译翻译机支持5种语言翻译,具备离线功能和即时翻译。搜狗翻译机支持离线翻译和拍照识别翻译。
在机器翻译技术的支持下,各家公司布局的翻译机纷至沓来,可以预见的是,机器翻译在教育、旅游、社交、跨境交易等领域有着巨大的应用空间。信息技术的进步在不断的降低人们的沟通成本,当机器翻译进步到可以替代专业翻译,我们是不是可以拾起《圣经》中的想象:一个能让不同语言的人无缝沟通的世界会在不远的将来到来?
① 凡本站注明“稿件来源:金宝搏188入口 ”的所有文字、图片和音视频稿件,版权均属本网所有,任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经本站协议授权的媒体、网站,在下载使用时必须注明“稿件来源:金宝搏188入口 ”,违者本站将依法追究责任。
② 本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。