大发pk10_pk10下载_大发pk10下载 - 由大发pk10,pk10下载,大发pk10下载社主办的《大发pk10,pk10下载,大发pk10下载》是我国消费领域中一张全国性、全方位、大容量的综合性日报。其立足消费网投领域,依托轻工行业,面向城乡市场,最先发布相关的专业权威资讯。

Facebook的新技术,击败了“上帝让不同人类说不同语言”的图谋

  • 时间:
  • 浏览:2

本文授权转载自PingWest品玩,作者:光谱,原文链接:http://www.pingwest.com/facebook-neural-translation/

《创世记》第11章中记载,人类计划建立通天的高塔,而上帝我应该 类说不同的语言,使得我应该 们无法协作协议,计划最终失败。

现实中,不同语言成为了个人所属文化的因子,构建出一种生活多样的美。但语言仍像鸿沟,阻碍着人类的交流。

最近,Facebook用人工智能对翻译系统进行了一次重大改造。

我应该 们的工程师发现,网站上对帖文和回复进行翻译的按钮每天会被点击数十亿次,翻译动作有数千个方向(比如中英互译,英文到中文是一一另一个 方向,反之又是从前方向)之间。

没能 巨量的翻译工作,Facebook时不时 以来做的却不好。我应该 们过去使用的统计机器系统,翻不准俗语,识别不了错字和缩写,无法理解上下文,没能准确翻译帖文的意图。于是,工程师们用改用一种生活叫金“带注意力的长短时记忆”(Long Short-Term Memory with attention, LSTM) 的层厚学习技术,设计了一套人工智能翻译系统。

目前,新的神经机器翻译系统已完整篇 取代了过去的机翻系统,部署到Facebook网站、Instagram以及有些产品中。改造的效果显著:按照业界公认的BLEU标准,Facebook新翻译系统各种语言互译得分比旧系统提高了11%。

人际沟通大多通过语言完成。而当参与方不使用统一语言,沟通就需用通过翻译。我应该 翻译系统的准确度极大影响着沟通的成果。但遗憾的是,绝大多数网上和手机上的翻译网站和软件,眼前 的技术都来自机器翻译。

通常,机翻系统对常见的单词、短语和句法简单的句子翻译效果较好。以前句子只是我 主谓宾,比如“我吃米饭”,系统翻译成“I eat rice”,这没问题报告 报告 。

但比如中日互译、以前下图中土耳其语和英文互译,原文的语言和翻译后语言在句法上有很大的差别,机器翻译就会捉襟见肘了。下图是机翻结果:

翻译出的英文没能 语法错误,但还是不太容易懂什么意思。这是以前机翻会把句子拆成一一另一个 个字段,结果只是我 把一一另一个 个字段的翻译放出来,没能 对目标语言的语序、语法和表达习惯进行优化。

人工智能如可做到更准确、更村里人 味儿地翻译呢?

维基百科解释,LSTM是一种生活在时间上递归神经网络(Recurrent Neural Network),适合于解决和预测时间序列后面 隔和延迟相对较长的重要事件。翻译正好是你有些类型的工作,以前很长的句子,以前后半段是对前半段的逻辑呼应,但机翻系统根本不记得前面说的是什么。

LSTM能记住整句话的内容,对句子的上下文进行反溯,理解逻辑,从而给出更精确、流利和地道的翻译结果,如下图:

“注意力”(attention)也是层厚学习里一一另一个 很有趣的机制,它有点儿像人类观察事物时眼神的聚焦,锅里有菜,我应该 自动把更多注意力分配到菜上而需用锅以前锅柄。

注意力可以帮助新系统留意有些在标准英语辞典里没能 总出 的词,什么词很有以前是缩写和短语,比如idk (I don’t know)、tmrw (tomorrow),需用以前是网络用语。当神经机器在句子里发现从前的词,会先留空不翻译,分配一定的计算力,去有些词库和训练数据集查找你有些词的释义,最后再翻译出来。

不仅没能 ,研发团队还利用了有些神经网络剪枝(保留重要的权重)和压缩编码的算法,极大地降低神经翻译系统的词汇表大小,减小了计算量,但没能 拉低翻译精度。

拿出了翻译系统,并需用终点,工程师们需用把它部署到Facebook数十亿用户量级的后端系统中去。开发了层厚学习框架Caffe的Facebook研究科学家贾扬清,以前带队开发出了更注重模块化,有有助于于移动端和大规模部署的Caffe2。在新框架上运行,神经翻译系统的层厚提升了2.5倍。

以前层厚学习技术的进展,神经机器翻译在近年越发流行,并已进入有些流行的产品中,结束英语 英语 帮助我应该 们更好地沟通。微软推出的翻译软件 Microsoft Translate,让沟通多方像用微信一样加入群聊,自然对话并获得个人的翻译,备受好评。

去年,全球5亿人使用的Google Translate服务中部署了神经翻译机器。当时PingWest品玩用有些经典中英段落测试互译,仍会总出 奇怪的翻译:

In my younger and more vulnerable years my father gave me some advice that I’ve been turning over in my mind ever since.

“Whenever you feel like criticizing anyone,”he told me,”just remember that all the people in this world haven’t had the advantages that you’ve had.”

人工翻译:

我年纪还轻,阅历不深的以前,我父亲教导过我句子,我至今还念念不忘。

“每逢你我应该 批评任何人的以前,”他对我应该 们说,“你就记住,你有些世界上所有的人,并需用个个需用过你什么优越条件。”

Google神经机器翻译(去年):

在我更年轻,更容易年,我的父亲给了我有些建议,我时不时 在我心中从此翻身。

“每当你我觉得批评任何人,”他告诉我,“只记得,所有的在你有些世界上的人都没能 ,你有过的优势。”

时隔一年之久再去测试,效果以前好了只是我:

在我年轻,更脆弱的青春岁月图片 里,我父亲给了我有些建议,自从我时不时 在转过头来。

“每当你想批评任何人,”他告诉我,“我希望记住,你有些世界上所有的人都没你不在 的优势。”

这是以前神经机器翻译后端的层厚学习系统学习能力比统计机更强。随着输入的数据源,以及使用的人太多,它能不断提升翻译技巧。Facebook用户以前超过20亿,每天需用超过13亿说不同语言的人在后面 分享活动、发图片、评论以及点赞。现在,Facebook翻译后端以前完整篇 迁移至神经机器翻译,什么训练好的神经网络每天解决多达45亿次翻译请求。

未来,Facebook打算引入有些更先进的神经网络架构,比如卷积神经网络(Convolutional Neural Networks, CNNs)。测试结果发现使用CNN进行英法互译的BLEU得分比LSTM进一步提升了12%。不仅没能 ,我应该 们也在尝试有些更难的挑战,比如多语种(而非双语种)翻译。

届时,基于神经网络的翻译系统,将在精度、地道程度、多语种翻译能力等更多维度上超过和取代统计机,甚至人工翻译——就目前来看,取代什么工作以前是人工智能为数太多的坏处之一。