2016年人工智能领域的人机战争不断,但最适合人工智能的工作不是挑战人类,而是与人类的工作结合起来。

面对翻译问题,免费机器翻译仍然不准确。使用深度神经网络的最新翻译工具也存在一些问题。长文的人工翻译又费时费力,在这方面有了新的想法,连接了人机合作的人机翻译工具。

对于技术本身来说,机器翻译对普罗大众来说不是什么大新闻。尤其是这些技术不能直接给用户留下特别的印象。但是,谷歌发布了基于深度神经网络的GNMT翻译框架后,整个翻译工具圈火热起来,百度、互联网巨头等国内翻译工具公司也投入了大量资金。

在了解这个消息之前,传统机器翻译和基于深度神经网络的翻译有什么区别?

传统的机器翻译是把固定的单词或短语翻译成大象语言。剑桥大学自然语言处理(NLP)团队的陈村在一篇文章中的描述显示,现有机器翻译界的主流方法都是Prased-Based Machine TRANSLATION(PBMT),以前Google翻译也使用基于此框架的算法。词组是把原文的话分解成词组,将相应的词组翻译成一个词组,最后将顺序归纳为目标语言的一句话。

例如,“今天我想吃蛋糕”可以被机器分解成“今天”、“我”、“想法”、“想吃蛋糕”。PBMT翻译模式将这些单词逐个翻译,然后根据自然语言处理重新排序,最后给出的结果看起来像一句话。因此,这也解释了为什么使用机器翻译时会出现很多语序问题,以及为什么该词汇的翻译完全不结合段落上下文。

基于神经网络的翻译模型是近年来发展起来的一个大方向,深度神经网络结构直接学习源语言与大象语言相适应的概率。

著名GNMT的理解逻辑

一般来说,传统统计机器翻译(SMT)的处理过程与一堆模块的组合、翻译、分词、排序等各细分“行”的职务相似,最后将这些模块通过设置的机制结合在一起,输出翻译结果。NMT的框架将需要翻译的原文视为整体,实现了以句子为整体的上下翻译环境,在单个句子中,翻译结果更符合逻辑。特别是出现长句的时候,这种翻译模式比更传统的PBMT更有秩序。

制定NMT结构框架后,要喂数据。例如,传统通用模式可以选择中英文比较版本的书,在新闻语料库和英语学习语料库中都有更多的源数据,因此模式训练更加成熟。与传统的基于短语的翻译相比,YNMT(Youdao-NMT)翻译质量的提高是过去两年SMT累计提高的总和,YNMT(Youdao-NMT)在新闻类语料和英语学习语料方面均超过了盲测量BLEU值(显示准确性)。

现在我们对这台机器翻译服务有了基本的认识。PingWest(微信公众号:wepingwest)收到机器翻译的初稿后,有正式指示,可以从机器翻译结果中手动编辑和审查译文,以确保翻译准确。(注:Wepingwest: Wepingwest)。

人工智能不是什么具体的技术。人工智能更接近新的思维方式,成为助手的工作工具。但是NMT是一种更先进的翻译模式,但是手动翻译的准确度还有一定的距离。例如,在一些专有名词和专业术语中出现罕见的数据源会给翻译带来问题。而且现在NMT也只考虑了短句的连接,不可能结合成一个完整的段落。

但是令人高兴的是,人工智能帮助我们在翻译领域提高了效率。人机翻译就是用这个概念。——首先使用YNMT辅助口译人员,进行初级翻译工作,在一定程度上共享口译人员的工作,剩下的工作量将手动完成。如果将人工智能放在其他行业,则可以代表的工具属性大致是这样的。

人机翻译的机构客户比较多,这些大量的汉英翻译工作在一些跨境机构中需求明显。有人机翻译的服务个人用户和企业用户都可以订购。合适的工作人员说:——“例如,网络考拉等跨境机构有很多海外化妆品,需要翻译产品介绍、化妆品成分,他们的翻译需求也很大,准确,人机翻译是一个好模式,便宜、准确、快捷。”

更多内容,关注品玩微信号:有限开放入群申请。平韦斯特品玩的老朋友?为什么不扫描代码,添加客服进入群聊?

相关推荐