推动智能翻译行业发展助力广东人工智能产业繁荣-语言与人工智能重点实验室

评论观点

您当前的位置 : 首页 >> 其他栏目 >> 评论观点 >> 正文

推动智能翻译行业发展助力广东人工智能产业繁荣

发布时间：2018/10/13 21:17:26

2017年7月20日，国务院印发了《新一代人工智能发展规划》，明确提出大力发展人工智能新兴产业，研究图像识别、语音识别、机器翻译、智能交互、知识处理等智能系统解决方案。2017年12月13日，工业和信息化部印发的《促进新一代人工智能产业发展三年行动计划(2018-2020年)》明确指出培育智能翻译行业，推动高精准智能翻译系统应用，围绕多语言互译、同声传译等典型场景，利用机器学习技术提升准确度和实用性。

智能翻译是人工智能领域“皇冠上的明珠”

人工智能是一项使用机器模拟人类认知、识别、分析、决策等功能的技术，本质是对人类思维和意识的模仿。人工智能将引领第四次工业革命，其对人类社会带来的影响与变革将远远超过蒸汽机、电力和互联网引领的前三次工业革命。我国政府在《“互联网+”人工智能三年行动实施方案》中提出：计划在2018年形成千亿级人工智能产业应用规模。

人工智能技术以算法规则、计算能力和数据资源作为基础支撑，以图像识别(计算机视觉)、语音识别和智能翻译(自然语言处理)作为基础技术，以使机器能够看懂、听懂人类的世界，理解并用人类的语言进行思考。

人工智能分为计算智能、感知智能和认知智能三个层次。计算智能主要是模拟人类储存和计算数据的能力，感知智能主要是模拟人类视、听、认、读外界信息的能力，认知智能主要是模拟人类利用信息进行思考的能力。语言作为人类知识的载体和思维的工具，承载了复杂的信息量，具有高度的抽象性，对语言的理解属于认知层面。在最高级的认知智能层次需要智能翻译技术(自然语言处理技术)，将人类的自然语言转换为计算机数据，使机器能够理解人类的语言，并使用人类语言模拟人类思考的过程。所以，智能翻译技术是人工智能最难攻克的难题、最具挑战性的领域，是人工智能领域皇冠上的明珠。

智能翻译行业发展现状

智能翻译就是运用计算机语言学、人工智能和数理逻辑学科技术通过特定的计算机程序将一种书写形式或声音形式的自然语言，翻译成另一种书写形式或声音形式的自然语言，并通过机器、参与的人和互联网构建出的智能生态系统。智能翻译的核心技术有语音识别技术、自然语言理解技术、机器翻译技术、语音合成技术等。当前最新的智能翻译技术是采用神经网络算法，对大量的双语对照样本数据进行训练，解决一种语言(比如英语)到另一种语言(比如中文普通话)翻译的人工智能技术。

(一)智能翻译的发展历程

智能翻译是直到2017年才正式明确下来的概念。20世纪30年代初，法国科学家G.B.阿尔楚尼最早提出用机器进行语言翻译的想法。1949年，信息论先驱、美国科学家Warren Weaver发表《翻译备忘录》，提出使用计算机进行语言自动翻译，正式提出机器翻译的思想。1954年，美国乔治敦大学在IBM公司协同下，用IBM-701计算机首次完成了英俄机器翻译试验，向公众和科学界展示了机器翻译的可行性，在人们头脑中形成了机器翻译的概念，并且使人意识到可以利用语法规则的转换和字典来实现翻译目的，从而拉开了机器翻译研究的序幕。

20世纪70年代末，随着计算机技术和语言学的发展以及社会信息服务的需求，机器翻译这一学科具有极大的开发潜力和经济价值，许多大公司开始投入资金和人力进行研究，开发出了多种翻译系统，如 Weinder、EURPOTRAA、TAUM-METEO等。这一时期，计算机和语言学的一些基础研究已经达到了一个比较深入的阶段，对语法和语义的研究也已经有了一些比较重大的成果，词法分析、句法分析的算法相继得到开发，并且加强了软件资源。

近20年来，机器翻译已经成为世界自然语言处理研究的热门技术。这一时期的翻译方法主要是基于经验主义，特点是注重大规模语料库的建设，基于实例和统计方法，针对大规模的真实文本进行处理，翻译结果的准确性与可读性都取得了非常大的进步。随着语音识别技术的发展和经济全球化的需求，2011年，机器翻译技术的研究热点开始转向一个比文本翻译更加复杂和困难的问题——语音翻译。

机器翻译功能越来越强大，从最初只能进行简单的单词翻译，到之后可以翻译出基本符合语法的句子，慢慢可以翻译具有一定逻辑性的句子，现在部分软件已经可以自主联系上下文进行翻译，翻译结果的准确性与可读性都已经取得了非常大的进步。加入了“深度学习技术”等人工智能的机器翻译已经不止于简单的将一个个单词翻译成另一种语言，而是可以像人工翻译一样，不断向前回顾理解结构复杂的句子，同时联系上下文进行翻译。现在部分机器翻译软件已经可以理解每一个代词的指代对象，使机器翻译越来越智能。

(二)智能翻译的应用分类

当前智能翻译的典型应用主要有文本翻译、语音翻译、图像翻译三种。

文本翻译就是将源语言文字转换为目标语言文字，即书面语及其翻译，在当前的智能翻译中应用最为广泛。文本翻译最为主流的技术方式是以神经网络翻译为主。谷歌、微软与国内的百度、有道、新译等公司都为用户提供了免费的在线多语言翻译系统，新译翻译还提供垂直领域的智能翻译。另外，即时通讯工具如 Googletalk，Facebook 等也都提供了即时翻译服务。速度快、成本低是文本翻译的主要特点，而且应用广泛，不同行业都可以采用相应的专业翻译。但是，这一翻译过程是机械的和僵硬的，在翻译过程中会出现很多语义语境上的问题，仍然需要人工翻译来进行补充。这就是常用的交互式机器翻译技术，典型的表现形式就是预测性输入法和辅助翻译系统。

语音翻译是目前智能翻译中比较富有创新意义的领域，人们越来越多地通过语音与计算机进行交互，吸引了众多资金和研究者的注意力，典型代表是亚马逊的Alexa、苹果的Siri、微软的Cortana 等。语音翻译需要经过四步：首先利用语音识别，将音频转换为文本;其次利用算法将口语优化为更标准的文本，使它更适合机器翻译;然后通过文本翻译的方法进行翻译;最后文本到语音转换，必要时输出译文的音频。以英译中为例，其业务处理过程为“语音(英语)--> 文本(英文)-->文本(中文)-->语音(普通话)”。

图像翻译也有不小的进展。谷歌、微软、Facebook 和百度均拥有能够让用户搜索或者自动整理没有识别标签的图片的技术;医疗公司可以利用计算机阅览X光、MRI(核磁共振成像)和CT(电脑断层扫描)照片，阅览的速度和准确度都超过了放射科医师;图像翻译技术对于机器人、无人机以及无人驾驶汽车的改进至关重要，福特、特斯拉、Uber、百度和谷歌均已在上路测试无人驾驶汽车的原型;除此之外还有视频翻译和VR翻译也在逐渐应用中。

(三)智能翻译的技术发展趋势

随着全球化和互联网的快速发展，跨语言的网络资源呈几何级数增长，极大地刺激了全球智能翻译产业的发展。随着产品技术的进步，人们对智能翻译的可接受度在迅速提高，同时也越来越清楚智能翻译能够做什么，以及应当怎么去做才能最大发挥智能翻译的效能。智能翻译技术的发展呈现以下趋势。

精准化

精准的翻译结果必将是不断追求的目标。通过限定性神经网络，可以不断提升智能翻译的准确率和使用边界。限定性神经网络就是通过干预输入的句子，调整底层神经网络的模型参数，准确无误地还原干预部分的译文表达，对被干预部分的翻译，能达到100%的准确度。

实用化

智能翻译将越来越多地应用到生活场景中。随着语音和图像识别技术的进步，人们出国时可用智能翻译了解菜单、店名、商品信息，看美剧时可以用电脑进行字幕翻译，通过拍照直接翻译出一朵花的名字，利用机器人进行多语翻译采访，外出旅游携带翻译机、翻译耳机等。

多模态化

智能翻译的多模态融合是一个重要的研究趋势。随着训练数据规模的增加，谷歌、百度、新译、腾讯的神经网络系统都取得了突破性进展，融合图像、音频、视频、文本等各种模态数据的智能翻译是未来的发展方向。

移动化

早期的智能翻译主要是在网页上进行，但是随着计算机技术的发展和智能手机的普及，以及移动办公、外出旅行等需求，导致智能翻译由网页端向移动端转变，移动端的应用越来越方便。智能翻译这一波创业大潮中，逐渐以APP方式、可便携的移动设备呈现给用户。

离线化

以前智能翻译技术必须在设备联网的前提下才能使用，但在旅行过程中以及一些涉密场景，需要在隔离网络的情况下使用智能翻译。离线化主要包括软件层面的离线和硬件层面的离线。硬件层面的离线，只是把原有的神经网络模型离线部署到硬件端中，软件层面的离线要复杂很多，需要从算法层面和硬件进行交互，这是一个发展趋势。

垂直化

垂直场景对于智能翻译的需求尤甚，目前很多智能翻译产品将机器翻译和字符识别技术、语音识别技术相结合，通过摄像头实时翻译外文指示牌、菜单、说明书等，或结合语音技术进行对话翻译，实现不同语种的无障碍交流，这是智能翻译的一个方向。

端到端化

下一代智能翻译技术，将采用端到端的“语音(英语) -->语音(普通话)”过程，将语音直接实时翻译，只需要标注好的语音双语数据即可，不再经过语音识别->机器翻译->语音合成这几步，进一步提升智能翻译的速度和准确性。谷歌、新译都在朝此方向深入研究。

(四)国际智能翻译应用概况

国际上智能翻译的研究比较早，而且注重基础核心算法层的研究，当前随着神经网络算法的大规模使用，翻译质量不断提高。质量的提升带来的使用便利化越来越强，涌现出不少智能翻译巨头，主要有谷歌、微软和Facebook。

近两年来，谷歌翻译的技术突破让人目不暇接。2016年，GNMT技术(谷歌的神经网络机器翻译技术，模仿人脑的神经思考模式)全面布局于谷歌翻译系统中，并且将此技术广泛应用于网页翻译与手机应用，使其智能翻译的译文误差降低了55%—85%。2017年6月谷歌又在智能翻译领域更进一步，实现了完全基于 Attention的Transformer智能翻译网络架构，并且在WMT 2014的多种语言翻译任务上超越了之前 Facebook 的成绩，达到了新的最佳水平。

微软翻译是基于云的机器翻译服务，通过Azure 云平台提供。它集成于各种微软的产品和服务，帮助全球数以千计的企业提高应用和工作的效率，降低成本，更有效的和全世界的顾客沟通。无论是语音翻译还是文本翻译，微软翻译都可以提供更多语言，更快、更智能的翻译服务。

Facebook翻译使用基于人工智能的神经机器翻译系统(NMT)——包括卷积神经网络(CNN)和递归神经网络(RNNs)，来翻译Facebook上的帖子和评论。和传统基于短语的机器翻译模型相比，神经机器翻译技术具有很多的优势，能产生更精确的译文。

(五)中国智能翻译发展概况

在人工智能技术、投资如此增长热度下，我国也投入了智能翻译技术的研究热潮，并取得了一定的成果。我国的智能翻译研究始于20世纪50年代，但是由于国际环境和电脑发展水平的束缚，国内真正对智能翻译的研究是在20世纪80年代晚期开始，具有重要意义的标志性成果是著名的“863智能英-汉翻译系统”。20世纪90年代，随着电脑技术的发展和对外交流的扩大，智能翻译的使用变得日趋频繁，智能翻译软件发展到了前所未有的新高度。

近几年国内智能翻译发展很快，智能翻译研究形成了独立研究机构和政府研究组织共存的良好局面。国内智能翻译的产品开发也呈现出前所未有的繁荣景象，各大IT公司都相继推出自己的智能翻译系统，神经翻译技术和深度学习技术作为一种新的智能翻译范式，已经成为目前学术界和工业界研究的热点。国内智能翻译的主要团队有百度、有道、新译、腾讯、搜狗和阿里。

2010年初，百度组建了智能翻译核心研发团队，2011年6月30日，百度翻译服务正式上线。目前，百度翻译支持全球28种语言互译、756个翻译方向，每日响应过亿次的翻译请求。百度还率先将基于神经网络的智能翻译投入应用，比谷歌翻译还早一年。其所研发的深度学习与多种主流翻译模型相融合的在线翻译系统以及基于“枢轴语言”的技术，处于业内领先水平，在国际上获得了广泛认可。

网易2011年创立网易感知与智能中心，拥有自建分布式深度学习平台，其自主研发的图像处理、语音识别、智能问答等AI技术，在有道翻译中得到了应用和推广。2017年5月网易有道在GMIC未来创新峰会上宣布由网易公司自主研发的神经网络翻译技术正式上线，应用于有道词典、有道翻译官、有道翻译网页版、有道e读等产品，服务6亿用户。

新译翻译成立于2014年12月，率先构建垂直化领域翻译体系，以自然语言处理和大数据为核心技术，首次提出限定性神经网络来提高关键术语的精准翻译，拥有智能翻译系统、文档翻译系统、辅助翻译系统、翻译插件、智译APP、智能翻译耳机、多语智能机器人、同传会议系统等多款产品，可以满足不同场景下的多语转化需求，产品已经应用在国防安全、政府会议以及金山、京东等互联网公司中。

2016年初，腾讯开始研发智能翻译产品，随后推出腾讯翻译君，支持中英日韩法德意土等15种语言和80个语种的翻译。2017年腾讯翻译君上线“同声传译”功能，用户边说边译的需求得到满足，语音识别+NMT等技术的应用保证了同声传译的速度与准确性。腾讯智能翻译基于腾讯领先的底层算法、丰富的中文知识图谱和先进的NLP搜索引擎能力，结合了神经网络翻译和统计翻译的优点，对源语言文本进行深入理解，使翻译效果更为准确，同时支持语音翻译、图片翻译、语种识别等多种场景。

智能翻译是搜狗人工智能战略中的重要一环。2016年5月19日，搜狗正式上线英文搜索。2017年11月的乌镇世界互联网大会上，搜狗展示了机器同传技术。12月21日，搜狗发布了跨语言搜索系统，英文搜索正式升级为海外搜索，并同步上线了基于神经网络的搜狗翻译频道。2018年3月，搜狗推出了定位为旅游用的搜狗旅行翻译宝，开始了在智能翻译硬件领域的探索。

阿里巴巴2015年收购了国内最大的众包翻译平台——365翻译，开始涉入智能翻译领域。2017年初阿里正式上线了自主开发的神经网络翻译系统，为阿里经济体复杂多样的国际化需求提供可靠的技术支撑。阿里翻译的宗旨是“让商业没有语言障碍”，为跨境电商信息本地化与跨语言沟通提供精准、快捷、可靠的在线翻译服务。

除此之外，国企、央企背景的外文局、中译语通，一些实验室成员组成的创业公司和传统翻译机构也陆续加入到智能翻译服务的行业中来，如语智云帆、小牛翻译、爱特曼等，这些创业企业均希望在垂直行业占据一定的市场。智能翻译在我国从无到有，如今其发展更是有着新的广度和深度，具有深刻的时代意义和现实价值。

推动广东智能翻译行业发展的建议

2017年5月14日，国家主席习近平在“一带一路”国际合作高峰论坛开幕式上发表主旨演讲时强调：“要将一带一路建成创新之路，创新是推动发展的重要力量。要坚持创新驱动发展，加强在数字经济、人工智能、纳米技术、量子计算机等前沿领域合作，推动大数据、云计算、智慧城市建设，连接成21 世纪的数字丝绸之路。”

广东作为“一带一路”特别是21世纪海上丝绸之路建设的排头兵和主力军，在形成全面开放新格局上要走在全国前列。从全国研究智能翻译的科研单位和企业来看，广东目前不占优势。但可喜的是，广东的腾讯和新译科技在这方面不断加大投入，不断与该项研究比较强的香港和澳门高校开展深度合作，促进了智能翻译技术的发展。智能翻译具有万亿级的潜在市场，当前需要投入巨大的财力、物力、人力推动其技术研究和产业应用，建议广东从政策、资金、人才和落地场景等方面推动智能翻译行业发展。

(一)政策支持

建议在广东筛选获得过融资或者国家、省级人工智能相关认证奖励的企业进行重点扶持，推动其与广东相关高校、企业优先合作，鼓励分享智能翻译企业需要的非涉密数据，推进智能翻译产业化升级。通过产业政策的正向引导，树立行业标杆，促进该行业良性发展，打造广东智能翻译创新高地。

(二)资金支持

目前，智能翻译技术处于快速发展阶段，智能翻译类创业公司对资金有强烈的需求。在资本投资市场上，外资背景的投资机构对智能翻译企业给予很高的估值，而国内投资机构很多偏向中后期市场。建议广东对确立的智能翻译行业重点扶持企业，有针对性地给予税收优惠、提供低息或无息贷款、给予一定比例的配套资金支持、探索智能翻译企业股权质押等方式予以资金支持。

(三)人才支持

虽然我国的智能翻译技术取得了巨大的突破，尤其是在应用市场上得到了广泛关注，但与国际水平还有一定差距，急需引进世界最先进的技术和海外顶尖人才。建议广东为智能翻译企业引进人才给予下列支持：办理临时居留证件，方便海外人才在我国的工作和生活;申请延长签证时间，减少多次办理签证带来的不便;特批人才租赁住房资格，或者提供人才公寓。

(四)落地场景支持

智能翻译企业的一大痛点就是落地场景。建议政府牵头，组织相应的帮扶部门，包括政府机构、合作的高等院校、各种孵化园区等，让智能翻译技术尽快应用到垂直行业中，如酒店、机场、新闻媒体、会议会场、出租车、旅游景点等现实场景。建议构建国家级、省级的智能翻译中心，向全国展示智能翻译在广东的真实应用。

（来源：《广东经济》2018年9月刊）

上一篇：刘建达：中国英语能力等级量表与英语测评下一篇：海丝精神催生东盟文化蓝图