评论观点

您当前的位置 : 首页 >> 其他栏目 >> 评论观点 >> 正文

外国语言文学学科建设:桂诗春教授的跨学科思想

发布时间:2018/04/23 11:25:29

教育部语言文字应用研究所冯志伟教授深情怀念桂诗春先生

桂诗春教授是中国著名语言学家和外语教育家。曾任广州外国语学院(现广东外语外贸大学)院长,国务院学位委员会外国语言文学学科评议组第二、三届委员,全国外语教学研究会副会长,全国外语教学计算机辅助教学委员会会长,广东外语学会会长等。4月21日,我参加了广外举行了桂诗春语言学思想座谈会。深切怀念老朋友桂诗春教授。

我是在上世纪80年代认识桂诗春教授的,当时我正在研究计算语言学的一些新理论和新方法,如词汇功能语法、链语法、递归转移网络、扩充转移网络、左角分析法、树邻接语法、CKY算法等,我写信与桂诗春教授讨论一些问题,发现桂诗春教授对于这些形式化的计算语言学理论非常熟悉。桂诗春教授对我说,他正在研究实验心理语言学,试图通过实验来验证心理语言学的结论,因此,他也关注到这些形式化的计算语言学理论。于是我们通过邮件经常讨论这些语言学中的新理论、新方法,积极倡导在语言学中进行跨学科研究。

桂诗春教授喜欢亲自动手用计算机处理语言,他的动手能力很强,他经常给我介绍他看到的语言自动处理的软件,有时他把这些软件收集起来,刻成光盘送给我。他在1991年的《实验心理语言学纲要》(湖南教育出版社)中,就有不少关于自然语言计算机形式分析方法的内容,我们之间在业务上有了很多共同点,我们都主张使用计算机来进行语言研究,这样,我们都成为了语言学界两个白发苍苍的电脑发烧友。

在桂诗春教授的鼓励和帮助下,我在计算语言学领域做了一些有意义的工作,还写了几本计算语言学的书。桂诗春教授写的《多视角下的英语词汇教学》和我写的《自然语言处理简明教程》,都收入了《现代语言学丛书》,这两本书都是语言学跨学科研究的成果。我非常感谢桂诗春教授对我的鼓励和帮助。

在信息化、智能化的时代,语言学与计算机科学、数学、心理学都发生了密切的联系,应用跨学科的方法来研究语言,或者借助于其他学科的理论和方法来研究语言,已经是迫不及待的事情。我们应当向桂诗春教授学习,不断地进行更新知识的再学习。“活到老,学到老”应当成为我们治学的座右铭。

目前,基于多层神经网络的、以大数据作为输入的深度学习方法引入到机器翻译中。深度学习使用多层神经网络的方法,重复利用中间层的计算单元,减少参数,计算机从海量的大数据中可以自动地产生模型的特征和算法,实现端对端的机器翻译,而不需要语言学家的干预。

2007年以来,采用深度学习的方法,以大规模的双语对齐的口语语料库作为语言知识的来源,从双语对齐的口语语料库中获取翻译知识,统计机器翻译又进一步发展成了神经机器翻译,口语神经机器翻译正确率已经超过了90%,针对日常口语的神经机器翻译已经可以与人的翻译媲美了。

由于神经机器翻译的成功,也有人认为语言学知识对于自然语言处理已经没有什么用处了,甚至认为翻译人员就要失业了。我不赞同这样的看法。

在神经机器翻译中,语言之间的翻译细节还是一个“黑箱”,尽管翻译的结果还可以,但是我们对于其中的语言处理机制和因果关系仍然是不清楚的,这需要我们在语言学上做出科学的解释。如果我们使用语言学的理论来研究神经机器翻译这个黑箱,在深度学习的算法中导入语言结构的知识,也许就能够揭开这个黑箱的神秘面纱。

自然语言处理就像一棵枝叶茂密的果树,果树上下挂满了累累的果实,现在有些急功近利的人出于实用的需求,都在争相摘取那些低枝头的果实,那么,如果低枝头的果实都被摘完之后,谁去摘取那些处于果树的高枝头上的果实呢?究竟怎样去摘取呢?由于自然语言处理的研究对象是语言,当然应当有语言学知识的支持,因此,要想摘取高枝头上的果实,除了依靠计算机技术之外,我们还需要依靠语言学知识去摘取。语言学家在自然语言处理中是大有可为的。我们要认真地学习语言学的知识,深入研究语言学中的各种规律和规则。

同时还要与时俱进,像桂诗春教授那样进行更新知识的再学习,除了学习语言学的各种新知识之外,还要学习数学、计算机科学,特别是要学习现代神经网络的各种理论和技术,学习跨学科的各种知识和技能,把自己培养成文理兼通、博学多才的人,才有可能摘取高枝头上的果实,成为信息化、智能化时代的新型语言学家。

文章转自微信公众号“冯志伟”。