「无心插柳柳成荫」的乔姆斯基 | 追溯 AI 大师系列

雷锋网 AI 科技评论按：「追溯大师」是雷锋网 AI 科技评论的新设栏目，专门介绍那些在历史上对人工智能发展形成重大影响的学术大师们。作为栏目的首位主角，艾弗拉姆·诺姆·乔姆斯基博士（Avram Noam Chomsky）在语言学方面的成就也许你略有耳闻，而他与人工智能的联系，你又了解多少呢？

「无心插柳柳成荫」的乔姆斯基 | 追溯 AI 大师系列

艾弗拉姆·诺姆·乔姆斯基博士（Avram Noam Chomsky，1928 年 12 月 7 日—），麻省理工学院语言学的荣誉退休教授，发表的《生成语法》被认为是 20 世纪理论语言学研究上最伟大的贡献。

乔姆斯基从小便聪颖过人，16 岁入读宾夕法尼亚大学，在俄裔语言学家 Zellig Harris 的影响下攻读语言学，本硕期间深入研究「现代希伯莱语的词素音位学」；博士期间，他以年轻学者的身份在哈佛大学继续深耕语言学研究，最终完成后来使他收获巨大声誉的学术成就雏形——「转换生成语法」。

该学说的集大成之作，是在 1957 年出版、使乔姆斯基收获巨大声誉的《句法结构》。乔姆斯基在《句法结构》中论证了语法的生成能力，他认为我们应该把语法看成是能生成无限句子的有限规则系统：

短语结构规则有三种：合并、递归、推导式，其基本形式是 x→y。→读作"改写"，这个公式就是将 x 改写成 y。

短语结构规则生成的是"核心语符列"，不经过转换直接由这种语符列得出的基本句型叫"核心句"。

转换规则包括：移位、删略、添加。

如今，转换生成语法已成为西方当代语言学理论中的基础性内容。

在机器翻译的早期研究中，美国的 METAL*(MEchanicalTranslationandAnalysisofLan-guage) 就充分利用了乔姆斯基的转换生成语法和短语结构理论。

*注：1978 年，美国得克萨斯大学与联邦德国西门子公司开始合作研制德英机器翻译系统 METAL 系统。它是高度模块化的结构，可并入语义分析、情报检索和专家系统模块。

该系统采用短语结构文法来构造语言规则系统，通过转换生成目标语言，主要基于尔科夫过程方法实现系统运行。根据资料记载，METAL 系统的翻译速度为 5.7 秒/词, 约为人工翻译的 6 倍 ( 1984 年时的试验结果)，由此成功在多个专业领域上被利用。

为自然语言系统打下基础

从宏观层面来说，转换生成语法反映了乔姆斯基对于理性主义传统的坚守, 这种理性主义在语言学中主要体现在三个方面:

第一, 承认存在一种普遍的语言, 与此对应, 还应存在一种对各种语言都适用的「普遍语法」。乔姆斯基在语言学研究中一直不断地寻求这种普遍语法, 并为它提供了具体的语言学描述, 即「管辖与约束理论」。

第二, 承认存在一种先天的语言学习机制 (LAD)。乔姆斯基认为, 语言学习是一种演绎过程:儿童从先天的 LAD 中推导出母语的具体结构, 并在语言环境中验证这些假设;那些证明与他们听到的语言相符合的假设被选作他们母语的语法。

第三, 坚持理性主义的方法论原则, 认为语言学具有自然科学的某些特征, 即通过一些普遍原则, 可以用演绎法推导出具体的语法。

早期麻省理工学院人工智能实验室成员 Robert C. Berwick 曾高度评价乔姆斯基语言学革命对人工智能研究的积极意义，尤其是「管辖与约束理论」(GB 理论)，他认为该理论让「触类旁通」的语言分析系统成为可能。

GB 理论是乔姆斯基八十年代初从事普遍语法研究的产物, 它的核心由一系列互相联系、互相制约的基本原则组成。这些原则具有普遍性, 适用于每种语言, 同时又具有灵活性, 允许不同的语言在一定范围内有些差异。Berwick 认为 GB 理论特别适合用来设计未来的人工智能自然语言系统，其优越性主要体现在三个方面:

GB 理论的系数化以及依赖约束的做法使它成为遵循语言学理论、探索匹配处理的较好的工程系统。

它使我们得心应手地处理不合规范的错误输入 (ill-formed input)。

GB 理论通过很少的参数表征所有的语言, 当它指出句法翻译的方式后, 我们就能用统一方式来分析各种各样的不同的语言

在 GB 理论出现以前, 许多语言学家利用大量的语法规则分析纷纭复杂的语言现象。GB 理论摒弃了这一传统做法, 改为依靠统一的、参数化的约束系统的交互作用来解释复杂的句子。

换句话说，如果我们有 10 种独立的约束, 每项约束可以取两个值 (利用该项约束或不利用), 我们原则上仅以 10 项约束就能描述 210 个句子, 这比用 1000 多种语法规则解释这些句子要方便得多。

对编程语言的影响

在乔姆斯基的语言学理论中，乔姆斯基定义了四型文法，并数学化地表述了每一型的语言表达能力，该理论后来深刻影响了编译领域中语法前端的设计。

约翰・巴克斯将乔姆斯基的语言学理论引入到计算机编译技术领域，据此书写出了 ALGOL 58 的语法，并提出可实现的计算机语法分析算法。巴克斯的工作在计算机编译系统的发展史上是里程碑意义的——它第一次允许编程语言中出现表达式语法和结构化控制流。

简单地说，乔姆斯基的理论回答了这样一个问题，即具备何种特征的语言可以用于书写程序，而巴克斯的工作则告诉我们，计算机程序确实能够用人类可以理解的方式写出并同时让人类和计算机理解。

乔姆斯基的文法理论在计算机领域中真正被使用的共有两者：三型文法和二型文法。前者的特征是语法中不存在递归下降结构，它的代表是基本正则表达式（扩展后的正则表达式情况略有不同）；而二型文法即上下文无关文法，特征是任何语言元素在任何上下文中的含义始终保持一致。

多数如今的程序设计语言语法都以此为基础，换句话说，以上两者构成了如今所有实用计算机程序设计语言的分析器理论基础，也有成熟的数据结构和算法支持。

事实上，乔姆斯基在其学术生涯中并未真正涉猎过计算机和 AI 领域，甚至还对 AI 领域的某些做法颇有微词（比如曾指出 N 元文法的缺陷），然而并不阻碍其高屋建瓴的思想对这两个领域造成不可估量的影响。在机器学习大行其道的当下，其偏向理性主义的体系思考，依然对我们有不少借鉴意义，只不过就需要我们去做进一步的挖掘。

参考文献：

1）《乔姆斯基与人工智能》. 王巍寇世琪

https://zhuanlan.zhihu.com/p/24018768

2）NLP 主流反思的扛鼎之作：立委译《Church：钟摆摆得太远》

https://blog.csdn.net/memray/article/details/50605879

3）知乎「乔姆斯基的语言学理论对编程语言的影响有多大？」提问下的回答

https://www.zhihu.com/question/21843639/answer/19524698

雷锋网(公众号：雷锋网) AI 科技评论

。

原创文章，作者：ItWorker，如若转载，请注明出处：https://blog.ytso.com/135227.html

「无心插柳柳成荫」的乔姆斯基 | 追溯 AI 大师系列

相关推荐

发表回复