雷锋网(公众号:雷锋网) AI 科技评论按,2019 年 6 月 15 日,北京语言大学语言智能研究院成立仪式暨语言智能学术论坛在京举办。来自学界和业界的多位重磅嘉宾参与了会议。
本次会议由北京语言大学信息科学学院党总支书记李超主持。在语言智能研究院成立仪式上,教育部科技司雷朝滋司长,中国科学院院士清华大学人工智能研究院院长张钹教授,语言智能研究院名誉院长、国际计算语言学学会终身成就奖得主哈尔滨工业大学李生教授先后进行了致辞。紧接着,刘利校长和雷朝滋司长共同为研究院揭牌。
语言智能研究院正式成立
语言智能研究院是在北京语言大学信息科学学院、语言资源高精尖创新中心基础上,整合北京语言大学校内外的信息科学、语言学及应用语言学、认知科学等学科优势资源与优秀人才,全新打造的一所旗舰级交叉学科研究机构。语言智能研究院依托信息科学学院进行建设,其前身,是成立于 1987 年 10 月的「语言信息处理研究所」,该研究所是我国第一批专门研究语言信息处理的研究机构,并以此为基础发展出来了北京语言大学计算机系、信息科学学院、国家语言资源监测与平面媒体研究中心、语言监测与社会计算研究所、大数据与语言教学研究、管理科学与工程研究所、汉语国际教育技术研发中心等单位,组建了老中青结合、本硕博齐全的教学科研团队。
在揭牌仪式之后,语言智能研究院与新华社技术局、国家知识产权局中国专利信息中心、神州泰岳集团、金山软件集团、理光软件研究所举行了签约仪式。
随后,语言智能学术论坛开始。本次论坛的主持人是北京语言大学教授荀恩东。参与论坛的嘉宾有北京理工大学计算机学院院长黄河燕,语言资源高精尖创新中心主任、原北京语言大学党委书记李宇明,信息科学学院名誉院长、北京语言大学银龄学者宋柔,中国中文信息处理学会副理事长、秘书长孙乐,苏州大学计算机科学与技术学院副院长、人类语言技术研究所长、人工智能研究院副院长、国家杰出青年科学基金获得者张民,模式识别国家重点实验室副主任、自然语言处理团队负责人宗成庆。
北京语言大学银龄学者宋柔:语言学和语言工程处于严重脱节状态,需携手合作
论坛伊始,信息科学学院名誉院长、北京语言大学银龄学者宋柔首先进行了主题为「语言知识工程与语言智能学科建设」的引导报告。
宋柔表示,关于建设语言智能研究院,他想侧重强调语言学和语言工程的深度融合。我们有各种学科,例如物理、化学、生物等。物理学作为一个基础学科,它支撑了许多物理工程,例如交通工程、建筑工程、机械工程等等;化学作为一门基础理论学科,支持了化学工程,包括化肥、农药、炼油、食品、纺织等等;生物学科作为一门基础的理论学科,支持了医学工程、生物工程、农业工程等等。但是,在语言工程方面,目前的实际情况是,支持它的基础学科是数据科学而不是语言学,语言学反而遭到了冷落。数据科学是一种工具性的科学,是很多学科的通用基础,但不能取代专业领域的科学。语言学和语言工程目前处在一个严重脱节的状态。这是一个不正常的现象。
宋柔认为,语言学需要通过建立语言知识体系,语言工程需要做计算方面的工作和应用方面的工作。这两个方面的结合点就在于在形式化。语言知识体系需要有形式化的手段将它表示出来,计算模型需要建立在形式模型基础之上。但是,研究语言学的人不擅长于形式化的表达,研究计算机科学的人并不清楚如何做语言知识的形式模型。因此,在交接这一块存在很大问题。要解决这一问题,语言学和语言工程需要携手协作。研究语言学的人应该关心形式化的要求和方法,了解算法和程序是怎么回事,往形式模型的方向去做研究,而不能只做面向人的语言学研究。而从事语言工程的人也需要了解语言知识体系,分析自己所做的应用需要什么样的语言知识,在建立计算模型之前首先建立恰当的形式模型。
宋柔提出,在人才培养方面不能只教学生具体的模型,因为模型是会更新的。在实际教学中不仅要讲结果、讲概念和方法,还需要告诉他们,这个概念是怎么来的,这个方法是怎么来的。我们需要把科研内容和教学结合起来。
雷锋网了解到,宋柔1981年毕业于北京大学计算机系取得硕士学位,师从我国著名数学家、计算机科学家、语言学家和教育家马希文。马希文同时也是北京语言大学语言信息处理研究所的创始人,他在语言研究中倡导数学、计算机科学与语言学的结合,做出了诸多开创性的工作,宋柔教授的“加强数据科学与语言科学结合建立语言知识体系”的倡议正是马希文治学观念的进一步延续。
在宋柔教授的精彩发言之后,语言智能学术论坛圆桌会议正式开始,本次会议的主题是「语言知识工程与语言智能学科建设」,在随后的发言中,多位专家也表达了与宋柔教授类似的观点。
北京语言大学语言资源高精尖创新中心主任、原北京语言大学党委书记李宇明:数据驱动与知识驱动齐头并进才能打破人工智能天花板
李宇明表示,在计算机信息处理技术刚出现时,语言学家非常激动,积极投身到信息处理领域。计算机给人类的发展带来了重大的变化,而在这一阶段,语言学家做了很多重要的工作。
我们经历了由知识驱动转向数据驱动的过程。在转向数据驱动的时候,语言学的知识看起来没有什么用处,甚至有的团队里面不需要语言学家了。语言学家希望在语言学领域,通过自己的知识为人工智能作出贡献,但是却看起来徒劳无功。
很多人认为,现在人工智能的发展必然还会遇到一个天花板。数据驱动给社会带来的红利是不可估量的,但它本质上存在着缺陷。那么,如何打破这种天花板?数据驱动和知识驱动齐头并进,才有希望打破可能出现的人工智能的天花板。
北京语言大学之所以成立语言智能研究院,是因为我们在语言上有一些优势,希望将语言学和计算机科学结合起来。接下来,知识工程、服务汉语国际教育,特别是语言学习和外语学习,将会成为我们工作重点之一。
北京语言大学还是有着自己的短板,这些短板我们会逐渐进行弥补。每个学校都有自己的短板,这些短板加在一块,就是整个国家的发展问题。我们当前最需要做的,就是做国家最需要的工作,弥补国家的短板。
北京理工大学计算机学院院长黄河燕:语言学需要和计算机更好地融合
黄河燕谈道,在以前他们一直是基于多种知识融合的方法来做机器翻译。他们使用的规则中,20% 的规则处理了 80% 的语言现象,剩下的 20% 的语言现象在处理的时候,会遇到各种新的问题。
如果有足够多的数据,就能解决很多的问题。他们用统计学、神经网络的方法,能够对数据进行建模和训练,这也是一种很好的解决问题的方式。但是,很多时候有数据涵盖不了的一些现象和问题无法解决。
对不同的应用,知识表示的方式也可能不同。知识表示和业务是密切相关的。
她认为,在语言学科的定位上,重要的是如何把语言知识和计算机更好地融合在一起。它们需要一个比较好的规范标准,在规范的情况下做建设。现在语言学的发展很快,很多学科都需要进行交叉。
在人才培养方面,首先,他们必须结合最新、最前沿的知识,结合产业界最新的技术。其次在设计课程的时候,他们最好也设计语言智能的课程体系。在设计课程的时候,要结合相关学科的基础课程,多学科的交叉领域也是非常需要的。最后,进行本硕博贯通的培养方式。这样不仅会有比较强的体系,还能在各个阶段提供一个支撑性衔接的平台,真正达到人才培养的目的。
中国中文信息处理学会副理事长、秘书长孙乐:要解决关键问题,而不是追逐热门技术
关于语言学领域的工作,孙乐给与会者们分享了两个观点。
第一个观点是,我们应该不忘初心。很多时候,人们因为人工智能热去做这些研究,但实际上,我们可能还是要回到语言本身。语言在产生之初改变了整个人类的历史,正是有了语言,人类的知识才一代一代传承下来。语言智能是人的核心能力。
所以我们应该意识到语言智能的挑战,它是一个核心的一个挑战,这并不是短期或者简简单单就可以实现的,它可能是一个非常艰苦的工作。在做研究的时候,我们不能只追逐热门技术,还是要去解决一些关键的问题。
第二个观点是,汉语是一门非常有特色的语言。早期的一些研究发现,人的大脑在处理不同的语言时,采用的区域是不一样的。在治疗一些有不同的语言障碍的病人时,科学家发现,说汉语的病人治疗的部位和说英语的病人不一致。从语言特色上看,汉语处理比英语处理难度更大,我们应该多做一些比较性的研究。
模式识别国家重点实验室副主任,自然语言处理团队负责人宗成庆:语料标准对于长期的基础理论研究很重要
谈到语言资源的建设,宗成庆提出了三个基本观点。
一是关于技术理论和标准。汉语是我们的母语,但是中国人对汉语却拿不出自己的标准。我们要扎扎实实长期地研究汉语本身的特点,先做出一个标准。我们希望有一个汉语国家数据库。作为母语,我们是有条件、也有能力做到这些事情的。
二是我们应该尽快拿出这个标准,这对于长期的基础理论研究来说是必要的。
三是我们现在做的语料标准更多注重语言本身的一些分析处理。而语言理解除了需要语言本身的知识以外,还有相当一部分是属于常识性的知识,如果不了解常识,我们很可能还是不能理解句子的意思。
关于教学,他会给中科院的学生布置大作业,以及实现一个项目,实现一个系统。但是,最后他收到的作业非常糟糕,几乎所有的学生都是用开源工具做的,并没有自己的思考,学生离开了开源工具就什么也做不了。我们应该鼓励学生用自己想出来的方法,而不是开源工具去做实验。
苏州大学计算机科学与技术学院副院长张民:我们要发展学科基础,建设自然语言处理工程
张民认为,语言学和自然语言处理所要解决的问题不一样。语言学有它自己的学科研究范围,没有义务去解决自然语言处理的问题。
谈到工程,谈到实际需求,我们需要考虑一个问题,人工智能为什么发展起来?最重要的原因,是因为产业的驱动和经济效益。从这一点上来说,我们要感谢产业界。目前,产业界和学术界严重脱离。很多小公司并不知道自然语言处理是什么,完全是从软件工程的角度来处理的。
我们要发展学科基础,建设自然语言处理工程。到底是语言智能还是语言学智能,到底是语言知识还是语言学知识,这个关系不大。外界对语言知识的期望是包罗万象,能够表达所有的常识。所有的知识都是能够用语言学表达的,但是语言学家只研究语义。
我们自己需要和国家同步努力,人工智能这个学科到底是人工智能还是智能科学技术,这个问题谁也说不清楚。人工智能、语言工程和传统的工程不一样,它是发展的、开放的,不能被明确地定义。学科问题是个大问题,一定要讲清楚。
至此,「语言智能学术论坛」圆桌结束。在本次圆桌会议中,嘉宾们对语言知识工程,语言学的研究都纷纷发表了自己的心得、看法,对于学科建设和人才培养也提出了很多独到的见解。
加强学术交流,打造智能语言研究桥头堡
在上午的圆桌结束后,下午还继续进行了「语言智能学术论坛」系列学术报告。
在下午的学术报告中,哈尔滨工业大学李生教授、微软亚洲研究院周明研究员、中国科学院宗成庆研究员、哈尔滨工业大学刘挺教授、苏州大学张民教授、北京大学穗志方教授、北京语言大学张劲松教授、荀恩东教授就语言智能的发展方向、前沿技术、基础资源和应用挑战进行了精彩报告。整场报告干货满满,嘉宾们从语言智能技术到当前发展趋势进行了精彩的解读。数千名网友通过在线方式观看了典礼和论坛直播。
今年,为更好地服务国家战略和北语发展需求,进一步巩固并拓展其在语言学及其相关领域的引领地位,更好地支撑“双一流”建设,北京语言大学举办了一系列学术活动,并成立语言智能研究院,旨在将语言智能研究院建设成为国内外权威、具有巨大影响力的人工智能研究机构。 2019 年 5 月,北京语言大学举办了「纪念马希文教授八十诞辰 暨《逻辑·语言·计算——马希文文选》出版」座谈会与学术研讨会。而今年 8 月,由中国计算机学会(CCF)、中国中文信息学会(CIPS)联合举办的第四届「语言与智能高峰论坛」也将在北京语言大学举办。据悉,语言智能研究院拟于近期启动团队组建工作,面向校内外、国内外多种形式招聘著名专家和优秀中青年学者加盟研究院。中国中文信息学会名誉理事长,原哈工大党委书记,国际计算语言学协会 (ACL) 终身成就奖获得者李生更是担任语言智能研究院的名誉院长。
未来,北京语言大学能否成为智能语言研究桥头堡?相信在不久的将来,北京语言大学语言智能研究院一定能够在语言知识工程领域做出很多优秀的成果,为我国语言智能事业的发展做出杰出的贡献。
雷锋网雷锋网
雷锋网版权文章,未经授权禁止转载。详情见。
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/136766.html