雷锋网 AI 科技评论按:2019 年 7 月 28 日,自然语言处理领域的顶级学术会议 ACL2019 在意大利佛罗伦萨召开。作为文艺复兴时期的重要艺术城市、如今的旅游胜地,在盛夏时节来到佛罗伦萨的不止有世界各地的计算语言学学者与 NLP 应用开发者们,当然还有许多游客们。佛罗伦萨市内的大街小巷也十分热闹。
ACL2019 的会议地址是 Fortezza da Basso,它是文艺复兴时期的代表建筑之一。公元十六世纪修建它时是作为一个守卫佛罗伦萨的堡垒,如今已经成为佛罗伦萨的主要会议举办地点。大会演讲、论文报告、专题研讨会等都会在这里的各个场馆内进行。
Tutorial 日活动
会议第一天 28 日为 Tutorial 日,集中了 9 个不同主题的 Tutorial(教学讲座);7 月 29 日至 7 月 31 日为正会,有大会开幕式、2 个特邀演讲、所有的论文口头报告、论文海报展示、论文 demo、ACL 论文奖以及个人荣誉奖颁奖。8 月 1 日、2 日的内容是 workshop(专题研讨会)。
大会签到也是从 28 日开始。签到处也有文艺复兴元素,大会准备了两个来自著名画作的照相版供参会者合影留念。
ACL 2019 有众多赞助商,不仅可以在展位区的赞助商展示牌上看到,更可以沉甸甸地感受到:签到时发放的资料袋里有赞助企业们的 ACL 宣传材料,摊开可以摆满一桌子;内容以介绍本届 ACL 中的收录论文和规划的活动为主。当然了,ACL2019 官方的会议手册也是厚厚一大本。
雷锋网(公众号:雷锋网) AI 科技评论记者参与了下午的无监督的跨语言表征学习(Unsupervised Cross-Lingual Representation Learning)教学讲座,包括「NLP 网红」Sebastian Ruder 在内的三位讲者进行演讲。
他们从跨语言 NLP 课题的缘起和字词表征普及之前的时代讲起,详细介绍了双语、多语表征学习模型的发展,比较了有监督与无监督学习方法、不同的无监督学习方法之间的异同,讲解了方法应用各个步骤中的要点,讨论了现有方法在稳定性、可用性、语言对以及数据量方面的限制,以及说明了无监督跨语言表征学习对于后续任务和应用的有效帮助。这里的鸽子又多又不怕人,甚至有一只都飞到了这个讲座的会场里来「听讲」了。
一天的教学讲座结束后,晚上有一个欢迎酒会,给参会者们提供社交空间。我们也在闲聊中惊喜地发现了来自国内外的数位 AI 研习社内容的关注者。
全部教学讲座内容介绍及下载
我们把全部教学讲座的内容概要介绍如下。文末附有全部 9 个教学讲座的 PPT 的下载链接。
教学讲座 1: Latent Structure Models for Natural Language Processing,用于自然语言处理的隐含结构模型
对于处理复合数据、挖掘语言学结构、构建NLP数据处理流水线来说,隐含结构模型是一类非常有效的工具。它们有两大优点:它们可以在训练的时候集成结构偏倚,这可以让模型更加准确;它们也能够找到隐含的语言学结构,这带来了更好的可解释性。
这个教学讲座会介绍离散隐含结构模型在近几年中的发展情况。内容具体为,首先介绍一些现有方法的动机、潜力和限制,然后详细讨论设计这类模型的三种策略:梯度逼近(gradient approximation),强化学习,以及端到端的可微分方法。讲座中将会重点介绍这些方法之间的联系,并历数它们的优缺点。讲解到的这些方法都已经使用在了情感分析、自然语言推理、语言建模、机器翻译、语意解析等等许多NLP任务中。随着示例和评价结果的讲解,NLP实践者将会更了解哪种方法是适合解决自己的问题的。
教学讲座 2: Graph-Based Meaning Representations: Design and Processing,基于图的意思表征:设计以及处理
(北京大学孙薇薇老师也是这个教学讲座的演讲者之一)
在过去的几年中,以有标签的有向图(labeled directed graphs)的形式编码并处理句子意思的方法得到了极大的关注。这个方向上的做出成果的研究框架有不少,包括抽象含义表征(Abstract Meaning Representation)、最小递归语意的基于图的呈现(graph-based rendering of Minimal Recursion Semantics)、双向词法语意依赖性图(Bilexical Semantic Dependency Graphs),以及通用感知认知标注(Universal Conceptual Cognitive Annotation)。
作为语句意思的高级别向量表征的补充,解析为图表征这样的具有层次化结构且离散的语意表征也从一开始就是NLP研究的重要基石,未来也将继续在自然语言的理解中起到重要作用。这个教学讲座将首先简要回顾正式语意和语言学语意方面的相关背景,然后半正式地为不同的语义图和相关词汇进行统一的抽象定义介绍,接着对比综述常见的基于图的意思表征框架以及现有的图库,最后从技术角度介绍如何选择不同的具有代表性的解析方法。这个教学讲座的最终目的是为不同的语义图库以及对应的解析研究提供一个统一的视角,也就可以为入门水平的自然语言处理开发者和使用者们扫清运用最新技术、最佳用例的障碍。
教学讲座 3: Discourse Analysis and Its Applications,话语分析及其应用
话语处理是从文本中提取多种不同级别的语言学结构的一系列NLP任务,可以用来支持许多文本挖掘应用。它包括在一组对话内容中识别话题结构、识别一致性结构、识别互关联结构以及识别对话结构。提取出的这些结构可以用来推理出文本总结、文章打分、情感分析、机器翻译、信息抽取、问答以及线索重建。
这个教学讲座将首先介绍论述分析中的基本概念:单向文本&对话,同步&非同步对话,以及论述分析中的关键语言学结构。然后将会将会介绍传统的机器学习方法以及一些最新的基于深度学习的方法,并且在评测数据上比较它们的表现。对于提及的每种话语结构,讲座中都会介绍它在下游的文本挖掘任务中的使用,也会详细介绍评价它们的方式和指标。最后还会讨论这个领域未来的挑战以及发展机会。
教学讲座 4: Computational Analysis of Political Texts: Bridging Research Efforts Across Communities,政治文本的计算性分析:沟通不同领域的研究成果
用计算性方法研究政治内容的文本的做法经历了快速发展,如今在政治学研究中也形成了逐渐壮大的“以文本为数据”的研究员群体。NLP方法在许多分析和任务中得到了广泛的使用,包括从文本记录中推测某人的政治立场,检测政治文本中的观点,以及分析政治沟通中的文体运用(比如制定政治议程过程中语意模糊性起到的作用)。政治学研究者们构建了许多资源,并使用一些NLP方法处理文本数据;这个过程很大程度上是独立于NLP研究人员们的。
同时,NLP研究人员们也研究了许多非常相近的任务,比如选举结果预测、思想分类、立场检测。这两群研究者们互相之间几乎没有什么了解,NLP研究人员们几乎不知道政治学中的这些有趣的应用场景,政治学家们也不知道有哪些最新的NLP方法可以用来解决他们的问题。这个教学讲座将会全面展示政治文本的计算性分析这一领域的研究成果,也会介绍NLP研究人员们目前在相关&类似任务上的研究进展。
教学讲座 5: Wikipedia as a Resource for Text Analysis and Retrieval,把维基百科作为文本分析和检索的资源
维基百科中由众多网友们参与贡献形成的文章不仅反映了大众或者说网民们越来越广泛的兴趣,也很可能是目前为止最大的公开的、去中心化的非结构化或者半结构化知识库。这个教学讲座分析了维基百科作为一个文本库,能在文本分析和检索中起到什么样的作用。维基百科能起到积极作用的文本分析任务包括共指解析、字义及实体去模糊以及信息提取。
对于信息检索任务,对于查询指令的结构和意义有更好的理解,也可以帮助更好地匹配文档查询、聚合查询结果、为热门实体的查询提供知识检索。这个教学讲座将会对比维基百科与其他人工收集的知识库的特性以及优缺点,将会介绍把维基百科中的半结构化数据转换为结构化数据后的导出资源,以及介绍维基百科及其导出资源在文本分析以及增强信息检索中能起到的作用。
教学讲座 6: Deep Bayesian Natural Language Processing,深度贝叶斯自然语言处理
这个教学讲座将会介绍用于自然语言处理的深度贝叶斯学习的发展,以及它在语音识别、文本总结、文本分类、文本分割、信息提取、图像描述生成、句子生成、对话控制、情感分类、推荐系统、问答、机器翻译等等许多任务中的广泛应用。传统上,我们用“深度学习”形容推理和优化过程基于真实值的确定性模型,然而单词、句子、实体、动作以及文档中提取出的“语意结构”可能无法用数理逻辑或者计算机程序准确地表达或者正确地优化。在离散或者连续隐变量自然语言模型中的“分布函数”可能是无法适当地分解或者预测的。
这个教学讲座介绍了统计模型和神经网络的基础知识,并将重点讲解一系列高级的贝叶斯模型以及深度模型。这些模型之间的联系、能在自然语言的许多符号化表示和复杂模式中发挥作用的原因也会得到介绍。教学讲座的内容还包括:为了解决复杂模型的优化问题而提出的变化推理和采样方法,把词表征、句表征、聚合和协作聚合与语言学限制、语意限制相结合,为了分别解决深度贝叶斯学习和理解中的不同问题而进行的案例研究,以及讨论未来研究的一些方向和展望。
教学讲座 7: Unsupervised Cross-Lingual Representation Learning,无监督的跨语言表征学习
在这个教学讲座中,我们对弱监督、无监督跨语言词表征领域的最新最前沿成果进行一次完整的综述。在简单介绍跨语言词表征的发展历史之后,我们会重点介绍以下内容:1,如何在资源非常有限以至于无法保证双语监督的情况下引入弱监督以及无监督的跨语言词表征;2,在无监督方法无法高效运行的情况下检验不同训练条件和要求的效果;3,用于弱关联性语言之间的更鲁棒的方法能够改善不稳定以及表现不佳的问题;4,如何全面地评价这些表征;5,介绍能从跨语言词表征中获得收益的实际应用。
教学讲座 8: Advances in Argument Mining,争论挖掘领域的进步
争论和辩论是文明社会以及智慧生活的基石。对争论的处理支持了政府的运行、构建了科学进步并形成了宗教信念。随着我们对争论的形成方式、解释以及造成影响的方式都有了更好的理解,现在也可以提出计算性的问题,探讨如何让机器建模并复制针对自然语言争论的识别、重建、解释、评价、推理过程。
这个讲座的目标是向学生们介绍这个在过去三年中经历了巨大进展的领域,讲解这段时间内的重要研究成果。争论挖掘建立在观点挖掘、情感分析的基础上,和它相关的不仅仅是提取出人们的想法,还有为什么他们会持有这些想法。这个领域如今有上百篇论文、数百万美元的商业和科研投资。
教学讲座 9: Storytelling from Structured Data and Knowledge Graphs : An NLG Perspective
在这个讲座中,我们将讨论把结构化数据以及知识库转换成自然语言话语的基础知识、方法论以及系统开发方法。这个讲座的内容包括了自然语言生成(NLG)任务的挑战和方法,尤其重点介绍了从(结构化)数据到文本的转换范式。
我们预计听众将有这些收获:1,如何用基础的以及最流行的NLP与NLG技术描述以及总结非语言化的或者有结构的文本数据;2,对一些开放性的问题有自己的见解,未来也许能够引向重要的科研成果。我们将对从数据到文本这一任务设定下的从数据表示技巧到领域适应方案等等的各种做法做整体的介绍,也会讨论传统的基于规则的、启发式的方法,以及现代的数据驱动的深度学习架构,以及对评价和质量预计进行简单的讨论。
9 个教学讲座 PPT 打包下载链接:https://ai.yanxishe.com/page/resourceDetail/919
ACL2019 正会第一天开幕式的内容播报也已经出炉,请参见这篇文章。
更多 ACL 2019 会议内容报道,未来更多顶会消息,请继续关注雷锋网 AI 科技评论。
。
原创文章,作者:kepupublish,如若转载,请注明出处:https://blog.ytso.com/137023.html