导读:ECAI 2016是欧洲展示AI科学成果的最佳场所,大会为研究人员提供了很好的机会,去介绍和听取当代最优秀的人工智能研究成果。
用于改善文字和文本嵌入的聚类驱动模型(Cluster-Driven Model for Improved Word and Text Embedding)
摘要:大多数现有的文字嵌入模型只能考虑文字和与它相近语境之间的关系(例如,十字左右的目标文字)。然而,超越相近语义的信息(整体语境),反映了丰富的语义含义,而这通常都被忽略了。本文中,我们提出了一个通用的框架,利用全局信息学习单词和文本表示。我们的模型可以很容易地集成到现有的局部字嵌入模型,从而根据不同的下游任务引入不同程度的全局信息。此外,我们从共生矩阵的角度来看待我们的模型,在此基础上一种新的加权词-文档矩阵被因式分解以生成文本表示。我们进行了一系列的实验,来评估通过我们模型学习的单词和文本表示。实验结果显示我们的模型优于或者堪比最佳性能的模型。
本论文的原程序在https://github.com/zhezhaoa/cluster-driven
第一作者介绍
Zhe Zhao
中国人民大学信息学院
via:ECAI 2016
PS : 本文由雷锋网(公众号:雷锋网)独家编译,未经许可拒绝转载!
雷锋网原创文章,未经授权禁止转载。详情见转载须知。
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/60772.html