AI“读图会意”首超人类，阿里巴巴达摩院刷新全球 VQA 纪录

IT之家8 月 13 日消息据财联社，国际权威机器视觉问答榜单 VQA Leaderboard 在近日出现关键突破，阿里巴巴达摩院的 AliceMind 以 81.26% 的准确率创造了新纪录，让 AI 在“读图会意”上首次超越人类。

VQA 是 AI 领域难度最高的挑战之一，在该测试中，AI 需要根据给定的图片、自然语言问题生成正确的自然语言回答。也就是说，AI 需要同时具备计算机视觉和自然语言算法，先扫描图像，然后理解文本，最后再推理作答。解决该挑战，对研发通用人工智能具有重要意义。

VQA 挑战自设立以来，吸引了包括微软、Facebook、斯坦福大学、阿里巴巴等众多机构和公司参与，形成了国际规模最大、认可度最高的 VQA 数据集，包括 20 万张真实图片、110 万道考题等。

IT之家了解到，除了本次“读图会意”挑战，阿里巴巴的达摩院还在 2018 年的斯坦福 SQuAD 挑战赛中，令机器阅读理解首次超越人类。

原创文章，作者：ItWorker，如若转载，请注明出处：https://blog.ytso.com/93635.html