今日,全球最为权威的计算机视觉大赛 ImageNet ILSVRC2016(大规模图像识别竞赛)公布了算法排名结果,中国学术界和工业界团队包揽多项冠军。
今年 ILSVRC2016 分为五大部分,包括:目标检测、目标定位、视频中目标物体检测、场景分类、场景分析。中国团队的成绩如下:
-
CUImage(商汤科技和港中文)目标检测第一
-
Trimps-Soushen(公安部三所)目标定位第一
-
CUvideo(商汤和港中文):视频中物体检测子项目第一
-
NUIST(南京信息工程大学):视频中的物体探测两个子项目第一
-
HikVision(海康威视):场景分类第一
-
SenseCUSceneParsing(商汤和港中文):场景分析第一
目标检测
任务 1a:用提供的数据进行目标检测
CUImage(商汤科技和港中文) 使用提供数据合成 6 个模型,检测物体胜出种类数量 109,检测准确率为 0.662751。
任务1b:使用附加训练数据进行目标检测
CUImage(商汤科技和港中文)采用带标注的 ImageNet Det 数据作为训练数据。识别物体胜出种类数量 176 个,平均精准度 0.66081。
目标定位
任务 2a:基于给定数据进行分类+定位
第一名 Trimps-Soushen(公安部三所)的模型定位错误率为 0.077087,分类错误率为 0.02991。
任务 2b:使用附加训练数据进行分类和定位结果
Trimps-Soushen(公安部三所) 在定位和分类上位列第一。
视频中的目标物体检测(VID)
任务 3a:基于给定训练数据进行的视频中的目标物体检测
NUIST(南京信息工程大学),识别物体胜出种类数量 10 个,平均精准度 0.808292。
任务3b:使用附加训练数据进行的视频中的目标物体检测
NUIST(南京信息工程大学)识别物体胜出种类数量为 17 个,平均精准度 0.79593。
任务3c:给定训练数据进行的视频中物体检测和追踪
CUVideo(商汤科技和港中文) 采用基于多模型集成的方法在该项目获得第一名。
任务 3d:附加训练数据进行的视频中目标物体检测和追踪
NUIST(南京信息工程大学) 提出的基于级联区域回归和跟踪的方法在改项目获得第一。
场景分类
Hikvision(海康威视)提取的模型在该项目排名第一。
场景分析
SenseCUSceneParsing(商汤科技和港中文)提出的环境语义分割框架获得该项目第一。
中国团队频繁刷爆国际 CV 榜单
近两个月,国内团队先后在全球最权威的人脸检测评测平台 FDDB 和全球自动驾驶算法公开排行榜 KITTI 以及 Cityscapes 上取得非常好的成绩,这在一定程度上证明了国内计算机视觉相关算法已达到国际顶尖水平。
人脸识别
上个月 FDDB 公开两组数据集排名,一个是研究团队公开人脸检测方法的评测组,另一个则不公开方法的评测组。其中小米在公开监测方法组里面拿到了世界第一的好成绩,而在不公开方法的评测组中,中国公司抢占了整个榜单的半壁江山。
此外,近些年中国公司在人脸关键点定位 300-W Benchmark 和 LFW 人脸识别数据库上,也多次包揽世界第一。
自动驾驶
在自动驾驶算法排行榜上,上周国内初创公司图森互联在全球最权威的自动驾驶算法公开排行榜 KITTI 和 Cityscapes 评测数据集上均获得世界第一。在 KITTI 数据集中,图森互联获得目标检测三个单项、目标追踪两个单项、道路分割四个单项,共计九个单项的世界第一。
从现在的势头来看,可以预见接下来国内团队将会陆续在 ImageNet 等国际人工智能榜单中取得非常好的名次。
那么计算机视觉公司如何在 ImageNet 比赛中获得冠军?
9 月 27 日下午 3:00 ,雷锋网硬创公开课邀请本次ImageNet 大赛中在场景分类中荣获第一名的杭州海康威视的首席科学家 、海康威视研究院常务副院长浦世亮为大家公开讲述他们是如何刷爆 ImageNet 的。敬请期待!
扫描二维码,参与公开课主题分享
雷峰网原创文章,未经授权禁止转载。详情见。
原创文章,作者:306829225,如若转载,请注明出处:https://blog.ytso.com/213844.html