天地伟业杨清永：安防AI的未来方向将是全目标识别

10月27日，由雷锋网(公众号：雷锋网) & AI掘金志主办的「全球AI芯片·城市智能峰会」，在深圳大中华喜来登酒店盛大召开。

延续雷锋网大会一贯的高水准、高人气，「全球AI芯片·城市智能峰会」以“城市视觉计算再进化”为主题，全面聚焦城市视觉与城市算力领域，是业内首个围绕“算法+算力”展开的大型智能城市论坛。

峰会邀请到了业内极具代表性的14位业内知名专家，世界顶尖人工智能科学家、芯片创业大牛、产业巨头首席技术高管、明星投资人齐聚，为行业资深从业者们分享前瞻的技术研究与商业模式方法论。

此次大会上，天地伟业总工程师杨清永发表了《AI 时代的安防新理念》的主题演讲。

杨清永表示，安防行业分别经历了三个时代的变迁：模拟时代、数字时代和智能时代。而数字时代，存储成本高、数据可读性差、取证难度大等弊端，决定了向智能时代的跨越是一条必经之路。

而在安防的智能时代，主要是为了实现身份识别和行为识别两大目标。但杨清永认为，未来安防AI的发展方向将是全目标识别，“也就是在一个视频里，所有能看到的东西都能够进行身份识别、行为识别，最终让摄像机能够看懂世界。”

杨清永是安防行业的一名老兵。他说到，2015、16年时，每年安防展的人数都在缩减，安防行业进入了一个洗牌的时代。但是这两年，安防展越来越火，参展人数越来越多，这是AI给安防行业带来的新活力，也给业内人士的实战理念带来了变化。

在他看来，AI时代的安防产品必须将产品和用户的应用场景结合起来，针对用户的痛点设计出一套解决方案，最终实现用户的价值。“真正用起来，用户才会买你的东西。普通录像机就可以录像，为什么要买带人脸识别的呢？”

杨清永在演讲中表示，未来安防会向AI解决方案和AI产品两种方向发展。两种方式目前没有分出胜负，而竞争力的核心和关键点在于成本，看谁的成本能够做到最低、性价比做得更高。为了降低成本，则需要做到协同智能、高集成化、多模型开发和资源适配这四点。

“智能越前移，成本会越低，市场的量也会越大。最终在前端完成所有的智能功能，并且这些功能都固化，我认为这是发展的终极目标。”

以下是杨清永大会现场演讲内容，雷锋网做了不改变原意的整理及编辑：

杨清永：大家下午好。感谢雷锋网给我这个机会和大家进行分享。

我在安防行业干了十五年，见证了这个行业的发展。有了AI技术之后，安防行业确实发生了一些变化。主要从两个方向，一个是安防行业的过去、现在和未来，另一个是AI产品给安防行业带来的理念与变化。

从事安防行业比较久的人都知道，在2006年以前，安防行业处于模拟时代。那时候的视频监控是模拟摄像机传输到监控中心的监视器显示。这个时代有一些比较典型的产品，例如摄像机、视频切换矩阵等等。从2006年到2016年，可以称之为数字时代。那时候，视频录像的存储是比较困难的，后来通过硬盘，把进行编码后的视频信号存储下来。这是数字时代的典型特征。

从2016年开始，安防行业进入了智能时代。从数字时代发展到智能时代，是因为数字时代的安防行业产生了一些问题。

虽然，我们可以通过编码把视频存储下来，但是占用空间非常大，存储成本非常高，而且存储下来的都是非结构化的视频数据，这些数据没有办法检索，取证比较困难。也就是说，在视频监控发展的这段时间，它的主要作用就是两个，一是视频录像，二是视频回放。一套监控系统安装之后就再也没有人管了，除非有事件发生才会调取录像。

进入智能时代后就不一样了。举个例子，普通摄像机的存储空间有10T。如果用AI摄像机对视频进行结构化处理后，它的存储空间可以下降99%以上。

从检索时间来看，如果是纯视频数据，要靠人为去看这些视频；而在智能时代，视频结构化后的检索速度可以达到秒级。它的存储空间有接近100倍的下降，检索速度有1000倍的提升，这是安防行业从数字时代到智能时代的一条必经之路。

到现在为止，安防行业研究的工作无非是人和车，主要实现两类目标：身份识别和行为识别。

人工智能发展的初期，首先是在视频里面进行移动侦测，通过智能算法检测出视频目标的移动状态。后来，又有了基本目标检测，能够检测到视频里面有一个目标在动，但是区分不出来这个目标是什么。我们把这个时代称为基础智能。有了基础智能之后，对这些目标可以进行行为识别，比如绊线、周界、物品遗留等等，这是基础时代的目标检测和目标行为分析。

后来，有了车牌识别。摄像机可以识别车牌号码、车牌属性、车辆颜色，同时可以识别出车的行为，比如闯红灯、压实线、逆行等等。再后来，可以识别人的目标，同时又以人脸以及人体属性的识别为特征，比如性别、年龄、身高、发型、胡须、眼镜等等。

同时，在行为识别上，有了和人相关的行为识别，比如奔跑、跌倒、举手、起立、睡着等等，包括表情的微笑、愤怒。

这是安防行业AI发展的现状。那么，未来的方向在什么地方？全目标识别。

也就是在一个视频里，所有能看到的东西都能够进行身份识别，以及行为的识别，最终让摄像机能够看懂世界。摄像机做全结构化分析，可以做语义分析，这应该是人工智能在安防行业发展的终极目标，也是人们一直在追求的目标。

AI给安防行业带来了一些变化。在人工智能兴起之前，安防行业进入了瓶颈时期。

我记得2015年、2016年的时候，每年安防展的人数在缩减，安防行业进入了一个洗牌的时代，有几家知名的大企业开始大规模扩张，而一些小企业基本上没有什么生存空间。这两年，大家能看到，每年的安防展越来越火，参展人数越来越多，这就是AI给安防行业带来的新活力。

安防行业进入AI时代以后，我认为一个最大的变化是实战化理念的变化。以前，作为一个录像和回放系统，视频监控是一个标准化的东西，可以放在门店、商场销售，因为作用非常简单，就是录像和回放。

AI时代就不一样了，如果你说你的摄像头能人脸识别，那么用户就会问，对我有什么用？能给我带来什么价值？也就是说，AI时代的安防产品必须要把产品和用户的应用场景结合起来，能给用户产生应用，能与他的应用系统相结合，甚至结合到OA办公软件里面。真正用起来，用户才会买你的东西，否则不会买你的东西，普通录像机就可以录像，为什么要买带人脸识别的呢？

所以，我们必须找到一个应用场景的痛点，针对用户的痛点设计出一套解决方案，最终实现用户的价值。如果不结合应用场景，AI时代的安防产品就很难得到推广，这是一个很大的变化。

之所以有了这些应用场景的需求，所以，从监控产品上就有了AI摄像机、AI球机、AI特色产品、AI大数据、AI服务器，从解决方案上有了智慧公安、智慧社区、智慧政法、智慧校园等等，在结合了大量应用以后，安防行业里面产生了非常非常多的创新企业，这些企业像雨后般的春笋一样发展起来。

所以现在的安防展会比原来更火爆，因为参加的人数和厂家多了，这些厂家可做的工作多了。只要选中一个场景，把这个场景做实战、做应用，就可以生存下来。任何一家公司，包括现在的龙头企业，都不可能覆盖所有的应用场景，因为应用场景是一个劳动密集型的工作，必须得结合这个应用场景里面的实际应用去做，把应用做深、做好用，这个工作量非常大，没有任何一家企业可以独霸天下。

现在安防行业基本上沿着两个方向走，一个是AI解决方案，一个是AI产品。解决方案越来越专业、越来越实战，因为这个解决方案已经不再是简单的标准化，而是要结合行业应用，做得不实战、不易用，就没有人买你的东西。

产品方面在沿着两个方向发展，一个是向标准化和开放性发展，另外一个是向多样性发展。这两个方向有什么区别？

开放性方面，华为就提软件定义摄像机，一个标准的摄像机硬件平台，在里面灌输什么算法就可以实现什么摄像机。这个摄像机用在什么场景、有什么功能，是由软件定义的，摄像机只提供一个硬件开发平台。华为倡导的软件定义摄像机，走的是一条开放性、标准化的路。

多样性是指针对一个行业的特殊应用需求专门制作这个行业特殊需要的产品，比如养猪场要做猪脸识别，针对特殊的应用场景，摄像机的外观、形状、大小、环境参数都不一样，专门设计一套摄像机，可以让摄像机成本达到最低、性价比达到最好。这是两种发展理念。

这两种发展理念谁好谁坏？现在还不好说，因为专业的摄像机达不到一定的量是没有什么市场的。这两种方向发展的竞争力核心或者发展的关键点在成本，看谁的成本能够做到最低或者性价比做得更高。

在降成本的策略方面，我举了几个例子，这几点应该是AI进入安防行业以来带来的新策略和方向：

首先是协同智能，就拿人脸识别来说，最开始的智能系统，前端是普通的摄像机，后端要通过智能服务器来做人脸检测、识别和比对，它需要大量的视频，需要很大的带宽传输到计算中心。计算中心需要设置大量的服务器，对这些视频进行解码、智能分析，对数据进行结构化。

进入AI时代，前端的摄像机具备了一定的智能分析功能，比如人脸抓拍机，它已经不是普通的摄像机，它可以知道这个视频里面哪个地方是人脸，可以把人脸图片抠出来，只把人脸图片传输给后端，这样传输到后端的带宽就可以大大降低，只需要很小的带宽就可以把同样数量摄像机的信息传输到后端。

同样，后端服务器不需要用大量视频进行解码。大家都知道，用CPU解码视频需要很高的资源消耗，不需要解码视频了，服务器就可以接入更多的图片。在中心端，只需要一台服务器就可以把同样数量的摄像机的人脸识别完成。这就是一个降成本的作用，通过系统层面来降低成本，也就是协同智能，完成一件智能分析是通过前端和后端协同来完成。

高集中度，大家比较容易理解，因为刚开始做智能相机的时候，当相机的主芯片不具备AI分析能力的时候，我们一般的策略是通过加一个协处理器、加一个AI芯片来完成。原来视频监控的主芯片可以完成处理编码和网络业务，AI功能由协处理器来完成。

发展到现在，海思出了一系列AI芯片，从视频监控的主业务里面整合了AI智能分析的功能，现在一个芯片可以完成所有的人工智能以及传统的视频监控，这样成本就会更低。从设计来讲，系统方案的成本会更低。当然，高集中度不光是能降低成本，还可以提升产品的品质和效果。

这两张对比图片是FACE AE的对比图片。当你的智能分析和前端采集集成到一个芯片里面，可做的东西就多了。比如原来前端摄像机采集的处理算法是不知道什么地方有人脸、不知道什么地方有目标。

但是集成了AI技术以后，同一个芯片就知道这个视频里面你对人还是对车感兴趣，或者是对一个什么物件感兴趣，你就会针对这个目标来指导前端的SP算法，把目标的清晰度提高。

FACE AE是通过人脸检测算法，检测到视频里面哪个地方有人脸，反过来调取前端图像处理模块，把有人脸的地方做特殊处理，比如曝光加强。在人脸抓拍摄像机里面，即便不用人脸抓拍功能，录下来视频中的人脸也比普通摄像机的人脸清楚。这是高集中度带来的产品品质方面的提升。

多模型开发，现在的硬件环境有CPU、GPU、DSP、ARM以及一些专门的智能处理芯片，对我们的算法就提出了更高的要求，因为不能一个算法通吃所有的硬件平台，这些硬件平台上算法的大小是不一样的，有的算力大、有的算力小，有的分析要求复杂度高、有的分析要求复杂度小，要针对不同硬件平台开发不同规模的算法模型来匹配。这就是从算法模型上匹配硬件算力，让产品的性价比达到最高。

刚刚说到算力，这里有一个资源适配的问题。算力是不是越高越好？这要看你到底用这个算力来完成什么业务、应用。

我认为，算力不是越高越好，算力是越适配越好，因为算力也是要钱的，不管通过什么方式实现，肯定通过一定成本购买回来。要完成一件事情，一定要用最适合的算力完成，这叫资源适配。

举个例子，大家最熟悉的是TESLA卡，这是大家做人工智能方面用的比较多的，不管是人脸识别、车辆识别以及其他分析。我们拿P4卡来举例，P4卡的算力是22T，天地伟业也做了一个智能卡，用海思的3559做的，算力并不高，16T。举个例子，如果大家对算力提取人脸特征不熟悉的话，英伟达的TX1可以做4路视频的人脸特征提取，那是1T的算力。现在人脸识别里面最耗费算力的地方就是特征提取，22T用这个算力来计算，可以做88路人脸特征提取，这没有问题。

但是它的解码能力只有12路，现在普通视频流已经达到1080P，卡本身的视频解码能力只有12路，现在很多家出的人脸识别服务器单卡只能分析12路的人脸识别，有的做得好的只到10几路，为什么做不上去？是因为资源适配不好。

如果要分析好，必须用CPU对视频进行解码。要解码64路1080P，5万多块钱的CPU必须配2个以上，这还是算比较好的。天地伟业的P5卡算力只有16T，但是它支持64路1080P的解码。它的算力并不高，但是作为服务器上只插一个卡的硬件，能完成64路的视频流的人脸识别，而P4卡只能完成12路人脸识别。

算力不是越高越好，而是要匹配应用场景。英伟达P4用在其他场景肯定有优势，我只是说在视频监控和人脸识别场景。现在有人说，出了人脸抓拍机了，从前端传到服务器的都是抠出来的人脸图片，P5卡里面解1080P图片是960张/秒。如果解人脸图片会更多。理论上来计算，这张卡如果前端接的是人脸抓拍机，单张卡可以带256路人脸识别。

做过人脸识别研发的同事应该知道，现在人脸识别服务器里面，比较耗费算力的是特征提取，另外一个是特征比对。人脸识别是一个很长时间的比较，很耗费算力。在英特尔高配的双核CPU上做人脸特征比对的话，一台服务器可以比2000-3000万次/秒，这是顶配的CPU服务器。大家想一想，一台服务器如果有256路人脸识别，放在公安网里面做人脸布控，正常是30万张，每秒需要比对多少次？按照每一路摄像机每一秒传一张人脸照片到服务器，服务器用这张照片和30万张做比较，一台256路人脸识别服务器一秒钟需要比对7000万次以上。很多厂商在后端机房里面做比对都是用专门的高配服务器集群做人脸特征比对。

这张卡里面带16核DSP。虽然现在用在其他场景的非常少了，但是用在人脸特征比对，16核的DSP一秒钟人脸比对可以达到1亿次以上。

这两张卡，前一张P4卡如果配普通的CPU，就只能完成12路人脸识别，如果要完成64路人脸识别，要配顶级的服务器，因为需要视频解码，不是顶级的不够，因为要做特征比对，要有服务器集群才能完成64路。

用后面这张P5卡，用一个低配的服务器，CPU一般的就够用，因为其他资源都配齐的，只要插一张卡，最高可以完成256路，这就是资源匹配的重要性。P4卡公开售价是1.4万，如果客户关系比较好的话可以拿到1.2万。P5卡公开售价是6000元。

这是资源适配好了之后带来的价值和成本方面的变化。

很多智能功能开始往前端推送，这应该是发展的一个必然趋势，越往后发展，后端的服务器和后端的云更多处理的是大数据和关联性的数据分析，而所有的智能检测、智能分析相关的功能，或者单点视频里能够完成的功能，都会向前移，因为这会给整体系统成本带来很大的降低。

智能越前移，成本会越低，市场的量也会越大。最终在前端完成所有的智能功能，并且这些功能都固化，我认为这是发展的终极目标。到了这个目标，前端的量才会非常大，后端的应用才能做得非常广，这应该是AI时代安防行业发展的一个必然趋势。

希望我们安防行业里面更多做应用的企业、更多做产品的企业在AI时代把安防行业推向一个新的高潮。谢谢大家！

关于全球AI芯片·城市智能峰会

「全球AI芯片·城市智能峰会」是雷锋网 & AI掘金志安防团队继「中国人工智能安防峰会」、「CCF-GAIR视觉智能论坛」后，全力打造的又一大品牌活动。

在上述三大论坛中，组委会先后邀请到了高文、Demetri Terzopoulos、权龙、华先胜、贾佳亚、孙剑、颜水成、田奇、程浩、张鹏国、浦世亮、殷俊、余虎、李子青、申省梅、王晓刚、杨帆、陈宁、温浩、陈瑞军、张永谦、肖洪波、胡大鹏等在产学两界享有盛誉的权威专家。

论坛内容围绕「摄像机」这一介质入口展开，覆盖AI安防产品、图像与视觉智能算法、视频芯片&服务器、投融资、商业模式等多个维度的主题，旨在打造业内最完整的智能城市论坛体系。

。

原创文章，作者：ItWorker，如若转载，请注明出处：https://blog.ytso.com/72335.html

天地伟业杨清永：安防AI的未来方向将是全目标识别

关于全球AI芯片·城市智能峰会

相关推荐

发表回复