返回 登录
5

旷视科技:视频结构化推进智能安防走进2.0时代

阅读4960

随着我国智慧城市、平安城市、雪亮工程战略的深入发展,目前,各部门行业安装的摄像机数量已近2500万台,初步构建起覆盖公共区域、要害部位的“天网”。全国公安机关也已基本搭建起视频图像信息资源整合汇聚和共享交换的基础支撑平台,联网可控的摄像机数量较2015年增长近60%。同时,2015年5月6日,九部委下发《关于加强公共安全视频监控建设联网应用工作的若干意见》(以下简称“意见”)。《意见》指出,到2020年,要基本实现“全域覆盖、全网共享、全时可用、全程可控”的公共安全视频监控建设联网应用。随着公共安全视频共享平台的逐渐完善,让公共安全具备了“法网恢恢,疏而不漏”的上帝视角。

“天网”让泛安防更加强力的同时,由大规模视频产生的海量数据也让监控中心的工作变得更加繁重,反而成为负担。据统计,在首都北京,出去民用安防,仅政府部门和社会公共机构部署的摄像头总数就已超过两百万个,而这些昼夜不停记录的摄像头每天产生的视频数据总和便长达两百万天,要逐个看完都够再创一个华夏五千年了!可想而知,仅依靠人工对视频进行人、地、事、物、组织的甄别,难于大海捞针;况且道路监控视频更受自身硬件设施及光照条件的限制,会产生许多不清晰的低质良录像,而这些低质量视频靠人眼是基本无法分辨画面内容的,在这些低质量的视频数据中进行比对工作不仅艰难且可信度低。

安防行业是大数据应用典型行业,而人、地、事、物、组织,是公安视频处理中的核心对象,要实现对安防视频大数据的分析和信息挖掘,首先要解决视频数据结构化问题。

何为视频数据结构化?

视频结构化是一种将视频内容中的重要信息进行结构化提取的技术,利用它对视频内容按照语义关系,采用时空分割、特征提取、对象识别、深度学习等处理手段,组织成可供计算机和人理解的文本信息或可视化图形信息。在实际应用中,文本信息可进一步转化为公安实战所用的情报,实现视频数据向有效情报的一次转化。

图片描述

智能分析能够对视频中的人员、物品数据进行深度挖掘和信息提取

安防行业为什么需要视频结构化?

信息技术革命带来的一个天然属性就是实现了数据的量产。如果把视频数据的堆砌比作盖楼,那么视频结构化就显得尤为必要。没有结构化的视频数据就如同建筑废料,除了造成环境污染不能产生任何价值。而如果通过一些手段或工具来将一砖一瓦的视频进行智能化整合与合理分类,这些数据才有可能平底起高楼,成为社会看不见的基础设施。

因此,数据化便是信息社会建筑原材料的积累的过程,数据本身并不能直接产生实用价值,对数据的内容提取和分析才是价值所在。在安防领域,如果能够对视频大数据进行规模结构化将推动安防整体行业水平升级,而人工智能技术和视频数据结构化的结合将带领整个行业进入智能安防2.0时代。

视频数据结构化从多个维度优化现有的安防业务,将原本许多数量庞大、响应龟速、且大多没有应用价值的监控视频进行精缩,变为更易查找、占存更小且可被深度挖掘的高密度数据。

结构化的视频数据可极大提升搜索和排查效率。实验结果显示,视频结构化之后,从百万级的目标库中(对应数百到一千小时的高清视频)查找某张截图上的行人嫌疑目标,数秒即可完成;千万级目标的库中查找,几分钟即可完成(如果实现云化,速度会更快)。因此在公安实战业务中,基于结构化的视频大数据检索,可以有效解决大海捞针的难题。

此外,结构化视频数据的存储占比可以极大的降低。经过结构化后的视频,存储人的结构化检索信息和目标数据不到视频数据量的2%; 对于车辆,不到1%;对于行为降得更多。存储容量极大地降低,可以解决视频长期占用存储空间的问题。

最后,视频结构化还可以盘活视频数据,成为公安系统数据挖掘基础。视频经过智能化的处理、分类后,存入相应的结构化数据仓库,如人脸照片数据库、人脸特征数据库、行为图片及特征库、车辆图像及特征库等等,而综合这些数据仓库以及关联视频片段仓库可以建立相应的检索引擎,实现对各类的数据仓库的深度信息挖掘,充分发挥大数据作用,提升视频数据的应用价值,提高视频数据的分析和预测功能。

图片描述

通过结构化实现视频关联数据库

当视频结构化技术与安防行业结合,凭借视频内容信息处理和网络化共享应用两大特点,视频结构化技术可全面实现监控视频信息的情报化、视频监控网络的智慧化,强化警务视频应用的普适性。即实现以机器自动处理为主的视频信息处理和分析,并且通过技术手段转化为安防工作可用的情报; 实现监控网络之间、端与端之间,甚至警种之间的信息共享和主动互操作,实现主动监控、自动联网分析等网络功能;全方位拓展视频在警务工作中的应用模式,大幅度提高技术的易用性,实现以业务民警为中心的随时随地的灵活、简单、多样的视频按需服务应用。

视频数据智能结构化被广泛应用

在视频结构化描述的内容方面,公共安全关注的视频信息主要是:人员、车辆、行为。在视频中把人作为一个可描述的个体展现出来,其中包括人员的面部精确定位、面部特征提取、面部特征比对,人员的性别、年龄范围、大致身高、发饰、衣着、物品携带、步履形态等多种可结构化描述信息;对于车辆的描述信息包括:车牌、车颜色、车型、品牌、子品牌、车贴、车饰物信息等多种车辆描述信息;对于行为的描述信息包括:越界、区域、徘徊、遗留、聚集等多种行为描述信息。

虽然庞芜的监控视频数据让安防的工作量陡增,但却为人工智能提供了天然优越的发展环境。以人脸识别为代表的人工智能技术开始与视频监控相结合,辅助多地公安系统打造“智慧警务”新体系,实现了传统安防向智能安防的转型。

目前视频监控行业都在大力发展视频智能结构化技术,作为中国人工智能计算机视觉领域的排头兵,旷视(Face++)在安防业务应用中通过布局智能硬件设施和后端算法服务器为多地公安机关推进视频结构化打下了基础。

在前端智能感知应用中,旷视打造的智能人像抓拍机可以在前端实现对图像中人像的质量判断,并输出最佳姿态的人脸图片形成“半结构化”的视频数据,为进一步视侦比对提供依据。而针对公安的实战需求,旷视(Face++)面向公安刑侦、视侦用户推出了系列智能视频侦察产品(即后端分析服务器),采用基于大数据的深度学习算法,内置旷视 VCSE 视频内容搜索引擎,支持面向自然语义的视频内容高速检索功能和以图搜图检索功能,实现了监控视频的数据结构化输出,帮助安防行业开辟“智能为主、人工为辅”的新工作模式,大大提升了视频检索的算法精度、处理速度和鲁棒性。

图片描述

旷视(Face++)视侦产品特点

在旷视(Face++)为公安部门研发的智能人像卡口大数据系统整体解决方案中,监控摄像机拍到的视频在经过旷视的结构化云服务系统后,能够检测、判断监控视频中人员的性别、年龄、民族、衣着、背包、雨伞或行李,甚至对行走方向和行走速度等条件进行结构化语义检索;还可通过多组摄像机的抓拍记录及人员比对,对目标嫌疑人进行行为轨迹、出行规律分析,为公安人员提供案情线索,实现灵活布控打击。

图片描述

旷视推出的视频结构化系统能够实现行人检测、特征查找等功能

旷视(Face++)对公共安防领域坚持不懈的技术追求,也在全国范围内落地开花,帮助公安部门屡屡破案。截至2016年底,旷视(Face++)已经为包括合肥、无锡在内的25个省市的公安部门提供了具备视频结构化新技术的智能视频侦查系统,协助警方抓获在逃人员和犯罪嫌疑人达500余名。过去不到1年的时间里,无锡警方利用旷视为其打造的智能视频侦查系统实现了3秒钟锁定嫌疑人、25分钟破案的超高效办案奇迹;今年年初,湖北襄阳也在旷视移动版智能视频侦查系统的帮助下接连破获多起抢劫案、抢夺案,并帮助聋哑、走失老人回家。

未来,视频结构化技术还需要构建其自身的标准化发展体系,更需要符合安防行业发展规律的关键技术不断突破和创新,视频结构化和计算机视觉技术的结合,将智能安防推向了离智慧安防更近的新台阶。

评论