智能监控技术已经在不少独立的领域有所发展,但目前还未出现比较完美的综合性的解决方案,笔者根据多年的工作实践,结合现在的计算机技术发展,提出以下五个技术方面的设想。
智能码流技术
智能码流,是系统根据图像识别后,根据画面运动主体的运动速度,将正常录制的视频进行码流调整,进行最后的视频存储。对于运动慢的运动主体,码流记录甚至可以低至8帧/秒(fps)以下,对于正常速度运动的主体,码流设定正常的25fps,对于敏感图像的运动物体的视频码流可设定在 30fps以上。对于高速的运动主体,在高速摄像机的配合下,码流可高达1000fps以上。智能码流技术,可以减少非敏感图像占用视频存储资源,从而对敏感图像提供了充裕的记载能力。
动态区域自适应的智能监控技术
以某车库视频监控画面为例,画面上的敏感信息为运动的车辆和人。不敏感画面是背景(地面和屋顶)。但在实际的视频记录中,背景(地面和屋顶)占据了50%以上的存储空间。通过图像识别技术,可以判定固定背景与运动物体图像,因而,具备了只在记载画面的中有运动的技术可能。动态区域智能监控,就是只记载除背景以外的运动物体,从而大大减少了视频存储空间的需求,相同的存储空间,可保留的视频时间长度可以成倍提高。摄像系统,通过图像识别技术,可以智能学习,判断哪些图像是背景,即便是由云台控制的摄像头,通过设定的时间内的自动学习,也可以自动判定录制视频中的新背景,从而实现对运动物体图像的智能监控。
非敏感区域的低码流记载技术
视频上方的25%到30%的区域,通常是天空或建筑的顶部图像,基本属于敏感要素不太可能出现的区域。如某些典型监控图像中的红色马赛克部分的图像,基本不会含有人们关心的视频内容,因此可以把视频图像的非敏感区域的忽略或者用低码流另外记录,只需在回放的时候与高码流的视频做一个同步。值得说明的是,非敏感区域在不同应用场景,各有不同,有的也许在视频图像的下方,有的监控场景,非敏感区域是不规则的,可以在视频监控系统安置好后,根据实际情况再进行应用层面的人工设定。
人脸/车辆识别(或其他敏感移动物体)驱动高清摄录技术
在特殊的场景下,比如大楼的进口处、电梯等地方,人脸是敏感图像。在车库内、小区的进出口处,车辆及其号牌是敏感图像。若全部用高清的视频固然可以满足监控需求,但视频存储,特别是长时间的保存就会需要海量的存储空间;若根据图像识别技术,判断出现设定的敏感图像的时候,才驱动摄像头启动高清记录,对于一般的非敏感图像,则启动标清甚至低码率的视频流来记录。这样高清与标清相结合的监控记录,即保证了记录敏感图像的质量,同时又较大程度上减少了视频存储量。
序列帧视频文件分布存储技术
把视频在一秒内产生的帧为标识成序列帧,同时编制存储与播放序列,把不同序列的帧划分为数个文件存储;单个帧序列文件可以单独播放,效果等同于低码流记录的视频效果。
所有帧序列可以合成完全视频一起播放时,则是高清(或标清)的视频效果。当需要回收存储空间的时候,可按存储策略规划,先将一部分序列帧视频文件所占的区域覆盖。另一部份则保存下来,从而更有效的利用存储空间。例如按原存储能力可以保留1个月的视频数据,经过视频帧文件的分布存储后,可以保留数个月的有选择的序列帧视频的文件数据。对已保留了中长期的序列帧视频文件进行部分覆盖,实现淡入淡出式的视频逐渐丢弃,长期保留的视频数据不是一下完全消失,而是慢慢的消失、丢弃。从而最大限度地延长监控视频保留的时间。
基于以上五种技术的智能视频监控的视频流
如图1所示,智能监控的视频流,是经过一系列的不同逻辑层面的图像识别,进行的智能判断后进行录制、存储的。其中动态区域自适应的智能监控技术、非敏感的低码流记载技术的运用可以根据实际需要,贯穿在整个存储过程;或者根据应用层面的人工设定,有选择地实施。图像识别从初步识别,到精细识别,按需要分层次进行。对视频图像识别的采样频率,可以根据需要,设定具体频率,不需要对每一帧的图像都识别。