视觉使人类得以看见和感知这个世界,计算机视觉即通过电子化的方式来感知和理解影像,利用人工智能方面的科技成果,可以让机器在感知方面越来越接近于人类的主动感知,甚至超过人类。
得益于近年来深度学习算法的蓬勃发展,侧重于感知智能的图像分类技术逐渐实现商业价值。由人工智能驱动的智能摄像机广泛应用,每天产生的庞大数据量,给承担数据存储和计算的后端服务器带来很大压力。因此,越来越多的研究重心放在智能化前移上,彻底颠覆了以往视频监控硬件的传统定义。
所谓前端智能,是指将图像分析、视频结构化、人脸识别等AI功能集成到前端的智能摄像头,在数据源直接对视频信息进行处理,再将分析结果传送至中后端服务器。其最大优势在于帮助客户直接从视频图像中提取关键信息,实时高效进行智能分析,快速为行动决策提供可靠依据。前端智能的优势主要在于减轻后端计算压力,并节省传输带宽资源。
在搭建前端智能的过程中,各类厂家就硬件还是软件更能定义智能摄像机这一话题存在着不同看法。近日,千视通受雷锋网邀请与其他7家行业头部友商进行了观点碰撞。
雷锋网总结道:传统安防厂商对于软件定义摄像机这一概念不太苟同;而安防新兴玩家则对该说法持以肯定态度。自Bjarne Stroustrup发明C++之后,人类文明便运行在软件之上。在这场几十年未见的技术革命性转变过程中,由“软件”基础设施的崛起而驱动的力量,正以高速自动化的方式分配与重新配置,不会受到非动态设置的硬件基础设施的限制。
“软件定义”的商业反响也远远高于技术本身,它正快速动摇科技企业之间的产品形态和品宣口径,一些厂商们都在争先恐后地重新定位自己,借此开拓软件信息技术的新时代。在这场技术变革中,一直有人提到安防的独特性,与C端产品不同,这个行业注重应用,软件有它的实际价值,但未来行业顶尖玩家究竟如何发展还未可得知。
千视通CTO胡大鹏博士认为:以往要提升一个摄像头的功能,只能在分辨率、帧率等方面改善,包括传感器性能、解析度大小、焦距远近、补光强弱等等,但硬件本身局限了摄像头的功能。而AI芯片的出现,通过为普通摄像头嵌入人工智能算法,实现了软件和硬件一体化,使摄像头的“智能化”真正变为可能。
在硬件基础上,我们可以直接在摄像头内、在成像之前或之后完成一些运算,这样摄像头就再不只是用于拍摄采集,而是可以根据需求来制定成像程序,可以让摄像头在前端进行夜间拍摄以及结构化分析,承担除了采集图像之外更多的功能,大大缓解传输和后端分析的压力。
未来摄像头在基本组成部件不变的情况下,可以说传感器以外的功能都是由软件而决定,并由AI芯片作为载体,以嵌入式算法去定义。千视通基于核心算法技术,招揽了智能硬件和IC设计团队,开展AI前端化算法移植和芯片AI算法集成化技术研究。为广大终端设备厂家和芯片厂家提供前端AI化集成服务和芯片AI赋能服务:视频结构化IP Core、人脸识别、车辆识别IP Core、机器视觉定制化FPGA平台等。
千视通在多年场景应用的观察中发现,实际上在规模数亿的视频监控市场,视频数据的来源仅有约2%来自人脸摄像头,约8%来自车辆卡口摄像头,而近90%来自于普通摄像头,普通摄像头由于其抓拍角度和成像质量等因素,大多无法捕捉可用于识别比对的人脸数据。千视通的核心技术主要围绕市面上90%的普通摄像头的高效利用和动态人脸布控这一市场,着重关注实战效果。
在进行前端智能布控时,除了考虑人脸属性、识别精度、拍摄角度等基本参数外,千视通主要考虑更多的是用AI算法解决极端场景中难以识别的实际问题。
如超远距离抓拍时,针对放大后人脸不清晰的问题研发的超分辨率技术,通过超分神经网络生成清晰人脸,并且可用于库中比对;而大多数情况下,由于目标故意躲避摄像头,或者移动范围偏离导致普通摄像头无法抓拍到完整脸部,千视通的侧脸还原技术可以很好的以局部还原整体,解决大多数侧脸抓拍识别的难题。
另外,在进行夜间拍摄时,普通摄像头的硬件局限性导致目标与黑夜融为一体,无法分辨。而传统星光级摄像头解决方案改造成本过高,且噪点过多,也难以达到库中识别标准。千视通的超夜视算法,即便是用普通摄像头的视频数据,通过卷积网络处理夜间图片,能有效还原白天场景,并精准提取可识别信息,具有更强实战价值。
在前端智能和后端智能巧妙结合的应用场景中,我们不得不提到一个很重要的概念,就是结构化数据。结构化数据是指前端采集到了实时信息后,会对信息进行前端分析和处理,得到我们想要的信息,是一个信息过滤的过程。同时,为了提高前端智能的准确度和识别率,仅靠前端处理是不够的,还需要将图片传到后台,不断地对图片进行学习训练,进而得到更精准的模型。因此,前端智能和后端智能它们是互相协同渗透,解决不同层面的问题。