还原真实视界|探析图像技术演进之路
发布时间:2024-01-05 点击:1074 次
科技时代令人着迷。眼界千变万化,眼界之大。回到安防之初,对图像无止境的追求和打磨,形成了以智能视频为核心的安防应用生态。
偏离的世界和地平线
百种安全,各种精彩!2023年底,影像中,回望初心,审视当下,展望未来。
人眼看到的世界和机器读取的地平线有相同点也有不同点。
世界是地平线,人看到地平线,或许都一样。
人眼具有很强的观察能力,能够在复杂多变的环境中识别目标。同时,大脑被赋予了最高智能分析能力,可以利用逻辑分析和推理能力来识别不断变化的目标。
正因如此,长期以来,在监控室盯着屏幕已经成为监控人员的日常生活,这也是视频监控时代最传统、最常见的工作方式。然而,人眼看到的视界是真正的视界吗?
人见天边,也许真的不一样。
人不是机器,天生短板,主观,容易被误导和误判。
相比文字和声音,视频承载了更多的信息,从大量丰富的信息中读出有用的数据是非常复杂的。这种被动的应对方式无法主动预防,而且受到人的数量和能力的限制,比如长时间的疲劳、错读漏读、阅读不及时等。另外,显示终端也受到各种原因的影响,你看到的地平线不一定是真实的。
因此,有偏的世界和视界需要图像处理、优化、调整,甚至多维时空整合,使图像尽可能具有全球性。
机器视觉的“技术雏形”
回顾过去,对于图像,业界最初的做法是不断添加图像,一堆后期处理技术在科研上取得突破,最明显的体现在视频图像处理技术上。简而言之,就是用计算机处理视频数字图像,本质上是一个信号处理过程,是离散信号处理。
这其实就是机器视觉最初的技术形态。虽然作用有限,但基础还在。看图像处理技术的应用价值,有几个方面:
第一,提高图像的视觉质量,如图像的亮度和颜色变换,某些成分的增强和抑制,图像的几何变换等。,以提高视频图像的质量。
其次,提取视频图像中包含的一些特征或特殊信息,往往为图像的计算机分析提供方便。
第三,视频图像增强和恢复。图像增强的目的是将图像转换成更适合人和机器分析的形式。
第四,图像分析。从图像中提取一些有用的度量、数据和信息,得到一些数值结果。
第五,可以让图像重现。当图像被数字化后,它准确地代表了手稿,因此数字图像处理过程可以始终保持图像的再现。
第六,灵活的加工功能。将监控画面分成任意大小的二维数组,这意味着图像的数字精度可以满足任何应用的要求。
第七,适用范围广。任何行业的信息源的图像,只要转换成数字编码形式,都是由二维数组表示的灰度图像组成的。
第八,灵活性高。即所有可以用数学公式或逻辑关系表示的运算都可以通过数字图像处理来实现。
根据这八个特征,图像处理的研究内容分为三个部分:图像压缩;增强和恢复;匹配、描述和识别。
机器读取地平线的行业逻辑。
时代在变,技术在进化,与之相反,会逐渐衰落,这也适用于图像处理技术。比如楼宇对AIOT讲智能家居、防盗器,图像处理对机器视觉只是时代的产物,背景颜色并没有改变。
以前图像处理在后面,机器视觉更“靠前”。
目前智能相机本身就是前端产品,芯片、镜头、焦距、补光灯、外壳等一系列硬件项目是基础。智能算法可以关联场景后,可以根据算法要求定义一个范围,尽可能改变场景,但可以减少硬件,通过软件调整。
全天候多维全局感知是智能相机对图像追求的另一个技术维度。随着视频、音频、气味、生物特征等技术的发展和成熟,完全控制防控场景和目标的完整信息成为可能。越来越多类型的传感设备部署在安防应用中,从更多维度采集目标信息,包括目标的各种要素、活动轨迹和相关信息,从而形成动态传感系统,实现防控工作的全能化。这一点用近年来的一系列场景清晰度产品来说明,如声光划界相机、光谱水质相机、射线视觉相机、气象观测相机、环保相机等。,多面多角度的图像处理适应多场景的深度。
当然,单个相机无法肩负起这个时代和这个愿景,形成成熟的高价值解决方案的闭环,也是必然的。
在追求极致更好形象的过程中,形象的广度在缩小,更多的是追求深度。通用型、一招式、全能相机已经不存在了,还是用户需求驱动。
记者在2023年深圳安博会参观过程中了解到,不少底层用户或中级小众集成商大多表示,现有的智能视频解决方案过于笼统,不适合具体的行业场景。为此,本届博览会最大的一个不同就是硬件展示减少,方案展示居多。
机器视觉解决方案需要融合行业本身长期运营沉淀下来的业务逻辑和行业经验。除了成熟的技术能力,该解决方案对于行业内特定场景的全方位适配至关重要。同样,机器视觉解决方案的应用门槛高,难以适配企业IT架构/基础设施。对于很多企业来说,算法训练相对容易实现,但如何将其与实时推理相结合,部署在实际应用场景中,是一个难题。为此,大模型的出现,或者类似的算法商城、算法工厂、AI自动化工具等。,开辟了另一个战场,又一个对图像无止境的行业逻辑追求。
图像的未来愿望
对于形象创新来说,行业是心脏。如果你沉湎于过去,你就无法打破现状。对于形象的未来,你要冷静,看未来的愿望和应用。
第一,在大视觉时代,未来的数据图像技术强调发展高清晰度、高速传输、实时图像处理、三维成像或多维成像、智能化和自动化。
其次,在智能方面,力求让计算机的识别和理解按照人的理解和思维方式工作,兼顾主观概率和非逻辑思维。这里要指出的一点是,AI在智能上可以提取和分析图像数据和内容,但在视频图像处理上不能做文章。
第三,未来的图像技术强调操作和应用的便捷性,图像处理功能的集中化趋势必然存在。所以近几年硬件芯片厂商不断将很多AI功能固化在芯片上,形成了SOC级别的独立小系统。
偏视,以智道为径,尽可能形成你为我眼,你看我看;不仅是看到的东西,还有其他的东西,用图像作为点来画地平线。