近日,Meta AI发布了基础模型 Segment Anything Model(SAM)并开源,其本质是用GPT的方式(基于Transform 模型架构)让计算机具备理解了图像里面的一个个“对象”的通用能力。SAM模型建立了一个可以接受文本提示、基于海量数据训练而获得泛化能力的图像分割大模型。这些特征在自动驾驶(检测其他汽车、行人和障碍物)、医学成像(提取特定结构或潜在病灶)等应用中特别重要。
根据美国制造工程师协会机器视觉分会和美国机器人工业协会自动化视觉分会对机器视觉的定义,机器视觉是通过光学的装置和非接触的传感器,自动地接收和处理一个真实物体的图像,以获得所需信息或用于控制机器人运动的装置。
机器视觉行业的上游包括相机、镜头、光源等硬件及算法软件;机器视觉行业的中游为视觉系统与智能装备;机器视觉行业的下游为各行业集成应用和服务。一个典型的机器视觉应用系统包括图像捕捉、光源系统、图像数字化模块、数字图像处理模块、智能判断决策模块和机械控制执行模块。
机器视觉产业图谱
从全球机器视觉市场来看,机器视觉市场包括视觉器件、可配置视觉系统和智能视觉装备三个细分市场。根据前瞻产业研究院报告,机器视觉产业链整体可分为底层开发商(核心零部件和软件提供商)、集成和软件服务商(二次开发),其中核心零部件及软件包括光源、镜头、工业相机、图像采集卡、图像处理软件等。在目前的整个机器视觉系统成本构成上,核心零部件及软件开发占据了80%的比例,是产业链中的核心环节。
机器视觉系统成本构成
5亿年前,感光细胞的产生催生了寒武纪的生物大爆发。当下眼睛成为绝大部分生物赖以生存的重要工具,但只有一个眼球是什么也看不到的,因为视觉传感器和其它传感器不一样。视觉的产生是需要大脑完成处理的,可以说眼睛不仅仅是个器官,它其实是大脑的一部分。而今天视觉大模型SAM的发布正如五亿年前的感光细胞,它正带领我们感受即将来临的机器智能的时代光芒!
领取专属 10元无门槛券
私享最新 技术干货