智通财经APP获悉,中金公司发布研报称,SAM大模型开源,模型优势明显。今年,Meta AI发布基础模型Segment Anything
Model(SAM)及其训练数据集SA-1B,并在GitHub上开源,推动了机器视觉通用基础大模型的研究与应用。SAM大模型用GPT的方式让计算机具备理解图像中个体对象,对图像进行观察、思考和逻辑推理的能力,主要用于对图像或视频中物体的识别和分割,具备处理大规模数据、准确率和性能高等优点。
中金公司主要观点如下:
智能制造转型时代,下游应用升级推动软件算法迭代。随着我国制造业向精细化、数字化、智能化方向升级,机器视觉渗透率逐步提升,视觉系统在精密组装和精密检测中已经得到有效验证。但随着下游消费电子、半导体、汽车等行业对机器视觉的技术和检测精度提出更高要求,传统软件算法存在数据样本不足、实时性较低以及算法泛化不足等问题,导致应用场景进一步拓展受限,人工智能对机器视觉加持的影响作用逐渐加深。
AI大模型快速发展,打开机器视觉增量空间。3D视觉技术和深度学习算法快速发展,利用大量工业数据、AI算法优化图像检测模型,提高机器视觉向许多无规则、易混淆、复杂度高等非标准化场景的扩展能力。此次SAM开源,实现零样本和少样本学习能力,突破了机器视觉的底层技术,扩展包括物体表面区域分割、外观缺陷检测等应用空间。随着大模型进一步向多模态发展,该行认为图像处理门槛将进一步降低,提升机器视觉产品性能优势,助力其渗透到更多应用场景之中,为机器视觉在工业智能化应用带来新机遇。
AI+机器视觉,智能制造有望多场景落地。1)自动驾驶领域,人工智能支持驾驶自动化进入下半场,推动自动驾驶规模与视觉方案的发展;2)人形机器人领域,AI底层算法运用海量数据信息训练神经网络,优化复杂数据信息的接收与分析,提升信息识别和定位精准度;3)工业自动化领域,顺应工业4.0的进程,在工业中提升生产效率,减少人工成本,一方面代替劳动力完成包括焊接、打包、组装等繁复工作,另一方面扩大精度较高应用领域的渗透程度,带动Al工业视觉的市场规模。
风险:AI算力需求不及预期,下游应用落地不及预期,行业竞争加剧。