首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

天风研究:SAM实现CV底层技术颠覆式创新,或将赋能多场景应用

Meta发布SAM智能抠图,可以用于识别图像和视频中的物体,甚至是人工智能从未被训练过的物品。利用类NLP技术路线,完成CV底层技术突破,并且具有广泛的通用性。SAM作为开源且更通用AI系统的强大组件,赋能工业、煤矿、电力、自动驾驶、安防监控等多场景。

1、Meta发布SAM智能抠图,CV领域或迎来颠覆式技术创新

Meta研究部门发布了一篇名为其“SegmentAnything”的论文,文中介绍了一个全新的SegmentAnythingModel(SAM),可以用于识别图像和视频中的物体,甚至是人工智能从未被训练过的物品。利用类NLP技术路线,完成CV底层技术突破,并且具有广泛的通用性,足以涵盖各种用例,不需额外训练就可开箱即用地用于新的图像领域,并具备零样本迁移的能力。

2、Meta同时发布了迄今为止最大的分割数据集SA-1B,由1100万张图像及11亿个掩码组成

该数据集由1100万张多样化、高分辨率、保护隐私的图像,以及11亿个高质量分割掩码组成。SAM模型收集新的分割掩码速度较以往任何时候都要快,交互式标注一个掩码只需要大约14秒。与以前的大规模分割数据收集工作相比,SAM模型比COCO完全手动的基于多边形的掩码标注快6.5倍,比以前最大的数据标注工作快2倍。此外,SA-1B比任何现有的分割数据集多出400倍的掩码。并且通过研究证实,这些掩码具有高质量和多样性。

3、SAM作为开源且更通用AI系统的强大组件,赋能工业、煤矿、电力、自动驾驶、安防监控等多场景

与专门为一组固定任务训练的系统相比,基于prompt工程等技术的可组合系统设计将支持更广泛的应用,可以预计,在未来,在任何需要在图像中查找和分割对象的应用中,都有SAM的用武之地。SAM可以成为AR、VR、内容创建、科学领域和更通用AI系统的强大组件。

风险提示:CV技术发展不及预期;应用落地不及预期;国内技术跟进不及预期;行业竞争加剧。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20230414A01F8400?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券