您现在的位置: 首页 > 动态资讯 > 行业观察
AI视觉迎来“GPT-3时刻”,通用视觉大模型之战打响
发布时间:2023-04-17 信息来源:财联社 字体:

近日,Meta发布了一个人工智能模型,可以从图像中挑选出单个对象,以及一个图像注释数据集。该模型名为Segment Anything Model(SAM),Meta官方表示这是有史以来最大的分割数据集。SAM是计算机视觉领域发布第一个用于图像分割的、可通过提示(prompt)方式应用的通用大模型,类似自然语言领域(NLP)中的大模型ChatGPT。英伟达人工智能科学家Jim Fan将Meta的这项研究称作计算机视觉领域的“GPT-3时刻”之一——其分割方法可以通用,可对不熟悉的物体和图像进行零样本泛化,初步验证了多模态技术路径及其泛化能力。几乎同一时间,国内智源研究院视觉团队也推出通用分割模型SegGPT,通用视觉大模型之战打响。视觉大模型能把任意图像从像素阵列解析为视觉结构单元,像人类视觉那样理解各类场景,这对自动驾驶、安防、智能家居、工业视觉等众多行业都将带来飞跃式提升。(财联社)

往期推荐

微信

小程序
Produced By CMS 网站群内容管理系统 publishdate:2025-02-25 10:36:07