品玩7月12日讯,据 Arxiv 页面显示,来自香港科技大学、微软研究院、IDEA等多个机构的学者近日联合发布论文,公布了一款图像分割模型 Semantic-SAM。
论文显示,该模型具有两个关键优势:语义感知和粒度丰富性。为了实现语义感知,研究者们整合了三个粒度上的多个数据集,并引入了对象和部分的解耦分类。这使得Semantic-SAM 能够捕捉丰富的语义信息。对于多粒度能力,研究者在训练过程中提出了一种多选择学习方案,使每次点击可以生成与多个标准掩膜相对应的多个级别的掩膜。
实验结果和可视化展示表明,Semantic-SAM 成功实现了语义感知和粒度丰富性。
新浪科技公众号
“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)