品玩7月12日讯,据 Arxiv 页面显示,来自香港科技大学、微软研究院、IDEA等多个机构的学者近日联合发布论文,公布了一款图像分割模型 Semantic-SAM。
论文显示,该模型具有两个关键优势:语义感知和粒度丰富性。为了实现语义感知,研究者们整合了三个粒度上的多个数据集,并引入了对象和部分的解耦分类。这使得Semantic-SAM 能够捕捉丰富的语义信息。对于多粒度能力,研究者在训练过程中提出了一种多选择学习方案,使每次点击可以生成与多个标准掩膜相对应的多个级别的掩膜。
实验结果和可视化展示表明,Semantic-SAM 成功实现了语义感知和粒度丰富性。
![](http://n.sinaimg.cn/spider20230712/368/w750h418/20230712/355d-b82d6574c5b5383aa144d17bfd8efa15.jpg)
![新浪科技公众号 新浪科技公众号](http://n.sinaimg.cn/tech/content/tech_qr2x.png)
新浪科技公众号
“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)
![](http://n.sinaimg.cn/tech/content/tech_weixin2.png)