大型数据集可纠正AI在视觉任务中的偏见

大型数据集可纠正AI在视觉任务中的偏见
2025年11月09日 11:50 滚动播报

据最新一期《自然》发表的研究,科学家建立了超过一万张人类图像的数据库,以评估并纠正人工智能(AI)模型在视觉领域存在的偏见。这一“公平的以人类为中心的图像基准”(FHIBE)由索尼AI开发,采用符合伦理手段获取、基于用户同意的数据集,可精确评估以人为中心的计算机视觉任务,从而识别、纠正偏见和刻板印象。团队认为,这是迈向更可信AI的重要一步。

计算机视觉广泛应用于自动驾驶车辆、面部识别等技术领域。许多计算机视觉使用的AI模型,其训练数据存在缺陷,可能未经同意收集,经常来自网络大规模图像抓取。人们也发现,AI模型可能会反映出延续性别歧视、种族歧视或其他刻板印象的偏见。

此次,研究团队构建了一个图像数据集,在同意机制、多样性和隐私等多方面采取了最佳实践。FHIBE包含81个国家和地区中1981名个体的10318张图像。该数据库包括了人口统计和生理特征的全面标注,包括年龄、代词类别、祖先血统、发色与肤色等。参与者获得了关于项目和潜在风险的详细信息,帮助他们做出知情同意,过程符合全面数据保护法规。这些特征使该数据库成为评估AI偏见的可靠资源。

团队将FHIBE和27个现有以人类为中心的计算机视觉应用数据集做了比较,发现FHIBE数据集在多样性与AI评估的可靠同意方面标准更高。它还有效减少了偏见,包含的参与者自我申报标注信息超过其他数据集,还包括了相当比例通常代表性不足的人群。该数据集可用于评估现有的AI模型在计算机视觉任务中的表现,能揭示更多此前无法了解的偏见。

不过,团队也承认,目前创建数据集的过程充满挑战且成本十分高昂。

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片