Meta使研究人员能够更多地访问Facebook和Instagram数据

Meta使研究人员能够更多地访问Facebook和Instagram数据
2023年11月23日 13:57 DeepTech深科技

来源:DeepTech深科技

Meta 近日发布公告,它将发布一款名为 Meta Content Library and API (Meta 内容库和 API,以下简称内容库)的新透明度产品。这款新工具将允许特定研究人员访问 Facebook 和 Instagram 平台上的公开数据,以便更全面地了解这些平台上的情况。

(来源:STEPHANIE ARNETT/MITTR | ENVATO)(来源:STEPHANIE ARNETT/MITTR | ENVATO)

此举出台之际,包括 Meta 在内的多家社交媒体公司正面临公众和监管压力,要求提高其产品(特别是推荐算法)的工作方式及其影响的透明度。

学术研究人员长期以来一直呼吁,希望更好地访问 Meta 等社交媒体平台的数据。对于 Meta 平台正在发生的事情的可见性,以及 Meta 的产品对网络对话、政治和整个社会的影响而言,这个新内容库是朝着积极的方向迈出的重要一步。

Meta 全球事务总裁尼克·克莱格(Nick Clegg)在接受采访时表示,这些工具“确实非常重要”,因为它们在很多方面提供了“对 Facebook 和 Instagram 上公开内容的最全面访问(渠道),这是我们至今所建的所有东西都无法比拟的”。

正如 Meta 在一篇博客文章中指出的那样,该内容库还将帮助该公司满足数据共享和透明度方面的新监管要求和义务。

该内容库和相关 API 于几个月前首次发布了测试版,允许研究人员访问 Facebook 上的页面、帖子、群组和事件,Instagram 上的创建者和企业帐户以及相关的近实时数据。反应数(互动数)、分享数、评论数和帖子浏览数。

虽然所有这些数据都是公开的,比如任何人都可以在 Facebook 上看到公开的帖子、反应和评论,但内容库使研究人员可以更轻松地大规模搜索和分析这些内容。

Meta 表示,为了保护用户隐私,这些数据只能通过虚拟“无尘室(clean room)”访问,并且不可下载。访问权限目前仅限于获得批准的研究人员,他们需要通过独立的第三方组织进行申请。

除了新的库和 API 之外,Meta 还宣布了新的合作伙伴关系,扩大社交网络与经济流动性之间联系的研究。

就在几天前,有媒体报道称,该公司正在解散其负责任人工智能(Responsible AI)团队,并将研究人员分散到该组织的其他部门。此举引发了对其用户安全承诺的怀疑。克莱格对人工智能团队的重组没有发表评论。

希望进行“有意义的”研究

研究人员过去与社交媒体公司的关系令人担忧,特别是在访问平台可能不希望公开的数据时。例如,2021 年,Facebook 向纽约大学透明度项目的研究人员发出了一封中止函,他们当时正在通过网络爬虫在该平台上调查定向投放政治广告的情况。该公司称该项目侵犯了用户隐私。

克莱格表示,他希望该产品能够实现“有意义”的研究,他强调研究人员目前对社交媒体的确切影响缺乏共识。由于缺乏来自社交媒体公司的公开数据,研究无疑变得更加困难。

新的内容库主要是一个数据库,可以通过类似于搜索引擎的界面或通过 API 进行访问,研究人员可以在 API 中编写自己的查询以得到大量数据。例如,研究人员可以要求查看 2023 年 2 月 14 日有关生成式人工智能的所有英文公开帖子,按查看次数最多到最少排序。

监管机构,尤其是欧盟监管机构,最近的举措可能促使 Meta 要求提高透明度。欧盟数字服务法案 (DSA) 于今年 8 月生效,要求 Meta 这种规模的大型平台为调查“欧盟系统性风险的检测、识别和理解”的研究人员提供实时数据访问权限。

澳大利亚、巴西、美国和其他地方的其他监管部门也试图模仿这些要求。在所谓的“布鲁塞尔效应”中,科技公司通常会选择在其运营的每个国家都遵守最严格的标准(通常由欧盟制定),以避免产品碎片化。

政策层面的努力一直在试图平衡提高透明度的要求和对隐私保护的担忧。克莱格表示,Meta 试图通过申请流程来达到这种平衡。

希望访问内容库和 API 的研究人员必须向密歇根大学的独立组织“政治和社会研究大学间联盟(Inter-university Consortium for Political and Social Research)”提交有关其机构和研究问题的信息。

梅塔表示,筛查的主要目的是对使用数据的群体及其经济利益进行安全检查,而不是审查研究问题。

然而,申请过程已经引起了一些人的关注。康奈尔理工大学研究社交媒体影响的博士后研究员史密莎·米利(Smitha Milli)说:“我的主要问题是,为什么不是每个人都可以使用它?” 特别是因为该内容库只包含公开可用的数据。

米利补充说,重要的是要考虑申请过程将增加研究周期的时间,并表示这可能是“最大的限制(因素)”。

Meta 表示,它对内容库的访问设限,是为了保护用户隐私。“平台上公开可获取的数据与以编程的方式访问大量数据之间存在很大差异。” Meta 产品经理基兰·贾加迪什(Kiran Jagadeesh)说道。

米利指出,研究人员非常希望获得有关推荐算法如何工作、人们在个人信息流中看到的内容以及在平台上运行实验的方法的信息。

目前尚不清楚最新产品将如何在这些方面取得进展,但克莱格表示,研究人员可以将内容库与其他项目(例如推荐系统卡)结合起来,这将提供“比以往任何时候都更加丰富的画面”。

南丹麦大学数字民主中心教授莉娜·弗里施利希(Lena Frischlich)测试了内容库的测试版,并表示她的团队发现访问 Instagram 上的视频和 Facebook 上的活动等多媒体内容特别有用,而且它提供了有关观看次数的新数据。

弗里施利希还表示,虽然新产品是“迈向提高透明度的重要一步”,但这只是一步。 “数据访问仍然受到某种限制”,因为并非每个国家都包含在数据库中,并且只有合格的学术或非营利研究机构的研究人员才会被授予访问权限。

克莱格表示,出于多种原因,他希望新工具最终能够更好地研究社交媒体在社会中的作用。“我认为这里有一种社会责任感。”他说,“但也关乎一种自身利益,那就是试图消除一些围绕社交媒体的夸张说法,让辩论更加扎根于事实。”

支持:Ren

运营/排版:何晨龙

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片