Claude 4要来了?Anthropic发布38页经济指数报告,43%人类工作正被AI取代!

Claude 4要来了?Anthropic发布38页经济指数报告,43%人类工作正被AI取代!
2025年02月11日 12:37 网易新闻

新智元报道

编辑:编辑部 JYZ

【新智元导读】据悉,Anthropic本周会提前放出Claude 4?并且,一份38页Anthropic经济指数报告放出,结论是43%的人类工作正在被自动化!一个有趣的现象是:低薪和高薪职业中,AI使用率都很低。

Claude 3.5 Opus无了,Anthropic本周可能会提前放出Claude 4。

网友爆料称,除了Claude 4,还有推理模型也将首亮相,评分全面超越o3。

Anthropic已经沉寂太久了,去年曾被传出内部模型研发受阻。

不久前,或许因为DeepSeek的冲击,OpenAI、谷歌密集上新了新模型全家桶。

这次Anthropic要直接来一波大的:评分超越「满血」o3,那可是目前公认的比DeepSeek-R1强的对手!

同一天,他们还发布了「Anthropic经济指数」报告,全文38页全面分析了数百万匿名Claude对话,从中揭示了AI在各个职业的应用现状。

Anthropic认为在未来几年,AI对人们的工作将产生重大影响,最新报告旨在长期追踪AI对劳动力市场和经济的影响。

论文链接:https://assets.anthropic.com/m/2e23255f1e84ca97/original/Economic_Tasks_AI_Paper.pdf

AI将自动化43%工作

在这篇报告中,Anthropic从任务类型、使用深度、职业技能、收入水平等角度,讨论了AI对不同职业不同群体的影响。

主要结论如下:

更值得一提的是,Cluade编码和数学占所有 使用量1/3(37.2%)。

为什么发布「经济指数」?

基于Claude.ai平台上数百万条匿名对话数据,该指数的首份报告提供了前所未有的分析和洞察,揭示在现代经济的各类任务中,如何实际应用AI。

迄今为止,这是关于AI融入现实经济活动的最清晰图景。

为了推动更广泛的研究,Anthropic决定开源本次分析所使用的数据集,供研究人员在此基础上进一步探索和扩展。

项目地址:https://huggingface.co/datasets/Anthropic/EconomicIndex

面对劳动力市场即将到来的转型及其对就业和生产力的影响,制定有效的政策措施需要多方视角,统筹兼顾。

因此,Anthropic诚挚邀请经济学家、政策专家及其他研究人员提供宝贵意见。

数据分析方法:将对话和职业关联

新论文基于对技术影响劳动力市场的长期研究,从工业革命时期的珍妮纺纱机到当今的汽车制造机器人

关注AI(AI)的持续影响。新研究不调查人们的AI使用情况,也不尝试预测未来;相反,直接获取了AI实际使用的数据。

分析职业任务

新研究始于经济学文献中的重要洞见:有时候,关注职业任务而非职业本身,也有意义。

工作通常共享某些任务和技能:例如,视觉模式识别是设计师、摄影师、安检员和放射科医生共同完成的任务。

某些任务比其他任务更适合被新技术自动化或增强。

因此,预计AI会在不同职业中有选择地被采用,分析任务(而不仅仅是整体工作)将提供一个更全面的图景,展示AI如何融入经济。

使用Clio匹配AI使用与任务

这项研究得以实现,依靠的是Clio系统。在保护用户隐私的同时,它可以分析与Claude的对话。

新研究分析了约一百万次与Claude的对话(包括Free和Pro版本的对话),并按职业任务对对话进行分类。

美国劳工部维护着一个包含约20,000项具体工作任务的数据库,称为职业信息网络(O*NET)。

在线职业分类:https://www.onetonline.org/

根据美国劳工部的分类选择任务,Clio将每次对话与最能代表对话中AI角色的O*NET任务进行匹配。

Clio系统将与Claude的对话(严格保密,位于下图顶部左侧)转化为职业任务(下图顶部中间),并进一步映射到O*NET提供的职业/职业类别(顶部右侧)。

随后,这些数据可以输入到多种分析中(下图底部一行)。

最后,按照O*NET的分类方案,将任务分组到它们最能代表的职业中,并将职业分组到一小组总体类别中:教育和图书馆、商业和金融等。

算法流程总结

具体结果

对不同职业影响

采用AI最多的任务和职业是「计算机与数学」类别,主要涵盖了软件工程角色。

37.2%的Claude查询属于这一类别,涉及的任务包括软件修改、代码调试和网络故障排除。

第二大类别是「艺术、设计、体育、娱乐和媒体」(10.3%的查询),主要反映了使用Claude进行各种写作和编辑任务。

不出所料,涉及大量体力劳动的职业,如「农业、渔业和林业」类别(0.1%的查询),在数据中表现最少。

新研究还将数据中的比例与各职业在整体劳动力市场中的出现率进行了比较,详细结果如下图所示。

职业内部AI使用程度

分析发现,在工作中AI的重度用户集中在极少数职业:仅约4%的职业在至少75%的任务中使用AI。

AI的中等使用率更为普遍:大约36%的职业,在至少25%的任务中一定程度地使用AI。

AI在经济中的应用分布:基于Claude.ai的真实使用数据。数据中的百分比表示与Claude的对话中涉及特定任务、职业及类别的比例。

AI在经济中的应用分布:基于Claude.ai的真实使用数据。数据中的百分比表示与Claude的对话中涉及特定任务、职业及类别的比例

正如预测的那样,数据中没有证据表明职业被完全自动化:相反,AI在经济中的许多任务中得到了广泛应用,对某些任务群体的影响比其他任务群体更大。

AI使用与薪资

O*NET数据库提供了各个职业在美国的中位薪资。

研究者将这一信息加入分析,从而比较不同职业的中位薪资与其任务中AI使用水平之间的关系。

有趣的是,低薪职业和高薪职业的AI使用率都较低(这些职业通常涉及大量手工操作,例如洗发师和产科医生)。

而AI使用最广泛的职业主要集中在中等至较高薪资范围内,例如计算机程序员和文案撰写人。

年薪(x轴)与涉及该职业的对话百分比(y轴)的关系。一些具有代表性的职业被突出显示

自动化vs.增强

研究者还更详细地分析了任务的执行方式。

他们关注了哪些任务属于「自动化」(即AI直接执行任务,如格式化文档),以及哪些任务属于「增强」(即AI与用户协作完成任务)。

总体来看,AI在任务执行上更倾向于增强模式,57%的任务属于增强,43%的任务属于自动化。

也就是说,在超过一半的情况下,AI并未取代人类完成任务,而是与人类协作,参与诸如验证(例如核对用户的工作)、学习(例如帮助用户获取新知识和技能)以及任务迭代(例如帮助用户进行头脑风暴或执行重复的生成性任务)等工作。

Claude对话中涉及增强与自动化的比例,以及每个类别内任务子类型的分解

38页报告中,还覆盖了其他一些有趣的数据。

下图4中展示了不同职业中,人工智能使用深度的分析。约36%的职业至少在25%的任务中使用AI,仅约4%的职业在75%或更多的任务中使用AI。

这表明了,在大多数职业中,人工智能的整合仍然是选择性的,而非全面性的。

图5展示的是,与Claude对话用户职业技能的分布。图5展示的是,与Claude对话用户职业技能的分布。

批判性思维、写作、编程等技能在对话中出现频率较高,而设备维护、安装等手工技能则较为罕见。

图8所展示的是,Claude Sonnet 3.5(新版)和Claude Opus模型之间任务使用模式的比较分析,展示了人们偏好差异。

前者在编码和技术任务方面表现出更多的使用量,而后者则更多用于创意写作和教育内容开发。

任务层级使用状况

如上所述,研究人员用Clio创建了一个任务层级体系,将对话匹配到最适合的O*NET任务。

在顶层(图11),可以看到:

在中层级(图12),数据揭示了更细化的任务模式:在中层级(图12),数据揭示了更细化的任务模式:
在基础层级(图13),可以看到高度具体的技术操作:在基础层级(图13),可以看到高度具体的技术操作:

注意!

新研究提供AI如何改变劳动力市场的独特视角。

然而,与所有研究一样,它也存在重要的局限性。以下是一些主要的注意事项:

结论与未来

人工智能的使用正在迅速扩展,模型的能力也在不断提升。劳动力市场的面貌可能在短时间内发生显著变化。

因此,Anthropic将不断重复上述分析,以帮助跟踪可能发生的社会和经济变化,并定期发布结果和相关数据集。

这种纵向分析可以为提供关于AI和就业市场的新见解。

例如,可以监测职业内部AI使用深度的变化。如果人工智能仅用于特定任务,且只有少数职业在大多数任务中使用人工智能,那么未来可能是大多数现有职业演变而非消失。

还可以监测自动化与增强的比例,了解自动化在哪些领域变得更为普遍。

注意新研究只是对AI模型Claude的对话数据分析,并没有提供政策建议。

如何做好为AI对劳动力市场的影响的准备,不能仅从研究中直接得出,而是需要结合证据、价值观和广泛的经验。

参考资料:

https://assets.anthropic.com/m/2e23255f1e84ca97/original/Economic_Tasks_AI_Paper.pdf

https://www.anthropic.com/news/the-anthropic-economic-index

海量资讯、精准解读,尽在新浪财经APP
AI

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 01-17 宏海科技 920108 5.57
  • 01-16 亚联机械 001395 19.08
  • 01-16 海博思创 688411 19.38
  • 01-14 富岭股份 001356 5.3
  • 01-13 超研股份 301602 6.7
  • 新浪首页 语音播报 相关新闻 返回顶部