来源:世界经济论坛
图片来源:Unsplash/Choong Deng Xian
Darko Matovski
causaLens创始人兼首席执行官
数据的快速增长超过了现有的人工智能人才的数量,这使小型组织在有效利用AI方面遇到了重大障碍。
人工智能数据科学代理能够自动化数据处理和因果分析,为人工智能的普及化和赋能资源匮乏领域提供了一个颇有前景的解决方案。
人类的监督对于确保对人工智能驱动决策的信任至关重要,这有利于使AI数据科学代理转变为各个行业可靠、可解释和可访问的合作伙伴。
到2025年,全球每年将产生175ZB的数据。如果中国长城上装满1TB的硬盘,那么产生的数据量相当于长城长度的1.5倍。然而,这种数据的爆炸式增长并未带来普遍进步。
数据的指数增长远远超过数据科学人才的线性增长——这种稀缺性导致人工智能人才的成本上升到令人望而却步的水平。
一个严重的鸿沟正在显现:只有大公司和资金充足的机构才能充分利用人工智能,而小型企业、非营利组织和公共部门组织则被抛在后面。这一鸿沟不断扩大,影响到经济竞争力和我们应对紧迫全球挑战的集体能力。
在于达沃斯举行的世界经济论坛2024年年会上,人工智能治理联盟将包容性人工智能列为2025年的优先事项。通过我与联盟的合作,有一个现实变得清晰起来——我们需要突破性的解决方案,让所有人都能享受到人工智能的好处——我相信我们已经找到了一个。
如果我们能够通过普及人工智能创新成果的获取来弥合数据鸿沟,那会怎样呢?想象一下这样一个世界:每个组织,无论规模或资源如何,都可以几乎免费获得优秀的人工智能数据科学家的帮助。
以人工智能数据科学代理弥合鸿沟
人工智能数据科学代理是一个应对爆炸式的数据挑战的可能的解决方案。它不仅仅是分析工具,同时也代表了我们在全球范围内解决复杂问题方式的范式转变。
这些代理自动化了整个数据到决策流程,允许人类数据科学家对其进行监督,确保其治理并验证见解以保持信任。下面我将详细介绍一下它们的操作框架。
其操作的核心是自动化数据处理——这是数据科学中最耗时的方面。这些代理智能地连接到各种数据源——从数据库到应用程序编程接口 (API) 和物联网设备——自动处理数据质量问题并准备数据以供分析——这个过程通常耗费人类数据科学家80%的时间。
然后,它能够发现是什么让数据变得有价值,揭示有意义的模式和关系。而这些模式和关系人类分析师可能需要花费数周时间才能找到。
AI数据科学代理的与众不同之处在于,它们能够使用各种定量和高级推理技能来分析数据。例如,人工智能代理可以构建因果模型,表示数据中的因果关系,然后使用该模型预测未来行动的影响。
这种更深层次的理解,加上大型语言模型解释和说明复杂模式的能力,使得这些代理能够以类似人类的方式交流他们的发现。
通过将复杂的分析与清晰的沟通相结合,这些人工智能数据科学代理让以前无法负担数据科学团队的组织能够使用先进的人工智能。
这种转变对企业、政府和社会有着深远的影响——让我们通过两个示例用例来探讨一下。
1. 改变服务匮乏社区的水资源管理
在许多贫困社区,获得清洁水仍然是一项严峻挑战。虽然这些社区收集了有关其供水系统的宝贵数据,但他们缺乏有效利用这些数据的资源。一名数据科学家的薪水可能超过当地水务部门的整个运营预算。
人工智能数据科学代理可以利用现有数据来改变这些社区的水管理:水点状态记录、使用模式、基本传感器读数和当地天气数据。
这种方法之所以特别有效,是因为它使用了因果推理。它不仅可以识别模式,还可以揭示某些供水点比其他供水点更容易发生故障的原因。例如,它可能会发现特定区域的故障主要是由使用模式而不是基础设施老化引起的,从而可以采取更有针对性和成本效益更高的干预措施。
其影响是立竿见影的,也是切实可行的。AI数据科学代理可以:
在故障发生之前预测潜在故障
实现预防性维护,而非昂贵的紧急维修
根据实际需求优化资源配置
确定水资源短缺的高风险地区
最重要的是,这些见解将以清晰、可操作的术语传达,以便当地团队能够理解和信任。
2. 赋能小型制造业创新
全球制造业的支柱并非是大型工厂,而是竞争激烈、利润微薄的中小型制造商。尽管行业领先制造商在数字化转型方面取得了进展,但中小企业却因资金限制而面临巨大挑战。
人工智能数据科学代理可以通过以下方式改变制造运营:
预测设备故障,减少昂贵的停机时间。
找出质量问题的根本原因并提出精确的调整建议。
优化生产计划以提高效率并减少浪费。
平衡库存水平以增强现金流。
查明能源浪费并推荐具体的节约机会。
真正的创新在于这些人工智能数据科学家如何通过使用制造语言进行交流,使复杂的流程变得简单易懂。工厂经理可以简单地提出这样的问题:“为什么我们上周看到的缺陷更多?”它们就可以收到将具体生产条件与结果联系起来的明确解释以及切实可行的改进建议。
借助人工智能数据科学家,小型制造商可以在无需对数据科学团队进行大量投资的前提下,实现与大型企业相同的运营复杂度,从而打造一个更具韧性的制造业,让各种规模的企业都能创新和发展。
平衡信任与自动化
人工智能数据科学代理有潜力为资源丰富的组织和目前无法负担数据科学专业知识的组织提供公平的竞争环境。然而,实现这一愿景需要的不仅仅是强大的自动化——它还需要信任。
这种信任是我们人工智能驱动的未来的重要支柱。虽然人工智能可能在未来提供大部分分析能力,但人类智能仍将是关键的后盾。随着AI数据科学代理自动化复杂的工作流程,人类专家需要提供必要的监督和判断,确保这些系统保持可靠和值得信赖。
AI数据科学代理将利用大语言模型来编写和执行数据科学代码,而他们的因果推理能力使他们能够清楚地解释他们的工作。
业务用户可以用自然语言与它们互动,以发现数据中的基本关系,并了解事情发生的原因,而不仅仅是发生了什么。这种人工监督与可解释的人工智能相结合的方式,将它们从黑匣子转变为值得信赖的合作伙伴。
我们设想的未来是,每个组织,无论规模或资源如何,都能利用数据的力量。人工智能数据科学代理将与人类专家一起工作——不是要取代他们的判断力,而是要增强他们的能力。这并不是一个遥远的愿景。我们目前正在与领先的企业合作,利用AI数据科学代理来应对超出人类分析能力的挑战,同时保持人类的战略控制。
随着人工智能的发展,它在全球分析能力中所占的份额越来越大,而人类监督仍将是信任的基石。信任与自动化之间的平衡将使人工智能真正为所有人所用,推动社会各个领域的创新和进步。
特别声明:以上内容仅代表作者本人的观点或立场,不代表新浪财经头条的观点或立场。如因作品内容、版权或其他问题需要与新浪财经头条联系的,请于上述内容发布后的30天内进行。
400-690-0000 欢迎批评指正
All Rights Reserved 新浪公司 版权所有