以数助算,以密促实

以数助算,以密促实
2024年07月08日 14:54 人民政协网

人民政协网7月8日电 于7月5日召开的国务院常务会议,研究部署了推进数字经济高质量发展有关工作。会议特别强调“要从全局高度认识和推动数字经济高质量发展,促进数字技术和实体经济深度融合,推进数字产业化、产业数字化,全面赋能经济社会发展”“要坚持改革创新和开放合作,持续优化数字经济发展环境,协同完善数据基础制度和数字基础设施,推进数据要素市场化配置”“要提升平台企业创新能力,促进平台经济持续健康发展”。

数据是发展新质生产力的关键力量,将为实体经济特别是中小微企业创造发展新机会。数据密态时代,低成本的密态计算技术是让“数据价值像自来水一样即开即用”的关键。但由于标准不统一,这项技术目前在应用端走得并不“顺溜”。而大模型要实现向下扎根深入行业,就必须要答好高质量数据供给和安全流通这两道题。

跨过大模型“入垂”第一道坎

7月5日,2024年世界人工智能大会(WAIC)进入第二天,作为数据要素领域的主要技术服务商,蚂蚁集团发布了“隐语Cloud”大模型密算平台,旨在通过软硬件结合的可信隐私计算技术,在大模型托管和大模型推理等环节实现数据密态流转,保护模型资产、数据安全和用户隐私。

数据供给质量高低、数据流通是否安全,是大模型应用于垂直产业的第一道门槛。而行业大模型要获得解决专业问题的能力,同样需要经过数量充足、质量高的专业数据训练。而现实情况是,专业数据“隐匿”于不同“端口”——企业担心数据外流,大模型厂商担心模型资产不安全,用户担心个人数据和隐私泄露,三方之间存在信任壁垒。

今年5月底,蚂蚁集团对外公布了以人工智能和数据要素技术为核心的科技战略,随后成立了独立运营的密态计算公司——浙江蚂蚁密算科技有限公司。公开资料显示,该公司由蚂蚁集团副总裁、首席技术安全官韦韬担任董事长和法定代表人,蚂蚁集团隐私计算部隐语总经理王磊出任CEO,该公司由蚂蚁集团全资控股。

发布会现场,王磊“解密”了“隐语Cloud”大模型密算平台首批推出的两大服务——大模型密态托管,可实现模型提供方将模型加密后托管在平台上,一键完成云上密态部署,保护模型资产不被泄漏和盗用;大模型密态推理可实现数据以密态形式完成推理,保护用户交互时的数据安全和商业机密。

此外,该平台支持GPU在可信执行环境下进行计算,这可使得大模型推理在密态形式下响应时间和使用效率与明文大模型接近,实现大规模商业可用。而在安全保障上,该产品利用内存、磁盘加密等方法,实现用户访问的端到端加密和托管模型的跨域访问控制。在易用性上,产品支持轻量化远程认证,用户在网页访问时就可以完成远程认证,不需要额外的操作步骤。

大模型在垂直行业应用时遇到的另一个“通病”,是许多企业通过私有化部署来应对数据安全挑战,这不仅增加了企业的运维服务成本,也影响对外服务的效率和质量。对行业发展而言,私有化方案也不利于多方数据跨领域、跨行业高效融合,无法进一步激发大模型的能力。

据介绍,“隐语Cloud”大模型密算平台提供公有云和专有云交付方案,支持市面上主流的通用大模型。以公有云为例,无论用户重新构建新的垂直大模型,还是将已有的大模型重新部署在该平台,只需一键部署和接入,10分钟即可完成高可用推理服务的发布。在使用过程中,用户按需获取密态算力,即开即得。

“接下来,我们还将为垂直大模型从预训练、微调、评测、推理到用户交互的全程提供密态计算服务,在大模型提供方、数据提供方、大模型使用方等之间实现数据可信安全流转。平台还将提供密态大模型开发所需的全链路工具,提供的服务包括密态检索增强生成、密态提示词、Agent流程编排等。”王磊表示。

韦韬则认为,数据供给决定了大模型应用能力的上限,而隐私计算技术则决定了数据跨域供给的上限。大模型作为“智力引擎”,要实现从通用走向专业应用,从技术想象力走向产业生产力,就必须要解决高质量数据收集稀缺和专业数据阻滞的问题,否则就会陷入空转。他同时期待,未来高价值数据实现深度融合,以密态方式进行安全流转。

安全分级是数据可信流通之“密钥”

如何让大规模高价值数据进行可信流通,也是数据要素市场发展的核心议题。由于隐私计算技术路线众多,在产业落地应用中难免存在“讲不清”“看不懂”“不敢用”等情况。业界普遍认为,隐私计算技术路线众多,且不断有新的技术涌现,产业方难以评估这些技术的安全程度。同时,由于部分隐私计算技术性能较低,市场上存在牺牲安全性换取性能的产品。因此,隐私计算技术在产业界得以大规模落地的先决条件,是搭建隐私计算产品安全分级框架,按级选型适配产品。

在今年的2024世界人工智能大会上,围绕隐私计算安全分级面临的核心难点(包括技术路线特征不同难以进行统一分级、部分重要安全能力难以被分级和量化等),由蚂蚁集团、中国通信标准化协会大数据技术标准推进委员会、深圳国家金融科技测评中心、清华大学牵头以编写《隐私计算产品通用安全分级白皮书》(以下简称《安全分级白皮书》)的形式,逐一进行了讨论。《安全分级白皮书》给出通用安全分级的设计思路,包括按照攻防效果分级来弥合不同技术路线差异,在“可证安全”和“不安全”之间增加一个“抵御已知攻击”的分级水位,引入软件信誉度等更多维度量化“实现安全”,明确所有技术特征与安全分级的对应关系。

从行业现状看,虽然针对单一技术路线已经有了一些安全分级标准,但不同技术路线的分级标准无法“同频”且不适用于新出现的技术线路,导致用户难以对所有产品进行横向比较,这些标准也不适用于新出现的技术路线。因此,适用所有技术路线的通用安全分级思路亟须明确,来引导数据跨域流通不同技术的安全评估工作。

如何在个人隐私保护基础上,实现数据价值开发,也是产业界面对的挑战。对于描述或标识特定自然人信息的数据,如自然人的姓名、身份证号码等,数据持有者掌握这类信息后,有可能出现隐私泄露、滥用等风险。对于自然人与数据持有者交互产生的描述行为痕迹信息的数据,数据持有者汇集大量个人痕迹数据后,数据挖掘与分析可将数据价值不断放大,但也可能利用大数据来“杀熟”。

资料显示,为平衡“数据流通”和“个人信息保护”的双重目标,《网络安全法》《个人信息保护法》已特别设置了“个人信息匿名化条款”,将匿名化的个人数据排除在个人信息保护之外。然而,由于匿名化条款的法律内涵和实施标准有待厘清,匿名化条款往往存而不用。(崔吕萍)

海量资讯、精准解读,尽在新浪财经APP

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 07-15 绿联科技 301606 --
  • 07-11 科力装备 301552 --
  • 07-01 乔锋智能 301603 26.5
  • 06-26 键邦股份 603285 18.65
  • 06-24 安乃达 603350 20.56
  • 新浪首页 语音播报 相关新闻 返回顶部