苹果揭秘 Apple 智能开发:差分隐私 + 合成数据,隐私原则贯穿 AI 技术演进

苹果揭秘 Apple 智能开发:差分隐私 + 合成数据,隐私原则贯穿 AI 技术演进
2025年04月15日 07:23 IT之家

IT之家 4 月 15 日消息,苹果公司昨日(4 月 14 日)发布博文,披露其 AI 隐私保护核心技术细节,重点介绍差分隐私和合成数据在 Apple Intelligence 中的应用。

差分隐私守护 AI 进化

以生成 Genmoji 表情为例,用户选择共享设备分析数据时,系统会通过随机噪声算法,收集高频指令(如“戴着牛仔帽的恐龙”),但不会记录频次过低的个性化指令,且所有数据与设备 ID 完全脱绑。

具体实现中,设备端会随机返回真实指令片段或干扰信号,只有某条指令被数百设备同时提交后,系统才会识别。这种机制已帮助优化多实体组合表情的生成准确率,且全程不触及 IP 地址等敏感信息。

合成数据破解长文本难题

面对邮件摘要等涉及长文本的功能,苹果研发了专有合成数据方案。首先由大语言模型批量生成虚拟邮件(如“明早 11:30 打网球吗?”),将其转换为包含主题、语言特征的数字向量(embedding)。IT之家附上苹果官方博文演示图如下:

参与计划的设备会在本地计算真实邮件的向量,通过差分隐私技术匿名反馈最接近的合成向量类型。经过多轮迭代,系统最终获得能反映真实邮件分布规律的合成数据集,但全程不接触原始邮件内容。目前该技术已在测试版邮件摘要功能中验证效果,未来还将应用于写作助手等场景。

隐私原则贯穿技术演进

苹果在博文中强调,Apple Intelligence 所有模型训练均采用去标识化数据,会预先过滤社交安全号等敏感信息。

即将发布的 iOS 18.5 等系统中,差分隐私和合成数据技术将扩展至 Image Wand 图像处理、记忆相册生成等十余项功能。苹果强调,即使用户启用设备分析计划,其个人数据也始终加密存储在本地,公司仅获取经数学验证的群体趋势报告。

苹果指令AI
新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片