5 月 29 日消息,据科技媒体 The Information 昨日深度披露,苹果与谷歌在 AI 领域的合作细节浮出水面,整体策略深度贯穿了苹果一贯的“隐私优先”原则。
端侧部署:采用“蒸馏”技术,物色初创公司压缩模型
在本地端侧处理上,苹果正基于谷歌 Gemini 模型,采用“知识蒸馏”(Distillation)技术来训练轻量级 AI 模型。该技术将大模型(教师模型)的知识迁移至小模型(学生模型)中,在保留接近大模型表现的同时,大幅降低推理成本。通过这种方式“教”出的轻量版模型,能在 Apple 设备本地流畅运行,既提升了响应速度,又避免了用户数据默认上传云端,完美契合苹果的隐私路线。此外,苹果还在积极寻找外部助力,曾考虑收购专注于本地运行 AI 模型的马萨诸塞州初创公司 Liquid AI,以进一步攻克模型压缩难题。
云端部署:算力受限转投谷歌云,引入英伟达机密计算
在云端部署方面,拥有数万亿参数的完整版 Gemini 模型对算力要求极高,苹果自家的 Private Cloud Compute 基础设施难以全面承接。消息透露,在 iOS 27 版本的 Siri 中,部分复杂请求将被转移至 Google Cloud,调用授权版 Gemini 进行处理。
为了在借力云端的同时守住隐私承诺,苹果最近几周批准采用 NVIDIA 的“机密计算”技术。该技术可在 GPU 处理数据和模型时进行加密,以更高强度的保护敏感信息,其代价是云端 AI 查询速度会略有下降。若该方案最终落地,苹果在运行部分云端 AI 功能时,将形成同时依赖 Google Cloud 与 NVIDIA AI 芯片的格局。


微信扫一扫
支付宝扫一扫 