长江证券:苹果(AAPL.US) 发布Apple Intelligence智能助手 异构芯片或成AI算力新方向

作者: 智通财经 刘璇 2024-08-14 11:11:26
与GPU相比,TPU不需要再频繁地访问内存,减少了与存储器的交互次数,从而大幅度提高了计算效率。

智通财经APP获悉,长江证券发布研报称,在2024年的全球开发者大会上,苹果(AAPL.US)推出了个人智能助理Apple Intelligence。该助手包含了多个功能强大的生成模型,可以快速、高效地处理用户日常任务,并能即时适应用户当前的活动。此外,苹果发布了基础模型AFM,为底层操作系统赋能。Apple Intelligence正是由AFM基础模型赋能的。在算力层面,AFM模型由谷歌(GOOG.US)TPU算力芯片提供支持,该TPU性能追及英伟达(NVDA.US)旗舰算力芯片。

苹果发布Apple Intelligence智能助手

苹果发布了基础模型AFM,为底层操作系统赋能。在2024年的全球开发者大会上,苹果推出了个人智能助理Apple Intelligence。Apple Intelligence包含了多个功能强大的生成模型,可以快速、高效地处理用户日常任务,并能即时适应用户当前的活动。Apple Intelligence可以实现撰写和润色文本、优先处理和总结通知、为与家人朋友的对话创建有趣的图片等功能,以及采取应用内操作以简化跨应用交互。Apple Intelligence将被搭载于IOS18、IOS18ipad以及MacOS18操作系统上。目前Apple Intelligence搭载于iOS18.1Beta版上,仅限注册开发者试用,订阅价格为99美金一年;普通用户仍需要排队等待。

Apple Intelligence由AFM基础模型赋能

AFM基础模型主要包含了端侧模型和云端模型两个部分。其中端侧模型专为端侧应用的特定场景所设计,只能处理语言相关的单模态任务,可以本地化搭载于iphone、ipad、Mac等设备上,模型包含30亿参数量。云端模型为私有云应用场景所设计,具备多模态能力,有更高的泛化能力,可应对更加通用的任务。这两个基础模型是苹果创建的生成式模型家族中的一部分,除了上述两个模型,Apple Intelligence还包含了一个编码模型和一个扩散模型。编码模型基于AFM语言模型,用于为Xcode注入智能功能;扩散模型帮助用户以视觉方式表达自己,比如在Messages应用中使用。

AFM云端模型性能追及GPT-3.5,略逊于GPT-4。

在模型性能评估阶段,苹果设计了1393个任务,将AFM模型与其他主流模型的性能进行了对比。对比结果显示,AFM云端模型性能超越Mixtral-8x22混合专家模型、GPT-3.5等模型,略逊于GPT-4和LLaMA-3-70B模型;在端侧模型方面,AFM端侧模型性能接近市场主流端侧模型。人类测评结果显示,AFM端侧模型性能超越Gemma-7B、Phi-3-mini、Mistral-7B、Gemma-2B等主流模型,略逊于LLaMA-3-8B模型;结果证明了AFM端侧模型的优异性能,有望在iPhone、iPad等设备上发挥较高实用性。

异构芯片或成AI算力发展新方向

在算力层面,AFM模型由谷歌TPU算力芯片提供支持。谷歌为本次训练提供了算力支持,云端的AFM-server模型由8192个TPU V4算力芯片训练得到,在训练阶段,苹果把8192芯片分成8组,每组1024个芯片相互串联形成一个基本单位,各组之间保持平行关系,训练数据与迭代仅在组内完成;端侧的AFM-on-device模型由2048个TPU V5p算力芯片训练得到。

谷歌TPU性能追及英伟达旗舰算力芯片。TPU(Tensor Processing Unit),是一种专为处理张量运算而设计的ASIC芯片。TPU通过脉动阵列机制实现高效运算。与GPU相比,TPU不需要再频繁地访问内存,减少了与存储器的交互次数,从而大幅度提高了计算效率。因此,TPU的有效算力利用率相比于GPU更高;GPU的算力利用率通常为20%-40%,而TPU的算力利用率往往超过50%。

风险提示

1、AI技术推进不及预期;

2、下游应用需求不及预期。


智通声明:本内容为作者独立观点,不代表智通财经立场。未经允许不得转载,文中内容仅供参考,不作为实际操作建议,交易风险自担。更多最新最全港美股资讯,请点击下载智通财经App
分享
微信
分享
QQ
分享
微博
收藏