大语言模型,苹果开卷!可在手机上运行
读特客户端综合
04-25 19:38

读特客户端

读特在线,您的新闻观察眼

苹果的大语言模型来了!

4月25日消息,在WWDC24之前,苹果在Hugging Face平台上发布了一个“具有开源训练和推理框架的高效语言模型”,名为OpenELM。苹果这次发布了完整的框架,包括数据准备、训练、微调和评估程序,以及多个预训练的checkpoint和训练日志,以促进开源研究。其源码及预训练的模型权重和训练配方可在苹果Github库中获取。

据界面新闻报道,该系列模型包含2.7亿、4.5亿、11亿和30亿共4个不同参数版本。基于较小的参数量,这些模型可在端侧设备上独立运行,而不必连接云端服务器。具体而言,其一共包括4个预训练模型和4个指令调优模型。

据苹果在Hugging Face上的公开信息,尽管这四套模型参数最小仅有2.7亿,最高30亿,但预训练数据规模高达1.8万亿tokens(模型处理文本时的基本单位)。这些数据来自Reddit、维基百科、arXiv.org等网站构成的公共数据集。同时,苹果采用CoreNet作为训练框架,这是苹果专门用于训练模型的深度神经网络库,目前也已开源。

这些模型可运行在笔记本电脑甚至智能手机上(而不是云端),苹果举例称,其中一台是配备M2 Max芯片、64GB RAM,运行macOS 14.4.1的MacBook Pro。

市场分析认为,此举显示苹果似乎把目标牢牢放在“让AI在苹果设备上本地运行”的方向上。

苹果一系列“操作”的背后,可能是因为硬件卖不动了。

财报显示,苹果2023财年第一财季到第四财季的营收分别下滑5.48%、2.51%、1.40%、0.72%。这也是自2007年iPhone发布以来,苹果首次在连续四个财季录得收入同比下滑,再往前追溯这个纪录,是在2001年。

从整体来看,苹果公司2023整体财年营收3832亿,同比下降2.82%,其中硬件营收2980亿,同比下降5.76%。其中,iPhone营收2004亿,同比下降2.4%。其他硬件,如Mac,iPad 以及可穿戴设备,营收也分别下滑27%、3%和3.3%。

距离划时代的智能手机产品iPhone横空出世已过去17年。自乔布斯时代以来,苹果一直在寻找除了手机、电脑之外的下一个风口。在十年造车计划叫停、传统业务收入来源承压的情况下,不管Vision Pro、AI手机还是家用机器人,无疑,苹果正在迫切寻求新的增长点。

(综合来源:界面新闻、IT之家、金融界)

编辑 张克 审读 张蕾 二审 关越 三审 刘思敏

(作者:读特客户端综合)
免责声明
未经许可或明确书面授权,任何人不得复制、转载、摘编、修改、链接读特客户端内容
推荐阅读
读特热榜
IN视频
鹏友圈

首页