7月26日,在世界人工智能大会(WAIC)期间,荣耀正式发布自研多模态感知大模型——MagicGUI大模型。
作为荣耀推出的首个GUI开源大模型,MagicGUI以7B(70亿)参数规模,支撑底层 AI 智能体的多模态感知与自动执行规划能力,比肩SOTA模型达到行业领先水平。同时,MagicGUI也是荣耀阿尔法战略不断持续推进的重要里程碑,此次面向全球软硬件开发者正式开源,将持续助力行业构建更繁荣的AI生态,进一步助力AI真正地走进用户生活。
凭借独创的“继续预训练+强化微调”两阶段训练方案,荣耀MagicGUI大模型在荣耀Magic V5常用场景用机操控中的准确率达到91.5%,较行业同类顶级开源模型提升16.4%。这背后,是荣耀在AI技术方面的创新突破。
在数据工程方面,荣耀构建了高效的数据采集与构造框架,优化数据配比与筛选方案,形成多样且高质量的训练数据集;训练中引入空间增强的复合奖励函数、DF-GRPO 强化学习算法等创新方法,大幅提升模型数据利用效率与泛化能力,使其在未经训练的新场景中仍能保持稳定性能,实现跨场景适应。
对比评测结果显示MagicGUI 大模型已达到行业领先水平。在行业开源和荣耀内部榜单测试中,移动端的视觉定位能力、页面理解问答能力、单步操作能力、动作序列拆解执行能力4类任务跑分全面领先。
以首款搭载MagicGUI的折叠屏旗舰荣耀Magic V5 为例,借助MagicGUI大模型赋予的感知、推理、规划、反思、执行任务的全链路能力,YOYO能够像人类助理般拆解复杂任务、调度跨应用资源、闭环完成操作流程,让“一语打车”等常用场景用机操控成为现实。
再以出行场景为例,只需一句话,YOYO便会在用户授权范围内自主调度高德、滴滴等应用,完成打开App、修改地址、选择车型、下发或取消订单,无需手动操作。
基于MagicGUI的多模态感知和自动化执行能力,YOYO还能高效完成常见APP主页搜索、查看订单与购物车等操作。经过训练的 MagicGUI 大模型,在“自动驾驶”时能根据屏幕视觉信息边思考边行动,依据页面反馈精准推理下一步操作,让 YOYO 的操作更智能高效。如果遇到用户指令有误、操作无法完成等突发情况,它还能主动停止,实现自动操作和人工接管的智能切换,保证操作流程顺畅进行。
而上述YOYO 智能体所有“自动驾驶”操作,荣耀均采用了业界公认的隐私保护方法,并且通过 ISO/IEC 27701、ISO/IEC 27001、ePrivacyseal 等多项国际权威隐私安全认证,从技术与合规层面双重保障用户信息安全,让 "放心用 AI" 成为基本前提。
有业内人士表示,此次,荣耀将模型的技术报告、参数配置、评估数据等核心要素向公众开放,旨在打破 AI 技术壁垒,推动行业内的技术共享与创新加速。对于全球 AI 产业而言,MagicGUI 大模型的价值不仅在于让全球开发者可基于开源资源快速构建差异化应用,更在于它为行业提供了一个开放的创新基座,推动 AI 技术从“同质化竞争”转向“多样化突破”,最终满足千行百业对 AI 服务的个性化需求。
AI 的发展不依赖单点突破,而在于生态协同。此次,在WAIC人工智能标准化国际合作论坛上,荣耀作为首批单位将与中国电子技术标准化研究院、阿里、百度等百余家行业企业共同发布《智能体协议共建共享联合倡议》,以进一步推动人工智能技术、标准的国际交流合作以及产业发展。截至今年6月,荣耀已联合20余家企业推动终端智能化分级指南标准落地,并联合中国信息通信研究院等牵头10余个AI终端的标准立项及起草,为AI终端技术产品应用普及和产业发展提供中国方案。
近日,在中国人工智能产业发展联盟第十五次全会上,荣耀还携手中国信息通信研究院、阿里、百度等行业领军企事业单位,共同发布了《人工智能安全承诺》实践披露成果。联盟围绕风险管理、模型安全、数据安全等6大核心内容,提炼了20项关键安全标签,公开了43项企业典型实践,致力于推进我国人工智能安全治理迈入体系化、透明化、实操化新阶段,为全球贡献“以人为本、智能向善”的中国方案。
荣耀MagicOS副总裁孙建发表示:MagicGUI不仅是技术成果的分享,更是荣耀推动AI终端生态的责任。目前荣耀MagicGUI大模型报告已登陆GitHub平台,模型与相关测试数据将于近期上线相关开源平台。
编辑 李斌 审读 秦天 二审 党毅浩 三审 余晓泽