日前,腾讯研究院正式发布了《向AI而行,共筑新质生产力——行业大模型调研报告》(下文简称“报告”)。这份报告结合腾讯研究院发起的对人工智能与大模型领域百余名专家的深度访谈“大模型百人百问”,深入剖析了行业大模型发展、应用、实现、治理与未来发展趋势,旨在为业界提供囊括学术、商业、政策等不同视角的全面参考。
所谓 “行业大模型”,指的是利用大模型技术,针对特定数据和任务进行训练或优化,形成具备专用知识与能力的大模型及应用。与通用大模型相比,行业大模更专注于提高性价比、增强专业性并保障数据(特别是私有数据)的安全性。
中国工程院院士邬贺铨在报告序言中提出,“人工智能大模型正在催生新一轮技术创新与产业变革,也将为工业、金融、广电等行业数字化转型和高质量发展带来新动能。当前市场以基础大模型为主,通识能力强,但缺少行业专业知识。如何将大模型融入千行百业,是下一阶段的发展重点。”
大模型的“不可能三角”
OpenAI提出的“规模定律”驱动了大模型的快速发展,传统AI模型参数量通常在数万至数亿之间,大模型的参数量则至少在亿级,并已发展到过万亿级的规模。大模型带来了AI性能突破,也激发业界向通用人工智能(AGI)领域进发的新热潮。
不过,大模型存在专业性、泛化性和经济性“不可能三角”问题,导致目前行业实际落地应用进程并不快。
“专业性”,指大模型处理特定领域问题或任务的准确性与效率。“泛化性”,指大模型处理训练数据集之外新样本的能力。而“经济性”则指大模型训练和应用的投入产出比,三者很难同时得兼。
例如,GPT为代表的通用大模型以发展通识能力为主要目标,更侧重泛化性,在专业性和经济性方面目前很难充分满足具体行业的特定需求,因此需要行业大模型来针对性解决。
中国互联网投资基金管理有限公司总经理李筱强认为,在算力、算法、数据、场景等四个决定大模型发展的关键要素中,数据和场景是我们相对优势的领域。而要更好地利用场景,成功实现商业落地,高质量的行业大模型必不可少。
三个核心发现
从目前情况看,行业大模型整体处于发展早期,尚未出现大规模成熟应用的范例。
本报告主要尝试厘清三个问题:一是行业大模型既有模型、也含应用;二是行业大模型大多生长在通用大模型之上,基于通用大模型进行再开发;三是行业大模型具备定制特征,本质是解决方案,而非产品。
行业大模型中的产品通常是“毛坯房”,客户需要因地制宜地“装修”才能满足需要。按照埃弗雷特·罗杰斯《创新的扩散》一书中对创新阶段的界定,行业大模型应用阶段可划分为探索孵化期、试验加速期、采纳成长期和落地成熟期。“百人百问”访谈和研究显示,目前大部分行业处于前两个阶段,还没有行业达到落地成熟期。
在实际应用方面,数字原生行业(如各类互联网应用)是行业大模型应用的先行者,传统行业中生产性服务业(广告、金融等)进展相对快,而重资产行业(建筑、制造、能源等)进展相对慢。《报告》发现,其中有两大核心影响因素是需求的适配度和数据的可得性,越高的行业进展越快。
《报告》还发现,行业大模型应用场景的快慢呈现“微笑曲线”特征。在产业链高附加价值的两端(研发、设计和营销、服务),大模型应用落地较快。造成这种情况的原因之一是,大模型带来“智力即服务”的范式变化。这种服务特别适配微笑曲线两端的知识密集型和服务密集型领域,而在低附加价值的中部(生产、组装等),大模型应用进程较慢。
虽然不同行业与大模型结合的进展和侧重点存在差异,但也存在三大共性需求,包括:内容生成与创意设计、信息提炼与专业辅助、任务调度与智能交互。
针对业界普遍关心的“如何衡量行业大模型成功与否”问题,《报告》总结构建出2-3-1原则:要避免片面追求技术性能或短期收益的2个误区,应评估降本提效、业务创新和体验增强上的3类价值,并重点构建1个高质量数据飞轮的模式。
其中有两个容易陷入的误区:一是误将技术指标当作证明大模型成功的标准。事实上技术指标的高低无法直接反映出大模型价值的大小,应关注用户数、使用量、收入等业务指标,这些指标能直观反映价值,作为评判成功的标准更具说服力。
二是过度看重投资收益中的短期产出部分而忽视长期投入。合理的方式是将大模型作为研发或孵化项目,不强求短期的财务指标绝对值达成,转而关注业务、技术等指标的相对提升,采取广泛的组合投资策略长期持续投入才可能真正见效。
目前,行业大模型主要有四种技术实现方式,从易到难分别是:提示工程、检索增强生成、精调和预训练。实际应用中这些方式通常是组合使用,以实现最佳效果。
提示工程适用于刚接触大模型的企业新手,采用这种方式能以最小资源投入、快速探索应用。局限性也很明显,若大模型内含的行业数据较少,效果较差。
检索增强生成适用于处理企业自有数据,通过大模型外挂知识库,更准确检索并生成知识库范围内的内容。该方式模型本身不会调整,算力等投入就不会太大,已成为部署行业大模型应用的主流选择,局限在于对知识库外的专业问题反馈效果有限。
精调适用于解决行业特定任务,通常是基于特定数据集局部调整模型参数,提高任务处理的效果和效率。精调是对大模型定制优化和成本投入的折中选择,算力和数据等投入明显增加,但比预训练更低。
预训练适用于行业专业性较高、数据类型和任务与主流通用大模型差异较大的情况,例如生物/医药研发。这种方式投入最大,不仅需要收集大量数据,还需要对模型进行全参数训练调整,甚至从头搭建一个模型。
行业大模型的发展方向
在“人工智能+”等重要政策指引下,行业大模型有望加速在传统行业的落地应用。在云智一体的基础设施支持下,行业大模型向多模态、人工智能体、端侧及小型化等方向发展,将更深入嵌入各行业的工作流程中,从而提升生产力。
一些与工作流程深度耦合的AI Agent已经开始涌现,有望逐步发展成为各行各业不可或缺的新型生产力工具。在办公领域,如Microsoft 365 Copilot及其个人版Copilot Pro;在社交领域,如Meta AI等产品;在工业领域,如Levatas等工业视觉检查机器人的应用;在营销领域,则诞生了SalesGPT等平台……
随着AI应用的深入,模型的规模、类型和复杂性将不断增加,MaaS(模型即服务)将日益成为行业用户云上用智的主流方式。
用户或直接调用云的大模型API,或借助全生命周期的大模型训练工具,生成适用于自身场景的大模型,并托管在云上,为最终用户提供高质量智能服务。为此,面向AI的、更高性能的算力底座必然不可或缺。通过计算、存储、通信、训练等各层面的优化,全面提升模型训练、开发和应用效率。
AI大模型在各行业的应用,将会加速社会共同迈向智能新时代。中国广告协会会长、国际广告协会全球副主席张国华认为,大模型是效率、体验和创造力的倍增器,它正在重塑着广告行业的未来;中国工程院院士李伯虎提出,“AI+制造”能够提高生产效率、提升产品质量、实现个性化定制、优化资源配置、促进绿色环保、实现人才结构优化等,进而加快推进中国工业的五个转型升级,实现工业的数字转型与智能化升级,促进新质生产力形成。
编辑 欧阳晨煜 审读 吴剑林 二审 桂桐 三审 赵明
读特热榜
IN视频
鹏友圈
诚邀您来写诗!用诗歌和AI,#把深圳写进诗#,打开45年的深圳记忆 今年是深圳经济特区建立45周年,也是你在深圳的第___年。或许在莲花山的朝阳下,你留下和深圳的第一张合影;在深圳湾的潮涌中,你看着高楼大厦如璀璨星辰。在夜幕中点亮那些奋斗的故事、深情的岁月,如今有人把它们编织成诗画传扬。 今天,距离深圳经济特区45岁生日,正好还有45天。读特客户端联合深圳市作家协会、深圳市美术家协会,推出“诗颂深圳,AI绘鹏城”特别策划活动,以“诗、诵、画”三位一体形式,呈现一场致敬特区精神、展现时代风貌的跨领域文化盛宴。 与此同时,我们也诚挚邀请深爱这座城的您,在鹏友圈带话题#把深圳写进诗#,用诗意的祝福,给深圳写一封“云端诗笺”。 【本期话题】#把深圳写进诗# 【参与方式】在鹏友圈带话题上传文字、图片或30秒以内视频,分享你对深圳诗意的祝福。 每一行诗句都是最深情的告白;每一幅画作都是一份炽热的心意;每一段声音都汇聚成礼赞特区的磅礴力量;每一句奋斗者的祝福既献给深圳,也献给未来……让我们携手,以诗歌之名,共赴下一个璀璨征程!
“圳”好玩!分享你的暑假遛娃攻略 暑期精彩不断!深圳各大公园推出40余场主题文化活动,涵盖群艺展演、自然教育、体育健身、户外音乐、艺术展览及创意市集六大板块。同时,读特小记者策划了5场趣味活动,通过互动课程培养孩子们的写作和表达能力。这个暑假,你准备带娃去哪里探索呢?快来分享你的#暑假遛娃攻略#,一起发现更多好玩去处吧!
00:08
这个暑假,深圳公园40余场文化活动轮番上演
00:05
深圳低空经济应用场景不断“上新”,上半年新增无人机物流航线50多条
带话题#读特小记者#在读特“鹏友圈”发布新闻稿,体验做一个读特小记者! “我是读特小记者,面对世界很好奇。我有新闻数不清,叽咕叽咕写不停~”爸爸妈妈们,你们的小记者,是不是也对身边大小事有着强烈的好奇心,有着旺盛的探索欲和表达欲呢?快邀请你们的小记者,勇敢地拿起笔,来读特“鹏友圈”撰写新闻稿吧! 小记者的眼睛里有大大的世界,小记者的才华会被我们看见!快来带话题#读特小记者#在读特“鹏友圈”发布个人自我介绍和新闻稿件,体验做一个读特小记者吧! 【本期话题】#读特小记者# 【招募对象】6岁到18岁青少年(小学到高中阶段) 【话题时间】2025年全年 【动态内容】800字以内,自拟题目,以身边发生的新闻事件为主题撰写新闻 【参选要求】①有效作品数量为每月1份;②参选者填写报名表一份 【版权提示】小记者在活动中上传的文字、图片、短视频以及其他形式的活动内容、知识性成果等,应确认拥有其作品的著作权并不侵犯他人权利,并授权活动组织方将这些作品应用于相关活动,版权归小记者本人及读特新闻客户端双方所有。如发现抄袭、侵犯第三人权利或其他不诚信行为,主办方有权取消参与资格。因抄袭等侵权行为引起任何纠纷均由创作者本人负责。 【报名流程】①关注“读特新闻”公众号;②回复“读特小记者”获取报名方式;③添加官方工作人员二维码;④将报名表私信工作人员;⑤工作人员将您拉进海选群;⑥将群内昵称改为参选者姓名 【发稿流程】①参选者在“读特”APP“鹏友圈”内注册账号;②更改账号名为参选者姓名;③带话题#读特小记者#在读特“鹏友圈”发布个人自我介绍1份,本人原创参与活动的新闻稿件1份 【入围奖励】①电子聘书1份;②账号将获得官方黄v标识,成为读特记者号;③被采纳的稿件将被收纳至读特“读特小记者”专题页面;④优秀稿件将会酌情给予稿费奖励
- 友情链接: 深圳新闻网
- 粤ICP备10228864号
- 粤公网安备 44030402000917号
- Copyright @1997-2023 深圳特区报社