主流媒体自研“大模型”是战略必需,还是盲目跟风?

AI传媒π

05-16 16:14

摘要

主流媒体大模型的自研竞赛本质是一场“有限游戏”——赢家不是拥有最大算力的机构,而是最懂“媒体本质”的玩家。

2023年以来,国内各大媒体积极拥抱大模型,有的媒体选择与外部大模型公司合作,有的媒体选择更为艰辛的自主研发道路。在这场轰轰烈烈的“大模型自研运动”中,中央级媒体、地方广电集团、报业巨头以及新型融媒中心等纷纷下场,俨然一场“技术主权”争夺战,各家媒体都希冀在大模型这条赛道上脱颖而出,以创造新的价值增长点,开创一条新的转型之路。

今天,我们就来扒一扒这些主流媒体自研的大模型,顺带也思考一下,主流媒体大模型是自树一帜更好呢,还是拿来主义更好呢?

自研大模型的媒体阵营

拥抱大模型于主流媒体系统性变革可谓是势在必行,“自研”还是“借力”还是有区别的,“自研”除了表征专业与实力外,还是一场“技术自主权”的构建。当下,自研大模型的主流媒体主要分为“领跑”和“跟进”两个战队。

央视国家队领跑

如果你看过《千秋诗颂》《AI看典籍》《中国神话》《美猴王》等AI视频,你就大概能体会“央视听媒体大模型”的视频生成效果。作为国内首个专注于视听媒体内容生产的AI大模型,总台的“央视听媒体大模型”是个领跑性和突破性的存在,集合了中央广播电视总台的海量视听数据、专业化媒体创作知识与上海AI实验室原创先进算法、大模型训练基础设施的优势,包括视频生成大模型“书生·筑梦”、AnimateDiff文生视频框架在内的多项先进技术,共同构成了央视听媒体大模型的核心。

当前全球通用的大模型数据训练集里,中国特色明显不足,中文语料仅占1.3%。为解决这一问题,2023年,总台与上海人工智能实验室等10家机构共同成立了“中国大模型语料数据库联盟”,为大模型发展提供高质量、大规模、安全可信的语料数据资源。

从2023年7月发布成立央视听媒体大模型到今年2月发布央视听媒体大模型2.0版本(戳链接>>),其也在不断更新迭代中,研发日益成熟,并在视频内容分析(通过逐步呈现的视觉元素来理解分析视频)、脚本生成、智能配音、字幕生成、文生动画、体育技战术分析、视频创作及编辑等领域具备行业领先的技术能力。近年来总台所推动的一系列AI实践,注重以中华优秀传统文化为根脉,注重在历史的纵深中讲好中国故事。

总台人工智能应用平台总体架构图 图片来源:《中央广播电视总台人工智能发展白皮书(2025版)》

地方媒体集团跟进

除国家队央媒外,地方媒体集团也研发自己的专业媒体大模型,促进媒体业务转型升级,如上海广电推出的“Scube”(智媒魔方)、四川日报川观新闻推出的“智媒大模型”、大众报业集团的“壹点天玑”传媒大模型、湖南广电芒果TV推出的“芒果TV大模型”、浙江卫视的“智媒果大模型”、浙江日报的“传播大模型”、重庆广电“芯问大模型”等。其中,川观新闻的智媒大模型是媒体领域首个获得国家“生成式人工智能服务备案”和“境内深度合成服务算法备案”双备案的大模型。 

 图片来源:官网截图 https://rdc.smgtech.net/web/u_chan_pin_yu_fu_wu/?tagsId=2

 图片来源:https://mp.weixin.qq.com/s/yx8zpepDDNhImygnQdCmiw

芒果TV“AIGC技术原理”流程图(图片来源:https://mp.weixin.qq.com/s/AuVfOJ7pQwivAzF-0wN6Hw)

地方媒体集团也是呈现区域差别,且基于各自资源优势及内容产出方向深耕各自垂直领域。

地方媒体中经济实力较强的地域,基础设施更完备,无论在组织和个人层面,对人工智能技术的尝试和运用范围更广泛,对人工智能技术的理解也更深入。像浙江省就独具特色,基于浙江全省一张网的媒体融合的顶层设计,浙江约有一半的市级媒体使用由传播大脑浙江科技有限公司推出的传播大模型产品,这算是主流媒体研发的大模型成功实现商业化的典型案例。

而且,各家媒体都发挥独特数据优势,像上海广电第一财经自研的“星翼大模型”在通用语料基础上,融入高质量财经媒体数据和专业领域知识,构建服务财经融媒体内容生产的AI智能体;四川日报集团推出四川省情语料库“若水”,对大量四川省情语料进行学习,以为各类大模型提供安全语料支撑。

自研大模型三大不可替代性

当媒体机构纷纷投身大模型研发时,一个核心问题浮出水面:这场“技术主权”争夺战是战略必需,还是盲目跟风?

主流媒体自研大模型一般耗时长,成本高,且商业落地难,所以是否有必要自研也成为主流媒体系统性变革中需要衡量的问题。任何事物发展都具有两面性,主流媒体自研大模型有着三大不可替代价值:一是数据主权的守卫者,主流媒体的历史稿件、用户行为数据、地方文化语料等是媒体的核心资产,具有高度敏感性,比如央视自己拥有的视听数据、四川日报构建的“省情语料库”,如果用第三方大模型应用这些宝贵的数据,存在数据泄露风险;二是场景定制的刚需,通用大模型难以满足媒体垂类需求,自主研发可深度融入本土语言特征和文化密码,解决通用模型在方言理解、文化隐喻上的适配难题;三是商业模式的护城河,自研模型可以形成差异化竞争力,如湖南广电自研虚拟拍摄软件,具备虚拟预演导摄、高效制作场景、高精度实时渲染能力,使内容制作成本降低20%以上。

但关于自研也需要一定的冷思考,虽然自研具有战略价值,但是不是所有媒体都适合自造车轮,毕竟这是一笔不菲的投入,而且有些地方媒体可能自身占有的数据不多,日均内容产出量也不足量,此时自研模型就可能得不偿失,选择与第三方大模型进行生态协作应该是更好的选择。

理性来看,媒体大模型的发展可能需要分级对待,央媒或头部实力雄厚的集团,全栈自研具有可行性,可以打造自主可控的技术底座,参与标准制定;省级媒体采用“核心自研+外围合作”模式可能是更好的方式,聚焦垂类场景单点突破,警惕重复建设;地市级媒体可以采购成熟工具,深耕“小而美”的内容生产。

主流媒体大模型的自研竞赛本质是一场“有限游戏”——赢家不是拥有最大算力的机构,而是最懂“媒体本质”的玩家。

作者|吴凤颖

免责声明
本文由【读特】深圳号入驻单位发布,不代表【读特】的观点和立场。如有侵权,请联系我们核实后删除!联系邮箱:2207482831@qq.com 。

读特热榜

IN视频

鹏友圈

首页