前沿聚焦 | 人工智能在传媒领域的应用、困境和启示 —— 以封面传媒“AI+ 媒体”探索为例
2023-07-19 16:59
收录于专题:新传播

□ 程悦   王子健   张华



封面传媒从2015年10月28日成立以来,以“构建引领人工智能时代的泛内容生态平台”为愿景,紧盯前沿技术,发力人工智能,坚定向着“AI+媒体”领域进军。历经7年多的持续建设,封面传媒积极将AI赋能机器写作、用户互动、内容生产流程重构、营销服务领域,形成了丰富的应用案例。



【关键词】人工智能 ChatGPT  AI+媒体   封面传媒   封面科技   技术驱动   应用创新

人工智能聊天机器人ChatGPT近期成为热点话题,生成式AI让人们感受到前所未有的惊喜与危机。马斯克去年曾在世界政府峰会上发表评论:“人工智能已经变得非常先进,它只是没有大多数人可以访问的用户界面。”ChatGPT就是这个用户界面,像浏览器帮助人们访问网络一样,ChatGPT实现了类似科幻电影中人工智能与人交流的场景,人们找到了可以便捷使用人工智能的方式,这也是它为什么能够爆火的原因。

ChatGPT并不是技术本身的变革,而是人工智能技术不断发展过程中的一次产品化尝试,是一次典型的集成式创新。它应用AI发展多年的技术储备,去满足当前人们在娱乐交流、知识学习方面的需求,虽然能提供非常详尽的答案,但是仍需警惕信息的准确性、AI伦理、算法偏见、版权侵犯等问题。更值得关注的是,ChatGPT能形成大热的核心亮点、产品思维、可工业化落地的应用场景,以及其大模型本身具有的局限和国内环境应用的安全风险。

一、封面传媒AI技术的发展历程与应用探索

封面传媒从2015年10月28日成立以来,以“构建引领人工智能时代的泛内容生态平台”为愿景,紧盯前沿技术,发力人工智能,坚定地朝着“AI+媒体”领域进军。

(一)钻研机器写作,多个领域的速报写作已形成规模

封面传媒对AI技术的探索,从对机器写作的探究开始,最初以生活资讯类的写作为试点,为用户即时提供与衣食住行相关的资讯。封面新闻的首条机器写作稿件,在2016年12月20日面世,内容是当日成都的打折资讯。此后,针对各类天气预警、灾害报道进行了专门研究,一方面提升内容丰富度和叙事逻辑性,另一方面提升写稿速度。四川青川发生5.4级地震时,小封机器人仅用8.09秒就完成近1300字的地震速报写作,内容包括速报参数、震中地形、周边村镇、周边县区、历史地震、震中简介、震中天气,并配有相关图片。随后,不断拓展写稿领域,封面新闻设立小封专栏,月平均发稿量超过 10 万篇,写稿领域涉及体育、财经、生活、科技等10大类和40多个小类。其中,在2018年世界杯赛期间,小封机器人总共推送世界杯机器写作的报道600多篇,全网总阅读量超过2亿。

多位媒体专家学者都对封面传媒的智能写稿技术予以高度评价。中国人民大学新闻与传播学院教授、博士生导师彭兰在《智能时代的新内容革命》一文中称小封机器人为“国内智能化写作的领先者之一”;北京大学国家战略传播研究院院长程曼丽在第四届海外华文新媒体高峰论坛上表示,“机器人小封等人工智能应用在新媒体中实现了临场化新闻”;著名诗人周瑟瑟称其“一直在关注小封机器人的成长和发展,原来其诗歌写作是小学生水平,现在应该已经到了大学生水平”。

(二)尝试互动创新,升级用户“视听读聊”体验

早在封面新闻推出3.0版本时,小封机器人1.0上线,主打“聊新闻”功能。小封机器人采用高准确率的语音识别技术,能够通过语音和文本聊天的方式,结合语义识别和自然语言处理技术,基于用户兴趣和平台新闻、生活资讯,与用户展开互动。产品的关键点在交流上,以期在极短时间内为用户提供所需要的内容,并且让用户在这个过程中感受到乐趣。这是封面技术团队对全新用户交互形态的一次积极探索。

目前封面新闻客户端迭代至8.0版本,除了小封机器人这位“常驻嘉宾”,封面新闻客户端中用户视、听、读、聊各个场景中,都融入了人工智能技术的应用,如推出“听”模式,智能生成文章摘要并自动生成语音播报,满足用户开车、通勤等场景“听新闻”的需求。在世界杯、奥运会期间,封面新闻设立特色频道,应用知识图谱技术,为用户展现运动员、场馆、比赛等相关延展知识。用户还可订阅关注的比赛,能第一时间收到小封撰写的比赛结果速报。

(三)赋能内容生产,实现策采编审发全流程智能化

封面传媒打造的封巢智媒体系统,以人工智能技术为支撑,涵盖“智能技术平台+智慧内容平台+智识管理平台”,重构内容生产流程,实现基于大数据的传播效果分析与绩效考核,并通过组件化的应用创新,不断延展应用场景。封巢智媒体系统经历了1.0至4.0版本的迭代升级,已在关键业务领域中实现了新技术与媒体痛点的精准对接,通过智能技术全链路支撑策采审编发效率提升。

在线索策划环节,封巢智媒体系统基于海量新闻线索的实时采集、清洗、结构化和标签化入库,同时通过智能算法对线索进行热度计算,最终形成有价值、层次清晰的新闻线索供给记者和编辑选用。

在审核环节,封巢智媒体系统应用封面技术团队自主研发的智媒审核云,实现对封巢9大系统、36项功能位,以及文本、图片、视频、音频方面的智能安全审核。将智能审校内嵌入文章、评论、用户资料、用户动态等内容发布环节,将界面融为一体,审校过程无感知,让安全辅助无压力。

在发布环节,封巢智媒体系统实现了从人工发布到机器自动发布再到智能发布的进化。通过智能标签体系,建立文章与频道多对多关系而实现高效、高覆盖面的发布机制,打破了人工界定的频道与文章的关系壁垒。引入对文本做向量化处理的BERT模型,以及训练数据的MLP全连接神经网络,并辅以分层式的过滤规则,经过对60多万条文章数据的整理分析,并通过6轮测试和算法调优,准确率从51.2%提升至88.8%,之后再次提升至99.2%。

(四)延展应用场景,助力用户运营与营销活动。

小封机器人最早的应用场景是在2017年七夕主办的“AI人工智能相亲会”。结合单身男女的基本资料,通过人脸匹配、推荐算法等技术,为用户挑选最为匹配的相亲对象。此后,封面传媒连续三年推出“高考志愿小助手”,利用教育大数据、神经网络算法等技术,为高考志愿填报提供智能化服务。在连续多届的乐至“田园诗会”活动上,小封机器人作为实体出现,与现场的小学生比赛写诗。小封写的诗兼具现代诗和古体诗风格,目前诗歌学习总量超过50万首, 2019年出版了 AI 诗集《万物都相爱》。在2022年6月8日举办的AI+智媒科技大会上,小封展示了为活动定制的AI画作NFT数字藏品。

(五)拓展输出版图,面向更广泛领域提供服务

随着封面传媒AI技术的进化,产品体系日益成熟,不断拓展应用版图,已建成包括海南和黑龙江两大省级融媒体平台,向北京、江苏、辽宁、上海等地输出30余个数字化服务项目,涉及党建、 政务、媒体、司法、网信、教育、文博、数字经济等多个领域。结合不同场景不同定位,小封机器人变身为大川、小科、小新、汉风小子、江小潮、时小刻等机器人,为各类用户提供服务。例如,小科作为智能导游,连续三年在中国(绵阳)科技城国际科技博览会云展馆中,为参展用户提供参观导览、展品推荐、路线规划、问题解答等服务。

二、智媒体建设中的三大难题和解决方案

一是个性算法与用户隐私的问题。人工智能的发展依靠数据的积累,千人千面的算法体验,建立在对用户信息及其内容消费行为的预测之上。但是,对个人信息可以使用的程度,并没有清晰的界限。封面新闻客户端通过隐私声明等方式得到用户的授权,只对用户的信息进行向量匹配,并不收集原始信息,这样可以大体解决用户隐私方面的问题。

二是推荐算法与专业编辑平衡的问题。智能算法能够根据用户的喜好,持续为用户提供感兴趣的内容,以得到良好的用户体验,但智能算法也不断爆出传播伦理问题。这些传播伦理方面的问题对公民的价值判断、社会的公序良俗等提出新的挑战,即便是现在爆火的ChatGPT依然存在此类现象。封面传媒通过专业编辑来解决部分问题,既要提升算法透明度,建立算法问责制,又要做好智能算法与专业编辑的平衡阀,将社会责任和正确的价值导向纳入内容把关范畴,推动智能内容生态的良性发展。

三是内容生产质量与可信度的问题。目前类似于机器写作的应用一般有两种实现方式,一种基于BERT,它更擅长处理自然语言理解类任务,类似于做完型填空,因此整体内容生产覆盖的业务领域很有限。ChatGPT爆火之后这类基于大模型的内容生成看上去更加自然和真实,但是真实性和可信度又很难得到验证。OpenAI公司2019年就开发一款可生产假新闻的人工智能工具,生成的假新闻基本可以以假乱真。封面传媒通过增加对行业的精细化定制,再增加AI审核机制,来解决质量和可信度方面的问题。

三、封面传媒布局四大AI新赛道

(一)立足泛媒体行业,建立技术框架

封面传媒根植媒体领域业务的需求、痛点和趋势,专注媒体认知智能底层算法研发,探索未来媒体技术。2023年,将重点布局AIGC等内容科技赛道,建设以内容创作、内容质量判断、内容分发、内容传播为主的主流媒体智能算法平台,逐步形成媒体领域通用智能化解决方案,不仅将升级扩展封面AI算法生态,同时应用于多家融媒体的AI智能化融合转型。

封面传媒将整体的技术框架立足泛媒体行业,基于主流价值观体系理论框架,建立并利用特定场景与主题下全媒体数据主流价值观标签体系,设计与媒体内容传播、内容标签体系相一致的全媒体数据主流价值观评价计算方法。融合全网数据及海量历史数据,挖掘以内容库、专家库、用户库、语料库、实体库、敏感库、领域知识图谱等为核心的知识中台,研发以深度学习、机器学习、强化学习为基础的文本、图片、音频、视频多模态内容分析理解技术,建立多层次、多维度的主流价值观理论体系,构建聚焦媒体领域创作、质量、分发、传播全业务场景的全链条算法生态,建设一批具有行业领先优势、市场示范效应、社会广泛影响的媒体融合算法应用标杆项目。

(二)布局AIGC赛道,形成智能化解决方案

封面技术团队立足泛媒体领域需求,研发基于深度学习、机器学习、强化学习的多模态内容理解技术,建设主流媒体算法生态,形成泛媒体领域通用的智能化解决方案。重点建设AIGC内容创作平台、内容质量评价系统和内容传播分析系统。

智能内容创作平台。基于业务数据和知识中台,研发以自然语义理解、自然语言生成为核心的智能文本生成算法;以语音识别、自然语义理解、自然语言生成、语音合成、视频结构化为核心的智能视频生成算法;基于大模型架构,研发文生图等跨模态生成产品,探索类ChatGPT的会话式内容创作应用场景。

内容质量评价系统。基于敏感知识库及多模态内容理解技术,研发涵盖文本、图像、视频、音频的内容审核算法;基于语义理解和党政领域知识,研发包括基础校对、政治校对的智能文本校对算法;基于全网实时数据及多模态内容理解技术,研发热点发现追踪算法;基于行为交互分析和主流价值挖掘,研发新闻价值判断算法。融合内容审核、智能文本校对、热点发现追踪、新闻价值判断算法,构建审核、校对、价值判断一体的内容质量评价系统。

内容传播分析平台。以智能合约、共识、哈希、公钥密码等算法为基础,研发聚焦媒体的区块链版权交易算法;以相关分析、对应分析、聚类分析、因子分析为核心,研发多维度用户阅读行为分析算法;基于全网实时数据,以分类聚类、线性和非线性、时间序列以及决策树算法为核心,研发涵盖时间、情感、网友讨论度、主题等多维度的舆情分析算法。聚合媒体区块链、用户阅读行为分析、舆情分析算法,结合搭建内容传播分析平台。

(三)研发流程标准化,从数据到应用落地

封面传媒的AI技术建设研究分阶段进行。先进行历史数据和算法的清洗汇总合并,然后基于业务规则和知识整理抽取融合,建立知识中台以及算法中台,接下来进行多模态中的技术攻坚,比如知识挖掘、多模态内容理解、新闻内容理解、媒体领域文本敏感审核等技术的实现,最后完成应用落地。

(四)拓展“科技文化”朋友圈,打造技术合作生态

封面传媒重视高层次创新人才平台建设,推进科技创新成果产业化,以提升核心竞争力。目前已与多家单位达成合作共建研究院和实验室,包括与微软、新华网未来媒体研究院、北京师范大学等,共同成立人工智能和未来媒体实验室,建立媒体人工智能及媒体技术研究与合作平台,促进媒体行业融合发展和智能化创新应用;与中译语通合作成立CGI媒体应用实验室,致力于在商业垂直领域做好大数据媒体榜单应用等。

四、ChatGPT 带给媒体领域AI建设的启示

智媒体建设充满挑战。如何体现价值主导技术解决算法偏差,如何解决AI在媒体领域的场景落地,如何解决AI技术的使用成本问题,如何解决模型在媒体领域应用中的实时性问题,如何解决AI带来的可信度问题……封面技术团队在不断尝试与积累中寻找答案。

ChatGPT也带来很多启示。一是高价值业务场景的挖掘、清晰的产品定位、明确的能力边界,才是智能化产品成功落地的关键因素;二是大一统的模型架构和算法思维,一改之前每个行业都需要一种模型然后在前端进行整合的模式,可能是我们走向通用人工智能的开始,要做好模型层和应用层的整合及业务适配;三是基于GPT的提示学习范式、高效自然的模型交互使用方式、侧重人类偏好的学习等,会很好地提高AI类产品的智能化表现,可以广泛应用到内容生成和问答交互等场景中。

在媒体领域具体应用方面,可以作为辅助性工具赋能媒体多业务场景,也可借鉴其核心算法和产品思维,指导相关智能化功能升级。可以利用生成能力提高媒体内容生产效率,让编辑人员更专注于观点和价值的输出;可以在C端进行娱乐化应用,实现传播引流的效果提升。

ChatGPT的出现,将加快封面传媒在“AI+媒体”领域的研发进程,而近期最为重要的机会就是AIGC在媒体业内的应用。当前ChatGPT的主要呈现方式还局限于文字,但是通过针对行业的模型定制、上层应用的开发,可以提供图片、短视频、音频多种媒介形态,来弥补ChatGPT现有体验中的不足。

作者程悦系封面传媒首席产品官兼总经理助理,四川日报报业集团青年首席工程师

作者王子健系封面传媒首席架构师兼数据研究部总监,四川日报报业集团特聘首席工程师

作者张华系封面传媒总经理、技术委员会主任

参考文献:

[1] 李鹏.都市报融合转型下一站:智媒体[J].传媒,2017,12.

[2] 刘静,周国超,程悦.封巢全业务链路的智能化设计[A].中国新闻技术工作者联合会2021年学术年会论文集,2021,08.

[3]徐桢虎.看封面新闻打造智能机器人IP有哪些经验[J].中国传媒科技,2023,2.


实习编辑 吴昕圆  审读 李 诚   审核 刁瑜文

免责声明
未经许可或明确书面授权,任何人不得复制、转载、摘编、修改、链接读特客户端内容
推荐阅读
读特热榜
IN视频
鹏友圈

首页