续写《三体》、创作新闻、解析数学,百度生成式AI产品文心一言正式发布
深圳特区报记者 周雨萌 文/图
2023-03-16 16:56
收录于专题:飞阅深圳 | 专题

3月16日下午,百度正式发布新一代大语言模型、生成式AI产品文心一言,并展示了其在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。

百度创始人、董事长兼首席执行官李彦宏在会上多次提及,这类大语言模型还远未到发展完善的阶段,进步空间很大,未来这段时间它一定会飞速发展,日新月异。

现场,李彦宏演示了根据对话问题,让文心一言续写知名科幻小说《三体》。只见文心一言提出了五个续写《三体》的建议角度,并准确回答了《三体》作者、电视剧角色扮演者等事实性问题。

在面对“于和伟和张鲁一有哪些共同点”“于和伟和张鲁一谁更高”这类问题,文心一言也基于推理能力得出了正确答案。此外,文心一言还顺利完成了给公司起名、写Slogan和新闻稿的创作任务,体现出其具有对话问答、总结分析、内容创作生成等综合能力。

在此基础上,文心一言还表现出优秀的中文理解及多模态生成能力。例如,其能正确解释成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论,还用“洛阳纸贵”四个字创作了一首藏头诗。

更有趣的是,文心一言能够生成四川话等方言语音。据悉,文心一言的视频生成能力因成本较高,现阶段还未对所有用户开放,未来会逐步接入。

据介绍,文心一言大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等。

应该说,文心一言是百度过去多年投入AI、持续努力的延续。百度首席技术官王海峰道出了其背后的技术。他说,文心一言是新一代知识增强大语言模型,是在ERNIE及PLATO系列模型的基础上研发的。其关键技术包括监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。其中,后三项是百度已有技术优势的再创新,也是文心一言未来越来越强大的基础。

如今,百度也是全球为数不多,在“芯片-框架-模型-应用”四层进行全栈布局的人工智能公司,从高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,到搜索、智能云、自动驾驶、小度等应用,各个层面都有领先的自研技术。

而随着AI市场爆发性的需求增长,文心一言也将释放出前所未有的、指数级的商业价值。会上,李彦宏预测,大语言模型将带来三大产业机会。

第一类是新型云计算公司,其主流商业模式从IaaS变为MaaS,也就是说,文心一言将根本性地改变云计算行业的游戏规则。之前企业选择云厂商更多看算力、存储等基础云服务。未来,更多会看框架好不好、模型好不好,以及模型、框架、芯片、应用这四层之间的协同。

第二类是进行行业模型精调的公司,他们可以基于对行业的洞察,调用通用大模型能力,为行业客户提供解决方案。例如,文心一言已经在电力、金融、媒体等领域发布了10多个行业大模型。

第三类是基于大模型底座进行应用开发的公司,即应用服务提供商。李彦宏断言,基于通用大语言模型抢先开发重要的应用服务,可能是真正的机会。目前,基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景,已经涌现出很多创业明星公司,可能就是未来的新巨头。

目前,百度是全球大厂中第一个做出对标ChatGPT产品的企业。李彦宏指出,无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,没法速成。

文心一言和生成式AI代表了一个新的技术范式,自今年2月百度官宣“文心一言”以来,包括深圳报业集团、金蝶等已有超过650家企业宣布接入文心一言生态。很多企业已经意识到,这种新的技术范式将会影响到千行百业。

“我们相信,人工智能会彻底改变我们今天的每一个行业。AI对各行各业的颠覆性改变才刚刚开始。未来,将会有更多的杀手级应用、现象级产品出现,将会有更多的里程碑事件发生。”李彦宏说。

(原标题《续写〈三体〉、创作新闻、解析数学,百度生成式AI产品文心一言正式发布!》)

编辑 秦涵 审读 吴剑林 二审 张玉洁 三审 余晓泽

(作者:深圳特区报记者 周雨萌 文/图)
免责声明
未经许可或明确书面授权,任何人不得复制、转载、摘编、修改、链接读特客户端内容
推荐阅读
读特热榜
IN视频
鹏友圈

首页