商汤大语言模型应用“商量SenseChat”开放服务
深圳特区报记者 闻坤
2023-08-31 18:16

8月31日,商汤科技日日新大模型旗下自然语言应用“商量SenseChat”正式面向广大用户开放服务。即日起,广大用户可访问https://chat.sensetime.com注册使用,或通过商汤官网访问体验。

商汤“商量SenseChat”今年4月正式推出,是国内最早的基于千亿参数大语言模型之一,并不断迭代更新。目前,基模型为商汤联合多家国内顶级科研机构发布的书生·浦语InternLM-123B,拥有1230亿参数,在语言、知识、理解、推理和学科五大能力上均处于行业领先水平,并在全球51个知名评测集(包括MMLU, AGIEVAL, ARC, CEval, Race, GSM8K等)共计30万道问题集合上测试成绩整体排名全球第二,超过GPT-3.5-turbo以及Meta新发布的LLaMA2-70B等模型,在主要评测中12项成绩超越GPT-4,排名第一。

商量SenseChat背后依托商汤AI大装置SenseCore,其上线GPU数量由2023年3月底的27,000块提升至日前的约30,000块,算力规模提升20%至6 ExaFLOPS,可有效支持语言大模型的训练、升级迭代和服务。

在训练数据方面,商汤每月可产出约2万亿token的高质量数据,支持更加强大的基模型的训练,预计年底高质量数据储备将突破10万亿token。同时,商汤还投入了数百台服务器搭载千卡GPU的计算资源,采用算法结合人工的方法对原始语料数据进行分门别类的精细化清洗,以确保数据的质量、安全性和价值观都符合要求。

截至目前,商汤商量在金融、医疗、汽车、地产、能源、传媒、工业制造等众多垂直行业与超过500家客户建立了深度合作,通过提供多种灵活的API接口和服务,为客户提供大模型的各项AI技术和服务,低门槛、低成本、高效率地实现各类生成式AI应用。

商汤“日日新SenseNova”大模型体系和生成式AI产品系列,包括商量、秒画、如影、琼宇、格物,分别对应着自然语言交互、AI文生图、数字人、3D大场景重建、3D小物体生成这五个主流的生成式AI应用。未来,商汤将依托强大的基模型,以及在算力、数据、算法基础上的积累和丰富Know-how,持续升级商汤日日新大模型体系下的多种生成式AI产品,满足各类用户的需求。

(原标题《商汤大语言模型应用“商量SenseChat”今日起开放服务》)

编辑 刘悦凌 审读 刘春生 二审 张雪松 三审 詹婉容

(作者:深圳特区报记者 闻坤)
免责声明
未经许可或明确书面授权,任何人不得复制、转载、摘编、修改、链接读特客户端内容
推荐阅读
读特热榜
IN视频
鹏友圈

首页