3月21日深夜,腾讯混元宣布,正式推出自研深度思考模型混元T1正式版。
在体现推理模型基础能力的常见benchmark上,如大语言模型评估增强数据集MMLU-PRO中,混元T1取得87.2分,仅次于o1。在CEval、AIME、Zebra Logic等中英文知识及竞赛级数学、逻辑推理的公开基准测试中,混元T1的成绩也达到业界领先推理模型的水平。
此前,腾讯宣布,混元大模型首次登上Chatbot Arena榜单,跻身全球Top 15。用户在该平台上以匿名方式与多个模型互动,投票决定何种模型更佳,从而根据分数生成排行榜。这种测评也被看成是大模型直接 PK 的竞技场,简单直接。
去年9月5日,腾讯发布了新一代大模型混元Turbo,采用MoE架构,比上一代产品推理效率提升100%,推理成本降低50%。
在本月1日发布的腾讯元宝电脑版App中则是内置了混元和DeepSeek两种模型,支持双模切换。
编辑 黄力雯 审读 郭建华 二审 李怡天 三审 郑蔚珩