腾讯混元2.0开启内测,推理性能自称“国内第一梯队”

256 0
2025-12-8 21:25:10 发表在 AI资讯| 查看全部 阅读模式
  406B参数空降!腾讯混元2.0开启内测,推理性能自称“国内第一梯队”

  12月5日,腾讯正式发布新一代自研大模型——混元2.0(Tencent HY2.0),包括Think(推理增强版)与Instruct(指令遵循版)两个版本,总参数406B、激活32B,支持256K上下文窗口,官方宣称数学、科学、代码等复杂推理任务“稳居国内第一梯队”。模型已同步上线腾讯云API,并在元宝、ima等原生应用中灰度放量。

  MoE架构+长窗口RL,推理成绩刷新公开榜单

  - 采用混合专家(MoE)架构,实测单卡A100推理速度较Dense结构提升40%

  - 在国际数学奥林匹克(IMO)2025公开题、哈佛-MIT数学竞赛中,HY2.0Think版准确率分别达83.1%与81.7%,超过GPT-4o78.9%的成绩

  -256K长窗口通过“分段采样修正”解决训练-推理不一致问题,10万Token文档QA任务F1提升6.8%

  指令遵循多轮对话优化

  - 引入可验证任务+评分式强化学习,Instruct版在Multi-Round MT-Bench上得分8.42,超过同规模模型0.3分

  - 支持Function Call、Json Mode与Tool Use,官方实测100轮工具调用成功率97.2%

  落地加速:元宝、ima、腾讯云三线并进

  - 元宝App已灰度上线“HY2.0Think”切换键,提供数学推导与代码解释两种场景

  - ima会议助手接入256K长文本总结,5万Token会议纪要生成耗时<15秒

  - 腾讯云API定价0.8元/百万Token输入、2元/百万Token输出,约为GPT-4o的45%,支持企业私有化部署

  开源计划:模型+数据+工具链三箭齐发

  腾讯透露,2026Q1将开源HY2.0Base权重、200GB中文预训练数据及长窗口RL工具链,继续推动国产大模型生态。

  行业观察:参数竞赛进入“400B+”时代

  随着混元2.0、Llama3.1-405B、Moonshot400B相继发布,国产大模型正式跨入400B参数俱乐部。腾讯强调“不与开源社区抢参数,而是把推理与工具能力做深”,能否凭借MoE架构+RL策略在成本侧胜出,仍需观察开发者生态与实际落地规模。AIbase将持续跟踪后续开源进展与性能评测。

回复 转播 分享

举报

回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

猜你喜欢
    https://i5qd.51xqx.com/a5sh20251007/data/attachment/block/25/25a412de2891482301b9d17ca28996e2.jpg400250 原标题:谷歌浏览器Chrome:强制HTTPS访问 2026 年将默认弹窗警告 HTTP 连接不安全   根据科技媒体 bleepingcomputer 10 月 28 日报道,谷歌计划自 2026 年 10 月发布的 Chrome 154 版本起,默认开启“始终使用安全连接”功能。这意味
  • 2025-11-03
    {var4}
    {var1} {var6}
  • https://i5qd.51xqx.com/a5sh20251007/data/attachment/block/60/60b3b79ad53c569b31b30e03341a3ad1.jpg400250 layui退场了,vue、react、angular三足鼎立,jquery瑟瑟发抖。
  • 2021-10-24
    {var4}
    {var1} {var6}
  • https://i5qd.51xqx.com/a5sh20251007/data/attachment/block/2f/2f8410d47cd900c94d320cfd8147c68c.jpg400250 刚刚,诺贝尔物理学奖揭晓! 今年颁给了量子力学领域的三位科学家John Clarke、Michel H. Devoret和John M. Martinis,以表彰他们: 在电路中发现宏观量子力学隧穿效应和能量量子化现象。 详细:https://www.163.com/dy/article/K
  • 2025-10-08
    {var4}
    {var1} {var6}
  • https://i5qd.51xqx.com/a5sh20251007/data/attachment/block/2b/2bfe7a70ebe2a063efb0076191d0a3ed.jpg400250 论坛上的程序员盆友,包括我,咱们的节日到了,庆祝一下吧。
  • 2021-10-24
    {var4}
    {var1} {var6}
  • https://i5qd.51xqx.com/a5sh20251007/data/attachment/block/5f/5feb70ced0cf017bcb2ed4edb3e896bc.jpg400250 其实算起来我算是一个野路子程序猿,虽然现在已经以php程序猿的身份工作了1年多,但骨子里还是认为自己是一个野生的站长。 我年龄已界中年,在2001年就开始捣鼓网站,并拥有了第一个自己域名的独立网站,想想还是挺像那么回事的在网络
  • 2022-09-15
    {var4}
    {var1} {var6}
  • https://i5qd.51xqx.com/a5sh20251007/data/attachment/block/29/29fea142eba1c7ae558122bb8e0e335e.jpg400250 每天睡觉前都会刷抖音,为什么几亿人同时刷抖音,依然可以做到非常流畅呢? 首先来了解一下什么是服务器和带宽。 服务器: 服务器也称伺服器,是提供计算服务的设备,由处理器、硬盘、内存、系统总线构成,其处理能力、稳定性、可靠
  • 2022-09-14
    {var4}
    {var1} {var6}
  • https://i5qd.51xqx.com/a5sh20251007/data/attachment/block/1d/1db97e1b7518cc507106c8c137bc87ac.jpg400250   IT之家 10 月 22 日消息,据《商业内幕》今日报道,OpenAI 正式向谷歌 Chrome 发起挑战,并推出首款浏览器产品 ChatGPT Atlas,这是 OpenAI 进军竞争激烈的网页浏览器市场的首款产品。消息公布后不久,谷歌 Chrome 母公司 Alphabet
  • 2025-10-22
    {var4}
    {var1} {var6}
  • https://i5qd.51xqx.com/a5sh20251007/data/attachment/block/a5/a57d7cc5953d042e3f2b9390e4e0ff85.jpg400250   eSIM手机来了,移动联通电信均开通   记者10月13日获悉,中国联通、中国移动官方公众号当日晚间先后官宣,已正式获得开展eSIM手机运营服务商用试验的批复。另据新华社当晚报道,中国电信获得工信部eSIM手机商用试验批复许可,eS
  • 2025-10-14
    {var4}
    {var1} {var6}
  • https://i5qd.51xqx.com/a5sh20251007/data/attachment/block/d5/d571cae6ba6a843f4cf27c1063edcffc.jpg400250 国内某大虾研究两年的画人像算法,这细腻度得给电脑一个9级素描证吧
  • 2021-10-30
    {var4}
    {var1} {var6}
  • https://i5qd.51xqx.com/a5sh20251007/data/attachment/block/d3/d36505e417ddf506a0aae8855fa43dd6.jpg400250 原标题:马云、张一鸣,都回来了   这些一度淡出公众视野的中国一代、二代互联网企业家,在2025年不约而同选择“归来”,重新站到聚光灯下。他们的每一次现身,都被外界解读为企业战略转向的重要信号,也共同预示着,在AI技术浪潮
  • 2025-10-12
    {var4}
    {var1} {var6}
热帖推荐换一批
关灯 在本版发帖
扫一扫添加微信客服
QQ客服返回顶部
快速回复 返回顶部 返回列表