网站首页
Portal
社区首页
BBS
精选导读
AI理想国
发帖
GLM-5架构曝光,智谱两日涨近60%:采用DeepSeek同款稀疏注意力
493
1
冬烛
Lv.1
2026-2-11 21:56:39
发表在
科技资讯
|
查看全部
阅读模式
不管Pony Alpha是不是智谱的,下一代旗舰大模型GLM-5都要来了。
GitHub代码确认,新一代架构细节曝光。
GLM-5采用了DeepSeek-V3/V3.2架构,包括稀疏注意力机制(DSA)和多Token预测(MTP),总参数量745B,是上一代GLM-4.7的2倍。
与此同时,OpenRouter平台上突然出现的神秘匿名模型「Pony Alpha」,编程和推理能力极为强劲,被社区91%以上的用户判断为GLM-5测试版。
受这些消息影响,智谱AI港股两日暴涨60%。
开源代码泄露参数架构
GLM-5的架构信息并非来自智谱官方,而是被开源社区从代码提交中“挖”出来的。
在vLLM推理框架的PR中,开发者发现GLM-5的实现逻辑被直接映射到了DeepSeek-V3的组件上。
GLM-5继承的第一项核心技术是DeepSeek稀疏注意力(DeepSeek Sparse Attention,DSA)。
DSA通过两阶段流程做到长文本处理效率大幅提升,输出质量几乎不受影响。
首先由Lightning Indexer轻量级组件快速扫描所有历史token并打分,评估它们与当前query token的相关性;然后只挑选得分最高的Top-k个token进行完整的注意力计算,其余全部跳过。
第二项技术是多Token预测(Multi-Token Prediction,MTP),用于提升模型的生成效率。
从代码中推断出的架构参数看,GLM-5包含78层隐藏层,采用MoE(混合专家)架构,共256个专家,每次推理激活8个,激活参数约44B,稀疏度5.9%,与DeepSeek-V3.2的5.4%基本持平。
上下文窗口支持最高202K token。
有开发者指出,复用DeepSeek架构意味着GLM-5可以直接受益于vLLM、SGLang等推理框架已有的优化,部署门槛会更低。
但也有人提出疑问:DeepSeek-V3架构以纯文本为主,GLM-5首发版本是否会因此缺失多模态能力?
匿名测试与春节档大混战
2月初,OpenRouter平台上新匿名免费模型,代号「Pony Alpha」,支持200K上下文窗口。
模型一上线就引起了开发者社区的广泛关注,它的编程能力非常突出,能根据单条提示直接生成完整的功能性应用程序,在复杂推理和Agent工作流上同样表现出色。
“这到底是谁家的模型”迅速成为社区热议话题。
指向GLM-5的证据链覆盖了多个维度:
时间上,「Pony Alpha」出现的节点与智谱首席科学家唐杰多次暗示的GLM-5发布窗口完全吻合。
有开发者测试发现该模型对特定token的反应和GLM系列一致。
风格上,它的输出排版习惯也与GLM系列高度一致。
GLM-5的发布窗口,恰好撞上了一个异常拥挤的档期。
唐杰在内部信中已明确预告GLM-5即将发布,多方信息指向2026年2月中旬,即春节前后。
而在同一时间段,DeepSeek新模型、Qwen 3.5、MiniMax M2.2等模型也都有消息将发布更新。
2026年的“春节档”,AI比电影那边还热闹。
https://www.qbitai.com/2026/02/378315.html
GLM-5
回复
转播
分享
举报
电梯直达
全部评论
1
uuoo
Lv.2
沙发
2026-2-11 22:22:22
|
查看全部
期待,GLM-4.7版灰常好用!
回复
举报
回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
猜你喜欢
天使羽毛1
2025-11-03
谷歌浏览器:2026 年将默认弹窗警告 HTTP 连接不安全
原标题:谷歌浏览器Chrome:强制HTTPS访问 2026 年将默认弹窗警告 HTTP 连接不安全 根据科技媒体 bleepingcomputer 10 月 28 日报道,谷歌计划自 2026 年 10 月发布的 Chrome 154 版本起,默认开启“始终使用安全连接”功能。这意味
人工智能
4
969
0
superman
2021-10-24
layui倒下了,前端框架三分天下的局面算定了吗?
layui退场了,vue、react、angular三足鼎立,jquery瑟瑟发抖。
日常吐槽
4
12659
1
superman
2021-10-24
今天程序员节,程序员们,嗨起来~
论坛上的程序员盆友,包括我,咱们的节日到了,庆祝一下吧。
日常吐槽
3
9316
1
simonzhd
2022-09-15
年届中年,简短回顾一下我滴程序猿之路
其实算起来我算是一个野路子程序猿,虽然现在已经以php程序猿的身份工作了1年多,但骨子里还是认为自己是一个野生的站长。 我年龄已界中年,在2001年就开始捣鼓网站,并拥有了第一个自己域名的独立网站,想想还是挺像那么回事的在网络
日常吐槽
3
5328
1
胶囊
2025-10-08
2025诺贝尔物理学奖颁给了谷歌量子计算机打造者
刚刚,诺贝尔物理学奖揭晓! 今年颁给了量子力学领域的三位科学家John Clarke、Michel H. Devoret和John M. Martinis,以表彰他们: 在电路中发现宏观量子力学隧穿效应和能量量子化现象。 详细:https://www.163.com/dy/article/K
人工智能
3
669
0
天使羽毛1
2025-10-12
马云、张一鸣,都回来搞AI了
原标题:马云、张一鸣,都回来了 这些一度淡出公众视野的中国一代、二代互联网企业家,在2025年不约而同选择“归来”,重新站到聚光灯下。他们的每一次现身,都被外界解读为企业战略转向的重要信号,也共同预示着,在AI技术浪潮
人工智能
2
577
0
superman
2026-03-17
警惕 AI 智能体原生风险:国家安全部发布 OpenClaw“龙虾”安全养殖手册
OpenClaw 是一款开源 AI 智能体工具,上线不久便迅速成长为 2026 年度现象级“开源奇迹”。不少用户从付费安装“龙虾”,到付费卸载“龙虾”,养“龙虾”正在成为一场智能体的狂欢。 警惕 AI 智能体原生风险:国家安全部发布 OpenClaw“
人工智能
2
307
1
simonzhd
2026-03-14
新设备Mac Studio
Mac mini没货,买了这个升级版。
兴趣交流
2
334
0
superman
2021-10-27
织梦CMS发布维权公告,将对侵权网站提起诉讼
10月26日,上海卓卓网络科技有限公司织梦CMS发布侵权网站清单及维权公告,将对侵权网站提起诉讼。织梦CMS称:即日起,我司将分批向维权团队移交侵权网站清单及存证数据,未按沟通涵要求支付上述款项的网站,将提起诉讼,而未移交维权团队
人工智能
2
9757
0
simonzhd
2025-10-19
美国网络攻击我国
(原标题:美国网攻我国大案侦破) 近期,国家安全机关破获一起美国重大网络攻击案,掌握美国国家安全局网络攻击入侵中国国家授时中心的铁证,粉碎美方网攻窃密和渗透破坏的图谋,全力守护“北京时间”安全。 美国安局多次利用窃取的
日常吐槽
2
560
0
冬烛
Lv.1 新手上路
3
主题
0
回帖
24
积分
+ 关注
发消息
热帖推荐
换一批
梁文锋:DeepSeek V4 将于 4 月下旬正式发
各位每天喝水多吗?
宇树机器人跑出 10m/s 刷新世界纪录,逼近
a5sh社区招各板块斑竹~
不造车的华为赢麻!当前已有35款车搭载乾崑
问界M9成为十四五成就展唯一入选新能源车
以玫瑰之柔,以铸利剑锋
到底想干嘛
如何看待张雪机车 820rr 在 wsbk 葡萄牙站
情绪价值越来越值钱了
现在网上社区真的人气很低落
很好玩的一则新闻,大家可以看看
大家下班后或业余时间都喜欢做啥
张雪峰猝死想到的点滴
DDR4 8GB 价格达一年前 8.8 倍
警惕 AI 智能体原生风险:国家安全部发布 O
一个25年老站长的碎碎念
现在人工智能迭代太快了,都不敢轻易入手各
科技:是人类的拐杖,而非灵魂的方向
新设备Mac Studio
刚在美国赔了 1.5 亿美元,Adobe 又遭英国
央视 3·15 晚会曝光 AI 大模型被投毒,给
有谁用过大龙虾了~
A5sh社区转型为泛科技生活论坛
最新热评
加载中...
关灯
在本版发帖
QQ客服
返回顶部
快速回复
返回顶部
返回列表