网站首页
Portal
社区首页
BBS
精选导读
AI理想国
发帖
GLM-5架构曝光,智谱两日涨近60%:采用DeepSeek同款稀疏注意力
829
1
冬烛
Lv.1
2026-2-11 21:56:39
发表在
科技资讯
|
查看全部
阅读模式
不管Pony Alpha是不是智谱的,下一代旗舰大模型GLM-5都要来了。
GitHub代码确认,新一代架构细节曝光。
GLM-5采用了DeepSeek-V3/V3.2架构,包括稀疏注意力机制(DSA)和多Token预测(MTP),总参数量745B,是上一代GLM-4.7的2倍。
与此同时,OpenRouter平台上突然出现的神秘匿名模型「Pony Alpha」,编程和推理能力极为强劲,被社区91%以上的用户判断为GLM-5测试版。
受这些消息影响,智谱AI港股两日暴涨60%。
开源代码泄露参数架构
GLM-5的架构信息并非来自智谱官方,而是被开源社区从代码提交中“挖”出来的。
在vLLM推理框架的PR中,开发者发现GLM-5的实现逻辑被直接映射到了DeepSeek-V3的组件上。
GLM-5继承的第一项核心技术是DeepSeek稀疏注意力(DeepSeek Sparse Attention,DSA)。
DSA通过两阶段流程做到长文本处理效率大幅提升,输出质量几乎不受影响。
首先由Lightning Indexer轻量级组件快速扫描所有历史token并打分,评估它们与当前query token的相关性;然后只挑选得分最高的Top-k个token进行完整的注意力计算,其余全部跳过。
第二项技术是多Token预测(Multi-Token Prediction,MTP),用于提升模型的生成效率。
从代码中推断出的架构参数看,GLM-5包含78层隐藏层,采用MoE(混合专家)架构,共256个专家,每次推理激活8个,激活参数约44B,稀疏度5.9%,与DeepSeek-V3.2的5.4%基本持平。
上下文窗口支持最高202K token。
有开发者指出,复用DeepSeek架构意味着GLM-5可以直接受益于vLLM、SGLang等推理框架已有的优化,部署门槛会更低。
但也有人提出疑问:DeepSeek-V3架构以纯文本为主,GLM-5首发版本是否会因此缺失多模态能力?
匿名测试与春节档大混战
2月初,OpenRouter平台上新匿名免费模型,代号「Pony Alpha」,支持200K上下文窗口。
模型一上线就引起了开发者社区的广泛关注,它的编程能力非常突出,能根据单条提示直接生成完整的功能性应用程序,在复杂推理和Agent工作流上同样表现出色。
“这到底是谁家的模型”迅速成为社区热议话题。
指向GLM-5的证据链覆盖了多个维度:
时间上,「Pony Alpha」出现的节点与智谱首席科学家唐杰多次暗示的GLM-5发布窗口完全吻合。
有开发者测试发现该模型对特定token的反应和GLM系列一致。
风格上,它的输出排版习惯也与GLM系列高度一致。
GLM-5的发布窗口,恰好撞上了一个异常拥挤的档期。
唐杰在内部信中已明确预告GLM-5即将发布,多方信息指向2026年2月中旬,即春节前后。
而在同一时间段,DeepSeek新模型、Qwen 3.5、MiniMax M2.2等模型也都有消息将发布更新。
2026年的“春节档”,AI比电影那边还热闹。
https://www.qbitai.com/2026/02/378315.html
GLM-5
回复
转播
分享
举报
电梯直达
全部评论
1
uuoo
Lv.2
沙发
2026-2-11 22:22:22
|
查看全部
期待,GLM-4.7版灰常好用!
回复
举报
回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
猜你喜欢
天使羽毛1
2025-11-03
谷歌浏览器:2026 年将默认弹窗警告 HTTP 连接不安全
原标题:谷歌浏览器Chrome:强制HTTPS访问 2026 年将默认弹窗警告 HTTP 连接不安全 根据科技媒体 bleepingcomputer 10 月 28 日报道,谷歌计划自 2026 年 10 月发布的 Chrome 154 版本起,默认开启“始终使用安全连接”功能。这意味
人工智能
4
1660
0
superman
2021-10-24
layui倒下了,前端框架三分天下的局面算定了吗?
layui退场了,vue、react、angular三足鼎立,jquery瑟瑟发抖。
日常吐槽
4
13341
1
天使羽毛1
2026-06-07
天涯社区回归首日因访问量过大崩溃,前执行总编回应
6月1日,停摆三年的天涯社区正式宣布恢复访问,昔日盛极一时的中文网络社区重新归来。 然而时代早已变迁,这次重启也不那么顺利,因访问量过大,导致网页卡顿甚至访问失败。 一代人的精神家园 天涯社区,是一代人的
站长圈
4
270
0
superman
2021-10-24
今天程序员节,程序员们,嗨起来~
论坛上的程序员盆友,包括我,咱们的节日到了,庆祝一下吧。
日常吐槽
3
9851
1
simonzhd
2022-09-15
年届中年,简短回顾一下我滴程序猿之路
其实算起来我算是一个野路子程序猿,虽然现在已经以php程序猿的身份工作了1年多,但骨子里还是认为自己是一个野生的站长。 我年龄已界中年,在2001年就开始捣鼓网站,并拥有了第一个自己域名的独立网站,想想还是挺像那么回事的在网络
日常吐槽
3
5812
1
胶囊
2025-10-08
2025诺贝尔物理学奖颁给了谷歌量子计算机打造者
刚刚,诺贝尔物理学奖揭晓! 今年颁给了量子力学领域的三位科学家John Clarke、Michel H. Devoret和John M. Martinis,以表彰他们: 在电路中发现宏观量子力学隧穿效应和能量量子化现象。 详细:https://www.163.com/dy/article/K
人工智能
3
1211
0
胶囊
2021-10-30
惊了,电脑算法能画出如此细腻的人像!
国内某大虾研究两年的画人像算法,这细腻度得给电脑一个9级素描证吧
科技资讯
2
9011
0
天使羽毛1
2025-10-12
马云、张一鸣,都回来搞AI了
原标题:马云、张一鸣,都回来了 这些一度淡出公众视野的中国一代、二代互联网企业家,在2025年不约而同选择“归来”,重新站到聚光灯下。他们的每一次现身,都被外界解读为企业战略转向的重要信号,也共同预示着,在AI技术浪潮
人工智能
2
973
0
superman
2026-03-17
警惕 AI 智能体原生风险:国家安全部发布 OpenClaw“龙虾”安全养殖手册
OpenClaw 是一款开源 AI 智能体工具,上线不久便迅速成长为 2026 年度现象级“开源奇迹”。不少用户从付费安装“龙虾”,到付费卸载“龙虾”,养“龙虾”正在成为一场智能体的狂欢。 警惕 AI 智能体原生风险:国家安全部发布 OpenClaw“
人工智能
2
967
1
simonzhd
2026-03-14
新设备Mac Studio
Mac mini没货,买了这个升级版。
兴趣交流
2
872
0
冬烛
Lv.1 新手上路
3
主题
0
回帖
24
积分
+ 关注
发消息
热帖推荐
换一批
Fable-5之下,智谱开源的GLM-5.2拿下AI编程
天涯社区回归首日因访问量过大崩溃,前执行
有人看世界杯吗⚽️
Anthropic两款旗舰AI大模型发布仅3天即被禁
情绪价值越来越值钱了
宇树机器人在美买票坐飞机,电池被没收
“没有我就没有OpenAI”,马斯克起诉奥特曼
微软杀毒软件把系统“身份证”当病毒删了
准备做一个关于科技的公众号
现在网上社区真的人气很低落
AI 会让更多人开始独立开发,但不会让更多
梁文锋:DeepSeek V4 将于 4 月下旬正式发
各位每天喝水多吗?
Claude Opus 4.7发布了
宇树机器人跑出 10m/s 刷新世界纪录,逼近
a5sh社区招各板块斑竹~
不造车的华为赢麻!当前已有35款车搭载乾崑
问界M9成为十四五成就展唯一入选新能源车
以玫瑰之柔,以铸利剑锋
到底想干嘛
如何看待张雪机车 820rr 在 wsbk 葡萄牙站
很好玩的一则新闻,大家可以看看
大家下班后或业余时间都喜欢做啥
张雪峰猝死想到的点滴
最新热评
加载中...
关灯
在本版发帖
QQ客服
返回顶部
快速回复
返回顶部
返回列表