网站首页
Portal
社区首页
BBS
精选导读
AI理想国
发帖
GLM-5架构曝光,智谱两日涨近60%:采用DeepSeek同款稀疏注意力
631
1
冬烛
Lv.1
2026-2-11 21:56:39
发表在
科技资讯
|
查看全部
阅读模式
不管Pony Alpha是不是智谱的,下一代旗舰大模型GLM-5都要来了。
GitHub代码确认,新一代架构细节曝光。
GLM-5采用了DeepSeek-V3/V3.2架构,包括稀疏注意力机制(DSA)和多Token预测(MTP),总参数量745B,是上一代GLM-4.7的2倍。
与此同时,OpenRouter平台上突然出现的神秘匿名模型「Pony Alpha」,编程和推理能力极为强劲,被社区91%以上的用户判断为GLM-5测试版。
受这些消息影响,智谱AI港股两日暴涨60%。
开源代码泄露参数架构
GLM-5的架构信息并非来自智谱官方,而是被开源社区从代码提交中“挖”出来的。
在vLLM推理框架的PR中,开发者发现GLM-5的实现逻辑被直接映射到了DeepSeek-V3的组件上。
GLM-5继承的第一项核心技术是DeepSeek稀疏注意力(DeepSeek Sparse Attention,DSA)。
DSA通过两阶段流程做到长文本处理效率大幅提升,输出质量几乎不受影响。
首先由Lightning Indexer轻量级组件快速扫描所有历史token并打分,评估它们与当前query token的相关性;然后只挑选得分最高的Top-k个token进行完整的注意力计算,其余全部跳过。
第二项技术是多Token预测(Multi-Token Prediction,MTP),用于提升模型的生成效率。
从代码中推断出的架构参数看,GLM-5包含78层隐藏层,采用MoE(混合专家)架构,共256个专家,每次推理激活8个,激活参数约44B,稀疏度5.9%,与DeepSeek-V3.2的5.4%基本持平。
上下文窗口支持最高202K token。
有开发者指出,复用DeepSeek架构意味着GLM-5可以直接受益于vLLM、SGLang等推理框架已有的优化,部署门槛会更低。
但也有人提出疑问:DeepSeek-V3架构以纯文本为主,GLM-5首发版本是否会因此缺失多模态能力?
匿名测试与春节档大混战
2月初,OpenRouter平台上新匿名免费模型,代号「Pony Alpha」,支持200K上下文窗口。
模型一上线就引起了开发者社区的广泛关注,它的编程能力非常突出,能根据单条提示直接生成完整的功能性应用程序,在复杂推理和Agent工作流上同样表现出色。
“这到底是谁家的模型”迅速成为社区热议话题。
指向GLM-5的证据链覆盖了多个维度:
时间上,「Pony Alpha」出现的节点与智谱首席科学家唐杰多次暗示的GLM-5发布窗口完全吻合。
有开发者测试发现该模型对特定token的反应和GLM系列一致。
风格上,它的输出排版习惯也与GLM系列高度一致。
GLM-5的发布窗口,恰好撞上了一个异常拥挤的档期。
唐杰在内部信中已明确预告GLM-5即将发布,多方信息指向2026年2月中旬,即春节前后。
而在同一时间段,DeepSeek新模型、Qwen 3.5、MiniMax M2.2等模型也都有消息将发布更新。
2026年的“春节档”,AI比电影那边还热闹。
https://www.qbitai.com/2026/02/378315.html
GLM-5
回复
转播
分享
举报
电梯直达
全部评论
1
uuoo
Lv.2
沙发
2026-2-11 22:22:22
|
查看全部
期待,GLM-4.7版灰常好用!
回复
举报
回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
猜你喜欢
天使羽毛1
2025-11-03
谷歌浏览器:2026 年将默认弹窗警告 HTTP 连接不安全
原标题:谷歌浏览器Chrome:强制HTTPS访问 2026 年将默认弹窗警告 HTTP 连接不安全 根据科技媒体 bleepingcomputer 10 月 28 日报道,谷歌计划自 2026 年 10 月发布的 Chrome 154 版本起,默认开启“始终使用安全连接”功能。这意味
人工智能
4
1174
0
superman
2021-10-24
layui倒下了,前端框架三分天下的局面算定了吗?
layui退场了,vue、react、angular三足鼎立,jquery瑟瑟发抖。
日常吐槽
4
12958
1
superman
2021-10-24
今天程序员节,程序员们,嗨起来~
论坛上的程序员盆友,包括我,咱们的节日到了,庆祝一下吧。
日常吐槽
3
9515
1
simonzhd
2022-09-15
年届中年,简短回顾一下我滴程序猿之路
其实算起来我算是一个野路子程序猿,虽然现在已经以php程序猿的身份工作了1年多,但骨子里还是认为自己是一个野生的站长。 我年龄已界中年,在2001年就开始捣鼓网站,并拥有了第一个自己域名的独立网站,想想还是挺像那么回事的在网络
日常吐槽
3
5523
1
胶囊
2025-10-08
2025诺贝尔物理学奖颁给了谷歌量子计算机打造者
刚刚,诺贝尔物理学奖揭晓! 今年颁给了量子力学领域的三位科学家John Clarke、Michel H. Devoret和John M. Martinis,以表彰他们: 在电路中发现宏观量子力学隧穿效应和能量量子化现象。 详细:https://www.163.com/dy/article/K
人工智能
3
833
0
simonzhd
2026-02-14
A5sh社区恭祝各位新年快乐,马到成功!
祝:AI时代,生活够精彩!
站务室
2
649
0
天使羽毛1
2025-10-29
Firefox新增全新功能:完全跳过搜索页面
原标题,Chrome用户羡慕!Firefox新增全新功能:完全跳过搜索页面 快科技10月28日消息,地址栏是浏览器中最常用的组件之一,但Firefox正计划让它的地址栏 变得更加强大。 Mozilla宣布将推出“智能建议”(smart suggestions)功
人工智能
2
842
0
天使羽毛1
2025-10-28
豆包凶猛,深度解析字节AI战略
字节AI,“一盘棋”的野心 文|赵艳秋 编|牛慧 在生成式AI市场上,竞争一直处于白热化阶段,你方唱罢我方登场。字节的豆包大模型在年初面对横空出世的DeepSeek,一度保持沉默,但在6月推出新版模型后迅速反弹,重
科技资讯
2
912
0
天使羽毛1
2026-01-11
特朗普乐坏了:intel半年帮美国赚回100多亿美元
特朗普乐坏了:intel太给力,半年帮美国赚回100多亿美元 不得不说,在CES 2026期间,intel真是的大出风头。 原因是intel全球首发了intel18A芯片,也就是1.8nm工艺,这可是比台积电、三星更先进,更领先了。 并且intel的1.
人工智能
2
551
0
天使羽毛1
2025-10-15
Notepad++ 中存在DLL劫持漏洞(CVE-2025-56383)
Notepad++ 中存在DLL劫持漏洞(CVE-2025-56383),可导致任意代码执行,且POC已公开 Notepad++ v8.8.3曝出新漏洞(CVE-2025-56383),CVSS评分为6.5。该漏洞允许攻击者劫持Notepad++的DLL加载过程,可能实现任意恶意代码执行。
日常吐槽
2
858
0
冬烛
Lv.1 新手上路
3
主题
0
回帖
24
积分
+ 关注
发消息
热帖推荐
换一批
宇树机器人在美买票坐飞机,电池被没收
“没有我就没有OpenAI”,马斯克起诉奥特曼
微软杀毒软件把系统“身份证”当病毒删了
准备做一个关于科技的公众号
情绪价值越来越值钱了
现在网上社区真的人气很低落
AI 会让更多人开始独立开发,但不会让更多
梁文锋:DeepSeek V4 将于 4 月下旬正式发
各位每天喝水多吗?
Claude Opus 4.7发布了
宇树机器人跑出 10m/s 刷新世界纪录,逼近
a5sh社区招各板块斑竹~
不造车的华为赢麻!当前已有35款车搭载乾崑
问界M9成为十四五成就展唯一入选新能源车
以玫瑰之柔,以铸利剑锋
到底想干嘛
如何看待张雪机车 820rr 在 wsbk 葡萄牙站
很好玩的一则新闻,大家可以看看
大家下班后或业余时间都喜欢做啥
张雪峰猝死想到的点滴
DDR4 8GB 价格达一年前 8.8 倍
警惕 AI 智能体原生风险:国家安全部发布 O
一个25年老站长的碎碎念
现在人工智能迭代太快了,都不敢轻易入手各
最新热评
加载中...
关灯
在本版发帖
QQ客服
返回顶部
快速回复
返回顶部
返回列表