网站首页
Portal
社区首页
BBS
精选导读
AI理想国
发帖
GLM-5架构曝光,智谱两日涨近60%:采用DeepSeek同款稀疏注意力
401
1
冬烛
Lv.1
2026-2-11 21:56:39
发表在
科技资讯
|
查看全部
阅读模式
不管Pony Alpha是不是智谱的,下一代旗舰大模型GLM-5都要来了。
GitHub代码确认,新一代架构细节曝光。
GLM-5采用了DeepSeek-V3/V3.2架构,包括稀疏注意力机制(DSA)和多Token预测(MTP),总参数量745B,是上一代GLM-4.7的2倍。
与此同时,OpenRouter平台上突然出现的神秘匿名模型「Pony Alpha」,编程和推理能力极为强劲,被社区91%以上的用户判断为GLM-5测试版。
受这些消息影响,智谱AI港股两日暴涨60%。
开源代码泄露参数架构
GLM-5的架构信息并非来自智谱官方,而是被开源社区从代码提交中“挖”出来的。
在vLLM推理框架的PR中,开发者发现GLM-5的实现逻辑被直接映射到了DeepSeek-V3的组件上。
GLM-5继承的第一项核心技术是DeepSeek稀疏注意力(DeepSeek Sparse Attention,DSA)。
DSA通过两阶段流程做到长文本处理效率大幅提升,输出质量几乎不受影响。
首先由Lightning Indexer轻量级组件快速扫描所有历史token并打分,评估它们与当前query token的相关性;然后只挑选得分最高的Top-k个token进行完整的注意力计算,其余全部跳过。
第二项技术是多Token预测(Multi-Token Prediction,MTP),用于提升模型的生成效率。
从代码中推断出的架构参数看,GLM-5包含78层隐藏层,采用MoE(混合专家)架构,共256个专家,每次推理激活8个,激活参数约44B,稀疏度5.9%,与DeepSeek-V3.2的5.4%基本持平。
上下文窗口支持最高202K token。
有开发者指出,复用DeepSeek架构意味着GLM-5可以直接受益于vLLM、SGLang等推理框架已有的优化,部署门槛会更低。
但也有人提出疑问:DeepSeek-V3架构以纯文本为主,GLM-5首发版本是否会因此缺失多模态能力?
匿名测试与春节档大混战
2月初,OpenRouter平台上新匿名免费模型,代号「Pony Alpha」,支持200K上下文窗口。
模型一上线就引起了开发者社区的广泛关注,它的编程能力非常突出,能根据单条提示直接生成完整的功能性应用程序,在复杂推理和Agent工作流上同样表现出色。
“这到底是谁家的模型”迅速成为社区热议话题。
指向GLM-5的证据链覆盖了多个维度:
时间上,「Pony Alpha」出现的节点与智谱首席科学家唐杰多次暗示的GLM-5发布窗口完全吻合。
有开发者测试发现该模型对特定token的反应和GLM系列一致。
风格上,它的输出排版习惯也与GLM系列高度一致。
GLM-5的发布窗口,恰好撞上了一个异常拥挤的档期。
唐杰在内部信中已明确预告GLM-5即将发布,多方信息指向2026年2月中旬,即春节前后。
而在同一时间段,DeepSeek新模型、Qwen 3.5、MiniMax M2.2等模型也都有消息将发布更新。
2026年的“春节档”,AI比电影那边还热闹。
https://www.qbitai.com/2026/02/378315.html
GLM-5
回复
转播
分享
举报
电梯直达
全部评论
1
uuoo
Lv.2
沙发
2026-2-11 22:22:22
|
查看全部
期待,GLM-4.7版灰常好用!
回复
举报
回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
猜你喜欢
天使羽毛1
2025-11-03
谷歌浏览器:2026 年将默认弹窗警告 HTTP 连接不安全
原标题:谷歌浏览器Chrome:强制HTTPS访问 2026 年将默认弹窗警告 HTTP 连接不安全 根据科技媒体 bleepingcomputer 10 月 28 日报道,谷歌计划自 2026 年 10 月发布的 Chrome 154 版本起,默认开启“始终使用安全连接”功能。这意味
人工智能
4
859
0
superman
2021-10-24
layui倒下了,前端框架三分天下的局面算定了吗?
layui退场了,vue、react、angular三足鼎立,jquery瑟瑟发抖。
日常吐槽
4
12485
1
superman
2021-10-24
今天程序员节,程序员们,嗨起来~
论坛上的程序员盆友,包括我,咱们的节日到了,庆祝一下吧。
日常吐槽
3
9210
1
simonzhd
2022-09-15
年届中年,简短回顾一下我滴程序猿之路
其实算起来我算是一个野路子程序猿,虽然现在已经以php程序猿的身份工作了1年多,但骨子里还是认为自己是一个野生的站长。 我年龄已界中年,在2001年就开始捣鼓网站,并拥有了第一个自己域名的独立网站,想想还是挺像那么回事的在网络
日常吐槽
3
5221
1
胶囊
2025-10-08
2025诺贝尔物理学奖颁给了谷歌量子计算机打造者
刚刚,诺贝尔物理学奖揭晓! 今年颁给了量子力学领域的三位科学家John Clarke、Michel H. Devoret和John M. Martinis,以表彰他们: 在电路中发现宏观量子力学隧穿效应和能量量子化现象。 详细:https://www.163.com/dy/article/K
人工智能
3
596
0
superman
2022-09-14
抖音服务器带宽有多大,为什么能够供那么多人同时刷?
每天睡觉前都会刷抖音,为什么几亿人同时刷抖音,依然可以做到非常流畅呢? 首先来了解一下什么是服务器和带宽。 服务器: 服务器也称伺服器,是提供计算服务的设备,由处理器、硬盘、内存、系统总线构成,其处理能力、稳定性、可靠
站长圈
2
8345
0
天使羽毛1
2025-10-22
OpenAI推出网页浏览器Atlas后,谷歌股价一度下跌3%
IT之家 10 月 22 日消息,据《商业内幕》今日报道,OpenAI 正式向谷歌 Chrome 发起挑战,并推出首款浏览器产品 ChatGPT Atlas,这是 OpenAI 进军竞争激烈的网页浏览器市场的首款产品。消息公布后不久,谷歌 Chrome 母公司 Alphabet
人工智能
2
595
0
天使羽毛1
2025-10-14
eSIM手机来了,移动联通电信均开通
eSIM手机来了,移动联通电信均开通 记者10月13日获悉,中国联通、中国移动官方公众号当日晚间先后官宣,已正式获得开展eSIM手机运营服务商用试验的批复。另据新华社当晚报道,中国电信获得工信部eSIM手机商用试验批复许可,eS
兴趣交流
2
509
0
胶囊
2021-10-30
惊了,电脑算法能画出如此细腻的人像!
国内某大虾研究两年的画人像算法,这细腻度得给电脑一个9级素描证吧
科技资讯
2
8418
0
天使羽毛1
2025-10-12
马云、张一鸣,都回来搞AI了
原标题:马云、张一鸣,都回来了 这些一度淡出公众视野的中国一代、二代互联网企业家,在2025年不约而同选择“归来”,重新站到聚光灯下。他们的每一次现身,都被外界解读为企业战略转向的重要信号,也共同预示着,在AI技术浪潮
人工智能
2
489
0
冬烛
Lv.1 新手上路
3
主题
0
回帖
24
积分
+ 关注
发消息
热帖推荐
换一批
大家下班后或业余时间都喜欢做啥
张雪峰猝死想到的点滴
DDR4 8GB 价格达一年前 8.8 倍
警惕 AI 智能体原生风险:国家安全部发布 O
一个25年老站长的碎碎念
现在人工智能迭代太快了,都不敢轻易入手各
科技:是人类的拐杖,而非灵魂的方向
新设备Mac Studio
刚在美国赔了 1.5 亿美元,Adobe 又遭英国
央视 3·15 晚会曝光 AI 大模型被投毒,给
有谁用过大龙虾了~
A5sh社区转型为泛科技生活论坛
现在抖音里刷到的十个里有两个都是AI视频
分享一个大厂的icon素材库,很棒的哦~
AI冲击的受害者 Adobe宣布CEO将辞职、股价
小红书将全面封禁纯AI托管账号
每人 1000 万 Tokens 免费领,国家超算互联
周鸿祎提醒“养龙虾”风险:AI幻觉会把C盘
Mac mini 不止养 AI 龙虾:苹果 M4 算力机
苹果 M5 Pro / Max 采用新融合架构,AI 计
OpenClaw最佳工具榜来了!这6款龙虾最受欢
海淀放大招!90亿资金+近30条政策,重磅释
GLM-5架构曝光,智谱两日涨近60%:采用Deep
DeepSeek新论文剧透V4新框架!用闲置网卡加
最新热评
加载中...
关灯
在本版发帖
QQ客服
返回顶部
快速回复
返回顶部
返回列表