蚂蚁开源业内首个100B扩散语言模型LLaDA2.0

582 0

2025-12-12 22:02:04 发表在 科技资讯| 查看全部阅读模式

　　IT之家 12 月 12 日消息，蚂蚁技术研究院今日宣布推出 LLaDA2.0 系列离散扩散大语言模型（dLLM），并同步公开了背后的技术报告，宣称是“业内首个 100B 扩散语言模型”。

　　LLaDA2.0 包含 MoE 架构的 16B （mini）和100B （flash）两个版本，将 Diffusion 模型的参数规模首次扩展到了 100B 量级。

　　蚂蚁技术研究院表示，此次发布的模型不仅打破了扩散模型难以扩展的固有印象，更在代码、数学和智能体任务上展现出了超越同级自回归（AR）模型的性能。

　　通过创新的 Warmup-Stable-Decay（WSD）持续预训练策略，LLaDA2.0 能够无缝继承现有 AR 模型的知识，避免了从头训练的高昂成本。结合不仅限于常规 SFT 的置信度感知并行训练（CAP）和扩散模型版 DPO，LLaDA2.0 在保证生成质量的同时，利用扩散模型的并行解码优势，实现了相比 AR 模型 2.1 倍的推理加速，证明了在超大规模参数下，扩散模型不仅可行，而且更强、更快。

　　蚂蚁技术研究院在知识理解、数学、代码、推理 & 智能体等多个维度对模型进行了评估。结果显示，LLaDA2.0 在结构化生成任务（如代码）上具有显著优势，并在其他领域与开源 AR 模型持平。

　　LLaDA2.0 的模型权重（16B/100B）及相关训练代码均已在 Huggingface 开源。

回复转播分享

回复

猜你喜欢

天使羽毛1

2025-11-03

谷歌浏览器：2026 年将默认弹窗警告 HTTP 连接不安全

原标题：谷歌浏览器Chrome：强制HTTPS访问 2026 年将默认弹窗警告 HTTP 连接不安全　　根据科技媒体 bleepingcomputer 10 月 28 日报道，谷歌计划自 2026 年 10 月发布的 Chrome 154 版本起，默认开启“始终使用安全连接”功能。这意味

人工智能
4 1660 0
superman

2021-10-24

layui倒下了，前端框架三分天下的局面算定了吗？

layui退场了，vue、react、angular三足鼎立，jquery瑟瑟发抖。

日常吐槽
4 13343 1
天使羽毛1

2026-06-07

天涯社区回归首日因访问量过大崩溃，前执行总编回应

　　6月1日，停摆三年的天涯社区正式宣布恢复访问，昔日盛极一时的中文网络社区重新归来。　　然而时代早已变迁，这次重启也不那么顺利，因访问量过大，导致网页卡顿甚至访问失败。　　一代人的精神家园　　天涯社区，是一代人的

站长圈
4 270 0
superman

2021-10-24

今天程序员节，程序员们，嗨起来～

论坛上的程序员盆友，包括我，咱们的节日到了，庆祝一下吧。

日常吐槽
3 9851 1
simonzhd

2022-09-15

年届中年，简短回顾一下我滴程序猿之路

其实算起来我算是一个野路子程序猿，虽然现在已经以php程序猿的身份工作了1年多，但骨子里还是认为自己是一个野生的站长。我年龄已界中年，在2001年就开始捣鼓网站，并拥有了第一个自己域名的独立网站，想想还是挺像那么回事的在网络

日常吐槽
3 5812 1
胶囊

2025-10-08

2025诺贝尔物理学奖颁给了谷歌量子计算机打造者

刚刚，诺贝尔物理学奖揭晓！今年颁给了量子力学领域的三位科学家John Clarke、Michel H. Devoret和John M. Martinis，以表彰他们：在电路中发现宏观量子力学隧穿效应和能量量子化现象。详细：https://www.163.com/dy/article/K

人工智能
3 1212 0
天使羽毛1

2025-10-11

AI 偏见降低 30%：OpenAI 宣布 GPT-5 是其最中立模型

　　IT之家 10 月 10 日消息，科技媒体 decrypt 今天（10 月 10 日）发布博文，报道称 OpenAI 发布研究报告，称 GPT-5 是该公司迄今“偏见最少”的 AI 模型，在处理政治敏感内容时，表现出更强的中立性。　　测试数据显示，新推出的 GP

科技资讯
2 1028 0
simonzhd

2026-02-14

A5sh社区恭祝各位新年快乐，马到成功！

祝：AI时代，生活够精彩！

站务室
2 892 0
天使羽毛1

2025-10-29

Firefox新增全新功能：完全跳过搜索页面

原标题，Chrome用户羡慕！Firefox新增全新功能：完全跳过搜索页面　　快科技10月28日消息，地址栏是浏览器中最常用的组件之一，但Firefox正计划让它的地址栏变得更加强大。　　Mozilla宣布将推出“智能建议”（smart suggestions）功



人工智能
2 1079 0
天使羽毛1

2025-10-28

豆包凶猛，深度解析字节AI战略

　　字节AI，“一盘棋”的野心　　文｜赵艳秋　　编｜牛慧　　在生成式AI市场上，竞争一直处于白热化阶段，你方唱罢我方登场。字节的豆包大模型在年初面对横空出世的DeepSeek，一度保持沉默，但在6月推出新版模型后迅速反弹，重

科技资讯
2 1156 0

天使羽毛1

Lv.6 金牌会员

222 主题	42 回帖	1051 积分

+ 关注发消息

热帖推荐换一批