游客您好
第三方账号登陆
推荐阅读
天使羽毛1 中级会员
未知星球 | 未知职业
  • 关注0
  • 粉丝0
  • 帖子115
精选帖子

DeepSeek同时发布两个正式版模型

[复制链接]
天使羽毛1 发表于 昨天 22:41 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
DeepSeek同时发布两个正式版模型:DeepSeek-V3.2系列发布



  站长之家(ChinaZ.com)12月2日 消息:今日,DeepSeek正式推出V3.2系列模型,包含标准版DeepSeek-V3.2与长思考增强版DeepSeek-V3.2-Speciale。此次更新不仅在推理性能上实现重大突破,更通过创新性技术架构重新定义了开源模型的能力边界。

  目前,官方网页端、移动应用及API服务已全面升级至V3.2标准版,而Speciale版本则以临时API形式开放供学术研究使用。

  DeepSeek-V3.2在平衡推理效率与输出质量方面取得突破性进展。该模型在公开推理基准测试中达到GPT-5水平,较前代产品Kimi-K2-Thinking输出长度减少42%,计算开销降低35%,特别适合问答场景与通用智能体任务。更引人注目的是,其思考模式首次实现与工具调用的深度融合,用户既可通过指令切换传统工具调用模式,也可在ClaudeCode等支持环境中激活深度推理能力。

  作为技术巅峰之作的DeepSeek-V3.2-Speciale,通过整合DeepSeek-Math-V2的定理证明模块,构建出具备超强逻辑验证能力的"数学推理引擎"。该模型在主流基准测试中表现媲美Gemini-3.0-Pro,更在2025年国际数学奥林匹克(IMO)、中国数学奥林匹克(CMO)、国际大学生程序设计竞赛全球总决赛(ICPC World Finals)及国际信息学奥林匹克(IOI)四大顶级赛事中斩获金牌。其中ICPC成绩达人类选手第二名,IOI位列第十,刷新了AI在结构化思维领域的纪录。

  研发团队透露,Speciale版本通过独创的"难解答-易验证"强化学习框架,在1800个训练环境与8.5万条复杂指令中锤炼出卓越泛化能力。尽管该模型在复杂任务处理上展现出显著优势,但其高计算成本(较标准版增加3-5倍)与专项优化特性,决定其现阶段主要面向科研场景开放。官方特别说明,当前版本未针对日常对话进行优化,且不支持工具调用功能。

  ModelScope:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Copyright © 2025 A5sh.com ( 苏ICP备20011375号-3 )