2025年8月21日DeepSeek-V3.1 正式发布

2025-08-21 14:39|编辑: 小李老师|阅读: 509

摘要

8月21日，DeepSeek-V3.1正式发布，迈向 Agent 时代的第一步！自主选拔在线特整理相关内容，一起来共同学习。

今天，深度求索团队正式发布 DeepSeek-V3.1。本次升级包含以下主要变化：

DeepSeek-V3.1 发布，迈向 Agent 时代的第一步

　　混合推理架构：一个模型同时支持思考模式与非思考模式;

　　更高的思考效率：相比 DeepSeek-R1-0528，DeepSeek-V3.1-Think 能在更短时间内给出答案;

　　更强的 Agent 能力：通过 Post-Training 优化，新模型在工具使用与智能体任务中的表现有较大提升。

　　官方 App 与网页端模型已同步升级为 DeepSeek-V3.1。用户可以通过“深度思考”按钮，实现思考模式与非思考模式的自由切换。

　　DeepSeek API 也已同步升级，deepseek-chat 对应非思考模式，deepseek-reasoner 对应思考模式，且上下文均已扩展为 128K。同时，API Beta 接口支持了 strict 模式的 Function Calling，以确保输出的 Function 满足 schema 定义。(详见官方文档：https://api-docs.deepseek.com/zh-cn/guides/function_calling)

　　另外，增加了对 Anthropic API 格式的支持，让大家可以轻松将 DeepSeek-V3.1 的能力接入 Claude Code 框架。(详见官方文档：https://api-docs.deepseek.com/zh-cn/guides/anthropic_api)

　　工具调用/智能体支持增强

　　编程智能体

DeepSeek-V3.1

表 1：编程智能体测评（SWE 使用内部框架测评，相比开源框架 OpenHands 所需轮数更少；Terminal Bench 使用官方 Terminus 1 framework）

　　在代码修复测评 SWE 与命令行终端环境下的复杂任务(Terminal-Bench)测试中，DeepSeek-V3.1 相比之前的 DeepSeek 系列模型有明显提高。

　　搜索智能体

DeepSeek-V3.1 发布

表 2：搜索智能体测评（测试结果调用商用搜索引擎 API+网页过滤+128K context window；R1-0528 使用内部 workflow 模式测试；HLE 测试同时使用 python 与 search 工具）

　　DeepSeek-V3.1 在多项搜索评测指标上取得了较大提升。在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上，DeepSeek-V3.1 性能已大幅领先 R1-0528。

　　思考效率提升

　　我们的测试结果显示，经过思维链压缩训练后，V3.1-Think 在输出 token 数减少 20%-50% 的情况下，各项任务的平均表现与 R1-0528 持平。

DeepSeek-V3.1 发布

在各项评测指标得分基本持平的情况下（AIME 2015: 87.5/88.4， GPQA: 81/80.1， liveCodeBench: 73.3/74.8），R1-0528 与 V3.1-Think 的 token 消耗量对比图

　　同时，V3.1 在非思考模式下的输出长度也得到了有效控制，相比于 DeepSeek-V3-0324 ，能够在输出长度明显减少的情况下保持相同的模型性能。

　　API & 模型开源

　　模型开源

　　V3.1的Base模型在V3的基础上重新做了外扩训练，一共增加训练了 840B tokens。Base 模型与后训练模型均已在 Huggingface 与魔搭开源。

　　Base 模型：

　　Hugging Face:

　　https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

　　魔搭：

　　https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base

　　后训练模型：

　　Hugging Face:

　　https://huggingface.co/deepseek-ai/DeepSeek-V3.1

　　魔搭：

　　https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1

　　需要注意的是，DeepSeek-V3.1 使用了 UE8M0 FP8 Scale 的参数精度。另外，V3.1 对分词器及 chat template 进行了较大调整，与 DeepSeek-V3 存在明显差异。建议有部署需求的用户仔细阅读新版说明文档。

　　价格调整

　　将于北京时间 2025 年 9 月 6 日凌晨起，对 DeepSeek 开放平台 API 接口调用价格进行如下调整：

　　执行新版价格表(如下图所示，详见定价页面);

　　取消夜间时段优惠。

　　在 9 月 6 日前，所有 API 服务仍按原价格政策计费，您可继续享受当前优惠。

　　同时，为更好地满足用户的调用需求，我们已进一步扩容 API 服务资源，欢迎使用!

声明：本文信息来源于deepseek官微，由自主选拔在线团队（微信公众号：zizzsw）排版编辑，如有侵权，请及时联系管理员删除。

分享到：

微信扫一扫分享

微信里点“发现”

扫一下二维码便可将本文分享至朋友圈

报错

上一篇：2025世界教育者大会拉开序幕，创新人才培养、终身学习等成为高频词

下一篇：双非力压985/211？2025年国家电网最新录取TOP10高校出炉！

关键词

DeepSeekDeepSeek-V3.1 模型

精选推荐

高三考生，DeepSeek教你如何使用“首考诊断报告”2025-02-07

DeepSeek锐评北京东、西海、朝四区第一梯队高中院校！2025-02-07

一起来看看！DeepSeek锐评大学专业！2025-02-08

DeepSeek版中国高校top100，复旦勇闯前3！2025-02-08

DeepSeek评选出“北京家长最想让孩子上的15所大学”2025-02-08

0/500

没有更多了