跑278亿Token省1万美元:DeepSeekV4超高缓存

跑278亿Token省1万美元:DeepSeekV4超高缓存

据[动察 Beating](https://t.me/OneMillion_AI) 监测,近期有开发者正借助 DeepSeek V4 API极低的缓存命中价格进行大规模全自动编程。不少项目在单日级别处理数百亿 Token,整体成本却明显低于同类模型。尽管 DeepSeek 并未像部分竞品那样推出包月代码套餐(Coding Plan),但社交平台上开发者的评价却很一致:它真正把“Token 自由”带给了普通人——因此在业内被称为大模型领域的「价格屠夫」

开发者晒账单:极低成本跑满高吞吐

多位开发者公开了近期的高频调用账单,差异化的工作负载也从侧面验证了这套成本模型的“优势兑现”。

  • 案例一:一位用户用 V4 Pro 自动修复 CI 错误。程序连续运行两个半小时,共消耗8000 万 Token。由于缓存命中率达 99.41%,最终仅花费4 元人民币

  • 案例二:另一位开发者单日跑满278 亿 Token,账单总额仅160 美元。结合官方价格反推,这组账单对应的模型大概率是V4 Flash

如果将同样的缓存命中率估算到 Claude Sonnet 4.6,则成本约为11076 美元。换句话说,两者价差超过10900 美元

成本落差来自 DeepSeek 的极端降价与缓存红利

这类巨大差距,核心在于 DeepSeek 的极端降价策略

  • V4 Pro 限时 2.5 折优惠期:已延期至5 月 31 日,当前输出价格降至0.87 美元/百万 Token
  • 全线 API 缓存命中价格永久直降:整体永久下调十分之一
  • 缓存命中单价更低:V4 Pro 的实际缓存命中价格低至0.003625 美元/百万 Token;Flash 版更是只有0.0028 美元/百万 Token

在 Agent 编程这类反复加载同一代码库前缀的场景中,缓存命中率通常会被持续拉高。因此在高吞吐、且“命中前缀”的特征明显时,纯按量计费的 API 反而往往比限制调用次数的固定包月订阅制更划算。

第三方接入同步更新:解锁百万上下文

为了承接这波智能体开发流量,官方也同步更新了第三方接入指引:

  • 在 Claude Code 中:将模型名设置为 deepseek-v4-pro[1m] 即可解锁百万上下文
  • OpenCode:已升级至 v1.14.24+ 完成原生适配。
  • OpenClaw:已升级至 v2026.4.24+ 完成原生适配。

原创文章,作者:admin,如若转载,请注明出处:https://www.23btc.com/179368/

(0)
上一篇 11小时前
下一篇 11小时前

相关推荐