跳到内容
AI

如何使用 AI 模型成本计算器

AI

AI Cost Calculator

更新于:

1 分钟阅读

为什么需要成本计算器

调用 AI 模型 API 时,费用往往不像直觉那么简单。除了输入和输出的 token 数量,缓存命中、模型选择、币种差异都会影响最终账单。AI Cost Calculator 把这些变量整合到一个界面里,让你在调用前就能估算成本。

三步完成估算

1. 选择计算模式

首页提供三种场景入口:

  • 文本模型:适用于 Claude、GPT、DeepSeek 等对话模型的请求成本估算
  • 音频模型:语音转文字、TTS 等音频 API 成本(即将上线)
  • 图像模型:图像生成、编辑相关 API 成本(即将上线)

大多数用户直接从「文本模型」开始。

2. 填写请求参数

在计算器卡片中填入三项数据:

参数说明示例
缓存未命中 (Miss)首次处理的 token 数1,000,000
缓存命中 (Hit)从缓存读取的 token 数0
输出 (Output)模型生成的 token 数100,000

每个参数旁边标注了单位(/1M tokens),方便你换算。

3. 切换币种查看

点击右上角的 CNY / USD 按钮,即可在人民币和美元之间切换。默认以人民币显示,更符合国内开发者习惯。

多模型同时对比

计算器支持同时对比多个模型。初始展示 3 个默认模型(DeepSeek V4 Pro、Claude Sonnet 4.6、GPT-5.4 Mini),点击卡片下方的 + 添加模型 可以从剩余模型中选择更多;如果想先看完整单价,也可以打开 模型价格表文本模型 页面。

每个模型卡片显示:

  • 输入单价(缓存未命中 / 缓存命中)
  • 输出单价
  • 本次请求总价
  • 按 30 天运行的成本预估

理解定价公式

不同提供商的计费方式不同,计算器已内置对应公式:

标准公式(GPT、DeepSeek 等):

总成本 = (Miss × 输入单价) + (Hit × 缓存输入单价) + (Output × 输出单价)

Anthropic 提示词缓存

总成本 = (Miss × 基础输入单价) + (Hit × 缓存输入单价) + (Output × 输出单价)

Anthropic 的缓存写入还有一次性创建费用,会在卡片中单独标注。

DeepSeek 缓存命中/未命中: DeepSeek 对缓存命中和未命中的输入分别计费,差距可达 10 倍,使用缓存能显著降低高频场景成本。

实用技巧

  1. 先填缓存命中再算总价 — 如果你的应用有缓存机制,记得填 Hit 字段,差价可能很可观
  2. 用人民币视角做预算 — 默认 CNY 显示,方便和国内云服务比价
  3. 30 天预估别当真 — 这只是基于单次请求的数学推算,实际用量波动很大
  4. 反馈错误价格 — 底部有「报错」链接,发现定价不准可以直接提交反馈;也可以参考 账单核对方法 先判断是价格错误还是用量变化

下一步

推荐阅读

降低 AI API 成本的 7 个实用方法

整理降低 AI API 成本的 7 个实用方法,包括缩短上下文、控制输出长度、使用缓存、模型分层、批处理、限流和监控异常请求,适合上线后持续优化模型调用费用,并通过请求配额、账单监控、失败重试分析和高成本场景拆分减少无效 token 消耗。

阅读全文

AI 应用 Token 预算模板:上线前怎么填

提供一个实用的 AI 应用 Token 预算模板,帮助团队在上线前填写请求量、输入 token、输出 token、缓存比例、模型单价和安全余量,快速得到月度 API 成本估算,并在上线后用真实请求量、平均 token、缓存命中率和账单金额持续校准预算。

阅读全文

如何选择低成本 AI 模型而不牺牲效果

从任务类型、输入输出长度、上下文需求、缓存能力和失败成本出发选择低成本 AI 模型,帮助开发者在 Claude、GPT、Gemini、DeepSeek 等模型之间做更实际的预算取舍,并结合成功率、重试率、人工审核时间和真实样本测试,避免只按单价选择模型。

阅读全文