跳到内容
AI

音频模型

独立规划语音转文字、语音合成、实时语音和音频理解 API 成本,区分音频输入、输出和文本部分,避免与文本模型成本混合,便于语音产品上线前估算费用,支持人民币/美元切换,覆盖主流音频模型,提供官方计费单位说明、来源链接和预算注意事项核对清单。

OpenAI · GPT-Realtime-2

$0.00

每次请求

输入 $32/1M tokens
输出 $64/1M tokens
缓存读取 $0.4/1M tokens
输入0%
输出0%
缓存读取0%

Google · Gemini 3 Audio

$0.00

每次请求

输入 $3/1M tokens
输出 $12/1M tokens
输入0%
输出0%
缓存读取0%

Google · Gemini 2.5 Flash Audio

$0.00

每次请求

输入 $0.5/1M tokens
输出 $1.5/1M tokens
缓存读取 $0.05/1M tokens
输入0%
输出0%
缓存读取0%