音频模型
独立规划语音转文字、语音合成、实时语音和音频理解 API 成本,区分音频输入、输出和文本部分,避免与文本模型成本混合,便于语音产品上线前估算费用,支持人民币/美元切换,覆盖主流音频模型,提供官方计费单位说明、来源链接和预算注意事项核对清单。
OpenAI · GPT-Realtime-2
$0.00
每次请求
输入 $32/1M tokens
输出 $64/1M tokens
缓存读取 $0.4/1M tokens
输入0%
输出0%
缓存读取0%
Google · Gemini 3 Audio
$0.00
每次请求
输入 $3/1M tokens
输出 $12/1M tokens
输入0%
输出0%
缓存读取0%
Google · Gemini 2.5 Flash Audio
$0.00
每次请求
输入 $0.5/1M tokens
输出 $1.5/1M tokens
缓存读取 $0.05/1M tokens
输入0%
输出0%
缓存读取0%