“接大模型 API,成本怎么算、怎么省?”——本文给出测算方法与省钱技巧,并说明用 osFoundry 控成本。价格横评见 主流大模型API价格对比。
说明:dgm 是独立于 osFoundry 的集成与落地服务商。价格为 2026-06 公开口径、需复核。
成本怎么算
成本 = 输入 token × 输入单价 + 输出 token × 输出单价。注意三点:
- 阶梯:很多模型按输入长度分档,越长越贵;
- 缓存命中:重复上下文可大幅打折;
- 输出更贵:输出单价通常是输入的数倍。
国产 API 极低(DeepSeek Flash 约 ¥1/¥2 每百万)。
省钱技巧
| 技巧 | 说明 |
|---|---|
| 缓存命中 | 重复上下文走缓存 |
| 批量接口 | 部分 5 折 |
| 精简提示 | 减少输入 token |
| 控制输出长度 | 输出更贵 |
| 分层用模型 | 高吞吐用廉价档、难任务用旗舰 |
BYOK vs 按席位
重度/可变用量,BYOK 直付低单价 + 无席位费通常更省、成本随用量线性。建议按真实用量做 TCO 对比。
用 osFoundry
osFoundry 按用量计费 + BYOK 直付低单价 + 多模型路由(按场景择优),并可缓存/自托管;成本随用量线性、可优化。osFoundry 公布数据区为美/欧/日(无中国区),中国落地走自托管,由 dgm 设计。
dgm 作为独立的 osFoundry 集成伙伴,协助做成本测算与优化。欢迎联系 dgm。