“接大模型 API,成本怎么算、怎么省?”——本文给出测算方法与省钱技巧,并说明用 osFoundry 控成本。价格横评见 主流大模型API价格对比

说明:dgm 是独立于 osFoundry 的集成与落地服务商。价格为 2026-06 公开口径、需复核。

成本怎么算

成本 = 输入 token × 输入单价 + 输出 token × 输出单价。注意三点:

  1. 阶梯:很多模型按输入长度分档,越长越贵;
  2. 缓存命中:重复上下文可大幅打折;
  3. 输出更贵:输出单价通常是输入的数倍。

国产 API 极低(DeepSeek Flash 约 ¥1/¥2 每百万)。

省钱技巧

技巧说明
缓存命中重复上下文走缓存
批量接口部分 5 折
精简提示减少输入 token
控制输出长度输出更贵
分层用模型高吞吐用廉价档、难任务用旗舰

BYOK vs 按席位

重度/可变用量,BYOK 直付低单价 + 无席位费通常更省、成本随用量线性。建议按真实用量做 TCO 对比。

用 osFoundry

osFoundry 按用量计费 + BYOK 直付低单价 + 多模型路由(按场景择优),并可缓存/自托管;成本随用量线性、可优化。osFoundry 公布数据区为美/欧/日(无中国区),中国落地走自托管,由 dgm 设计。

dgm 作为独立的 osFoundry 集成伙伴,协助做成本测算与优化。欢迎联系 dgm。