Kimi(月之暗面)以超长上下文著称,适合长文档与资料密集型场景。本文梳理其价格与企业评测,并说明用 osFoundry 接入它的差异。

说明:dgm 是独立于 osFoundry 的集成与落地服务商。价格为 2026-06 公开口径、需复核。

价格(每百万 tokens,人民币 ¥)

模型输入(未命中)缓存命中输入输出上下文
Kimi K2.6¥6.5¥1.10¥27262K

缓存命中折扣明显:长文档重复读取场景靠缓存命中可把输入成本降到约 1/6。

评测:强在哪、要注意什么

  • :长上下文(262K)适合长文档分析、长对话、资料密集问答;缓存命中对重复读取场景友好。
  • 注意:Kimi 是模型/API 提供方,落地业务仍需编排、RAG、集成、合规;数据不出域场景需评估出境合规。长上下文不等于免 RAG——海量材料仍建议配检索控成本与幻觉。

用 osFoundry 接入 Kimi

osFoundryBYOK 接入 Kimi:按官方单价付费、无席位费,可与 DeepSeek/通义等按场景切换;并能在编排里针对长文档场景针对性利用缓存命中折扣。数据不出域场景走自托管开放权重模型 + 必要时调 Kimi(osFoundry 公布数据区为美/欧/日,无中国区,中国落地走自托管,由 dgm 设计)。

dgm 作为独立的 osFoundry 集成伙伴,帮你把 Kimi 用在合适场景并优化长文档成本。欢迎联系 dgm。