“企业想用 DeepSeek,云 API、一体机还是自建?”——本文讲清接入方式与成本,并说明用 osFoundry 落地。深入对比见 大模型私有化部署方案对比。
说明:dgm 是独立于 osFoundry 的集成与落地服务商。成本为媒体/经销商口径、波动大、需核实。
三种接入方式
| 方式 | 优势 | 成本/适合 |
|---|---|---|
| 云 API | 最快、价极低 | 数据出域,敏感场景需评估 |
| 一体机/私有化 | 数据不出域、软硬一体 | 十几万–200 万元+(口径波动) |
| 自建 GPU 集群 | 最可控 | capex 最高、需团队 |
算力(671B 满血版)
据公开报道:BF16 约需 32 张昇腾 910B(4 台×8);W8A8 量化约 16 卡。可走全国产栈(昇腾 + CANN + MindIE,无 NVIDIA 依赖)。DeepSeek 的 MoE 架构(671B 激活约 37B)让大显存 GPU(如 H20)做推理性价比高。
成本量级(需核实)
一体机十几万到 200 万元+;671B 满血版一体机 >200 万元;70B 档约 50–100 万元;32B 可单卡 RTX 4090。以当前厂商报价为准。
用 osFoundry 落地
osFoundry 模型/服务栈无关,可 BYOK 接 DeepSeek API,或在自有云/昇腾栈自托管 DeepSeek 开放权重,并统一做 RAG 与编排;数据不出域走自托管。osFoundry 公布数据区为美/欧/日(无中国区),中国落地走自托管,由 dgm 设计。
dgm 作为独立的 osFoundry 集成伙伴,负责 DeepSeek 接入、私有化部署与落地。欢迎联系 dgm。