实践复盘2026-04-15

大模型的底座选择和价值管理

大模型选型需从单点成本、企业回收、市场规模三层评估

智能化升级有2个核心路径：

降低成本：基于已有产品或业务链路，进行脑力层人力替代。
提升效益：基于场景建立新的产品或链路，达成更好效果。

无论哪条路径，智能化投入始终要计算 投入产出比（ROI）

以 基于已有产品进行脑力层人力替代 为例：

智能化升级方案遵循以下流程：

梳理业务流程 -> 寻找脑力活动部分 -> 确定脑力劳动价值 -> 寻求AI替代方案

脑力劳动价值评估

两个维度：

难度：单位时间的成本
占用时长：同样难度在一个流程中的时间成本

难度越大、占时越长，则替换价值更大

脑力劳动人力成本简易计算

单分钟人力成本 = 月人力成本 / 每月计薪天数 * 每日工作时长 * 60分钟

某任务人力成本 = 单分钟人力成本 * 完成一次任务的时长（分钟）

大模型选型的三层评估框架：单点、企业、市场

1. 单点评估：衡量一项任务、一个流程或一个岗位的单位经济成本

1.1 核心判断

如果大模型单次使用的成本高于当前方案的成本，就没有经济可行性。

1.2 成本分析维度

Token 成本：完成一次完整任务所需消耗的 Token 费用。
人力成本：实现智能化需要投入的人员工时（如设计、开发、测试等环节）。

1.3 成本粗略估算

Token 成本

以 DeepSeek 这类价格最低的模型作为基准进行评估——如果连最低价的模型都难以覆盖成本，基本上就应当放弃。

做最大成本测算：不考虑任何折扣、优惠时段或缓存命中的情况。

快速压力测试：问问自己，如果成本再放大十倍，还能不能接受？

人力成本

计算公式：人力成本 = 人月单价 ÷ 月工作日数 × 所需投入人天数。

1.4 基于市场价格的价值评估

以法律合同风险审查场景为例。假设：由执业律师人工审查一份合同收费 500 元，市面上已有的智能合同审查产品（如某法律 AI 工具）单次收费 30 元，而自建大模型方案的单次成本仅为 1 元。

成本比较：

自建方案 vs 人工审查：每次节省 499 元

自建方案 vs 现有产品：每次节省 29 元

反推技术摊销门槛：

若自建方案的一次性落地人力成本为 15,000 元，相较于现有产品每次节省 29 元，就需要服务 [15000 ÷ 29 ≈ 517] 次才能覆盖开发投入。

这意味着，如果最终服务次数低于 517 次，该自建方案在经济上就不合算。

如果切换参照系，目标是替代人工审查，则只需服务 [15000 ÷ 499 ≈ 30] 次就能实现成本摊销，看起来更容易达到。

** 结论：只有预估的服务量高于相应的阈值，项目才具备经济价值；否则不值得投入。**

1.5 选择大模型底座的逻辑

常规选型遵循三个原则：合规、满足业务需求、尽可能节省 Token 费用。

成本与质量的平衡

大模型存在不可能三角：质量、速度、价格。要想清楚自身的优先级：追求极致质量（就要接受慢且贵），追求极致速度（就要容忍准确性下降），追求极致成本（就要接受回答不那么聪明、响应不快）。

满足国内落地的特点

面向国内市场的产品必须选择已通过备案的模型。
要考虑到政府、国企等客户的私有化部署需求。
中文语料的丰富度和语言适配能力是关键。

根据产品发展阶段调整模型使用策略

验证阶段：上最强的模型。如果连最顶级的大模型都搞不定，那就只能等技术继续突破，不要硬上。
发展阶段：通过压低 Token 成本来扩大利润空间。如模型路由、对话缓存等方式。
成熟阶段：利用积累的业务数据对开源小模型进行微调，甚至蒸馏出一个专属小模型，让成本进一步降低。

2. 企业层面的评估

2.1 成本回收周期评估

通过计算投入在多长时间内可以回收来做判断：

月成本节省 = 改造前月均成本 - 改造后月均成本

回本周期 = 一次性开发成本 ÷ 月成本节省

3. 市场层面的评估（不展开）

通过估算市场规模，
来判断进行开发投入是否具备经济价值，
需要综合考量市场定价、竞争格局和行业成本结构。

注：本文基于在知乎平台直播课学习后整理