返回手记列表
实践复盘

大模型的底座选择和价值管理

大模型选型需从单点成本、企业回收、市场规模三层评估

智能化升级有2个核心路径

  1. 降低成本:基于已有产品或业务链路,进行脑力层人力替代。
  2. 提升效益:基于场景建立新的产品或链路,达成更好效果。

无论哪条路径,智能化投入始终要计算 投入产出比(ROI)

基于已有产品进行脑力层人力替代 为例:

智能化升级方案遵循以下流程:

梳理业务流程 -> 寻找脑力活动部分 -> 确定脑力劳动价值 -> 寻求AI替代方案

脑力劳动价值评估

两个维度:

  • 难度:单位时间的成本
  • 占用时长:同样难度在一个流程中的时间成本

难度越大、占时越长,则替换价值更大

脑力劳动人力成本简易计算

单分钟人力成本 = 月人力成本 / 每月计薪天数 * 每日工作时长 * 60分钟

某任务人力成本 = 单分钟人力成本 * 完成一次任务的时长(分钟)

大模型选型的三层评估框架:单点、企业、市场

1. 单点评估:衡量一项任务、一个流程或一个岗位的单位经济成本

1.1 核心判断

如果大模型单次使用的成本高于当前方案的成本,就没有经济可行性。

1.2 成本分析维度

  • Token 成本:完成一次完整任务所需消耗的 Token 费用。
  • 人力成本:实现智能化需要投入的人员工时(如设计、开发、测试等环节)。

1.3 成本粗略估算

  • Token 成本
  1. 以 DeepSeek 这类价格最低的模型作为基准进行评估——如果连最低价的模型都难以覆盖成本,基本上就应当放弃。
  2. 做最大成本测算:不考虑任何折扣、优惠时段或缓存命中的情况。
  3. 快速压力测试:问问自己,如果成本再放大十倍,还能不能接受?
  • 人力成本

计算公式:人力成本 = 人月单价 ÷ 月工作日数 × 所需投入人天数。

1.4 基于市场价格的价值评估

以法律合同风险审查场景为例。假设:由执业律师人工审查一份合同收费 500 元,市面上已有的智能合同审查产品(如某法律 AI 工具)单次收费 30 元,而自建大模型方案的单次成本仅为 1 元。

成本比较:

  • 自建方案 vs 人工审查:每次节省 499 元
  • 自建方案 vs 现有产品:每次节省 29 元

反推技术摊销门槛

若自建方案的一次性落地人力成本为 15,000 元,相较于现有产品每次节省 29 元,就需要服务 [15000 ÷ 29 ≈ 517] 次才能覆盖开发投入。

这意味着,如果最终服务次数低于 517 次,该自建方案在经济上就不合算。

如果切换参照系,目标是替代人工审查,则只需服务 [15000 ÷ 499 ≈ 30] 次就能实现成本摊销,看起来更容易达到。

** 结论:只有预估的服务量高于相应的阈值,项目才具备经济价值;否则不值得投入。**

1.5 选择大模型底座的逻辑

常规选型遵循三个原则:合规、满足业务需求、尽可能节省 Token 费用。

  1. 成本与质量的平衡

大模型存在不可能三角:质量、速度、价格。 要想清楚自身的优先级:追求极致质量(就要接受慢且贵),追求极致速度(就要容忍准确性下降),追求极致成本(就要接受回答不那么聪明、响应不快)。

  1. 满足国内落地的特点
  • 面向国内市场的产品必须选择已通过备案的模型。
  • 要考虑到政府、国企等客户的私有化部署需求。
  • 中文语料的丰富度和语言适配能力是关键。
  1. 根据产品发展阶段调整模型使用策略
  • 验证阶段:上最强的模型。如果连最顶级的大模型都搞不定,那就只能等技术继续突破,不要硬上。
  • 发展阶段:通过压低 Token 成本来扩大利润空间。如模型路由、对话缓存等方式。
  • 成熟阶段:利用积累的业务数据对开源小模型进行微调,甚至蒸馏出一个专属小模型,让成本进一步降低。

2. 企业层面的评估

2.1 成本回收周期评估

通过计算投入在多长时间内可以回收来做判断:

  • 月成本节省 = 改造前月均成本 - 改造后月均成本
  • 回本周期 = 一次性开发成本 ÷ 月成本节省

3. 市场层面的评估(不展开)

  • 通过估算市场规模,
  • 来判断进行开发投入是否具备经济价值,
  • 需要综合考量市场定价、竞争格局和行业成本结构。

注:本文基于在知乎平台直播课学习后整理