中等规模的非 IT 企业在 2025 年的 AI 应用路线图
人工智能(AI)在过去两年呈爆发式发展,特别是 2024 年 12 月 26 日 DeepSeek V3 模型的发布,标志着中国正式进入 AI 智能时代。对于非 IT 主业的传统企业而言,制定清晰的 AI 战略路线图已成为数字化转型的关键。
目前的 AI 现状与方向选择
DeepSeek V3 为何能成为里程碑
在 DS V3 实现大规模商用前,国内企业面临两大困境:其一,国际主流模型受地缘政策限制难以合规使用;其二,可用模型的调用成本居高不下(单次请求约 0.8 元),严重制约规模化应用。DS V3 通过技术突破将成本降低 40 倍(单次成本约 0.02 元),使企业级应用真正具备经济可行性。
自部署 vs 调用 API
目前看来自部署的唯一优势就是隐私安全,其他完全不能和直接调用厂商 API 比较,调用 DS 的 API,2 月份花费不到 1 元,即使考虑需求在未来增长百倍,一年也不过 1200 元的费用,而一块 4090 的显卡目前价格在 2 万左右,等于可以用几十年。
更重要的是调用 DS API 的模型是 670b 的 V3 或者 R1,从模型参数看,也比单块 4090 跑的 14b 要大 47 倍,而且这个差距不可弥补,使用 AI 最重要的是 AI 的智能,14b 的模型基本等于小学生的智能,而 V3 绝对可以达到大学本科的水平。
自部署的 14b 在实际测试中,对于合同分析的问题,比如“收款条件第一笔是否为预付款,回答是或者否”,令人难以置信的是,硅基流动的线上版本的DeepSeek-R1-Distill-Qwen-14B的思考链效果也远远好于本地部署的Ollama 的 DeepSeek-R1:14b,理论上这两个模型应该是完全一样,实在令人不解。
同时我还在微信群中看到有某单位领导部署 70b 模型后与公网差距巨大的截图,可见即使是完全相同的模型,在部署的时候的一些 knowhow 可能仍然是不公开的。
DeekSeek 在 2025 年 3 月开源第 6 天的X 推文中指出,DS 在部署中可以达到 545% 的理论每天利润率,与此同时,伯克利尤洋却可以算出每月亏损 4 亿的奇怪数字,所以自部署模型无论从经济或者技术角度,可能都不是目前的最佳选择,这至少是目前看到的形式。
RAG vs 模型微调
另外一个存在选择的方向是使用 RAG 搜索嵌入,或者对模型进行微调,这个在网上讨论也是非常多的,目前来看,RAG 的灵活性和实时性要好得多,可以优先尝试,其实这两个方向不存在矛盾,在以后积累了一定的问答数据集后,同样可以对模型进行微调。
但第一优先的仍然应该是 RAG,RAG 的方式方法其实也非常多,在穷尽这些方法前我认为没有必要去看模型微调,尤其是 RAG 很直观,永远能从 Prompt Log 中看到引用了那些知识内容,理论上只要提供的准确的文本信息,模型能力到位,是完全可以得到准确答案的。这种确定性和实时性非常重要。
相比之下模型微调只有在经过很长时间的一段时间的模型调整后才能查看结果,而且若对这次模型调整的新的例子的推理结果不满意的话,又要将准确的例子作为训练素材进行重新微调,一次微调耗时 1~2 天(硅基流动调用频率),显然无法和 RAG 对比实时性。
当然在积累足够量的标注数据(≥1 万条)后,我们仍然可对基础模型进行领域适配。但需注意单次微调周期约 48 小时,且需要持续迭代优化。
另外我们仍然需要考虑模型的优化速度,可能这些微调都没必要做,因为可能当我们的项目做了 3,4 个月后,更优秀的模型早就出了,可能都不用做微调。
直接使用厂商 API vs 通过 AI 中间平台调用
由于 AI 调用的返回极其缓慢,导致直接调用厂商 API 性能收益约等于 0,可能通过 AI 中间平台调用会损失 1 秒,但是相比呼叫 AI 模型厂商动则需要等待 20 多秒的情况,可以忽略不计。
使用 dify 应用开发平台,可以免费获得 prompt 调试环境,API 调用历史分析等功能,同时还可以将 AI 模型调整的工作从较为瓶颈的程序员下放到运营和产品经理身上,甚至最终用户身上,更加便于 AI 的使用者理解 AI 目前的局限性,所以肯定是使用类似 dify 这样的应用开发平台合适。直接调用厂商 API 都没有这些功能。
未来的方向与展望
现在 AI 的瓶颈已经从模型端转移到应用端,对中等规模的非 IT 主业企业来说,最重要的是找到自己公司流程上各个可以运用 AI 智能,降低人力的应用点,逐个补强,至少是用 AI 平替这些点,这样才能在未来 AI 含量越来越高的市场环境中获得成本和反应速度优势,当然是在保持人类智能质量的前提下。
目前我们已经在用的是 7777 IT 服务问答助手,PLM 问答助手,在研发的有 BIM 空间名称识别,合同分析测试,相信还有很多微小的可以用 AI 替代人工的点存在,所以 AI 应用在 2025 年大有可为。