AI应用如何落地

2026-02-23 随想杂谈

春节假期看了一本书《AI工程》，记录一下。

整本书其实介绍了如何落地AI应用，没有代码，就讲一些实践和方法，包含落地AI应用的各个方面，挺不错的。

毕竟大部分公司都不会去搞基础模型，极少数公司会去对模型进行微调，大部分公司还是会选择基于基础模型搞应用，提升自己的业务的效率。

顺便摘录一张图，包含了落地AI应用的各个模块：

稍微解释一下：

不管是RAG还是Agent，其实都是在为大模型准备上下文，让大模型能够更好地理解和处理问题。
在大模型处理前的路由还是很有必要的，可以做一些意图识别，如果根本不是自己业务范围内的问题，可以直接拒绝。这个路由可以由内部小模型来承担。
输入输出的防护也是很有必要的，可以防止公司的敏感信息泄露，同时也不要让缓存里有敏感信息。
缓存可以分两种，精确缓存和语义缓存。
最终输出的结果可以由Agent完成一些写入动作，不过一定要控制好权限和范围。

原文作者: James Yang

原文链接: https://jamesyyang.github.io/2026/02/23/thinking-ai-application/

许可协议: 知识共享署名-非商业性使用 4.0 国际许可协议