AI应用如何落地
春节假期看了一本书《AI工程》,记录一下。
整本书其实介绍了如何落地AI应用,没有代码,就讲一些实践和方法,包含落地AI应用的各个方面,挺不错的。
毕竟大部分公司都不会去搞基础模型,极少数公司会去对模型进行微调,大部分公司还是会选择基于基础模型搞应用,提升自己的业务的效率。
顺便摘录一张图,包含了落地AI应用的各个模块:
稍微解释一下:
- 不管是RAG还是Agent,其实都是在为大模型准备
上下文,让大模型能够更好地理解和处理问题。 - 在大模型处理前的路由还是很有必要的,可以做一些
意图识别,如果根本不是自己业务范围内的问题,可以直接拒绝。这个路由可以由内部小模型来承担。 - 输入输出的防护也是很有必要的,可以防止公司的
敏感信息泄露,同时也不要让缓存里有敏感信息。 - 缓存可以分两种,精确缓存和语义缓存。
- 最终输出的结果可以由Agent完成一些写入动作,不过一定要控制好
权限和范围。