AI应用三大支柱:Workflow、RAG与Agent
当前AI项目面临核心矛盾:用户需求的无限复杂性与技术实现的有限稳定性。为解决这一矛盾,Workflow(工作流)、RAG(检索增强生成)和Agent(智能代理)构成三大技术支柱,分别对应流程控制、知识扩展与动态决策三大维度。三者非简单并列关系,而是形成嵌套协同的架构体系——RAG依赖Workflow构建数据处理管道,Agent通过调度机制优化前两者的执行流程。

Workflow:自动化流程的基石
Workflow本质是将业务SOP(标准操作程序)技术化的过程,核心解决"如何分步完成特定任务"的问题。其技术实现聚焦两大能力:
- 实体提取:从用户输入中识别关键参数,例如"查询北京明天天气"需提取时间(明天)、地点(北京)等槽位数据
- 意图识别:判定用户需求归属的业务场景,决定调用天气接口而非旅游规划服务
这种模式虽能保证输出稳定性,却面临维护成本飙升的困境。以某电商客服系统为例,历经三年迭代的Workflow包含超过200个决策节点,新增需求常引发连锁错误。根本矛盾在于:有限的预设流程难以覆盖用户无限的表达变体,导致开发陷入"修改-测试-崩溃"的恶性循环。

RAG:知识增强的检索系统
当大模型固有知识无法满足时效性、专业性要求时,RAG技术通过外部知识库扩展模型能力边界。典型架构包含三阶段:
- 用户问题语义重写(如分解多意图查询)
- 向量数据库的相似性检索
- 结果相关性评估与过滤
其效果高度依赖数据处理质量。某医疗知识库项目显示,未经清洗的PDF文档导入后,检索准确率不足40%;经专业术语标准化处理并建立症状-药品关系图谱后,准确率提升至82%。

值得注意的是,RAG系统实质是Workflow的特定应用形态:数据清洗需定义字段提取规则,查询优化需预设改写策略。这也解释了为何掌握Workflow的开发者更易理解RAG实现逻辑。
Agent:动态决策的智能体
Agent技术通过ReAct框架解决Workflow的泛化难题:
Thought(思考)→ Action(行动)→ Observation(观察)→ 循环至问题解决该机制将复杂任务拆解为可验证步骤。例如处理"查询2018世界杯冠军国总统"时,Agent自主生成工作流:
- 调用体育知识API获取冠军国家(法国)
- 检索法国政府数据库确认时任总统(马克龙)

在Agentic RAG场景中,这种动态调度价值更为凸显。传统RAG面对"比较中美AI监管政策差异"的多跳查询时,固定流程可能遗漏关键条款;而Agent能自主规划检索策略:先提取中国《生成式AI管理办法》要点,再对比美国NIST AI风险管理框架,最终进行交叉分析。
三大支柱的协同与未来
实际项目中三类技术呈现深度融合特征:
- Workflow提供执行骨架:定义可复用的基础操作单元
- RAG注入领域知识:确保信息时效性与专业性
- Agent实现智能调度:根据上下文动态组合能力单元
某金融风控系统验证了该架构的可行性:Workflow固化反洗钱检查步骤,RAG接入最新监管文件,Agent根据交易特征动态调整审核路径,使误报率降低37%。
技术演进将朝两个方向发展:
- 组件化封装:将实体提取、HyDE查询改写等能力标准化,降低集成门槛
- 分层调度架构:轻量级Agent协调本地Workflow,重型Agent处理跨系统协作
随着大模型理解能力提升,未来可能出现"元Agent"架构——由顶层Agent分析任务特征,自主选择Workflow、RAG或混合模式执行,真正实现人工智能系统的自适应进化。












