阿里云开发者#
mp.weixin.qq.com
↗
原文链接
AI Agent系列|什么是 ReAct Agent?
ReAct,拆开来就是Reasoning(推理)+ Acting(行动),也就是观察-思考-行动-再观察的循环。它的优势在于能根据实际情况灵活应对,而不会遇到意外就卡住。
(话说cursor好像很久之前就是使用的这种模式,应该是最早使用这种模式的)
ReAct实现的关键要素:
- 历史上下文(History):ReAct会维护一个对话历史,记录之前所有的思考、行动和观察。这样LLM在做决策时,可以参考之前发生了什么,避免重复操作或者走错路。
- 观察当前环境信息(Current Environment Information):这是Agent在当前时刻接收到的外部信息,比如用户的输入、系统的状态、或者其他需要处理的数据。这些信息会作为LLM推理的输入,帮助决定下一步该做什么。
- 语言模型(LLM Thinking):ReAct的"大脑",负责推理和决策。每次需要思考下一步该做什么时,LLM会根据当前的历史上下文、环境信息和观察结果,生成下一步的行动计划。
- 工具/动作(toolcall):ReAct的"手脚",用来执行具体的操作。比如搜索、查询API、读写文件等等。每个工具都有明确的输入输出,Agent可以调用这些工具来完成实际工作。
- 观察结果(toolcall结果)每次执行动作后,都会得到一个观察结果。这个结果会被反馈给LLM,作为下一轮推理的依据。观察结果可能包括成功的数据、错误信息、或者需要进一步处理的内容。
