大家好,在研究Agent时,发现了不同的会话模式会带来对相同的问题带来不同的处理方式,所以研究了Re-Act 和 Conversational-Chat的区别,发现对于2B而言re-act才是更适配的模式。
对标了2款产品,TFlow AI 和 Coze
一、先介绍一下产品
TFlow AI 是面向B端业务场景Agent平台,能按流程处理任务(SOP),围绕目标来进行离散推理。
允许LLM与环境进行交互,根据环境数据的反馈不断的调整行动计划/策略。
且整个sop的过程是由文本来控制,不需要用到Work Flow。
产品基本信息如下:
·使用问心一言-3.5的模型,未微调 ·做了逻辑处理的Agent框架 ·单条回复的消耗不到2K token,成本约0.8-2份钱。价格不贵
怎么理解目标、sop、离散推理、环境交互?我们以下列TFlow AI任务sop提示词为例:
·目标:要做一件什么事情,要达到什么目的。解答问题,引导留咨 ·任务sop:处理事情流程步骤。注:模拟人的行为的任务处理流程或者说思考流程,以及标准的交互过程。 ·离散推理/环境交互:要完成留咨任务,需要多次与用户/外部环境进行互动。不断的根据用户反馈,调整执行计划,达成目标。
如:在上述的任务sop的流程中,任务的执行需要多次与外界交互,借助外界补充的信息,持续推理完成任务的过程。比如查询知识库、引导用户提供姓名联系方式、调用留咨工具,将数据插入到已有的CRM中。
相同提示词下,在Coze和TFlow Ai的表现如下
oze和TFlow的比较
为什么会产生这么个差异昵?为什么coze不能做到昵?
核心的区别就一个:Agent的模式不同
二、Agent的会话模型:Conversational-Chat VS Re-ACT
会话模式代表了处理提示词的逻辑不同
·豆包:Conversational-Chat (助手模式)要做什么事情,取决于用户的指令 ·TFlow Ai:Re-Act(推理+行动)要解决什么问题,初始的提示词决定
1. Conversational-Chat:助理的模式
助理模式下的Agent的逻辑处理如下:
助理模式Agent的思考逻辑
提示词确定后,对于用户的每次输入的处理步骤:
·观察:用户输入了什么?工具返回的数据 ·思考:是调用工具,还是直接回答用户 ·行动:调用知识库,搜索等 -将结果重新给到大模型,继续观察 -中间过程可能重复N次 ·答案:模型理解用户为你,不需要调用工具,直接给到用户答案
特点如下:
·助手。每次思考都是基于用户的指令,理解我该去做什么事情。 ·大模型要执行的事情由用户来控制,根据用户输入,去理解做下一步事情
关键点:要做什么事情,取决于用户的指令
2. Re-ACT:Reason and Act(推理+行动)
处理逻辑如下:
e-act处理逻辑
提示词确定后,对于用户的每次输入的处理步骤:
·持续循环:观察用户的最新输入,和任务的关系,形成新的计划、直到模拟达成任务目标 ·观察:用户输入了什么?工具返回的数据 ·思考:我的下一步要做做什么事情 ·行动:我才采取什么样的行动
……中间过程可能重复N次,直到模拟完成任务
计划模拟完成,确定下一步的行动计划
·行动:我该去调用什么工具 ·答案:我可以直接回复用户
特点:
·拿到用户输入,都会思考和用户输入和目标之间的关系,然后重新制定执行计划,达成目标。 ·用户无法决定让模型做什么事情 ·要解决什么问题,取决于初始的提示词
为什么TFlow AI的Re-ACT模式,更适合B端对客场景
2B业务对客户特征:
特征1:
2B对业务有明确的思考流程和目标。参考以真人处理为思考流程
例1:常见退货换处理。
·目标:解决用户对到货商品的不满意问题。 ·用户提问:我要退货 ·处理流程:不满意原因是什么-&订单是否是真实(已到货)-& 是否符合退货政策-&引导退货操作-&解答退货流程中的问题
例2:汽车销售过程关于汽车参数的咨询
·目标:帮助客户找到合适的汽车 ·用户提问:这款车的续航轴距是多少? ·处理流程:收集客户用车诉求(显示身份等)-& 解答续航问题-&补充用车诉求下的产品价值(如续航低,但是上下班通勤足够)
例3:saas软件产品答疑
·目标:引导客户留咨 ·用户提问:软件有什么优势 ·处理流程:收集客户场景-& 解答产品疑问-&引导留咨询
Re-ACT模式能够基于流程去模拟真人思考处理问题的流程
特征2:
·用户问题的解答处理,需要在B端企业提供的可控范围内 ·如果是豆包的助手模式,用户使用的产品的过程都无法预测。
|