做了这么久的Agent平台,是时候回忆、总结一下了。
Agent是什么
开始学习细节之前,我们先来对Agent有一个大致的概念
我们以这张图来开场,图上分别从多个角度罗列了Agent相关的产品。从这么多产品我们不难看出,Agent的市场确实很大,可以涵盖到方方面面,那Agent到底是什么呢。
我先用最简单的语言定义一下Agent。
Agent指能自主感知环境并采取行动实现目标的智能体,进行某种特定行为和交易,降低一个人或组织的工作复杂程度,减少工作量和沟通成本。
Agent的核心决策逻辑是让LLM根据动态变化的环境信息选择执行具体行动或者作出判断,并影响环境,通过多轮迭代重复执行上述步骤,直到完成目标。
精简的决策流程: P(感知)→ P(规划)→ A(行动)
- 感知(Perception)是指Agent从环境中收集信息并从中提取相关知识的能力。
- 规划(Planning)是指Agent为了某一目标而作出的决策过程。
- 行动(Action)是指基于环境和规划做出的动作。
工程实现上可以拆分出四大块核心模块:推理、记忆、工具、行动
再来一张经典的图
这样是不是对Agent有一个直观的认识了,Agent是基于LLM加上Memory、Tools(Action)、Planning。
什么还是不知道Agent是什么?
那就不得不请出斯坦福小镇了。
研究者们成功地构建了一个名为 Smallville 的「虚拟小镇」,25 个 AI 智能体在小镇上生活,他们有工作,会八卦,能组织社交,结交新朋友,甚至举办情人节派对,每个「小镇居民」都有独特的个性和背景故事。
为了让「小镇居民」更加真实,Smallville 小镇还设置了许多公共场景,包括咖啡馆、酒吧、公园、学校、宿舍、房屋和商店。「小镇居民」可以在 Smallville 内随处走动,进入或离开一个场所,甚至去和另一个「小镇居民」打招呼。
「小镇居民」的行为有多像人?举例来说如果他们看到早餐着火了,会走过去关掉炉子;如果看到浴室有人,会在外面等待;如果遇到一个想交谈的个体,会停下来聊天……
看到这里,很多朋友是不是已经想去玩这个游戏了:)
别忘了我们是来学习Agent的,并且斯坦福小镇目前已经开源了,并且有详细的论文,后面我们专门写一篇来如何部署(玩)斯坦福小镇吧
在斯坦福小镇这个场景中,完美的诠释了P(感知)→ P(规划)→ A(行动)
对于Agent有了简单的认识,并且知道Agent在各个领域都有产品,请保留对于Agent的幻想和好奇,自己可以想一想Agent还能做什么,有哪些是还没在图上的,保持对于Agent的独立思考。
如何学习Agent
我们先定一个大纲吧
斯坦福的虚拟小镇 (确实好玩)
构建自己的Agent (开源项目)
简单罗列了一下,实在是有点多,不过我们可以先聚焦一下比较有名,当然也是很重要的几个,比如LangChain、AutoGPT、AutoGen
这里可能要分多章,内容确实有点多。
Agent论文 (知其所以然)
在我们学习或构建自己Agent的时候,有好产品一般会提供论文,如果发现有特别优秀的论文,我们就放到这里。
有趣的AI(更像人)、有用的AI(更像工具)
有趣的AI能够提供情感价值和娱乐体验,而有用的AI则能解决实际问题,提高工作效率。
随着我们对于Agent的学习和实战会渐渐迷失自我,归根结底我们其实还是要考虑清楚,我们是想做有趣还是有用的Agent。