最近吴恩达教授 Andrew.Ng 在 deeplearning.ai来信中表示大语言模型 Agents工作流将是AI领域中一个关键的趋势,并且有可能在今年推动大规模的人工智能进步——甚至可能比下一代基础模型更甚。
I think AI agent workflows will drive massive AI progress this year — perhaps even more than the next generation of foundation models. This is an important trend, and I urge everyone who works in AI to pay attention to it. -- Andrew.Ng
我们通常在ChatGPT中希望一次输入就能获得期望的结果,然而结果通常并不理想。我们会根据响应一次一次的提示ChatGPT修正答案,最终获得期望的输出。问题来了,我们是否可以将这种流程规范化呢?
业界有人提出了Agents workflow,在一个工作流中,我们可以要求LLM多次迭代文档,最终输出高质量的答案。它通过模仿人类解决问题的迭代方法,使得人工智能生成的输出更加精确和细致。这种方法不仅利用了大型语言模型的优势,还通过引入反馈循环来弥补其不足,从而实现持续改进。通过规划、行动、审查和调整的循环过程,人工智能可以产生更高质量的结果。吴教授的团队在Human Eval这个数据集上对此进行了测试,并获得了如下的图表。Human Eval论文《Evaluating Large Language Models Trained on Code》中提到一个代码评测标准。
从上图中我们可以看出,GPT-3.5和GPT-4在zero-shot中分别获得了48%和67%左右的正确率,而通过使用Agent work flow,有些Agent在GPT-3.5上甚至达到了95%的准确率。可见通过迭代Agent work flow实现的性能提升远远超过了从GPT-3.5到GPT-4的改进。这一发现强调了Agent work flow在提高人工智能性能方面的重要性。甚至能让GPT-5提前到来。吴教授总结了当前的业界研究,提出了四种工作流设计模式。
此外,Open AI的应用主管Liliang Weng在2023年6.23撰写的一篇博客《LLM Powered Autonomous Agents》也提出了如下自动化Agent架构。这篇博客非常值得一读,系统的描述了一个Agent工作流类似AutoGPT,BabyAGI等利用LLM作为大脑自动完成任务的流程和核心组件。
2.1 概述
下一篇我们将深入Agent work flow的Reflection,并结合之前搭建的Llama.cpp来测试验证。动动小手,加个关注,收藏评论哦,及时获取最新的更新。