上海交通大学温颖教授:打造“通才”Agent|Agent Insights
时隔一年,我们再次访谈了上海交通大学人工智能学院/约翰·霍普克罗夫特计算机科学中心的长聘教轨副教授温颖。温教授在大模型之前的 Agent 研究基础上,持续深入探讨了大模型时代的 Agent 研究,提出了许多跨 AI 时代的重要观点。他在此次访谈中分享了一个新颖的见解,即“将大模型视为一个 Agent,Prompt 就是让 Agent 进行一整套在线强化学习”。他和团队提出了一种创新的策略优化方法——POAD,应用于多智能体强化学习框架中,能够推动“通才”Agent 的研究,今天的文章将聚焦在他的最新研究 POAD 上。Enjoy