上海交通大学温颖教授:打造“通才”Agent|Agent Insights
时隔一年,我们再次访谈了上海交通大学人工智能学院/约翰·霍普克罗夫特计算机科学中心的长聘教轨副教授温颖。温教授在大模型之前的 Agent 研究基础上,持续深入探讨了大模型时代的 Agent 研究,提出了许多跨 AI 时代的重要观点。他在此次访谈中分享了一个新颖的见解,即“将大模型视为一个 Agent,Prompt 就是让 Agent 进行一整套在线强化学习”。他和团队提出了一种创新的策略优化方法——POAD,应用于多智能体强化学习框架中,能够推动“通才”Agent 的研究,今天的文章将聚焦在他的最新研究 POAD 上。Enjoy北航沙磊教授:当Agentic RAG照进现实——Agent Insights
WWDC 24 发布会上,苹果带来了全新的系统,除此之外,Apple Intelligence 作为压轴戏也终于上演,让我们看见了 AI 如何融入我们的日常生活。绿洲邀请到了一位在 NLP 领域有着学术背景和产业双重背景的专家——沙磊教授,他曾经也在美国湾区苹果公司 Siri 组工作。沙教授将在本期为我们介绍他的最新研究项目 ATM(Adversarial Tuning Multi-agent System),顺便聊聊他对苹果 AI 未来发展的看法,以及 ATM 技术如何利用类似于 GAN 网络的对抗型 Agent 提升 RAG 检索生成能力。Enjoy商汤科技毛航宇研究员:Agent间的协作与对齐 —— Agent Insights
Agent 逐步开启了从执行单一任务到复杂决策的转变,从传统自然语言智能体进化成大语言模型智能体。底层模型能力正以日新月异的速度不断增强。近期绿洲与商汤科技大模型事业部,担任资深研究员的毛航宇老师共同讨论 Agent 的未来。作为拥有近 10 年多智能体及强化学习研究经历的毛航宇老师,他所参与的 TPTU(任务规划与工具使用)框架,以及对 One-Step Agent 与 Sequential Agent 的创新设计,为绿洲近期对于 AI Alignment 研究以及 Agent 应用思考带来了新的启发。Enjoy浙江大学 ReLER 实验室研究员杨宗鑫:哆啦A梦的百宝袋 | Agent Insights
Sora 以视频的方式展示了“世界模拟器”和智能机器对人类时空物理世界的理解,最近又要被集成在 Adobe 视频剪辑软件中,在生成式 AI 的应用层面无疑取得了令人惊叹的进展。但在能够模拟出符合人类感知视频内容的同时,它依然缺乏对物理定律的深入理解。浙江大学 ReLER 实验室研究员杨宗鑫基于大小模型协同思想设计了 Agent—— DoraemonGPT,该 DoraemonGPT 显著提升了 Agent 理解动态视频的能力,相信大小模型协同互补可以缓解大模型逻辑顺序杂乱的问题。Enjoy