AI编程时代的生存原则是什么?吴恩达:快速行动,承担责任
近日,吴恩达(Andrew Ng)在首届Buildathon上发表主题演讲,内容围绕AI辅助编程、快速开发产品原型,以及AI工程师技能需求展开。
吴恩达是人工智能与机器学习领域的国际权威学者。他是谷歌大脑项目的创始人之一,也是在线教育平台Coursera的联合创始人。2014年,吴恩达加入百度,担任首席科学家,2024年吴恩达进入亚马逊董事会。他近年来活跃于AI投资和创业领域,创立了AI Fund和DeepLearning.AI等项目。
演讲内容划重点:
1、硅谷新箴言:“快速行动,承担责任”。
AI辅助编程让独立原型开发实现10倍加速。原型成本大幅降低使快速多次试错成为可行策略,真正价值在于在试错中发现值得深度开发的项目。
吴恩达提出,原型开发对安全性、扩展性要求较低,AI进一步降低了试错门槛。他推崇“快速行动,承担责任”(Move fast and be responsible)原则,建议在沙盒环境中大胆实验,再决定是否投入生产化改造。
2、代码正在贬值,开发者需要转型为系统设计者和AI指挥者。
编程工具已经历多代进化:从GitHub Copilot到IDE,再到高度代理化的编程助手。工具迭代速度创造实质性效率差距,落后半代即可能显著影响产出能力。
代码价值本身正在降低。AI可自动生成代码、迁移数据库架构,使架构决策变得更可逆。开发者需要从代码编写者转型为系统设计者和AI指挥者,重点把控核心架构与复合型系统构建。
3、工程效率革命,催生“产品管理新瓶颈”。
工程速度提升后,产品决策与用户反馈成为新瓶颈。吴恩达以亲身案例说明:当工程时间从3周压缩到1天时,花费1周获取用户反馈会显得极其漫长。
他提出数据使用的新范式:不应单纯依赖数据做决策(如“数据说选版本三”),而要用数据修正直觉(“为什么我误判用户想要版本一”)。通过走廊测试、咖啡店调研、快速原型验证等方式打磨用户直觉,建立高效决策循环。
4、“AI时代无需学编程”是史上最糟的职业建议。
吴恩达强烈反对“AI时代无需学编程”的观点,指出历史上每次编程工具进步都让更多人群具备编程能力。他团队中的CFO、法律顾问、前台人员均通过学习编程提升工作效率。未来核心技能是“精准告诉计算机该做什么”,这需要理解计算机语言与编程逻辑。非技术人员可通过AI辅助快速掌握基础编程能力,实现跨领域效率提升。
5、AI工程师奇缺,大学课程却已严重脱节。
计算机专业毕业生失业率升至7%,可企业却仍面临AI工程师严重短缺。核心矛盾在于大学课程未能及时覆盖关键技能:AI辅助编程、大语言模型调用、RAG/Agentic工作流构建、规范错误分析流程等。新兴AI工程师需掌握三大技能:使用最新AI编程工具、熟悉AI构建模块(提示工程/评估技术/MCP)、具备快速原型能力与基础产品直觉。吴恩达呼吁教育体系加速课程更新,并鼓励开发者主动拥抱这些变化。
以下为演讲原文:
很高兴周末在这里见到大家。我想做的是与大家分享我对AI辅助软件工程的一些看法,以及我们为什么要组织这次Buildation活动,即一天内从零到产品的快速工程竞赛。
我发现,当你尝试做一些创新的事情时,无论是像AI Fund那样建立一家初创公司,还是在更大的企业环境中进行创新,预测项目是否可能成功的最大因素之一是速度。有些团队只需以迅猛的速度执行,就可以让他们获得更多的迭代、尝试更多的事情,成功的几率就会大大提高。
坦率地说,当我与投资组合公司的工程师或CEO合作时,我非常尊重的一点就是能够果断、快速执行的人。顺便说一句,我知道当我谈论速度时,有时人们会想,“哦,Andrew只是在谈论更加努力地工作吗?”但事实并非如此。就像努力工作肯定有帮助一样,我知道在世界的某些地方,谈论努力工作并不十分正确,但坦率地说,我努力工作,我尊重努力工作的人,就是这样。
但除了努力工作之外,还需要一定的决断力,可以让你执行力爆棚,并尝试更多的事情,完成更多的工作。而我对AI辅助编程感到兴奋的原因之一,是它把我们工作的核心部分提速了许多。
当我回顾我所从事的软件工作时,我所做的一些工作是构建小型独立产品的原型,而我所做的一些工作,以及你们很多人所做的工作,是在大型代码库上开发生产软件。如果我们研究AI辅助编程的影响,很难进行严格的研究,但也许对于处理大型传统的生产规模代码库而言,AI可能会让我们的速度提高50%,甚至更高,我不确定。但对于构建小型独立产品的原型来说,这并不是50%的加速,而是10倍的加速。
我想你们中的许多人都经历过很多项目,而两年前这些项目需要三名工程师花六个月的时间才能完成。现在,我们和朋友们可以在周末一起完成这件事。这意味着我们要尝试新事物,我们可以构建20个原型并看看哪些有效。实际上因为我的时间安排,我往往在周六写更多代码。每周六,我都会编写大量的软件,然后说,“天哪,这根本行不通!”但我从来没有告诉过任何人,它们也从来没有面世过。事实证明,有些人感到焦虑,因为在AI领域,许多概念验证从未投入生产。这被视为一个问题,但我实际上并不这么认为。对我来说,解决方案不是让更多的概念验证投入生产,解决方案是将概念验证的成本降到如此低的水平,他们根本不会在意你是否构建了20个原型,其中18个失败,并且永远无法面世,但这是发现真正有价值的两个原型的代价,你确实需要花费更多的时间来使其强大、可靠并扩大规模。
事实证明,在构建小型独立产品的原型上,我们能够特别快地做到可扩展化的要求是有原因的,坦率地说,如果我编写的软件只在我的笔记本电脑上运行,那么对可扩展性甚至安全性的要求就会低得多,因为我并不打算恶意攻击我自己的笔记本电脑,所以,如果我没有那么多防火墙也没关系,只要我不泄露敏感信息或做其他坏事。因此,构建原型所需的工作量要低得多,而且AI正在继续降低这一成本,同时也使其更加安全。
几年前,硅谷的口头禅“快速行动,打破常规”(Move fast and break things)名声不佳,是因为它真的破坏了一些事情。我认为有些人由此得出的结论是,硅谷发展得太快了,不要发展得这么快,但这是错误的。而我的团队的口头禅是“快速行动,承担责任”(Move fast and be responsible)。我发现许多聪明的团队都有办法创建一个沙盒环境,这样你就不会向数百万人发送可能以某种方式伤害他们的软件。但是你正在构建一个原型,你正在亲自尝试,假设你不会对自己造成太大的创伤。你知道,如果大语言模型给出了一次错误的回答,那么,可以快速行动,但要在安全的沙箱中进行,以便进行原型设计,然后决定是否要采取安全措施,然后再进行衡量。
AI辅助编程的特点之一是,在过去的几年里,已经出现了多波创新浪潮,多代创新。我认为两年前GitHub代码自动生成是一项巨大的创新,但现在我们已经远远超越了这一点。然后就会出现一波支持AI的集成开发环境(IDE)。我当时经常使用Windsurf或Cursor,同时,也出现了一波像Replit、Bolt、V0,也许还有Lovable这样的企业,然后就在今年早些时候,或者过去几个月,又出现了那股浪潮,一波高度代理的编程助手,比如Claude Code、Gemini CLI、Codex,你们中的一些人知道,我个人经常使用Claude Code,对吧?但是,我会在两个月后再说一次我在用什么。
我发现,工具的进化速度非常快,它确实带来了实质性的变化,使用最新一代工具与不使用最新一代工具实际上会有很大区别。也许大语言模型已经足够成熟,如果你正在使用,那么有多个模型足以满足许多商业应用的需求。但编程辅助是正在迅速发展的领域之一,落后半代或一代实际上已经产生了非常实质性的差异。然而,如果使用落后六个月的大语言模型,那么你知道,可能没关系,对于很多应用程序来说它可能都是可以的。
我看到的另一件令人兴奋的事情是,代码曾经是一种非常有价值的产物,用这种传统软件来构建代码非常困难,代码非常有价值,需要维护它、更新它,但代码作为一种产物的价值正在降低,因为AI可以为你编写它。甚至选择一种架构也更接近于“可逆决策”,这是杰夫·贝佐斯(Jeff Bezos)的术语,你可以做出决定,如果你不喜欢它,就改变它。
因此,之前,你设置了数据库模式,你永远不想改变它。但是现在,如果你有错误的数据库模式,那也没关系,让AI为你完成迁移,这并不那么痛苦。所以当我建造时,有时我会在一天内探索三种完全不同的架构,一切都很好。然后,也许下周,我会说,“你知道吗?让我们放弃我的代码库,让我们从头开始重建一切。”因此,这将引发人们以非常新的方式思考软件。
其中一件令人兴奋的事情,我稍后会再谈,就是硅谷,我想在座的各位,以及观看直播的各位,实际上都处于这方面的前沿。我稍后会再谈这个问题。
但我在软件领域看到的最大变化之一是,当构建变得更容易时,然后决定构建什么就成了更大的瓶颈。我一直将此称为产品管理瓶颈(Product Management Bottleneck)。
因此,在AI Fund,当我们构建产品时,我认为我们试图推动一个非常快速的迭代循环,我们编写一些软件来构建原型,也许是一个快速而粗糙的原型,然后我们做一些产品管理工作,获取用户反馈,塑造我们对产品的看法,促使我们更新我们想要构建的内容,我们围绕这个循环快速迭代,试图建立用户直觉,并获得更好的产品。所以对我来说,这是一个核心循环,在AI Fund、DeepLearning.AI,我的许多团队都在使用它来推动软件开发。
由于AI编程辅助和快速工程,我们现在可以比以往更快地构建软件,这意味着获取反馈或磨炼我们对用户真正想要什么的直觉,是一个越来越大的瓶颈。所以之前我花三个星期来构建一个原型,再花一周时间进行设计研究或其他什么的话,那就没问题了。因此,花三周时间编写代码,一周时间获取反馈,这样就可以了。但现在,如果我们可以在一天内编写软件,那么就需要花一整周的时间来获得用户反馈,这感觉就像过了一个世纪一样。
所以我看到的一个有趣的趋势是,我的很多团队越来越多地凭直觉做出决定,因为这是一个非常快的决策过程。你知道,我是一个数据型的人,我热爱数据,我研究AI数据,我谈论以数据为中心的AI。所以很明显我重视并尊重数据。事实上,我们就像Snowflake,一家数据公司,数据很重要。
但是让我给你举一个我做出的决定的例子。史蒂文和我致力于开发一款产品,这款产品尚未发布,所以我不想谈论细节,但长话短说,我们有四个产品创意。我喜欢其中一个,但我的团队不同意我的观点,所以他们进行了一项用户调研,以了解用户喜欢什么,结果数据出来了,我错了。我喜欢第一版,用户喜欢第三版。
所以对我来说,使用这些数据的糟糕方式是说,“哦,用户喜欢第三个版本,让我们构建第三个版本”,这很好,许多团队都这样做,你的决定是由数据驱动的。但对我来说,这是一种非常简单的数据使用方法。我实际上所做的不仅仅是说“数据显示版本三,让我们决定这样做”。我所做的是花了很长时间仔细检查用户数据,我们提出了多个问题,这是其中之一,我真的坐下来反思,“我怎么把事情搞砸了?为什么我认为用户想要第一版,但数据却清楚地表明用户想要第三版?”
因为相比起单纯的数据,即数据显示用户想要第三版,我更想要根据这个数据进行决策,我想要做的是使用数据来保持我的直觉,然后据此来决定要构建什么。这是一个很大的区别,因为这意味着,我真的花了几个小时在想,“我怎么把这件事搞砸了?”因为我认为,通过花时间磨炼我的直觉,我不仅可以用更好的方式做出这个决定,还可以以更好的方式做出很多其他决定,以便为用户提供服务。
鉴于此,我们实际上花费了大量时间思考一系列策略来磨炼我们对用户的直觉。但是你知道,我们所做的一切都是从亲自试用产品开始的,如果你很了解用户,你的直觉就会很好。而且当你对用户的直觉很好时,这是一个非常快速的决策过程。询问朋友、团队成员、进行走廊可用性测试(Hallway Usability Testing)、询问一些陌生人,我经常会坐在咖啡店或酒店大堂,非常尊重地抓住陌生人并请他们看看我的产品,我现在仍然这样做。从原型测试一直到上线做A/B测试,我知道硅谷喜欢A/B测试,当然,我们也进行A/B测试,我们希望产生结果,但对我来说,这实际上是我们投资组合中最慢的策略之一,我们很少使用。但是,这个例子展示的是,当工程加速时会在其他地方造成瓶颈,我们现在必须努力消除这种瓶颈。
我认为你们中的许多人都会被问到这个问题,因为你们中的许多人都是软件工程师,或者你们的非软件工程师朋友可能会问:“我应该学习编程吗?”在结束之前,我想花一点时间来讨论这个问题,在过去的一年里,很多人建议其他人不要学习编程,说AI将使其自动化,我认为我们会回顾这是有史以来最糟糕的职业建议。
当编程时,当软件工程从穿孔卡片发展到键盘和终端时,实际上有人当时说,“看,我们现在有了编程机器人,编程非常简单,就像你不需要软件工程师一样”,人们实际上是这么想的。但这是错误的。我的意思是,代码或键盘和终端使编程变得更容易,并且更多的人这样做。当我们从汇编语言发展到更高级的语言、从文本编辑器发展到集成开发环境(IDE)、从集成开发环境(IDE)发展到现在的AI编程辅助时,每一步都在使编程变得更容易。这意味着更多的人应该学习编程。
因此,我认为在AI Fund和DeepLearning.AI,每个人都会学习编程,而且我实际上已经在YouTube上发布过,当我们的CFO知道如何编程时,她可以做的工作会让她和她的团队更有效率;当我们的总法律顾问知道如何编程时,他会加快处理保密协议的速度;当前台人员知道如何编程时,她可以做以前无法完成的工作。所以我发现,我鼓励你所有的朋友都学习编程。
当我为每个人教授生成式 AI 这门课程时,有一件事让我恍然大悟。这是我们在 Coursera 上推出的增长最快的课程,它旨在让非技术人员了解生成式 AI 的商业意义。在幕后,我与一位了解艺术史的合作者汤米•尼尔森( Tommy Nelson )一起工作。他可以用艺术语言、艺术灵感、调色板、流派灵感来编写 Midjourney 的提示语,因此他可以创作出像这样的美丽图画。另一方面,你知道,我不懂艺术史,我所能做的只能是提示:“请为我制作漂亮的机器人图片。”而我永远无法获得像汤米那样的控制权,这就是为什么我们最终使用了他的所有照片,而没有使用我的。
我认为,展望未来,不仅对于我们所有开发人员,而且对于每个人来说,未来最重要的技能之一就是能够准确地告诉计算机你希望它做什么,以便计算机为你完成它,并且在可预见的未来,了解计算机语言,了解编程将使你对计算机有更深入的了解,从而更精细地控制它。并不是说人们需要用10个手指编写那么多代码,你可以让AI为你完成这些工作,但更深层次的理解对于告诉计算机为你做什么至关重要。所以我希望他们能够出去传播这个观点,因为我看到的是,不仅对于软件工程师,而且对于几乎所有的知识工作者来说,那些知道如何在AI的帮助下做到这一点的人,在有AI协助的情况下,都会变得效率更高、更强大。因此,我认为让他们也加入我们,甚至提供帮助,这一点很重要,这样可以让在座的所有人的工作变得更加轻松。
我看到的另一个热点是,人们想知道,我们需要计算机科学专业吗?因此,我认为近期计算机科学专业毕业生的失业率已经上升到7%左右,这令人担忧,但我看到的是,AI工程师的短缺。我在《The Batch》中写过这篇文章,称之为“生成式AI应用工程师”,但我认为这个名字太拗口了。不幸的是,我看到的是,仍有许多大学尚未升级其课程,无法让学生了解当今的工作角色。但坦白说,我找不到足够多的AI工程师,企业无法找到足够的此类人才。有些人获得了学位,但是,他们毕业时甚至没有调用过一次大语言模型。事实上,我最近遇到过一些学生,他们还没有尝试过任何AI编程助手,我认为这真的很不幸。
但我发现,当我与许多企业交谈时,我们就是找不到足够的AI工程师。所以对我来说,这些是一些关键技能,也是我对于新兴AI工程师角色的看法。一是熟悉AI辅助编程,它更加高效。好消息是,学习这些工具并不需要两年的时间,因为这些工具实际上并没有存在那么长时间,但这是一项关键技能。
我发现真正重要的第二个工具集是熟悉AI构建模块。由于大语言模型,许多企业或开源或闭源现在已用于prompting、实施RAG、Agentic工作流、如何进行Evals的技术,我发现构建Agentic工作流最重要的技能之一,是推动一套规范的错误分析流程的能力,这出乎意料地困难,但这有点像要学习如何使用工具,例如MCP、语音技术栈(Voice Stack)等等。但我发现,这套新的AI构建模块可以让你编写出比两年前功能更强大的软件。因此,如果你了解这一点,你就有更多可选构件,可以以组合的方式拼接在一起,来构建新型软件。
最后一种技能就是这种快速原型制作技能,包括基本的全栈知识。这真的很有趣,我发现我是一个非常糟糕的前端开发人员。我的背景更多的是后端机器学习。但是在AI的帮助下,我是一个很棒的前端。使用AI辅助编程,你可以更轻松地发现前端错误,而棘手的后端错误仍然需要数周时间才能调试。而且由于产品管理瓶颈,我发现开发人员只具备非常基础的产品管理技能,所以如果工程师只会像素完美的Figma设计,那就没那么有价值了。而如果工程师可以拥有更多的用户意识和用户判断力,那么就可以做出一些基本的产品决策,拥有一些用户直觉和基本的设计决策,这实际上可以让团队发展得更快。
因此,尽管最近计算机科学毕业生失业率上升令人沮丧,这是我们需要解决的问题,但我发现硅谷各地的许多企业都找不到足够拥有相关技能的人才,而就业机会实际上是这样的,如果你拥有相关技能,那么来吧,你正在寻找工作,与我联系,我可以向你介绍很多企业。对于很多人来说,确实存在短缺,但这也是真正的机会。
总而言之,我知道我触及了很多要点,但最后再说几点。我们中的许多人都处于快速工程的前沿,也许还有另一个术语“氛围编程”(vibe coding)。我倾向于不经常使用这个术语,因为我认为它会误导人们认为你只需要去感受氛围,接受Cursor建议的所有更改建议,是的,你可以这样做,但事情并没有那么简单。当我和一个编程助理一起编程一整天或一个下午时,我会筋疲力尽,这是一项非常耗费脑力的练习,所以我发现“氛围编程”(vibe coding)这个术语很多非技术人员都会使用它,但我不会在简历上写“我是一个氛围编程员”。
这导致了工作流程和软件的很多变化,以及产品管理瓶颈,但还有很多其他的事情,我很高兴能和你一起探索。我希望我们今天能做的事情之一是,如果您看到了最佳实践或工作流程中的奇怪变化,我很想听听你们所有人也看到了什么,因为你们正在创新,或者遇到不存在的新问题,然后找到新的解决方案,我发现这很有趣,所以我希望在这里的对话,我们都可以相互学习。
而这也是我们想要组织这次Buildation的原因之一,我清楚地看到,硅谷和其他主要科技中心,甚至其他地方的人们,他们的建设速度比一年前快得多。世界上很多人还没有明白这一点。我们仍然会遇到有人说:“哦,我正在使用AI进行编程。”您知道,“这就像为我自动完成代码一样”这真是太棒了,但我们现在已经远远超越了这一点。因此,我希望我们能做的事情之一就是,彼此分享最佳实践,互相学习,同时也要传播观点,让世界上许多还未达到最前沿水平的人们了解现在所能达到的水平,甚至可能超越我希望你们所有人做的事情,即引领世界进步。
我认为软件也是其他学科未来发展的先兆。因此,在大语言模型领域,我认为已经存在两个清晰的价值领域。一是回答问题,你知道,ChatGPT是这方面的市场领导者,只是回答人们的问题。二是编写代码。这是两大价值领域。正因为如此,人们在AI上投入了大量资金,这些工具比其他职业领域的工具已经先进得多。
但我认为,我们在软件领域看到的很多东西,最终,这些工具也会为许多其他职业领域带来更好的发展。因此,我们在软件领域看到的这些真正令人兴奋的加速,也将扩展到其他领域。
因此,除了快速工程和加速我们在软件方面的工作之外,我觉得它甚至为非软件工程师提供了早期的一课,让他们知道他们的领域可能很快会发生什么,并为我们自己以及世界上所有知识工作者弄清楚这一点。也许人们也都是知识工作者。我发现这一系列令人兴奋的任务,我希望我们所有人都能参与其中,这不仅是为了我们自己的工作,也是为了帮助其他人与我们一起努力。
所以我期待与大家一起度过愉快的一天,非常感谢。
问答环节Q&A:
观众A:吴教授,我很高兴来到这里。我毕业于斯坦福商学院,我的背景是商科。我没有编程经验。两年前我认真考虑过编程,并且研究、编写了很多Agent。今天我有一次很棒的经历,因为在亲眼看到一个项目之前,我根本不知道它会是什么样子。
今天早上和你谈论Agent的模块化时,确实产生了共鸣。我们考虑prompt,我们考虑MCP,我们考虑各种各样的事情,所以我们是否有针对Agent更快速地评估编程?最佳做法是什么?因为每个人都使用不同的工具,每个人都使用规范驱动(spec-driven),而且人们谈论的是上下文工程(context engineering),而不是提示工程(prompt engineering),我们提出了自己的工作流程,但有时结果很好,有时则不然。所以我们真的很想听听你的观点,看看我们能做些什么,让我们做得更好。
吴恩达:坦率地说,AI编程的最佳实践正在迅速发展。即使今天听小组成员发言或在走廊里聊天,我也在学习。所以我不知道是否存在一个世界上最好的方案,因为最佳实践发展得太快了。但我所知道的一些最佳实践,比如测试驱动开发,我们确定要在其之上构建一些组件,因此要进行更严格的测试。而对于那些未在其之上构建的内容(例如前端),我会进行不太严格的测试,但对于后端数据库,我会进行真正的测试,以避免以后无法发现的真正奇怪的错误。规范(Spec)很重要。我发现快速迭代确实有助于推动产品进步。我认为问题是如何协调多个Agent的协同工作,我看到很多不同的人做很多不同的事情来协调,感觉就像狂野的西部。
我认为MCP是一项伟大的进步。MCP面临的挑战是API的列表很长,所以我认为最终我们需要开发更具层次化的发现协议。实际上我经常做的一件事就是尝试阅读其他人的提示语。事实证明,我成为一个相当不错的提示语作者的方法之一是,每当有一篇非常酷的研究论文发表时,我有时会去下载开源文件并真正阅读提示语,变成优秀提示语工程师的唯一方法就是自己尝试,同时也要阅读别人的提示语。
关于eval的一件事,Agent稍微成熟一些,决定你构建Agent的能力的最大因素之一,是驱动规范的错误分析过程的能力。最佳实践是,你有一个你知道的AI Agent,例如,下载PDF,提取文本,进行网络搜索以检查你是否在与某个被制裁的人打交道,如果你是供应方,你查看数据库和定价等等。因此,我发现这些Agent工作流能够快速构建端到端工作流程,然后对端到端工作流程进行评估,然后进行错误分析,以便当AI Agent没有像人类专家那样行事时,我们能够真正仔细地将Agent和人类之间的差距归因于哪个组件的行为不当,这样它就可以将注意力集中在正确的组件上。
目前,我发现推动错误分析流程的团队之间仍然存在很大差异。这样一来,你就不必猜测要做什么了,Agent能诊断出哪里有问题,哪里表现都不佳,并真正将注意力集中在这一点上。它拥有一套非常系统化的评估系统,并且非常有系统性并且观察AI Agent在哪些方面比人类专家做得差,并利用它来集中注意力,我希望你可以把它教给所有人,它对团队的速度有很大的影响。
观众B:目前这种AI编程的限制是什么?就像我们可以看到它正在创建SaaS应用程序,我们已经看到了,但是大型后端软件呢,比如,RDBMS是如何制作的。您是否看到了AI,现在可能不需要几十年的时间来建立数据库。您认为这可能从中获得很多帮助吗?
吴恩达:我曾听到很多Anthropic的研究人员很久没有手写过一行代码了。所以我认为我们正在看到用AI编程代理编写的真正严肃的软件。我所看到的是,对于更常见的任务,比如正常的前端后端开发,有了更多的训练数据,所以在这方面表现出色。顺便说一句,事实证明它非常善于实现一个transformer神经网络,因为有足够多的数据。但对于真正奇怪的极端情况或有时底层GPU编程,训练数据较少。因此,它们实际上不太可靠,或者对于构建其他人尚未实现的非常奇怪的研究算法这些极端情况而言,你知道,你需要在提示语中降低层次。而对于前端来说,有很多React前端可以做高级提示,并且会有一定程度的合理解释。然后你会发现,从最近的进展来看,模型确实变得非常好。所以我认为Claude4是一个惊人模型,GPT-5也是一个惊人的模型,但我发现它们的很多力量不仅仅是一个模型,而是Agent团队,你知道那些云端代码,比如Gemini CLI或任何围绕这些构建器的东西。
我认为有趣的研究表明了这一点,如果你有一项人类可以完成的任务,那么两年前,AI还无法完成人类需要30秒才能完成的任务。而现在的情况是,人类需要一分钟、五分钟、十分钟、二十分钟才能完成的任务,对于人类来说难度随着要完成的时间增长成倍增加,而现在AI可以越来越自主地做这些事。这是一个非常令人兴奋的趋势,在AI的影响下,人类在一定时间内能够编写的代码量迅速翻倍。
观众C:所以从像Agentic Coding这样的技术来看,AI是新的电力,这可以追溯到使用图形处理器进行深度无监督学习。请问您还坚持什么世界仍未普遍接受的观点?
吴恩达:顺便说一句,我有点怀念那些我说了些什么却没人相信我的日子。然后我记得当我说我们必须扩大机器学习的努力时,很多人不相信我,对吧?然后我就默默地为自己努力了很长时间,最终人们开始接受我的观点。现在我真的很担心我可能会说一些愚蠢的话,然后人们就会相信我。
我认为未来几年还有很多工作要做,将大量企业工作流程实现为Agent工作流。有一件事我觉得很令人兴奋。我认为人们仍然低估了语音堆栈(voice stack)的力量。我认为未来将会有更多基于语音的应用程序受到广泛赞赏。我认为视觉AI的发展也有点慢,最有价值的图像类型是PDF文件的图像。有人告诉我,人类每年产生超过一万亿页的文档,那么Agentic文档提取真的会这样流行起来,能够提取多个PDF文件进行下游处理。也许还有另一件事人们还不相信我,我认为每个人都应该学习编程,而不仅仅是软件工程师等等。
观众C:您是指不借助Agentic AI的帮助自学编程,还是借助Agentic AI的帮助学习编程?
吴恩达:应该在AI的帮助下学习编程。但就我的团队、AI Fund和DeepLearning.AI而言,每个人都学会了编程,我看到很多职责不是软件工程师的人做的事情却更有效果。他们不会成为软件工程师,而且我也不希望每个人都成为软件工程师。但是你知道,当非技术领域的非技术人员学习编程时,你会成为一个更好的营销人员,一个更好的招聘人员,一个更好的人力资源专业人士,一个更好的财务专业人士。所以我认为世界仍需要相当长的时间来解决这个问题。
观众C:谢谢教授。因此,当今使用的很多模型都是在已经编写的软件上进行训练的。现在,在未来,新的软件构建模式将如何出现并传播到这些模型中并得到广泛传播?这个机制是什么样的?
吴恩达:你知道,有一件事我很好奇,在计算中,我们构建了抽象层,然后有时会有一些低层次的抽象层不是很好或者相当不错,但我们只是把它放在一边,然后我们只是在它的基础上进行构建。例如,我认为Linux很棒。另一方面,我不知道,我们可能永远都会被他困住,也许还有比Linux更好的操作系统可以发明。但其上已经构建了太多内容,可能不值得现在尝试改变。所以我有点疑惑,你知道8086汇编,对吗?坦白说,我们可能会被困住很长时间,但没关系。因此,我有点怀疑,既然互联网上有这么多Python和JavaScript代码,是否会让Python和JavaScript成为抽象层,或者C++和Java或其他什么,我认为如果是这样的话会没问题,因为它没有那么糟糕,但是如果有人发明了一种新的编程语言,那也没关系。正如我刚才提到的,我们在较底层的GPU编程方面遇到了很多困难,因为没有足够的数据。
哦,还有一件有趣的事。LLaMA论文。使用多版本的LLaMA论文和Agentic工作流来生成编程难题,所以他们让AI长时间思考来生成编程难题和解决方案,这会生成数据来训练下一代模型,以便快速解决相同的编程难题。因此我认为,由于具有agentic loop的AI系统可能需要很长时间才能解决这些难题,这会生成数据来训练下一代AI,以尝试更快地解决问题。因此,存在一条通往合成数据生成的道路,我认为这也非常令人兴奋。
观众D:谢谢你,Andrew。我有一个问题。这是非常开放式的。因此,当我们谈论大语言模型时,从最基本的层面上讲,它是根据前一个标记来预测下一个标记,对吗?但是当我们谈论AGI时,现在人们对AGI的到来赞不绝口,当我感觉到,当我将它与人类思维进行比较时,人类基本上是基于直觉、基于信念来思考,还有很多其他因素参与其中。但是为了达到AGI,我们的瓶颈基本上就是意识。就大语言模型或将其发展为AGI而言,您认为这个瓶颈将如何发展,使模型能够超越这个瓶颈,不再仅仅预测下一个输出,而是去预测我们作为人类所做的事情,根据信念、勇气和意识来预测我们人类所做的事情。这是不是太远了?
吴恩达:那么让我先谈谈AGI这个概念,然后再讨论AI的进展。所以我觉得,AGI已经成为一个炒作术语,而不是技术术语。我认为我所知道的最初的定义是能够完成人类相同智力任务的AI。而且我们大多数人都可以在全新的环境中学习驾驶汽车,比如在野生动物园,或者我们大多数人真的花了几十个小时才学会驾驶飞机,或者学会驾驶船只,所以这些都是人类可以完成的任务。它们实际上距离AI所能做到的还很远。所以我认为这实际上离我们设想的AGI还很远。但出于各种经济、商业或公关原因,许多公司一直在抛出AGI的替代定义来制造炒作或公关或其他什么。现在的情况是,对AGI的定义有很多不一致的地方,我不明白,很难知道人们在使用AGI时究竟在谈论什么,这就是为什么我怀疑当一些公司宣布他们达到AGI时,我认为不会有一个技术里程碑或营销里程碑。就像测序人类基因组的例子一样,结果发现有两个群体在公关、竞争等等方面展开竞争,最终决定,“我们就宣布成功吧。”他们召开了一次联合公关会议,宣布成功,然后他们又回到了实际测序人类基因组的真正工作中。因此经济学家往往会说:“我们为什么不直接宣布我们达到了AGI?我甚至不知道这意味着什么。”根据一些定义,我认为AGI几十年前就已经出现了。所以我实际上真的很想知道,我们是否应该只是鼓励公司,让我们宣布成功,然后让我们回到AI的真正工作。它可能会消除一些炒作并形成一个更健康的生态系统。我不知道,我可能会因为这个提议而陷入麻烦。
现在就我们的AI、意识的实际进展而言,我不知道如何衡量意识。意识是一个重要的哲学问题。但在哲学中,却存在着这样的问题:“你怎么知道我是否有意识?你怎么知道我是否有自我意识?”或者在哲学上有僵尸的概念。也许我没有意识,但我只是表现得好像我有意识,而你却看不出来。所以我认为我们已经决定在人类社会中,我们都不知道对方是否有意识,但假装对方有意识被认为是礼貌的。我认为我对计算机也有同样的感觉。对我来说,计算机是否有意识是一个哲学问题,而不是科学问题。因为据我所知,没有针对意识的测试。我并不是否认哲学问题的重要性。它们很重要,但这将是人们可以争论几个世纪却永远无法解决的一个问题。因此,作为工程师和科学家,我只能说,我不知道计算机是否有意识,就像你不知道我是否有意识一样。因此,如果我们将计算机的行为与智能人类的行为进行比较,就会发现两者之间仍然存在明显的差距。但在某些地方计算机远远超越人类,在某些地方计算机又远远不如人类。因此我认为完全缩小与人类的差距似乎真的很困难。我认为这可能需要好几十年的时间,主要是因为计算机的设计原理与生物学截然不同。因此,人类大脑具有一些计算机难以比拟的优势。对于计算机来说,有一些令人惊叹的优势是人类难以比拟的。所以我觉得我最终可能会做的就是专注于构建东西。
观众D:谢谢,Andrew。我有一个问题,关于您之前提到的话题,计算机科学对高校学生意味着什么?我当然知道显而易见的答案是每个人都应该开始使用这些工具,以提高他们所构建的任何东西的效率。但我的问题是关于更基础的东西,比如我们将重点关注到计算机科学基础知识方面的学习内容。比如,是否仍然需要知道如何进行汉诺塔问题的递归或如何遍历图表?是否仍会通过网络了解编译器设计的工作原理?或者也许现在或将来编写的编程或语言等问题将专门为大语言模型设计,而不是供人类去学习编写代码。所以我想知道,对于一个上大学的孩子来说,除了使用这些工具之外,他的重点还应该放在构建基础知识上,以便他能够扩展计算机科学领域本身吗?
吴恩达:所以我觉得,作为一名计算机科学人员,我学到的东西有些现在已经过时了,但也不是那么多。我认为计算机科学学位并没有教授很多有价值或有用的信息。我发现很多计算机科学课程存在的更大问题是,它们没有教授极其重要的新知识,课程尚未适应,有些东西已经过时了。举例来说,坦率地说,现在不要要求我记住JavaScript语法,对吗?所以我认为诸如此类的事情并不那么重要。但是很多计算机科学基础知识,例如了解数据是如何存储的,数据库模式是什么,这些东西如何扩展或不扩展?什么是网络?比如抽象层是什么?你正在构建的堆栈是什么?我认为这些基础知识可以让具有更深层次计算机科学知识的人仍然能够引导AI系统设计和构建更强大的可扩展系统。我想,我们中的许多人都有过这样的经历,AI coding Agent会奖励黑客,就像我发生在你身上一样,对吧?比如删除所有测试,因为这是通过测试的最快方法。AI coding Agent会做这样的事情。我认为具有更深计算机科学基础的人能够更好地思考解决问题。所以我发现这非常有价值,我的直觉是,两三年前计算机科学系教授的东西,也许70%、80%仍然高度相关且值得了解。但我们也确实需要增加这些非常有价值的新知识,我认为许多大学对此的适应相对较慢。
观众E:你好,Andrew,谢谢你的主题演讲。当天早些时候,您谈到了产品管理瓶颈,即与人、用户和陌生人一起测试的问题。所以我想知道您是否设想我们将使用AI来真正解决这个瓶颈,比如,您知道,促使大语言模型扮演产品用户并测试应用程序等。您有设想吗?如果是的话,那么如何设想呢?
吴恩达:是的,事实证明有很多人在做这样的努力,实际上刚才有人,Ash抓住我并向我展示了一些可以做到这一点的产品,但事实证明有很多关于使用simulated agent进行用户调研。所以我可以模拟100个角色,甚至以角色的身份进行调查,甚至可以回答他们,然后测试我的产品。所以现在有许多活跃且令人兴奋的研究是,我如何校准由100名simulated agent组成的群体,使其能够说出像提示语的话?比如:“你是这个年纪的这种人,适合这份工作。告诉我你的想法。”所以如何构建这个simulated agent集合,以便您得到的答案能够很好地与用户群体的行为相匹配。我认为这是第一步。我想我们中的许多人,如果我有一个产品创意,集思广益,从一个默认的人格就能得到第一手反馈实际上已经相当不错了。所以我认为这项研究有望继续下去。
但这实际上是一件事,很多人的反馈是,这些信息在互联网上并不存在。例如,当AI Fund构建大量B2B产品时,我们会与金融专业人士或合规专业人士等合作。互联网上并没有太多关于他们对不同产品特性的反应的数据。因此在这种情况下,大语言模型没有上下文,他们不了解他们为之构建软件的特殊工作。然后通过某种方式从真实的人那里获得反馈或仍然很重要。我们是否会派遣AI Agent去采访他们,而不是我们去与他们交谈,我认为这实际上是一个非常令人兴奋的领域。他们提出了一个产品管理问题,我认为我很有动力,看看我们是否可以找到方法来帮助你解决这个问题。
观众E:好的。非常感谢,Andrew。
本文来自微信公众号“划重点KeyPoints”,作者:重点君,36氪经授权发布。