亚马逊杀疯了,连甩十大重磅发布,揭Agent大招、自研芯进展
全球最大云计算巨头的AI武器库,又迎来重磅更新!
智东西拉斯维加斯12月2日报道,今日,在年度云计算产业盛会AWS re:Invent上,亚马逊云科技(AWS)连甩一系列重磅AI新品,包括最新AI芯片Trainium4、基于其首款3nm AI芯片的Amazon EC2 Trainium3 UltraServers、第二代自研大模型Amazon Nova 2系列,以及大量Agent开发利器。
从AI基础设施、AI推理平台、企业数据管理到智能体开发工具、前沿智能体,通通迎来一大波升级。智东西作为受邀现场参会的媒体,从大会前排带来超全干货报道。
Amazon Nova 2系列首发4款模型:经济高效推理模型Lite,高智能推理模型Pro,语音转语音的实时拟人对话式AI模型Sonic,以及面向多模态推理和图像生成的统一模型Omni。
其中,Nova 2.0 Pro Preview在指令跟随、智能体工具使用榜单中,性能超过了GPT-5 mini、GPT-5.1、Claude Opus 4.5、Gemini 3 Pro Preview等前沿模型。
值得一提的是,Amazon Bedrock新增18款全托管开源模型,其中包括4款国内顶尖模型:阿里Qwen3-NEXT和Qwen3-VL、月之暗面Kimi K2 Thinking、稀宇科技MiniMax M2。
其他新增的前沿模型还有谷歌Gemma 3、英伟达Nemotron、OpenAI gpt-oss-safeguard、Mistral AI的Mistral Large 3和Ministral 3等。
总体来看,今日十大重要发布包括:
1、P6e新实例:采用英伟达GB300 NVL72系统。
2、AWS AI Factories服务:专用客户定制AI基础设施,由AWS快速构建和管理。
3、AWS Trainium4自研AI芯片:第四代自研AI芯片,相比上一代带来6倍的计算性能(FP4)、3倍的FP8性能、4倍的内存带宽、2倍的内存容量,并可通过NVLink Fusion和UALink实现纵向扩展。
4、Amazon EC2 Trainium3 UltraServers:由AWS首款3nm AI芯片Trainium3提供支持,提供大规模AI训练和推理的高性价比,单集群可连接144张Trainium3芯片,算力达362PFLOPS(FP8),带宽为706TB/s,相较上一代带来4.4倍计算性能、3.9倍高内存带宽、5倍的每百万瓦token数。
5、Amazon Bedrock平台:新增18款开源模型,模型数量过去一年翻倍增长,已拥有超过10万客户,其中50多家客户均使用了超过1万亿个token。
6、Amazon Nova 2系列自研模型:包括Lite、Pro、Sonic、Omni。
7、Amazon Nova Forge服务:支持企业访问Nova模型在不同阶段的训练检查点,并将自有数据与亚马逊的训练数据集混合,构建定制前沿模型。
8、AgentCore开发工具:Policy in AgentCore(预览版),使用细粒度权限策略,给agent行动设置明确边界;AgentCore Evaluations(预览版),使用评估器,根据现实世界行为来持续检查agent质量。
9、4款前沿智能体:AWS Transform Custom(专为企业开发工作流程设计),Kiro autonomous agent(自主开发复杂编程任务)、AWS Security Agent(预览版,保护全开发生命周期安全)、AWS DevOps Agent(预览版,加快事件响应速度并提高系统可靠性)。
10、7款新实例、6项Amazon S3存储升级、5项Amazon RDS数据库更新、3项计算与加速优化新功能、4项管理与治理新功能。
01.新基建:全新AI芯片Trainium4性能飙6倍,帮企业定制专属AI基础设施
亚马逊云科技CEO马特·加曼(Matt Garman)称,亚马逊云科技是第一家在云中提供英伟达GPU的公司,其与英伟达合作已超过15年,也是迄今为止运行GPU集群最多的公司。
1、基于英伟达GB300 NVL72打造P6e-GB300
今天,亚马逊云科技新发布采用英伟达最新的GB300 NVL72系统的P6e-GB300,相比P6e-GB200,新实例GPU内存容量提升至1.5倍,FP4计算性能(无稀疏)提升至1.5倍。
英伟达在亚马逊云科技上运行其生成式AI集群。OpenAI也在亚马逊云科技上基于EC2 UltraServers集群支撑ChatGPT运行及训练下一个模型,部署了数十万张GB200。加曼透露这些处理器很快将会变为GB300。
本月初,亚马逊云科技还与沙特阿拉伯AI创企Humain建立了合作伙伴关系,计划在沙特的数据中心设施中提供、部署和管理至多15万个AI加速器。
2、AWS AI Factories满足企业私有化部署需求
为满足企业的私有化部署需求,今天亚马逊云科技宣布推出AWS AI Factories。基于这一平台,客户能在自己的数据中心部署专用AI基础设施,然后使用亚马逊云科技的基础设施和服务。
3、Amazon EC2 Trainium3 UltraServers
目前,Amazon Bedrock上运行的所有推理工具都由Trainium提供支持,亚马逊云科技已经部署了100万颗Trainium芯片,Trainium2的量产速度是其曾经芯片量产速度的4倍。
加曼称,亚马逊云科技的Trainium系列芯片虽然以“训练”命名,但这些芯片其实也适用于推理用途。目前,亚马逊云科技上的许多AI推理服务都是在Trainium芯片上运行的,包括Claude的前沿模型。
亚马逊云科技还围绕Trainium打造了一个超大规模系统,名为Project Rainier,用于Anthropic下一代Claude模型的训练。
这一项目的规模十分庞大,加曼称,如果过去大家常说单个数据中心已经成了新的计算机,Project Rainier则更进一步,让由多个数据中心组成的园区,构成了一个计算机。
Project Rainier将会不断扩大规模,最终支持高达30个单体数据中心,用掉1.1GW的电力,托管超过50万个Trainium2芯片。相关计算设备会使用超过100万个的高速连接器件,通过AWS EFA网络实现安全、可靠的连接。
亚马逊云科技于去年发布了Trainium3芯片,今天,加曼宣布Amazon EC2 Trn3 UltraServers服务器已经广泛可用。与上一代产品相比,该服务器可提供4.4倍的算力和3.9倍的内存带宽。
值得注意的是,Amazon EC2 Trn3 UltraSevers在能效比上也有提升,每兆瓦所处理的token数量达前代产品的5倍。
4、下一代AI芯片Trainium4
加曼还透露,亚马逊云科技的下一代AI芯片Trainium4已深入设计阶段。Trainium4预计能提供6倍的FP4性能,4倍的内存带宽,2倍的内存容量,并支持通过NVLink Fusion和UALink进行扩展。
02.新模型:阿里、Kimi、MiniMax模型上架,第二代自研模型Nova 2四弹齐发
亚马逊云科技Amazon Bedrock推理平台已经拥有超过10万客户,使用其处理超1万亿个token的企业客户已超过50家。
亚马逊云科技一直以来的信条就是“选择至关重要(Choice Matters)”,这也适用于模型的选择。加曼称,亚马逊云科技认为AI的未来不会仅由1个模型统治,过去1年,Amazon Bedrock上提供的模型数量已经翻倍,DeepSeek、Qwen等中国模型也在支持范围之内。
Amazon Bedrock还在今天新增了18款全托管开源模型,包括Qwen3-Next-80B-A3B、Qwen3-VL-235B-A22B、Kimi K2 Thinking、MiniMax M2等中国模型。此外,谷歌Gemma、英伟达Nemotron以及全新的Mistral Large 3和Ministral 3(3B、8B和14B版本)等模型也登陆Amazon Bedrock平台。
亚马逊云科技还发布第二代自研模型家族Nova 2系列,推出了4款新模型:Lite、Pro、Sonic和Omni。
Nova 2 Lite是一款快速且经济高效的推理模型,适用于各种类型的工作负载,拥有不错的指令遵循、工具调用、信息提取、代码生成等能力。Nova 2 Lite在上述四大领域的能力基本全面超越了Claude Haiku 4.5、GPT-5 mini、Gemini 2.5 Flash等轻量级模型,仅在编程能力上略逊于GPT-5 mini。
Nova 2 Pro是Nova系列中最智能的推理模型,支持文字、图像、视频、语音四种模态输入和文本模态输出,适用于高度复杂的工作负载,尤其是Agent场景。在两项Agent基准测试中,其表现已经超过了GPT-5.1(high)、Gemini 3 Pro Preview(high)等前沿模型。
Nova 2 Sonic则是亚马逊云科技的下一代语音转语音模型,支持文本和语音两个模态的输入输出,能为AI应用提供实时、类人的对话式AI体验。在语音理解和推理任务上,其性能已经超过了GPT Realtime、Gemini 2.5 Flash等。
Nova 2 Omni是Nova系列的新物种,也是业界首个支持文本、图像、视频和音频输入,并支持文本和图像生成输出的推理模型。不过,亚马逊云科技尚未公布其基准测试成绩。
03.新服务:开放Nova模型训练检查点,帮企业训出专属前沿模型
加曼谈道,AI需要拥有理解公司数据的能力,才能真正为公司和客户带来巨大价值。
由于数据具有独特性,企业往往不希望自己的专有数据被嵌入到第三方模型中,供他人使用。过去,业内让企业数据和模型结合最常用的技术是RAG或向量数据库,但这无法让模型真正理解数据。想要教会模型理解行业知识,还是需要定制模型。
然而,如果从零开始定制模型是极为昂贵的,企业没有足够数据、足够算力打造出强大的通用智能。
如果在开源模型的基础上,通过微调、强化学习等方式打造行业模型,则有可能出现其他领域性能下降的风险。
亚马逊云科技的解决方案,是Amazon Nova Forge。Nova Forge引入了“开放式训练模型(Open Training Model)”的概念。
通过Nova Forge,企业可以独家访问各种Nova模型的训练检查点,并在模型训练的任意阶段,将自己的专有数据与亚马逊创建的训练数据集混合。这使得企业能够产出一个深度理解企业信息的模型,同时不会遗忘模型已训练的核心信息。
Nova Forge还提供了使用远程奖励函数和强化学习微调的能力,以进一步改进模型,让企业可以将真实环境集成到训练循环中。由于基础模型已经理解业务,这些后训练技术实际上会变得更加有效。
亚马逊云科技已经和不少企业试点了Nova Forge服务。索尼便通过Nova Forge,对Nova 2 Lite模型进行了微调,使其适用于索尼自身的业务和运营。模型在引用一致性和文档依据等任务上表现优于基准模型,索尼的目标是借此将索尼合规审查和评估流程的效率提升100倍。
04.新工具:给Agent开发设限和打分
今天,亚马逊云科技宣布Amazon Bedrock AgentCore新增两项新功能,帮助开发者快速构建Agent。自AgentCore SDK预览版发布以来,其在5个月内下载量已超过200万次。
此前,亚马逊推出了为Agent设计的核心工具集AgentCore,包含部署、代码解释器、托管环境等诸多能力。在此基础上,亚马逊推出Policy in AgentCore预览版和AgentCore Evaluation预览版。
Policy in AgentCore允许开发者在AgentCore Gateway工具调用运行前拦截,使用带有细粒度权限的策略,为Agent行为定义明确的界限,如使用哪些工具、如何使用工具,开发者也可以通过自然语言创建标准,如“报销金额大于1000美元时,就阻止退款”等。
AgentCore Evaluations是一项全托管服务,帮助开发者持续监控和分析基于真实行为的Agent表现。开发者可以使用内置评估器来衡量常见的质量维度,如正确性、帮助性、工具选择准确性、安全性、目标成功率和上下文相关性,还可以创建基于模型的定制评分系统,根据自己选择的提示和模型进行业务定制评分。
所有AgentCore的评估结果都会在亚马逊统一监控平台CloudWatch被呈现。开发者还可以设置评估分数的警报和警报,主动监控Agent质量,并在指标超出可接受阈值时作出响应。
亚马逊此前构建了Amazon Quick和Amazon Connect两个Agent方案。
首先是Amazon Quick,可以帮助员工在几分钟内将观点转换成行动,指导深度研究和获得详尽分析,其会从获取信息整理出详细的研究报告;员工还可以创建小型Agent,帮助自己处理日常重复性工作。几周前,亚马逊在公司内部发布了Amazon Quick,目前其已拥有数十万用户。
其次是Amazon Connect,加曼谈到在亚马逊内部税务团队中的一个案例,该团队创建了一个Agent,帮助其汇聚所有税务数据来源、深入研究税法政策变化。该Agent的另一个应用场景是客户服务,可以将AI引入企业的联络中心。
05.新Agent:加速开发、优化编程、保护安全、增强可靠
加曼认为,对于试图快速现代化其应用程序的开发团队来说,目前最大的痛点之一就是处理技术债。在美国,技术债务每年给企业造成总计2.4万亿美元的损失,如今70%的IT预算都被用于维护遗留系统。
此前,亚马逊云科技已经推出了AWS Transform,通过AI实现转换流程的降本增效。在此基础上,AWS今日推出了AWS Transform Custom,这一智能体帮助用户创建自定义代码转换智能体,以实现任何代码、API、框架、运行时或编程语言的翻译和现代化。
例如,全球知名ERP软件公司QAD便是用AWS Transform,将原本需要至少需要两周才能完成转换的项目,压缩至3天。
今年早些时候,亚马逊云科技发布了面向专业开发者的AI IDE “Kiro”。加曼称,已经有数十万开发者在使用Kiro,有开发者感叹,用了Kiro之后,自己在过去5个月内交付的代码,比过去10年还要多。上周,亚马逊已经把Kiro定为该公司的官方AI开发环境。
为了进一步加强开发流程的自动化程度,亚马逊云科技发布了全新的三个前沿智能体,让Kiro在自主性、大规模可扩展和长期运行等领域的表现进一步增强。
Kiro Autonomous Agent是一个与开发工作流并行运行的自主开发智能体。它就像团队的一名额外成员,能独立处理复杂任务,让工程师专注于核心创意。开发者只需指派一个复杂的、目标导向的任务,它能自行规划、分解并执行所有必要步骤,直到交付可用代码。
这一Agent还会越用越聪明,能长期、深度地理解代码库、团队规范和过往决策,从每一次互动中学习,形成“集体记忆”,并应用所学知识到后续任务中。
AWS Security Agent则是一个持续、主动、内置的AI安全专家。它能在设计阶段主动审查文档,确保安全性;在编程过程中扫描代码漏洞,并直接集成到GitHub PR中,为开发者提供即时、可操作的修复建议。
这一Agent还可以将渗透测试自动化,将传统的、昂贵且周期长的渗透测试,转变为可按需启动、快速完成的自动化、持续验证过程。
AWS DevOps Agent则将运维工作自动化,能自动诊断并修复问题。当警报触发时,DevOps Agent会立即自动响应,诊断问题的根本原因,提供修改意见和修改方案,并交由工程师审查和批准。
06.新实例、新存储、新数据库、新加速、管理与治理
加曼最后用10分钟公布了25个新发布。
7款新实例:搭载第五代AMD EPYC处理器的X8i Instances,内存增加超50%;搭载第五代AMD EPYC处理器的X8aedz Instances,计算性能是前一代X2iezn实例的两倍;搭载第五代AMD EPYC处理器的C8a Instances,性能提升30%,性价比提升19%;搭载英特尔至强6的C8ine Instances,实例配置每个vCPU的数据包性能可比上一代C6in实例提升2.5倍;搭载第五代AMD EPYC处理器的M8azn Instances,计算性能是上一代M5zn实例的2倍。
还有两款采用最新苹果硬件的新实例:EC2 M3 Ultra Mac Instances、EC2 M4 Max Mac Instances。
面向开发者,亚马逊云科技推出Lambda durable functions(持久函数),开发者可以利用内置的自动恢复功能构建长期运行的工作负载。
存储方面,包括将S3最大对象大小从5TB提高到50TB,增加10倍;亚马逊S3的数据管理功能S3 Batch Operations更新,在200亿个对象的规模下,完成作业的速度提升10倍;为S3 Tables提供智能分层,节省80%存储成本;S3 Tables支持AWS区域和账户间自动复制;扩展Amazon S3接入点,支持Amazon FSx for NetApp ONTAP;用于存储和查询向量的对象存储S3 Vectors全面上市;利用GPU提升向量索引构建效率,速度提升10倍,仅需1/4成本。
计算与加速优化新功能,Amazon EMR Serverless提供Amazon EMR on EKS,允许用户在不预先配置或管理存储的情况下运行大数据工作负载。
Amazon RDS数据库的更新包括:RDS for Oracle和RDS for SQL Server扩展存储容量、RDS for SQL Server的CPU优化选项、对SQL Server开发者版本的支持,以及数据库节省计划。
管理与治理相关的新发布包括:为ECS和EC2新增GuardDuty扩展威胁检测功能、提供近乎实时分析及风险优先级排序功能的Security Hub安全中心、CloudWatch统一数据管理和分析功能。
07.结语:Agent开发已成,加速创新的大势所趋
在主题演讲中,加曼多次强调了Agent的重要性:Agent是企业从AI投资中看到实质性商业回报的地方。而为Agent系统、应用开发构建新的模块,需要性能更强的AI基础设施、推理平台、企业数据、构建和部署Agent的工具。
Agent可自主感知业务需求并依据需求智能适配业务流程、动态调整执行策略,高效匹配业务场景的核心诉求,其已经成为释放AI价值的重要载体。亚马逊云科技在扩展加速计算产品线的同时,亦在不断优化Agent开发和部署工具,推出满足开发者多元化工作负载需求的新平台、新工具。
据加曼回顾,今年第三财季,亚马逊云科技的年化收入已经达到1320亿美元,同比增长超20%。
过去一年,亚马逊云科技增加了3.8GW数据中心容量。如今,亚马逊云科技拥有全球规模最大、部署最广泛的AI云基础设施,全球数据中心网络覆盖38个地区、120个可用性区域,还宣布再增加3个地区。
亚马逊云科技已经与全球顶尖的大模型公司建立合作,在其平台陆续上架全球主流开源模型,下一步的重点,显然已经是如何帮助更多客户将Agent落地到真实业务中,产生更广泛的商业价值。
本文来自微信公众号“智东西”(ID:zhidxcom),作者:骏达 程茜,编辑:心缘,36氪经授权发布。















