2026年:AI开始“物理扎根”

思策智库·2026年01月27日 13:30
2026年,AI从“云端大脑”落地为“边缘终端”,嵌入工业现实。物理AI既是新工业革命引擎,也面临更为艰难的探索。

在技术迭代周期不断压缩的时代背景下,我们似乎总在寻找一个“转折年”。

进入2026年,肉眼可见的转变是:人工智能的主流应用,从数字领域的生成与对话,无可逆转地转向物理领域的感知应用。

去年我到国家电网下属的一个沿海省市电力公司,刚走进他们的变电站车间,我就感受到了满满的工业质感。依照电网“发、输出、变、配、用”全环节需求,将电网嵌入AI算法,实现数字孪生与多模态大模型融合,以此提升电网优化、智慧体验、覆冰预警,以及智能计量运维和故障诊断的可靠性与运营效率。

从云智能体在物理层构建,从云端大脑到边缘终端。事实是,AI智能的形态正从手机屏幕里跃迁出来,并越来越多地嵌入了物理世界的运行中。

AI的“ChatGPT时刻”是否已到来

如果说过去的AI擅长在比特世界里预测下一个词,那么现在就变成了如何在原子世界里预测并塑造下一个世界状态。黄仁勋称之为AI的“ChatGPT时刻”。

这就是最近科技圈比较火的一个概念:物理AI。它的特性是AI可以理解物理定律,与现实环境互动并施加改变的智能系统,实现“假设-AI模拟-实验验证”的科研新范式。这有望成为驱动这场新工业革命最具想象力的动力引擎。

但坦白说,物理AI的突破,可能要更为艰难。业内共识是,5到10年的深耕可能只是起步。

这就引出了物理AI最核心的发展逻辑。它不像语言模型去集纳规模化的数据符号。简单说,它既是AI,也是AI训练员。

你可以这样理解:一个优秀的语言模型,需要海量的文本语料来习得语法、逻辑与知识关联。而一个可靠的物理AI,则需要海量的物理交互语料来内化这个世界的运行法则。它需要知道,用力推一个放在桌沿的杯子,后果大概率是碎裂;它也需要体会,在光滑瓷砖地和在松软沙地上行走,膝关节的驱动策略应有根本不同。这种“知道”和“体会”,不能只靠标注,必须靠“经历”——无论是虚拟的还是真实的。

于是,物理AI的发展路径,呈现出一种有趣的“分层-融合”螺旋。传统的机器人学采用分层架构(感知、规划、控制),它清晰、模块化。国内很多机器人公司能快速在仓储、巡检等场景落地,这套成熟工程范式功不可没。但它的“天花板”也明显:各模块间的信息损耗和延迟,在面对动态未知环境时,会显得笨拙。

而当下的趋势是实现更极致的 “端到端” ——让AI像自动驾驶那样,从视觉输入直接映射到动作输出。这很“大脑”,很统一。但物理世界的复杂性和安全性要求,让这条路径充满险阻——数据从哪来?安全性如何保障?一个错误的输出可能意味着真实的碰撞与损坏。这不像文本生成,错了可以重来。

正是在这种两难中,“世界模型” 的概念被推至前台。它让智能体能在采取真实行动前,先在“脑海”中进行快速、低成本的推演与试错。这听起来很理想,但构建一个足够逼真、又能高效计算的通用物理世界模型,其难度目前来说,极具挑战性。

当前,它更多在特定封闭领域(如机器人操作特定物体)展现潜力。我们既需要“世界模型”赋予的常识与泛化能力,又不得不依赖分层架构的可靠与可控。未来的主流,很可能不是谁取代谁,而是一种基于世界模型的分层决策——大脑负责想象和规划,小脑和脊髓负责反射与稳定等等。

行业正在用一系列“开源节流”提升效率。首当其冲的是 “合成数据”。在高保真的物理仿真引擎(如英伟达的Isaac Sim、开源的MuJoCo)中,我们可以以零边际成本生成近乎无限的数据——让成千上万的虚拟机器人在虚拟工厂里日夜训练。但这里有个著名的“仿真到现实”的鸿沟:虚拟世界再逼真,其物理参数与真实世界总有微妙差异。一个在仿真中行走如飞的机器人,到了现实地面可能瞬间“翻车”。

因此,另一种“开源”思路备受关注:利用人类日常视频进行预训练。YouTube上无数第一视角的生活、工作视频,潜含着海量关于物体属性、物理常识和操作技能的信息。让AI模型大量观看这些视频,从中无监督地学习到“什么东西是易碎的”、“门通常怎么开”等基础物理常识。这成了弥补仿真鸿沟、注入人类先验知识的一条捷径。

比如英伟达的GROOT模型等前沿探索,正实践着“人类视频预训练+仿真微调+真机精调”的混合模式。这或许暗示了物理AI数据问题的未来解:一个由人类经验、虚拟仿真和实体交互共同构成的“三位一体”数据生态。

中国场景:在“性价比”与“战略纵深”之间

当我们将视角拉回全球竞争格局,物理AI的发展呈现出一个有趣的对比。美国在基础算法、芯片架构和前沿探索上依然引领风潮,其路径充满科幻感和原创性。而中国的路径,则深深烙刻着自身的产业基因,更突出工程的场景落地。

这种现实主义首先体现在性价比上。中国的优势,在于将前沿技术迅速工程化、产品化,并依托全球最完整、响应最快的供应链,将其成本控制在市场可接受的范围内。就像开头提到的变电站场景,其背后的技术整合、成本控制和部署效率,构成了中国物理AI落地的一把钥匙。它可能不是第一个发明某项算法的,但常常是第一个能把它稳定、便宜地用在工厂流水线、物流仓库或电网巡检中的。这种能力,在物理AI从实验室走向千行百业的初期,是一种强大的市场穿透力。

其次,是 “战略纵深” 。与一些国家倾向于基础研究和自由市场探索不同,中国通过顶层设计,为物理AI提供了清晰的应用场景和产业通道。“人工智能+”行动和“具身智能”被写入政府工作报告,意味着从智能电网到智慧农业,从柔性生产线到城市管理,一系列庞大、复杂且自带需求的“训练场”和“试验田”被系统性地开辟出来。我们的目标是具体的:2027年智能终端普及率70%。这为物理AI的进化,设定了一个充满想象力的现实坐标系。

当然,这条路径也有其挑战。过于强调应用和性价比,是否会削弱对更底层、更革命性原创技术的长期投入?如何在“集中力量办大事”的效率与激发“草根”创新活力之间取得平衡?这些都是需要持续思考的问题。

走向“泛化”的漫长路

物理AI的终极梦想,是“通用”——一个智能体能像人一样,快速适应从未见过的新环境、新任务。但我们距离这个目标,可能比想象中更远。我们当下必须面对的一个现实问题是:行业技术应用没有一招制胜的奇点,只有在感知、控制、规划、材料、能源等每一个环节上持续的、艰难的点滴突破。

当一个能轻易举起上百公斤的智能体在人群中自主移动时,它的任何一个决策失误,后果都是物理性的。因此,可解释性、安全冗余、伦理规范,这些在数字AI时代曾被部分搁置的议题,在物理AI时代将成为不可逾越的生命线。

从预测词语到预测世界状态,人工智能真正开始脱离虚拟的襁褓,尝试用机械的双手,去触碰并塑造人类的未来现实。

2026年不会是一个终点,但可以把它作为一个重要的路标——AI着陆,已经开始了。

本文来自微信公众号“思策智库”,作者:张自炯,36氪经授权发布。

+1
5

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000
特邀作者

汇聚智慧,深入调研,提供行业解析新视角。

下一篇

HBM3e容量达216GB、读写速度达7TB/s。

2小时前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业