手机AI愈发重要,可为何厂商不再宣传NPU算力

三易生活·2025年12月01日 10:37
如今的手机NPU,已经没法做到每一代硬件算力直接“翻番”。

众所周知,对于如今的智能手机行业来说,“AI”已经成为了各大厂商最常挂在嘴边的宣传点。

一方面,各头部手机品牌目前都会自称有“自研AI大模型”,并通过各种各样的“性能优化方案”,在手机上实现了或主打影像、或用于日常生活、或是辅助游戏体验的“AI功能”。

另一方面,纵观上游的芯片厂商,他们在宣发新款SoC时,如今也普遍会有关于NPU架构改进、能效提升,以及联合各种AI大模型做端侧性能优化的演示环节。

但如果大家还记得前些年的智能手机宣发就会意识到一件事,在“手机AI”还未普及的年代,彼时相关厂商都会在宣发他们的早期“NPU”时,明确给出性能(算力)指标。这样一来,尽管那个时候NPU“能做的事情”非常有限,但消费者起码一眼就能看出不同品牌以及不同代次SoC之间,在NPU性能上的差异与进步幅度。

相比之下,如今的手机SoC性能要强得多,NPU也更先进、可以支持更多的“端侧AI”功能了,但各大厂商在宣发时却普遍只会做具体的“功能演示”。所有厂商、其中包括手机厂商和上游芯片厂商,似乎都普遍对于“NPU算力数字”这个看起来更直观,更能让普通消费者也可以直接对比优劣的参数闭口不谈了。

那么这又是为什么呢?

是NPU算力“出问题”了吗?这样说其实不完全错

基于朴素的常识,大家都知道许多时候当某个数据突然中断公布时,往往就意味着它可能变得不太好看了。

这一点,对于手机里的NPU来说似乎也是成立的。比如以高通为例,2019年的骁龙855是首款公开宣传NPU算力的产品,当时它的算力是7TOPs。之后换代的骁龙865、骁龙888、骁龙8 Gen1官方都有公布这一数据,分别是15TOPs、26TOPs、52TOPs。

但是在骁龙8 Gen1之后,高通方面便不再公布NPU的“算力数字”。通过公开技术资料我们得知,2024年发布的骁龙8至尊版,NPU算力是80TOPs,到了今年刚刚换代的第五代骁龙8至尊版,这个数字则是100TOPs。

发现了什么问题吗?尽管高通这两代旗舰SoC的NPU性能,在行业中依然是“遥遥领先”,但这就意味着从骁龙8 Gen2到骁龙8 Gen3的这两代,NPU的“算力数字”进步速度确实可能是慢了下来。

从这份统计数据中就可以看出,高通的NPU性能领先幅度很大

当然,这只是高通一家的情况。从我们三易生活掌握的数据来看,其他几家主流手机芯片厂商在“NPU算力数字”这个方面,可能要比高通更难堪。所以当高通都“领头”、不再公开宣传NPU的算力时,其他的“友商”自然也就更有理由“从善如流”了。

为什么NPU性能进步变慢了?不止关乎芯片设计

从相关数据中不难发现,最早几代手机SoC里的NPU,很明显呈现出几乎每次换代都“算力翻倍”的态势。到了最近两年,NPU的“算力”进步速度,显然就没那么快了。

关于这种现象,一个很容易想到的理由,是早期的NPU本身在设计上留了更多“余量”,所以可以做到每次换代算力翻倍。但这种“代代翻倍”的设计,随着后期半导体制程成本的上涨、再加上厂商需要将更多的功耗分配给新架构的CPU和GPU,所以自然就没法那么“任性”地维系下去了。

但如果大家有关注过彼时手机厂商的市场宣传就会发现,在他们停止宣传NPU的“算力数字”后,实际上几乎依然会在每次芯片换代时宣称,新的NPU比前代“性能翻倍”。

很显然,现在大家已经知道,如今的NPU单从“硬件算力”来看,远远还做不到每次更新都翻倍的地步。那么这个“性能翻倍”是从何说起的呢?简单来说,这其实是因为过去的“手机AI”和现在的“手机AI”,在技术内涵、或者说所处理的任务类型上,已经发生了很大的变化,所以对NPU的设计需求也截然不同了。

举例来说,早期的“手机AI”几乎都集中在“计算视觉”领域,比如用摄像头来进行面部识别、拍照时的自动场景优化,甚至包括播放视频时自动画面增强等。这些技术就需要NPU有很强的图像信号吞吐量,所以最早的NPU几乎完全将重心放在了纯粹的“峰值算力”上,要的就是在最短的时间里“算完”。由于其余的时候NPU很少会参与手机的日常工作,所以能效比差点也无所谓。

但现在的情况已经发生了极大的变化。由于如今手机的“AI功能”不再局限于计算视觉,而是更多地集中在“内容生成”方面,比如AI生文、AI生画、甚至包括拍照时用AI去“生成”缺失的细节。再加上AI功能越来越多、系统日常调用NPU的场合愈发频繁,这就使得现在的NPU一方面在底层架构上需要针对生成式AI任务做出修改,另一方面它们也必须比过去更注重长时间运行时的能效比。

打个比方来说,最近一些机型已经开始用NPU来协助GPU,进行游戏中的“超帧超分”处理。很显然,如果这时候NPU还采用以前那种“爆发式”的性能设计思路,肯定是没法满足需求的。

手机的NPU还会继续进步吗?会,但思路已然不同

当然,在针对新的AI应用需求调整了底层设计后,如今可以看到不管是哪家芯片厂商,他们的NPU“硬件性能”实际上在最近这两年,还是重新回到了增长的轨道上。只不过由于各种各样的限制,如今的手机NPU显然没法像以前那样,做到每一代硬件算力都直接“翻番”了。

难道说以后就完全没法“指望”手机里的NPU,再有大幅度的性能提升吗?

从现有的信息来看,倒也不至于,但肯定不会像以前那样,纯粹靠“堆规模”和提升频率来解决问题了。比如,部分手机厂商会通过将他们的私有算法“固化”进NPU,相当于用算法来直接定制硬件,来提升NPU在执行特定任务时的计算效率。

对于更多的品牌来说,与大模型进行技术合作,深度调校AI功能在NPU上的兼容性和执行速度,也是当下提升NPU性能的主要方式。比如就在最近这几天,三星就与Nota AI达成合作,要通过软件优化的方式让Exynos 2500的NPU(算力59TOPs)在实际AI执行速度上,“追平”第五代骁龙8至尊版上的那颗100TOPs算力NPU。

虽然我们对于这样的“优化”究竟能否实现有点怀疑,但它至少表明,对于如今手机SoC里的NPU设计来说,软件优化所能实现的效果,甚至可能会比单纯的硬件设计更为重要。

本文来自微信公众号“三易生活”(ID:IT-3eLife),作者:三易菌,36氪经授权发布。

+1
0

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

Soul赴港IPO,80后女生创立,年入22亿。

13分钟前

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业