面对算力难题,AI企业可以这样应对|8分钟发布会回顾

36氪品牌·2023年03月31日 11:02
随着AI技术和应用场景的多元化,AI企业寻求更好的算力服务和更高的算力利用效率。

近期,以ChatGPT为代表的AI大模型在互联网上疯狂刷屏,这背后是大模型的里程碑式突破,也是企业对算力需求的井喷。如何找到更好的算力服务,提高算力的利用效率,是当下所有AI企业面对的难题。

2023年3月28日,36氪「8分钟发布会」联合「联想」举办了《AI技术发展激发算力需求》线上直播,联想中国区基础设施业务群互联网发展型企业业务总经理 仲磊、联想中国区基础设施业务群互联网行业售前技术专家 刘晓寅Ace、趋动科技创始人&CEO 王鲲、Nolibox计算美学合伙人 付博铭、源数创投管理合伙人 沈栋梁五位嘉宾做客直播间,嘉宾们围绕近期爆火的AIGC新技术给行业带来的机会AI技术带来的算力资源挑战和新技术浪潮下AI中小企业的机会和应对方式进行了深入讨论,以下是本场直播的精彩观点总结:

技术升级推动AI产业新发展

大模型已率先在B端应用落地,之后也有望加速在其他商业化领域的落地,迎来产业数字化和智能化变革。联想仲磊提到随着企业数字化和智能化转型的发展,大模型应用的场景已经多样化,数据也出现了爆发式增长,对算力的需求也在成倍增长,这对于数据底座软件和硬件也提出了新的要求。以硬件为例,企业需要针对不同场景和高性能计算能力进行拓展和融合,以满足用户对多芯部署、分布式优化和高性能计算的需求。所以,未来几年必将是大模型训练快速发展的一个窗口期,相关的大模型算法、算力基础设施、B端通用应用软件和垂直行业领域都有望迎来新的加速发展。

各种新技术的出现和广泛应用,会对整个AI产业产生系统性的影响。谈到生成式AI和以往人工智能的差异时,联想刘晓寅Ace将AI分为五个层级,即底层计算、记忆、感知、决策和创造。Ace认为以往的人工智能在计算、记忆和感知层面都已超越人类,但是在决策和创造层面却不及人类的智慧,而如今生成式AI的出现与成熟,预示着AI将走向具体应用场景,能够突破“决策”和“创造”的天花板,帮助人类解决更多实际问题。

随着AIGC浪潮的兴起,越来越多的AI企业尝试进入该赛道,但并不是所有AI企业都能在这场竞争占据优势地位。源数创投沈栋梁认为有三类AI企业能够在当下AI浪潮中占据优势:一、拥有自研大模型能力的企业;二、深刻理解行业和商业场景的落地,积累了丰富行业数据或语料的企业;三、具备快速商业场景应用及落地能力,擅于用市面上现有大模型做二次训练或微调,快速解决某一个行业的迭代问题的企业。但无论是哪一种企业,都需要通过后续的技术创新和升级才能确保自己不被超越。

作为AIGC赛道的新入局者,Nolibox付博铭相信AIGC会给创意行业带来两大影响:一. AIGC会将创作成本压缩趋向于零。过去的内容供需均衡将被打破,高质量和低成本可以划等号,专业化和低门槛可以共存,创意市场将由专业化走向全民化。二. AIGC的应用将会解放更多的创意工作者,通过 AI 赋能,创意工作者能从繁琐重复的设计创意工作中解放出来,聚焦在更具创造性的创意工作,关注「创造力本身」的同时也关注「商业化成果」。

当谈到AI大模型的未来发展趋势时,趋动科技王鲲认为大模型未来会呈现两个趋势:第一是成本会逐渐下降,第二是会涌现出一大批面向细分行业的大模型。现在大模型的投入成本之所以高是因为市面上很多玩家做的都是面向全行业的搜索引擎,所以他们需要全行业的语料来训练一个全行业的模型,成本自然很高。而一个产业想发展壮大,最终会形成企业百花齐放的局面,那大模型的准入门槛和成本肯定会逐渐下降。如何让成本下降呢?王鲲预判未来很多相关领域的玩家会去做细分行业的模型。随着技术的提升和成本的下降,越来越多的玩家能够迈过准入门槛参与相关创新,整个AI大模型领域才会发展的越来越好。

企业如何应对AI新技术带来的算力挑战

AIGC这类新技术给企业带来了机遇,也对企业提出了更高的挑战。入局AIGC赛道并不简单,它的背后是对企业算力资源的考验。

联想刘晓寅Ace提到,入局AIGC赛道的门槛通常包含技术门槛、企业规模门槛、企业资源门槛,其中算力资源是企业资源中的核心组成部分,这意味着不是每个企业都有能力进入该赛道,企业需要有足够的技术能力和技术认知、足够的资源以及支撑资源的能力或调拨资源的能力。Ace建议,AI企业想要打好数字底座,首先要认知到IT基础架构是提供算力资源的基础,考虑如何用有限的资金,以多元化的方式获得更多的算力资源,例如可以采用租赁的方式获取算力资源。同时,也要考虑如何优化算力资源的应用,做到最大化产出,让算力资源真正变成能力和生产力的产出。

AI模型背后的训练和推理都需要GPU算力支撑,Nolibox付博铭以AI绘画为例,列举了两类对算力需求高的应用场景:一、实时或近实时推理任务。为了提供优质的用户体验,AI 绘画应用需要在短时间内生成绘画结果,这需要足够的算力来支持实时或近实时的响应。二、模型微调和训练,这对算力的要求会更高,对 GPU 显存要求也高。比如过去 DreamBooth 基本要求 16G 显存,最新的 LORA 训练只要求 8G 显存,但考虑到训练速度,企业还是需要性能更高的 GPU。

面对算力资源的分配使用,企业也面临着一些难题。趋动科技王鲲提到,在GPU的使用上,大部分用户的痛点是GPU利用率太低。根据AWS公布的一项数据显示,企业GPU利用率大约在10%—30%;而国内的GPU利用率大多低于15%,损失严重。造成巨大浪费的原因是用户对GPU的使用和管理粗放。为了解决GPU利用率低下的问题,企业需要靠软件的协助让用户合理地使用、管理、分配算力,才能提高算力的利用率,达到算力的完全重复利用。

新技术热潮下,中小企业的机会和应对方式

讨论到AIGC这类新技术给中小企业带来的机会,几位嘉宾发表了自己的看法。

源数创投沈栋梁Nolibox付博铭都认为做大模型的入局门槛太高,对于中小企业来说,自研AI大模型机会不大。Nolibox付博铭点出在这波AIGC热潮中,中小企业一般无法和大厂拼算法、算力、软硬件方面的投入,所以在模型层上不占优势。中小企业应该抓住在应用层创新的机会,基于所在的行业往下做深做透。在自家产品的基础上,集成不同的能力,去满足不同领域客户的需求。

源数创投沈栋梁认为算力需求的爆发式增长,会给算力产业链上下游企业带来几方面的机遇:第一是在云服务方面,这可能会大幅推动云服务需求增长;第二个是在硬件方面,特别像芯片、GPU等,在几年前就已经受到影响了,AI相关的一些应用会推动芯片的快速发展;第三,通过软件、虚拟化的方式来优化算力,这毫无疑问也是对算力产业链的一个非常关键的推动角度。

趋动科技王鲲将一个产业发展分为三个阶段:make it work、make it perform、make it cheap。只有走到make it cheap的阶段,大家买得起,量上来了,更多玩家在这个行业里面能挣到钱,这个行业才能够迭代、完全发展起来。王鲲认为在大模型的领域,中小企业的机会在于去做make it cheap的事情,也就是说不管从细分赛道还是算法、算力层面,去探索如何才能降低成本,使得很多中小企业可以在某一些领域跟大厂掰手腕。

联想刘晓寅Ace认为中小企业未来肯定有机会,因为每个大企业都是从中小企业走过来的。Ace也赞同其他嘉宾的说法,即对于中小企业来说,入局的技术门槛、规模门槛还有资源门槛都很高。他建议中小企业主可以切换思路,即在赛道初始时就定位准确,结合自己的能力、技术特点以及技术认知,在克服技术门槛后完全有机会参与到这波AI新技术大浪潮中,而存在的技术门槛问题可以咨询联想这样的服务厂商以有限的资金获得更好的算力。联想仲磊补充到,面对越来越多的新技术,当下企业对于算力的要求越来越紧迫,为了让更多本土的中小型企业受益于“普慧算力”,联想于今年2月推出了全新服务器品牌——“联想问天”。作为联想服务器首个本地化品牌,联想问天传承了联想ThinkSystem服务器在性能、可靠性和稳定性等方面的领先性,以及对高品质的执着。同时,基于互联网、运营商、政府、银行、保险、教育、能源等本土客户的多样化需求,联想问天能够充分发挥本地创新、敏捷高效的服务优势;此外,在客户的应用生态中,联想问天通过性能调优助力客户的应用性能达到极致——联想问天服务器不但兼容全球主流软件,而且与本地创新的软、硬件生态深度整合,与国内合作伙伴共同进行底层硬件的同步优化,从而更好地支持客户应用。
 

+1
23

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

长春高新急需找到适合自身的“生长激素”。

2023-03-31

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业