大模型,真的不能代表所有AI技术 ...

数字化刘老师·2025年04月21日 14:26
大模型,真的不能代表所有AI技术 ...

DeepSeek的火爆,让很多传统企业包括政府机构,都争先恐后地开始玩儿大模型私有化部署。 

仿佛原本高门槛的AI技术,瞬间变得唾手可得。 

很多数字化决策者都觉得,有了大模型,公司和业务层面,都可以瞬间实现AI能力的原始积累。 

但其实,光有大模型和实现真正的业务“智能化”,还差的很远。AI只是一个引擎,而智能化转型的主体,是场景。 

一方面,企业需要围绕AI技术能力去做“相匹配”的应用设计,另一方面,企业应当确保,自己有足够的高质量数据资源,可以支撑起AI技术“大展宏图”。 

也就是说,不管是业务设计,还是数据治理, 企业的数字化准备要充分到位,才能让大模型部署这件事变得“货真价实”。 

另外,话说回来,对于需要智能化能力的企业来说,大模型既不是唯一选择,也不是必须选择。 

尽管大语言模型是一个参数量极大的,具有极强下游业务适配能力的深度学习模型,但是有些分析或预测问题的底层原理,并不能让大模型技术很好地发挥其技术优势。 

并不是不能用,而是不合适。任何技术都不能做到包打天下,尽管人们宣传的往往是可以。 

首先,大模型技术不适合“非序列型”问题的分析。

例如,大模型技术在处理网络结构的关系分析任务时,就不是很擅长——在社交网络分析中,通过某个用户,了解他在不同维度的兴趣社群,对他进行潜在好友的匹配或社交话题的推荐; 

通过软件系统架构、电力系统、金融交易网络、供应链网络的分析,识别业务风险点,为业务鲁棒性的管理决策赋能 ... 

其次,大模型技术不适合计算型问题。

很多智能化任务,特点在于根据特定的领域专业模型进行“精算”和推理,比如采用物理学模型、工程学、气象学模型、财务模型、金融模型、数学模型进行产业综合分析。 

对于这类任务,AI的本质在于自动化地执行某个既定的规则,尽管这个规则可能十分复杂,但业务场景对于输出结果的准确性要求是非常严谨苛刻的。 

大模型技术的内核是深度神经网络,其输出是一个“概率化”的结果,这类技术比较适合随机性较大,但同时在结果形式上相对灵活的AI任务。 

此外,大模型技术在“可解释性”方面并不是一个“靠谱”的技术选择。

大模型虽然可以处理各种各样的问题,但是它的计算推理活动一般是“ 端到端”的,直接给出问题的答案。 

对于中间的分析过程,大模型只能给个大概的解释。 

在更多场合,人们希望AI给出所作出决定的背后理由,真正理解AI的决策逻辑,才敢形成最终的业务结论。 

很多传统的AI小模型,例如决策树、回归模型、贝叶斯模型等,模型中每个参数都有具体对应的业务含义,不仅可以给出推理预测结果,还能很好地说明理由。 

可解释性的另一个显而易见的好处,在于过程可干预。

当模型预测结果与业务经验存在较大偏差的时候,业务人员可以对推理过程回溯分析,对模型参数、结构,或某个模型中间运行量进行调整,从而使模型的运用更加契合实际业务场景。 

除此以外,是否选择大模型作为AI解决方案,还要考虑成本因素,这既包括推理产生的算力成本消耗,以及等待大模型推理完成的时间延迟。 

我们在迷恋大模型技术魅力的同时,仍要理性看待技术的多元化发展特征,AI技术不只是大模型,大模型也并不能解决所有自动化和智能化需求。 

但无论如何,大模型的出现和规模化发展让人们重新拾起了对数字技术的信心,也的确激活了全行业的数字化转型变革动力。 

本文来自微信公众号 “大话数字化转型”(ID:dataminingxmz),作者:数字化刘老师,36氪经授权发布。

+1
7

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

最近几个月,几位首席数据官都问了我同一个问题:我们应该如何进行人工智能治理?

2025-04-21

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业