量子位

国产大模型DeepSeek全球爆火,训练仅需280万GPU小时,卡帕西等大佬狂点赞

发布于:22小时前
内容简介

国产大模型DeepSeek-V3一夜之间刷屏了,不仅性能媲美Claude 3.5 Sonnet和GPT-4o,而且训练成本仅需280万GPU小时,AI大佬们纷纷转发点赞。

参与讨论
评论千万条,友善第一条
后参与讨论
提交评论0/1000
36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业