只改2行代码,RAG效率暴涨30%,多种任务适用,可扩展至百亿级数据规模应用
ChatGPT用多了会变傻,MIT招募大学生做实验论证,用得越多人越笨
前英伟达中国一把手造国产GPU,冲刺IPO了
田渊栋:连续思维链效率更高,可同时编码多个路径,“叠加态”式并行搜索
AI哪怕答案正确,逻辑链却惨不忍睹,奥数级不等式证明成功率不到50%
单GPU搞定高清长视频生成,效率×10,引入Mamba机制突破DiT瓶颈
Agent创业来了位13岁的CEO
不用千亿参数也能合成高质量数据,这个开源框架让小模型“组团逆袭”,7B性能直追72B
大模型“拼好题”,45K数据撬动18%提升,数学问题拒绝死记硬背
o3-pro通关“推箱子”,人类怀旧小游戏成了大模型新Benchmark
10% KV Cache实现无损数学推理,这个开源方法解决推理大模型「记忆过载」难题
20瓦就能运行下一代AI?科学家瞄上了神经形态计算
全方位实测首个AI原生浏览器:618比价、写高考作文……网友:再见Chrome
韦东奕论文登数学顶刊,将散焦方程的爆破性研究扩展至d≥4
一句话生成任务专属LoRA,Transformer作者创业公司颠覆LLM微调
DeepSeek研究员1200行代码复刻vLLM,H800硬件实测性能反超原版
黄仁勋发布量子计算专用CUDA,预言量子计算机几年内应用,但现在还离不开GB200
何恺明新作:给扩散模型加正则化,无需预训练无需数据增强,超简单实现性能提升
LeCun世界模型出2代了,62小时搞定机器人训练,开启物理推理新时代
小扎“超级智能”小组第一位大佬,谷歌DeepMind首席研究员,“压缩即智能”核心人物
推送和解读前沿、有料的科技创投资讯
一级市场金融信息和系统服务提供商
聚焦全球优秀创业者,项目融资率接近97%,领跑行业