哲学家万字解析Sora本质,杨立昆点赞转发,AI视频离世界模拟器还有多远?
ControlNet作者新作:AI绘画能分图层了,项目未开源就斩获660 Star
Idea撞车何恺明「分形生成模型」,速度领先10倍,性能更强
Stable Diffusion火到被艺术家集体举报,网友科普背后机制被LeCun点赞
Stable Diffusion 3震撼发布,采用Sora同源技术,文字终于不乱码了
让Stable Diffusion一秒出图,清华硕士加速神器爆火,已有公司接入
清华团队提出“高分辨率”图像生成方法:任意分辨率无缝衔接,极大降低训练和采样成本
华为首款无孔屏新机要来了
LeCun世界模型出场,Meta震撼发布首个「类人」模型,理解世界后补全半张图,自监督学习众望所归
AI越进化越跟人类大脑像,Meta找到了机器的“前额叶皮层”,AI学者和神经科学家都惊了
微软GUI智能体OmniParser二代开源,推理延迟降低60%,大模型玩手机更溜了
无需向量监督的矢量图生成算法,入选CVPR 2021
免训练加速DiT,Meta提出自适应缓存新方法,视频生成快2.6倍
AI绘画何以突飞猛进? 从历史到技术突破, 一文读懂火爆的AI绘画发展史
Meta版Sora无预警来袭
AI视觉字谜爆火,梦露转180°秒变爱因斯坦,英伟达高级AI科学家:近期最酷的扩散模型
AI绘画爆火,它值得投资吗?
达摩院开源VideoLLaMA3:仅7B大小,视频理解拿下SOTA,在线可玩
GPT-4o图像生成的「核燃料」找到了,万字长文拆解潜在变量,网友:原来AI在另一个维度作画
中国如何复刻Sora,华人团队长文解构,996 OpenAI研究员:Sora是视频GPT-2时刻
不用GAN不用扩散,无需训练解锁AI生图新境界,判别模型成神秘第三极
3D高斯泼溅算法大漏洞:数据投毒让GPU显存暴涨70GB,甚至服务器宕机
360度无死角,UC伯克利华人发布3DHM框架:一张图片即可模仿任意视频动作
Meta新研究挑战CV领域基操:ViT根本不用patch,用像素做token效果更佳
声网Agora Lipsync 技术揭秘:通过实时语音驱动人像模拟真人说话
万字长文讲透AI艺术:缘起、意义和未来(上篇)
国产Sora来了,4K 60帧15秒视频刷新纪录,500亿美元短剧出海市场被撬动
终于有正经 AI 硬件了,一台能写诗的「拍立得」
一句话一张图秒变3D动画,4K级超清画质,英伟达祭出新作,游戏生成世界成真
揭秘Sora技术路线:核心成员来自伯克利,基础论文曾被CVPR拒稿
具身智能体主动迎战对抗攻击,清华团队提出主动防御框架
首个公开发表的SAR图像目标识别基础模型,国防科大刘永祥&刘丽教授团队提出SARATR-X 1.0
逼真复刻「完美中国情侣」,加强版Stable Diffusion免费体验,最新技术报告出炉
超级独角兽 Stripe 与“固态经济”(二)
把怀旧游戏租给玩家是个好主意吗?
ChatGPT,背后的核心是什么?
一锤降维,解密OpenAI超级视频模型Sora技术报告,虚拟世界涌现了
DeepMind独家访谈实录,解密Genie 3世界模型,将颠覆游戏与机器人行业未来
这台对世界好奇的机器,竟然还玩起了超级马里奥?
MIT、OpenAI等震撼力作:AI首次自主发现人工生命,人类窥见上帝造物
李飞飞:从斯坦福到谷歌云,让 AI 成为计算之魂
卷积?神经?网络?教你从读懂词语开始了解计算机视觉识别最火模型
两位科学家关于AI for science的开年演讲
计算机视觉GPT时刻,UC伯克利三巨头祭出首个纯CV大模型,推理惊现AGI火花
To B 行业容得下中年人
没有一个BAT老板的世界人工智能大会,看马斯克汤晓鸥姚期智们讲了啥
36氪研究院|2024年AIGC行业研究:多模态大模型与商业应用
从图画史看 AIGC,我们和 AI 作了100幅画——光源研究
Nano-Banana核心团队首次揭秘,全球最火的 AI 生图工具是怎么打造的
2023年的人工智能:应用层已经到来
推送和解读前沿、有料的科技创投资讯
一级市场金融信息和系统服务提供商
聚焦全球优秀创业者,项目融资率接近97%,领跑行业