08
14

OpenAI推出SWE-bench Verified

2024-08-14 08:44分享至
OpenAI推出更可靠的代码生成评估基准:SWE-bench Verified。公司在官网的一篇Blog中称:“随着我们的系统越来越接近AGI(通用人工智能),我们需要在越来越具有挑战性的任务中对它们进行评估”。该基准是对现有SWE-bench 的改进版本(子集),旨在更可靠地评估AI模型解决现实世界软件问题的能力。 (每日经济新闻)原文链接

下一篇

韩国失业率意外降至去年10月以来最低水平,给了韩国央行进一步推迟政策转向的动力。韩国统计部门周三称,7月经季节性因素调整的失业率降至2.5%,前月为2.8%。接受调查的经济学家此前预测失业率将小幅升至2.9%。韩国央行料将在下周会议上维持政策不变。许多经济学家最近推后了对央行转向宽松的预期时间,预计10月是最有可能的时间。(财联社)

2024-08-14

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业