36氪获悉,有消息称,OpenAI在刚刚发布的GPT-4.1系列模型中评测其函数调用能力时采用了ComplexFuncBench,这是由智谱团队提出的专用于评估大模型复杂函数调用能力的测试基准。ComplexFuncBench主要评测大模型在128K的长上下文下进行多步带约束的函数调用的能力。相比于现有函数调用测试基准,ComplexFuncBench要求大模型对真实场景下的用户需求进行细粒度理解,并在此基础上进行多步带推理的函数调用,这对模型的函数调用能力提出了更高的挑战。
从知情人士处获悉,奥迪即将有两款新车与卓驭科技进行合作,且奔驰高层人士也曾于近期到访卓驭科技,寻求智驾方案的“Plan B”。此外,即将在上海车展上市的长城第二代枭龙MAX,以及北汽极狐品牌也将采用卓驭科技的智驾方案。(财联社)
2025-04-15
8点1氪|西贝创始人贾国龙道歉,罗永浩发文回应;宗馥莉或另立门户,启用新品牌“娃小宗”;9月机票价格大跳水:不少航线低至1到2折
早该淘汰的机械停车位,终于要“凉了”
推送和解读前沿、有料的科技创投资讯
一级市场金融信息和系统服务提供商
聚焦全球优秀创业者,项目融资率接近97%,领跑行业