36氪获悉,本周,由阿里国际联合上海人工智能实验室、北京语言大学一起制定的AI翻译测评榜单TransBench在OpenCompass上线。与传统的翻译测评体系相比,增加了幻觉率、文化禁忌词、敬语规范等指标,并首次针对行业的细分领域构建评测数据和评测方法。这些指标均来自真实场景的使用反馈,测评方法也已开源。
36氪获悉,截至发稿,AI智能体概念局部异动,昆仑万维涨超10%,创意信息、彩讯股份、焦点科技、南兴股份、酷特智能等跟涨。
2025-05-22
8点1氪|内蒙古通报那尔那茜有关核查情况;一年电费40万炫富网红被禁言;罗永浩辟谣离开科技界
36氪独家丨淘宝闪购联合饿了么订单峰值突破6000万单,这个夏天结束预计达到8000万单
推送和解读前沿、有料的科技创投资讯
一级市场金融信息和系统服务提供商
聚焦全球优秀创业者,项目融资率接近97%,领跑行业