02
08

腾讯公布大语言模型训练专利,可提高模型的准确性

2025-02-08 15:08分享至
36氪获悉,天眼查App显示,2月7日,腾讯科技(深圳)有限公司申请的“大语言模型的训练方法、装置、计算机设备及存储介质”专利公布。摘要显示,在该方法中,通过在大语言模型的训练过程中引入第一摘要文本和第二摘要文本,为模型训练提供了更多可学习信息,同时由于第一摘要文本和第二摘要文本包含的信息量不同,且第一摘要文本中包含正确语句和错误语句,通过对同一样本文本的两个不同摘要文本进行对比学习,并区分学习第一摘要文本中的正确语句和错误语句,避免了由于摘要文本单一而导致的模型过拟合和生成不准确等问题,不仅提高了模型的泛化性能,还提高了模型的准确性。原文链接

下一篇

摩根士丹利策略师表示,随着市场消化美日政策利率趋同以及关税相关不确定性,2月份在G-10货币中跑赢的日元还有更多上涨空间。日元兑美元本月迄今已上涨2.4%;“最终,关税实施的越快,美元/日元的下行潜力就越大”,策略师Koichi Sugisaki和David Adams在2月7日的一份报告中称。他们表示:“市场越来越多地体现出增长放缓风险”。(新浪财经)

2025-02-08

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业