信息差

腾讯新专利申请：提升大语言模型训练的泛化力与精准度

天眼查App显示，腾讯科技（深圳）有限公司近日申请了一项名为“大语言模型的训练方法、装置、计算机设备及存储介质”的专利。这项专利的摘要揭示了该方法通过引入第一摘要文本和第二摘要文本，在大语言模型的训练过程中为模型提供更多可学习的信息。

根据专利描述，第一摘要文本和第二摘要文本所包含的信息量不同，其中第一摘要文本中还包含了正确语句和错误语句。通过对同一文本的这两个不同摘要进行对比学习，并区分学习其中的正确语句与错误语句，能够有效避免摘要文本单一可能导致的模型过拟合和生成不准确等问题。

该方法的创新之处在于提升了模型的泛化性能，并有效提高了模型的准确性。通过引入多样化的摘要文本内容，腾讯的这一训练方法为大语言模型的训练过程带来了更高效、更精准的提升。

如果觉得文章对你有用，请随意赞赏

快讯

腾讯新专利申请：提升大语言模型训练的泛化力与精准度

破晓

2025-02-10

2025-02-10

CC BY 4.0