月之暗面Kimi智能助手宣布推出新一代数学推理模型k0-math。k0-math模型在多项数学基准能力测试中表现突出,其成绩在中考、高考、考研以及包含入门竞赛题的MATH等4个数学基准测试中超过了OpenAI o1系列的o1-mini和o1-preview模型。

image

特别是在MATH测试中,k0-math模型得分93.8,仅次于o1完全版的94.8分。尽管在竞赛级别的OMNI-MATH和AIME基准测试中,k0-math初代模型的表现分别达到了o1-mini最高成绩的90%和83%,但公司计划持续迭代,以提升更难题目的解题能力。

k0-math模型采用了全新的强化学习和思维链推理技术,通过模拟人脑的思考和反思过程,大幅提升了解决数学难题的能力。

该模型在解题过程中会花费更多时间进行推理,包括思考和规划思路,并在必要时自行反思改进解题思路,以提升答题成功率。

尽管k0-math模型在解答大部分有难度的数学题方面表现出色,但当前版本还无法解答LaTeX格式难以描述的几何图形类问题,且对于过于简单的数学问题可能会过度思考,对高考难题和IMO题目也有一定概率做错。