快科技1月25日消息,中国电信人工智能研究院发布了复杂推理大模型”TeleAI-t1-preview,即将上线天翼AI开放平台。
该模型采用强化学习训练方法,结合探索和反思范式,显著提升了逻辑推理和数学推导的准确性。
在多项权威评测中,TeleAI-t1-preview表现优异,例如在美国数学竞赛AIME2024和MATH500测试中,分别获得60分和93.8分,大幅超越OpenAI的o1-preview和GPT-4o等标杆模型。
在研究生级别问答测试GPQA Diamond中,其得分也超过了GPT-4o,并与Claude3.5 Sonnet的性能相当。
TeleAI-t1-preview能够处理复杂的古文数学题,如《九章算术》中的题目。它先将文言文进行理解和简化,转换成现代汉语,再进行数学推导并给出答案。
这一过程展示了其在形象思维与抽象思维结合方面的能力,以及对古今单位换算的严谨处理。
TeleAI-t1-preview的发布标志着中国电信在人工智能领域的重大突破,为复杂推理任务提供了新的解决方案。