据阿里巴巴Qwen,Qwen3-Max推理模型仍在持续训练中,即便是当前的Checkpoint,当借助工具调用和规模化的测试时计算时,模型可在AIME 25和HMMT25等具有挑战性的数学推理基准测试中达到100%的准确率。

发布时间:2025年11月3日 23:40 来源:鹰瞳 分类:要闻
据阿里巴巴Qwen,Qwen3-Max推理模型仍在持续训练中,即便是当前的Checkpoint,当借助工具调用和规模化的测试时计算时,模型可在AIME 25和HMMT25等具有挑战性的数学推理基准测试中达到100%的准确率。