【源Yuan 3.0 Flash基础大模型开源发布】YuanLab.ai 团队正式开源发布 源Yuan3.0 Flash 多模态基础大模型。Yuan3.0 Flash 是一款 40B 参数规模的多模态基础大模型,采用稀疏混合专家(MoE)架构,单次推理仅激活约 3.7B 参数。Yuan3.0 Flash创新性地提出和采用了强化学习训练方法(RAPO),通过反思抑制奖励机制(RIRM),从训练层面引导模型减少无效反思,在提升推理准确性的同时,大幅压缩了推理过程的 token 消耗,显著降低算力成本,在“更少算力、更高智能”的大模型优化路径上更进一步。(财联社记者 郭松峤)

发布时间:2025年12月31日 11:10 来源:火眼 分类:全部
【源Yuan 3.0 Flash基础大模型开源发布】YuanLab.ai 团队正式开源发布 源Yuan3.0 Flash 多模态基础大模型。Yuan3.0 Flash 是一款 40B 参数规模的多模态基础大模型,采用稀疏混合专家(MoE)架构,单次推理仅激活约 3.7B 参数。Yuan3.0 Flash创新性地提出和采用了强化学习训练方法(RAPO),通过反思抑制奖励机制(RIRM),从训练层面引导模型减少无效反思,在提升推理准确性的同时,大幅压缩了推理过程的 token 消耗,显著降低算力成本,在“更少算力、更高智能”的大模型优化路径上更进一步。(财联社记者 郭松峤)