小米发布首个推理大模型MiMo-7B并宣布全面开源

4月30日消息,据小米公司公众号“Xiaomi MiMo”,小米今日开源首个专为“Reasoning(推理)”打造的大模型MiMo-7B,在AIME数学推理和LiveCodeBench编程测评中超越OpenAI o1-mini及阿里Qwen-32B。

MiMo通过大规模推理数据预训练与强化学习后训练联动提升推理能力,提出Test Difficulty Driven Reward等创新算法,并在同类7B模型中强化学习潜力领先。全系列已开源至Hugging Face,相关技术报告同步发布。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。