小米发布首个推理大模型MiMo-7B并宣布全面开源

2025-07-09 05:20:10 分类：量化宽松

4月30日消息，据小米公司公众号“Xiaomi MiMo”，小米今日开源首个专为“Reasoning（推理）”打造的大模型MiMo-7B，在AIME数学推理和LiveCodeBench编程测评中超越OpenAI o1-mini及阿里Qwen-32B。

MiMo通过大规模推理数据预训练与强化学习后训练联动提升推理能力，提出Test Difficulty Driven Reward等创新算法，并在同类7B模型中强化学习潜力领先。全系列已开源至Hugging Face，相关技术报告同步发布。