天才少女罗福莉加入小米后,小米首个开源推理大模型发布
创始人
2025-05-02 03:08:06
0

出品|搜狐科技

作者|张雅婷

天才少女罗福莉加入小米之后,小米交出了首份在大模型领域的成绩单。

4月30日小米,小米官方宣布开源首个为推理而生的大模型“Xiaomi MiMo”,联动预训练到后训练,全面提升推理能力。

在数学推理(AIME 24-25)和 代码竞赛(LiveCodeBench v5)公开测评集上,MiMo 仅用 7B 的参数规模,超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。

随着DeepSeek-R1引发业界强化学习(RL)共创潮,DeepSeek-R1-Distill-7B和Qwen2.5-32B已成为广泛使用的强化学习起步模型。在相同RL训练数据情况下,小米MiMo-7B 的数学&代码领域的强化学习潜力显著领先。

小米表示,MiMo推理能力的提升,由预训练和后训练阶段中数据和算法等多层面的创新联合驱动,比如在预训练中,核心是让模型见过更多推理模式,在后训练中,引入了高效稳定的强化学习算法和框架。

去年底,有报道称,罗福莉被小米创始人雷军以千万年薪招募,担任小米AI实验室的大模型团队负责人,她也被外界称为95后AI“天才少女”。

公开资料显示,罗福莉本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学专业。硕士毕业后,罗福莉进入阿里达摩院做人工智能研究,从事预训练语言模型相关的工作,负责阿里达摩院AliceMind开源项目,主导开发了多语言预训练模型VECO。

2022年,罗福莉加入幻方量化从事深度学习相关策略建模和算法研究,后又跳槽到DeepSeek担任深度学习研究员,参与研发MoE大模型DeepSeek-V2。

对于小米来说,端侧大模型是其需要重点突破的方向。此前在2023年4月,小米组建了AI大模型的团队,聚焦轻量化和本地部署,这也和很多互联网平台公司的思路是不同的。

从行业来看看,各家品牌厂都在加速布局大模型,加速推动AI落地手机端侧。IDC认为,中国市场AI手机份额也将迅速增长,到2027年将占比超过50%。新一代AI手机将带来存储、屏幕、影像设备的硬件升级和成本提升,会推动智能手机ASP进一步上升。

相关内容

现场视频丨空军八一飞行表演...
1月30日上午,中国空军八一飞行表演队在新加坡樟宜机场开展适应性训...
2026-01-30 22:17:42
中国空军八一飞行表演队进行...
↑1月30日上午,中国空军八一飞行表演队在新加坡樟宜机场海面上空展...
2026-01-30 21:09:45
中国空军八一飞行表演队在新...
本文转自【央视新闻客户端】; 1月30日上午,中国空军八一飞行表演...
2026-01-30 18:19:12
战机轰鸣!直击人民空军训练...
隆冬,寒风凛冽 空军航空兵某旅机场上战机轰鸣 各类保障车辆往来穿梭...
2026-01-30 16:50:16
00后女生嫁到光明村领到刘...
极目新闻记者 刘闪 刘琴 1月29日上午,在江苏宿迁来龙镇光明村,...
2026-01-29 14:27:59
中部战区空军某团新年度首次...
寒冬时节,记者走进中部战区空军某团营区,恰逢该团官兵整装待发,准备...
2026-01-29 09:05:02

热门资讯

岛内舆论担忧台积电变“美积电”... 1月14日,国务院台办举行例行新闻发布会。有记者问,美国《纽约时报》近日报道称,美国与台湾接近达成贸...
机械ETF(159886)开盘... 来源:新浪基金∞工作室 1月9日,机械ETF(159886)开盘涨0.00%,报1.051元。机械...
债权债务律师:连带保证还是一般... ——从“到期不还,由我归还”看被告担保人的有效抗辩策略 一、案件介绍 当收到法院传票,要求你对一笔...
粮食收购量达8300亿斤 本报北京1月7日电(记者欧阳洁)记者近日从全国粮食和物资储备工作会议上获悉,2025年全国各类企业累...
贵金属价格“闪耀”开年 本报记者 韩 昱 新年伊始,贵金属板块延续上一年的强势表现,黄金和白银的盘中价格双双刷新历史纪录。 ...
(外代一线)国际贵金属市场巨幅... 国际黄金和白银价格29日上演“过山车”行情,双双站上高位后暴跌,市场剧烈波动。纽约商品交易所4月黄金...
商品市场遭遇黑色星期五!黄金暴... 来源:格隆汇APP 格隆汇1月30日|市场聚焦新美联储主席人选,沃什再度成为美联储主席热门人选,由于...
金荣中国:金价过山车大跌行情,... 基本面: 周五(1月30日)黄金价格上演了一场惊心动魄的过山车行情,现货金价在触及历史高位后迅速回落...