天才少女罗福莉加入小米后,小米首个开源推理大模型发布
创始人
2025-05-02 03:08:06
0

出品|搜狐科技

作者|张雅婷

天才少女罗福莉加入小米之后,小米交出了首份在大模型领域的成绩单。

4月30日小米,小米官方宣布开源首个为推理而生的大模型“Xiaomi MiMo”,联动预训练到后训练,全面提升推理能力。

在数学推理(AIME 24-25)和 代码竞赛(LiveCodeBench v5)公开测评集上,MiMo 仅用 7B 的参数规模,超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。

随着DeepSeek-R1引发业界强化学习(RL)共创潮,DeepSeek-R1-Distill-7B和Qwen2.5-32B已成为广泛使用的强化学习起步模型。在相同RL训练数据情况下,小米MiMo-7B 的数学&代码领域的强化学习潜力显著领先。

小米表示,MiMo推理能力的提升,由预训练和后训练阶段中数据和算法等多层面的创新联合驱动,比如在预训练中,核心是让模型见过更多推理模式,在后训练中,引入了高效稳定的强化学习算法和框架。

去年底,有报道称,罗福莉被小米创始人雷军以千万年薪招募,担任小米AI实验室的大模型团队负责人,她也被外界称为95后AI“天才少女”。

公开资料显示,罗福莉本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学专业。硕士毕业后,罗福莉进入阿里达摩院做人工智能研究,从事预训练语言模型相关的工作,负责阿里达摩院AliceMind开源项目,主导开发了多语言预训练模型VECO。

2022年,罗福莉加入幻方量化从事深度学习相关策略建模和算法研究,后又跳槽到DeepSeek担任深度学习研究员,参与研发MoE大模型DeepSeek-V2。

对于小米来说,端侧大模型是其需要重点突破的方向。此前在2023年4月,小米组建了AI大模型的团队,聚焦轻量化和本地部署,这也和很多互联网平台公司的思路是不同的。

从行业来看看,各家品牌厂都在加速布局大模型,加速推动AI落地手机端侧。IDC认为,中国市场AI手机份额也将迅速增长,到2027年将占比超过50%。新一代AI手机将带来存储、屏幕、影像设备的硬件升级和成本提升,会推动智能手机ASP进一步上升。

相关内容

770万股全卖了,比尔·盖...
又一个知名基金会清仓微软。 据美国证券交易委员会(SEC)最新文件...
2026-05-17 19:38:28
Token经济学:AI时代...
文 | 硅谷101 在硅谷,有了一种新的炫富方式——每天烧了多少...
2026-05-17 11:11:55
机器学习在外汇、债券及商品...
内容提要 本文主要运用XGBoost机器学习模型,选取外汇、债券及...
2026-05-16 09:50:27
原创 ...
1980年9月22日凌晨,伊拉克总统萨达姆果断下达了进攻命令。按照...
2026-05-15 23:25:49
原创 ...
对越反击战期间,越南军队中有一位师长,嚣张得令人咋舌,甚至公然宣称...
2026-05-15 00:00:10

热门资讯

原创 特... 亚太日报 张瑀轩 当地时间周五,美国总统唐纳德·特朗普宣布,美国将从下周起把针对欧盟进口汽车和卡车的...
770万股全卖了,比尔·盖茨基... 又一个知名基金会清仓微软。 据美国证券交易委员会(SEC)最新文件显示,盖茨基金会信托(Gates ...
韩红基金会去年共收入7.8亿余... 近日 北京韩红爱心慈善基金会 正式发布了其2025年度报告 报告显示 2025年度韩红基金会共取得收...
中无人机最新公告:股东中航一期... 中无人机(688297.SH)公告称,股东中航一期基金因基金存续期即将届满,计划自公告披露之日起15...
中无人机:股东中航一期基金拟减... 新京报贝壳财经讯 5月17日,中无人机公告称,截至公告披露日,股东中航一期基金直接持有公司股份707...
中基协:94家基金经营机构开展... 5月15日,由《证券日报》发起并主办的第八届“5·15—5·19中小投资者保护宣传周”公益活动在北京...
原创 小... 要说地中海国家的空军实力,大家公认的前两名几乎无人争议:法国稳坐第一(手握明晃晃的核武器),以色列紧...
债券策略私募产品年内平均收益率... 私募排排网数据显示,截至2026年4月末,有业绩记录的1103只债券策略私募产品,今年以来平均收益率...
原创 空... 就在五代半歼-20A逐步进入现役、歼-20曾经的光环略微褪去的时刻,《央视军事》近期的一则报道再次将...
原创 号... 前言提到美国空军一号时,不管是资深军迷还是普通市民,几乎无人不知其大名。它不仅是美国总统的专属飞行座...