天才少女罗福莉加入小米后,小米首个开源推理大模型发布
创始人
2025-05-01 23:10:03
0

出品|搜狐科技

作者|张雅婷

天才少女罗福莉加入小米之后,小米交出了首份在大模型领域的成绩单。

4月30日小米,小米官方宣布开源首个为推理而生的大模型“Xiaomi MiMo”,联动预训练到后训练,全面提升推理能力。

在数学推理(AIME 24-25)和 代码竞赛(LiveCodeBench v5)公开测评集上,MiMo 仅用 7B 的参数规模,超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。

随着DeepSeek-R1引发业界强化学习(RL)共创潮,DeepSeek-R1-Distill-7B和Qwen2.5-32B已成为广泛使用的强化学习起步模型。在相同RL训练数据情况下,小米MiMo-7B 的数学&代码领域的强化学习潜力显著领先。

小米表示,MiMo推理能力的提升,由预训练和后训练阶段中数据和算法等多层面的创新联合驱动,比如在预训练中,核心是让模型见过更多推理模式,在后训练中,引入了高效稳定的强化学习算法和框架。

去年底,有报道称,罗福莉被小米创始人雷军以千万年薪招募,担任小米AI实验室的大模型团队负责人,她也被外界称为95后AI“天才少女”。

公开资料显示,罗福莉本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学专业。硕士毕业后,罗福莉进入阿里达摩院做人工智能研究,从事预训练语言模型相关的工作,负责阿里达摩院AliceMind开源项目,主导开发了多语言预训练模型VECO。

2022年,罗福莉加入幻方量化从事深度学习相关策略建模和算法研究,后又跳槽到DeepSeek担任深度学习研究员,参与研发MoE大模型DeepSeek-V2。

对于小米来说,端侧大模型是其需要重点突破的方向。此前在2023年4月,小米组建了AI大模型的团队,聚焦轻量化和本地部署,这也和很多互联网平台公司的思路是不同的。

从行业来看看,各家品牌厂都在加速布局大模型,加速推动AI落地手机端侧。IDC认为,中国市场AI手机份额也将迅速增长,到2027年将占比超过50%。新一代AI手机将带来存储、屏幕、影像设备的硬件升级和成本提升,会推动智能手机ASP进一步上升。

相关内容

热门资讯

原创 中... 我入职八年,自认为工作努力,业绩尚可,但无奈一直原地踏步,比我晚来的同事都提拔了,只有还在埋头拉车、...
全国劳动模范姚春雷:茶山上的逐... 近日,全国劳动模范表彰大会在北京隆重举行,来自各行各业的优秀劳动者接受荣誉表彰。其中,普定县靛山村的...
西安夜空现“龙形”飞行物,气象... 5月4日,“西安现不明飞行物”上了各大社交平台的热搜热榜:称5月2日西安雷雨夜空现条状不明物,多名网...
新华社权威快报|习近平将对俄罗... 外交部发言人5月4日宣布:应俄罗斯联邦总统普京邀请,国家主席习近平将于5月7日至10日对俄罗斯进行国...
俄媒:塞尔维亚第一副总理称,武... 【环球网报道】据塔斯社4日报道,塞尔维亚第一副总理兼财政部长西尼沙·马利表示,塞尔维亚总统武契奇已出...
“学生组团退60件演出服”,校... @第一现场、@央广网 5月2日,据深圳广电集团都市频道《第一现场》栏目消息,一店主称沈阳一职业技术学...
白茶之味甘甜入魂明道邀你共品茶... 生 活▎美 文▎情 感▎文 化 茶之妙有三一曰色,二曰香,三曰味喝过白茶的人,大多对白茶滋味的最深感...
鹤峰神龙泉:“一键式”种采管收... 云上恩施报道(鹤峰通联记者 杨国炎 田恩惠)5月2日清晨,晨光熹微,朝晖漫染,鹤峰县太平镇龙潭村的茶...
中星微发布最新AI芯片 可单芯... 4月30日,在福州举行的第八届数字中国建设峰会上,中星微宣布最新AI芯片“星光智能五号”已成功运行D...
心系祖国统一,107岁统派精神... 据台媒报道,统派精神领袖、台军退役上将许历农于今日(4日)清晨在台北荣民总医院安祥辞世,享年107岁...