yabo.com-每秒150token!小米MiMo-V2-Flash性能比肩DeepSeek
2026-02-21
【YABO科技动静】12月16日,YABO留意到,小米MiMo官方公布:MiMo-V2-Flash的总参数为309B,活跃参数为15B。

于架构设计上,小米MiMo-V2-Flash采用了混淆留意力机制。其混淆模块设计包罗8个混淆块,此中每一5个滑动窗口留意力(SWA)层对于应1个全局留意力层。于上下文撑持能力上,该模子原生撑持32K的练习,而且可以或许扩大到256K的上下文撑持。
从机能体现来看,小米MiMo-V2-Flash于通用基准测试中,与DeepSeek-V3.2八两半斤,同时延迟年夜幅降低。于SWE-Bench验证及多语言中别离取患了73.4%及71.7%的成就。尤为凸起的是其速率上风,于Day-0时,输出速率高达每一秒150个token,这一速率于同类模子中处在领先职位地方。

为了直不雅展示其机能,小米MiMo官方还有宣布了一系列对于比图表。于与DeepSeek-V3.二、K2-Thinking、Claude Sonnet 4.五、GPT-5(High)、Gemini 3.0 Pro等模子的对于比中,MiMo-V2-Flash于多个测试项目上都揭示出了极具竞争力的体现,部门指标甚至领先在其他模子。
版权所有,未经许可不患上转载
-yabo.com

返回





