MiniMax M3
MiniMax M3 是上海 MiniMax (稀宇科技) 发布的一款 428B 参数 MoE 大模型,每次推理激活 22B 参数。它是首个在单一架构里同时具备三项能力的开源权重模型:前沿级代码水平、100 万 token 上下文窗口、原生多模态输入。
2026 年 6 月 1 日发布,M3 引入了 MSA(MiniMax Sparse Attention),把 100 万 token 上下文下的单 token 计算量压到了上一代 M2.7 的 1/20。在 SWE-Bench Pro 上得分 59.0%,略超 GPT-5.5(58.6%)和 Gemini 3.1 Pro,权重在 API 上线后不久就在 Hugging Face 开源。
把 MSA 想成一个图书管理员:先扫索引再去取书,跳过 95% 的书架,只取相关的那几本。
MiniMax (稀宇科技) 是国内公司,这波 GLM-5.1、Kimi K2.6、DeepSeek、M3 同期涌现的国产开源浪潮,中文 builder 对背景天然更熟,写英文横评或技术解析有一手感。M3 性价比的故事 (SWE-Bench Pro 59.0%,价格约 Claude Opus 4.7 的 1/15) 对英文受众吸引力高,是内容切入的好角度。实际部署前先确认许可证,M2.7 曾有商用限制,M3 是否沿用还待核实。
搜索热度
-
萌芽0–7 天
-
初现8–30 天
-
验证中 ← 当前31–90 天
-
上升91–180 天
-
成熟180 天以上
为什么是现在火?
6 月 1 日,M3 以第一个开源权重模型的姿态亮相:SWE-Bench Pro 59.0%、100 万 token 上下文、原生多模态,输入价格只要 $0.30/M token,大约是 Claude Opus 4.7 的 1/15。6 月 13 日权重在 Hugging Face 上线,自托管的最后一道门槛也没了。
前景
未来 6 个月的信号走势和商业化节奏。
开源权重加上比 Claude Opus 4.7 低 15 倍的成本,M3 有望成为 2026 年 Q3 长上下文 agentic coding 的开源基准模型。
风险 · 跑分全是自报,没有独立机构复现;没进 DeepSWE 排行榜,公信力有缺口。
类比 · deepseek-v3 · kimi-k2-6 · qwen3
-
现在API 上线,权重开放
MiniMax API 和 OpenRouter 已同步上线;Hugging Face 的权重让自托管部署成为可能。
-
3-6 个月对比工具和微调服务
针对 22B 激活参数这个甜点,做跑分对比站和 LoRA 微调服务。
-
6-12 个月企业长上下文场景
基于 M3 或其后继版本,做代码库分析和文档处理 SaaS,100 万 token 上下文是核心卖点。
“MiniMax M3” 的竞争与机会
三个启发式信号,来自追踪到的搜索词、这个词的变现卡片,还有它的相关词。仅供参考,未经核实。
“MiniMax M3” 能做的点子
把这个词做成文章、网站、产品、帖子、邮件、视频或课程,随便挑一张卡片就能开干。
高意图的对比词,目前还没有权威横评。覆盖 SWE-Bench Pro、BrowseComp、定价和上下文窗口的并排对比。
428B MoE 权重带来了具体的部署问题,前两周里相关教程屈指可数。
M3 效率的核心是架构创新,技术解析却几乎没有,这个方向基本空着。
以这波国产开源模型为主线的品类横评,搜索量大但覆盖碎片化。
法律、金融、医疗团队要处理几百页的文档,正好需要长上下文模型;M3 标准价 $0.60/M token,单位经济跑得起来。
128 个专家的 MoE 支持在 22B 激活参数上跑 LoRA,面向想用 M3 量级性能跑私有代码库的团队。
用真实代码库正面对打,比贴跑分截图更有说服力;20-30 分钟带屏幕录制的格式,目前还很稀缺。
2026 年 4 月,四家中国实验室同时发布了前沿级开源 coding 模型。6 月,MiniMax 来了,把跑分又推了一层。
大多数「百万 token」模型过了 20 万就开始掉链子。M3 的 MSA 架构走的是另一条路,推理速度数据支撑了这个判断。
MiniMax 2026 年 1 月 9 日在香港联交所挂牌,六个月后发了一个在 SWE-Bench Pro 上超过 GPT-5.5 的模型,价格还只是零头。
大家在搜什么
来自 Google Suggest 和 Trends 的长尾词。热度和竞争度是估算,仅供参考,未经核实。内容类型由搜索词的写法推断。
“MiniMax M3” 的搜索结果
现在搜索的人会看到的页面:自然结果在上,有人投广告就显示在那。广告多少是实时的商业化信号。
常见问题
什么是 MiniMax M3?
MiniMax M3 是上海 MiniMax (稀宇科技) 发布的一款 428B 参数 MoE 大模型,每次推理激活 22B 参数。它是首个在单一架构里同时具备三项能力的开源权重模型:前沿级代码水平、100 万 token 上下文窗口、原生多模态输入。
MiniMax M3 为什么现在火?
6 月 1 日,M3 以第一个开源权重模型的姿态亮相:SWE-Bench Pro 59.0%、100 万 token 上下文、原生多模态,输入价格只要 $0.30/M token,大约是 Claude Opus 4.7 的 1/15。6 月 13 日权重在 Hugging Face 上线,自托管的最后一道门槛也没了。
MiniMax M3 是什么时候出现的?
约于 2026-06-01 公开出现(截至 2026-07-04 约 33 天前)。EarlyTerms 最早于 2026-06-01 记录到信号。
相关词
同一领域里的其他词:别名、子类、竞品,以及值得接着看的邻近词。
- 竞品 deepseek-v4 DeepSeek V4 是深度求索推出的一系列开放权重混合专家 (MoE) 大模型,把百万 token 上下文带进了前沿级别的性能区间,价格只有闭源模型的一小部分。这系列有两个变体:V4-Pro (1.6T 参数,激活 49B) 和 V4-Flash (284B… →
- 竞品 kimi-k2-6 Kimi K2.6 是 Moonshot AI 于 2026 年 4 月 20 日发布的开权重旗舰模型,1T 参数的 Mixture-of-Experts 架构(32B 激活,384 个专家,256K 上下文,原生多模态),在 Hugging Face 以… →
- 竞品 glm-5-1 GLM-5.1 是 Z.ai 发布的 7540 亿参数开权重大模型,专为 agentic 工程和长周期编程任务设计。它是 GLM-5 的训练后升级版,共用同一套 Mixture-of-Experts Dynamic Sparse Architecture,以 MIT 许可证发布。 →
- 竞品 mimo-code MiMo Code 是小米 MiMo 团队开源的终端 AI 编程 agent,解决的核心问题是长任务里决策质量下滑。这是所有编程 agent 的共同软肋,MiMo Code 用四层跨会话记忆架构来应对,保证 agent 在任务越来越长的过程中不会丢掉项目上下文。 →
- 相关 agentic-coding Agentic coding 是让 AI agent 自主完成开发任务的工作方式:agent 自己规划、写代码、跑测试、读报错、修改,一轮轮迭代直到跑通,不需要人在每一步之间点头。这和 autocomplete 式的「AI pair… →
- 相关 context-window Context window 是大模型在一次推理里能读入和处理的 token 总量上限。2025 到 2026 年间,这个词完成了一次身份转变:从当初「8K 还是 1M」的规格对比项,变成了 agent 团队每次会话都要主动预算、监控、并为之付钱的工程资源。 →
- 相关 managed-agents Managed Agents 是云平台托管并运行 AI agent 的基础设施模式。开发者以前要自己搭 agent 循环,记忆管理、工具路由、状态控制、沙箱隔离、错误恢复,全部自己处理;现在这些都由平台打包成 runtime 服务。 →
- 别名
- 属于
- 相关 ·
来源
这份报告引用的一手链接,点开任意一条都能自己核对。
- 01 MiniMax M3 — Hugging Face 模型主页(428B MoE,22B 激活,MSA,100 万 token 上下文) huggingface.co ↗
- 02 MarkTechPost — MiniMax M3 发布报道(2026 年 6 月 1 日) marktechpost.com ↗
- 03 NVIDIA Developer Blog — MiniMax M3 部署指南 developer.nvidia.com ↗
- 04 The Decoder — 开源权重 100 万 token 上下文模型分析 the-decoder.com ↗
- 05 Artificial Analysis — M3 跑分评测与注意事项 artificialanalysis.ai ↗
- 06 Wikipedia — MiniMax Group(公司背景,2026 年 1 月香港 IPO) en.wikipedia.org ↗
- 07 GitHub — MiniMax-AI/MiniMax-M3(官方仓库,2026 年 6 月 1 日创建) github.com ↗