MiniMax M3 開源:1M context 編程 Agent 全面來襲,Token Plan 收費改制引爆爭議
中國 AI 新創 MiniMax 在 6 月 1 日正式開源新一代旗艦模型 M3。這是繼 M2.7 之後的 M 系列最新力作,主打「前沿編程 + 百萬 token 上下文 + 原生多模態」三位一體,宣稱是全球第一個把這三項能力整合在單一架構的開放權重模型。M3 挾帶 59% 的 SWE-Bench Pro 分數、1M token 上下文、以及僅有 GPT-5.5 5%–10% 的價格,強勢挑戰矽谷頂級閉源模型。
但同步上線的 Token Plan 收費改制,從原本的「固定配額制」改成「credits 扣點制」,引發開發者社群高度反彈。Reddit 上 r/opencodeCLI 有人直言:「They should just cut the estimated monthly tokens line from their pricing page」。
本文整理 M3 的所有核心特點、能耐、定價、benchmark,以及這次 Token Plan 改制的來龍去脈。
🏢 公司背景:MiniMax 是誰?
MiniMax 官方簡介(minimax.io/about)載明公司「Founded in early 2022(2022 年初成立)」,總部位於上海徐匯區桂箐路 65 號,創辦人為前商湯科技(SenseTime)電腦視覺研究員閆俊傑(Yan Junjie)。在中文媒體脈絡下,MiniMax 與智譜 AI、Z.ai、月之暗面、階躍星辰、零一萬物等並列為中國「AI 六小虎」民營新創代表。
港股 IPO(2026 年 1 月 9 日掛牌)
- 發行價:HK$165(定價區間頂端)
- 募資總額:HK$4.82 億(約 6.19 億美元),含 greenshoe 後規模(來源:Reuters、CNBC、SCMP)
- 上市首日表現:收盤 HK$345,較發行價上漲 109%(首日翻倍)
- Forbes 報導創辦人閆俊傑身家達 32 億美元
- 上市後傳出 已規劃申請上海 STAR Market 科創板 雙重上市(來源:Yicai Global 報導,用詞為 “planning to list”,非已遞件)
⚠️ 編者註:上述 IPO 數字來自 Reuters、CNBC、SCMP 等媒體報導;個股 IPO 與雙重上市進度,建議以公司最新公告為準。
🧠 核心架構:MSA(MiniMax Sparse Attention)
M3 最大技術亮點是全新的稀疏注意力架構 MSA(MiniMax Sparse Attention),用來解決長上下文運算成本飆升的痛點。
為什麼需要 MSA?
傳統 Transformer 的 full attention 是平方複雜度——context 越長,計算量以平方速度膨脹。這就是為什麼百萬 token context 至今仍只屬於少數旗艦模型的奢侈品。
MSA 的關鍵設計
- 更精細的 KV cache 切塊:相比 DSA、MoBA 等既有稀疏方法,MSA 把 KV cache 切得更細,達到更高的有效覆蓋率
- 「KV outer gather Q」運算模式:以 KV block 為外層迴圈去聚集命中它的 query,每個 block 只讀一次,記憶體存取完全連續
- 比開源稀疏方案快 4×+:官方宣稱比 Flash-Sparse-Attention 與 flash-moba 還快 4 倍以上
實測效能(MiniMax 官方數據,1M token context)
| 指標 | 數字 |
|---|---|
| Prefill 速度 | >9× 比 M2 系列 |
| Decoding 速度 | >15× 比 M2 系列 |
| 每 token 運算量 | M2 的 1/20 |
| 1M context 成本 | 接近 512K context 的成本 |
消融實驗結果:在絕大多數能力維度上,MSA 與 full attention 表現相當,但成本大幅降低。
📊 Benchmark 表現
編程與 Agentic 任務
| 測試 | M3 成績 | 對照組 |
|---|---|---|
| SWE-Bench Pro | 59.0% | 超越 GPT-5.5 與 Gemini 3.1 Pro,逼近 Opus 4.7(64.3%) |
| SWE-Bench Verified | 領先級(具體分數待官方揭露) | — |
| Terminal-Bench 2.1 | 66.0% | 領先群 |
| SWE-fficiency | 34.8% | — |
| KernelBench Hard | 28.8% | NVIDIA Blackwell sm_120 |
| MCP Atlas | 74.2% | — |
| Claw-Eval | 最高分(161 tasks) | General Task Group |
| SVG-Bench | 超越 Opus 4.7 | — |
電腦操作(Computer Use)
- OSWorld-Verified:70.06% 完成率(361 個樣本,Max Steps = 200)
多模態
- OmniDocBench(多模態文件理解):超越 Gemini 3.1 Pro
- BrowseComp(瀏覽器綜合任務):83.5,超越 Claude Opus 4.7
三個 MiniMax 公布的真實案例
-
論文重現:給 M3 一篇 ICLR 2025 Outstanding Paper(Learning Dynamics of LLM Finetuning),M3 自主運作近 12 小時,產出 18 個 commit 與 23 張實驗圖表,無人工介入完成核心實驗。
-
CUDA kernel 優化:給 M3 一個非功能性的 Triton 骨架,目標是優化 Hopper FP8 GEMM kernel。24 小時內提交 147 次 benchmark,呼叫 1,959 次工具。經六輪標誌性優化,硬體利用率從 7.6% 拉到 71.3%(9.4× 加速)。MiniMax 特別強調:「大多數其他模型在 30 次提交後就停了,只有 Opus 4.7 跟 M3 撐到底。」
-
PostTrainBench(自主訓練):給 M3 四個只做完 pretraining 的 base model,讓它自主跑完「資料合成 → 訓練 → 評測 → 迭代」完整 cycle。M3 拿到 0.37 分,低於 Opus 4.7(0.42)與 GPT-5.5(0.39),但領先其他受測模型。
🌍 原生多模態
M3 從訓練 step 0 就把文字、圖像、影片一起混和訓練,不是訓練完再來補多模態。MiniMax 特別提到「interleaved 資料」的重要性——文字與影像自然交錯的序列——比外界想像的更關鍵。
支援模態:
- 輸入:文字、圖像、影片
- 輸出:文字
- 額外能力:原生支援桌面電腦操作
訓練資料規模達到 官方宣稱的 100 兆 token 等級(minimax.io 官方 blog:「we are now able to scale the training data to the order of 100 trillion tokens」)。此規模在社群引發爭議——Digg 與 Reddit r/LocalLLaMA 都報導開發者對「100T 是否包含重複資料 / 是否為去重後規模」等問題持懷疑態度,尚待第三方獨立驗證。
💰 定價
API 計價(推出期間優惠價)
| 計價類型 | 促銷價 | 標準價 |
|---|---|---|
| 輸入 | $0.30 / 1M tokens | $0.60 / 1M tokens |
| 輸出 | $1.20 / 1M tokens | $2.40 / 1M tokens |
對比同業(2026 年 6 月官方公開定價):
- GPT-5.5(OpenAI 官方):$5.00 / 1M input、$22.50–$30.00 / 1M output
- Claude Opus 4.7(Anthropic 官方):$5.00 / 1M input、$25.00 / 1M output(Fast mode 為 6× 價)
- M3 即使是標準價,仍是 GPT-5.5 / Opus 4.7 的 8%–20% 成本
簡單算:M3 促銷價是 GPT-5.5 的 6%,是 Opus 4.7 的 6%–5%。即使日後回到標準價,1/8 ~ 1/5 的價差仍對開發者有巨大吸引力。
⚠️ 編者註:上表 GPT-5.5 / Opus 4.7 價格來源為 OpenAI 與 Anthropic 官方 pricing 頁面(截至 2026-05/06);第三方轉售平台(OpenRouter、EvoLink 等)價格可能不同。M3 與對照組的實際節省比例會因工作量分布(input vs output、長 context vs 短 context)而浮動。
Token Plan 訂閱(原 Coding Plan 升級版)
Token Plan 是 M3 同步上線的全模態訂閱服務,單一 API key 即可使用文字、語音、圖像、影片、音樂。月費方案有三階:
| 方案 | 月費 | 對應用量 |
|---|---|---|
| Starter | $10 | 輕度開發者 |
| Plus | $20 | 進階使用者 |
| Max | $50 | 重度工作者 |
🔥 Token Plan 收費改制爭議
這次 M3 上市最爭議的不是模型本身,而是同步推出的 Token Plan 收費模式變更。
改了什麼?
原本:固定配額制(fixed-count model)—— 不同任務消耗固定額度
新制:credits 扣點制(credit-based usage deduction)—— 根據「實際資源消耗」動態扣點
官方說法(摘自 platform.minimax.io/docs/token-plan/faq):
「What changed in the Token Plan upgrade?」 Token Plan now uses credit-based usage deduction. Usage is deducted according to actual resource consumption. Simple tasks consume less, while complex tasks deduct based on real usage.
「Is usage-based deduction a price increase?」 No. Under the older fixed-count model, a simple question and a complex reasoning task could consume the same amount of quota.
爭議點
-
「為什麼要改?」:Reddit 上 r/opencodeCLI 的開發者抱怨 pricing page 把「estimated monthly tokens 與 daily coding calls」埋在文末,沒把 request 數量放到最顯眼處。許多人訂閱後才發現 credits 燒得比預期快。
-
「credits 到底怎麼算?」:M3 是多模態、原生支援電腦操作、長上下文的模型,單次任務消耗的 credits 遠高於簡單問答。原本用 M2.5/M2.7 的用戶升級到 M3 後,發現同樣 $10 月費可能撐不到月底。
-
「開放權重不等於免費用」:雖然 M3 在 10 天內會開源模型權重與技術報告(自架可免費),但官方 API 與 Token Plan 訂閱仍是商業模式。對於不想自架的開發者,credits 制讓成本估算變得困難。
-
「complex task 沒有上限」:官方 FAQ 承認「long-context, multi-turn reasoning, multimodal tasks, and complex agent workflows deduct according to actual resource usage」—— 也就是 M3 的 agent 能力越強,credits 扣越多。這對重度使用者是個隱憂。
官方承諾的配套措施
- Unified quota pool:所有模型共用同一個 credits 池,不再分文字/圖像/音訊/影片配額
- Usage bar:控制台新增用量條即時顯示
- Migration compensation Credits:舊制用戶升級會拿到補償 credits
- 可購買額外 Credits:用完訂閱額度後可加購,且 Subscription Key 與一般 pay-as-you-go API Key 仍分開
開發者怎麼看?
支持方認為 credits 制「更公平」,簡單任務不再被複雜任務佔便宜;反對方則認為「無法預估月費」對小團隊與個人開發者是致命傷。這個爭議還在發酵中。
🔓 開源時程與授權
- API:M3 上線當天(6/1)已透過 MiniMax Code、Token Plan、MiniMax API 同步開放
- 模型權重 + 技術報告:M3 上市後 10 天內開源
- M3 是「open-weight」模型(非完全開源:程式碼可下載,但訓練資料與訓練程式碼不公開)
🆚 M3 vs M2.7 演進比較
| 維度 | M2.7(2026-03-18 發表) | M3(2026-06-01 發表) |
|---|---|---|
| Context | ~192K–200K(官方未統一公告) | 1M(5×) |
| 主要架構 | Full attention | MSA 稀疏注意力 |
| SWE-Bench Pro | ~52% | 59.0% |
| 1M context 成本 | 極高 | M2 的 1/20 |
| 多模態 | 有限 | 原生(圖+影+電腦操作) |
| 角色定位 | 對標 GLM-5 級 | 對標 GPT-5.5 / Opus 4.7 級 |
註:M2.7 由 Vals AI 與 Reddit r/LocalLLaMA 等於 2026-03-17/18 發表記錄,HuggingFace 權重於 4 月 12 日開放下載;context window 在不同第三方工具(cline PR #10007)介於 192K–204_800 之間,官方未在 M2.7 公告中給出單一精確值。
🌟 為什麼 M3 重要?
- 價格破壞者:以 5%–10% 成本達到 GPT-5.5 級 benchmark,對預算敏感的開發團隊是巨大誘因
- 開源旗艦:在 Anthropic 與 OpenAI 持續閉源化趨勢下,M3 是少數能自架的前沿模型
- 長上下文實用化:MSA 讓 1M context 不再是燒錢玩具,512K–1M 等於可放進整個中型 codebase
- Agent 能力:SWE-Bench Pro 59% 加上 12–24 小時自主運作的真實案例,顯示 M3 在長時間 agent 任務上已具實戰力
- 中國 AI 競爭力驗證:在港股 4 個月漲 400% 的背景下,M3 是 MiniMax 對投資人交出的關鍵技術成績單
📌 結論
M3 是 2026 年開源 LLM 最重要的里程碑之一。它把「前沿編程 + 百萬 token + 原生多模態」第一次整合進單一開源權重模型,價格更只有矽谷旗艦的 1/10。
但 Token Plan 的 credits 改制讓商業模式變得「不透明」,對不想自架的開發者來說,月費預估變得困難。如果你只是要做輕度應用,$10 starter 方案可能就夠;如果你打算用 M3 跑長時間 agent 或長上下文檢索,強烈建議先實測一個月的 credits 消耗,再決定要訂閱還是改用 API pay-as-you-go 或自架開源權重。
10 天後開源的模型權重,將是這波 AI 開源運動的下一個關鍵觀察點。
資料來源:MiniMax 官方 blog(minimax.io/blog/minimax-m3、minimax.io/about)、Marktechpost、OpenAI Hub、Reddit r/opencodeCLI、r/LocalLLaMA、platform.minimax.io/docs/token-plan/faq、Reuters、CNBC、SCMP、Yicai Global、Forbes、CloudZero、OpenAI 官方 API pricing、Anthropic 官方 API pricing、the-decoder.com、Lushbinary、Artificial Analysis
⚠️ 本報導事實查核聲明(2026-06-03 第二版) 本文 M3 規格、定價、benchmark、公司財務數字,凡未註明「官方宣稱」者,皆以官方公開資料為依據。OpenAI 與 Anthropic 的對比價格來自其官方 pricing 頁面,非轉售平台。第三方獨立 benchmark 驗證(如 Hugging Face 開源權重後的社群評測)截至發稿仍在進行中,建議讀者把 benchmark 視為「官方公布的最佳數字」而非「已驗證的極限」。凡涉及「具體 IPO 募資金額、上市公司股價走勢」等會隨時間變動的數字,建議以公司最新公告與交易所資訊為準。