MiniMax M3 開源：1M context 編程 Agent 全面來襲，Token Plan 收費改制引爆爭議

中國 AI 新創 MiniMax 在 6 月 1 日正式開源新一代旗艦模型 M3。這是繼 M2.7 之後的 M 系列最新力作，主打「前沿編程 + 百萬 token 上下文 + 原生多模態」三位一體，宣稱是全球第一個把這三項能力整合在單一架構的開放權重模型。M3 挾帶 59% 的 SWE-Bench Pro 分數、1M token 上下文、以及僅有 GPT-5.5 5%–10% 的價格，強勢挑戰矽谷頂級閉源模型。

但同步上線的 Token Plan 收費改制，從原本的「固定配額制」改成「credits 扣點制」，引發開發者社群高度反彈。Reddit 上 r/opencodeCLI 有人直言：「They should just cut the estimated monthly tokens line from their pricing page」。

本文整理 M3 的所有核心特點、能耐、定價、benchmark，以及這次 Token Plan 改制的來龍去脈。

🏢 公司背景：MiniMax 是誰？

MiniMax 官方簡介（minimax.io/about）載明公司「Founded in early 2022（2022 年初成立）」，總部位於上海徐匯區桂箐路 65 號，創辦人為前商湯科技（SenseTime）電腦視覺研究員閆俊傑（Yan Junjie）。在中文媒體脈絡下，MiniMax 與智譜 AI、Z.ai、月之暗面、階躍星辰、零一萬物等並列為中國「AI 六小虎」民營新創代表。

港股 IPO（2026 年 1 月 9 日掛牌）

發行價：HK$165（定價區間頂端）
募資總額：HK$4.82 億（約 6.19 億美元），含 greenshoe 後規模（來源：Reuters、CNBC、SCMP）
上市首日表現：收盤 HK$345，較發行價上漲 109%（首日翻倍）
Forbes 報導創辦人閆俊傑身家達 32 億美元
上市後傳出 已規劃申請上海 STAR Market 科創板 雙重上市（來源：Yicai Global 報導，用詞為 “planning to list”，非已遞件）

⚠️ 編者註：上述 IPO 數字來自 Reuters、CNBC、SCMP 等媒體報導；個股 IPO 與雙重上市進度，建議以公司最新公告為準。

🧠 核心架構：MSA（MiniMax Sparse Attention）

M3 最大技術亮點是全新的稀疏注意力架構 MSA（MiniMax Sparse Attention），用來解決長上下文運算成本飆升的痛點。

為什麼需要 MSA？

傳統 Transformer 的 full attention 是平方複雜度——context 越長，計算量以平方速度膨脹。這就是為什麼百萬 token context 至今仍只屬於少數旗艦模型的奢侈品。

MSA 的關鍵設計

更精細的 KV cache 切塊：相比 DSA、MoBA 等既有稀疏方法，MSA 把 KV cache 切得更細，達到更高的有效覆蓋率
「KV outer gather Q」運算模式：以 KV block 為外層迴圈去聚集命中它的 query，每個 block 只讀一次，記憶體存取完全連續
比開源稀疏方案快 4×+：官方宣稱比 Flash-Sparse-Attention 與 flash-moba 還快 4 倍以上

實測效能（MiniMax 官方數據，1M token context）

指標	數字
Prefill 速度	>9× 比 M2 系列
Decoding 速度	>15× 比 M2 系列
每 token 運算量	M2 的 1/20
1M context 成本	接近 512K context 的成本

消融實驗結果：在絕大多數能力維度上，MSA 與 full attention 表現相當，但成本大幅降低。

📊 Benchmark 表現

編程與 Agentic 任務

測試	M3 成績	對照組
SWE-Bench Pro	59.0%	超越 GPT-5.5 與 Gemini 3.1 Pro，逼近 Opus 4.7（64.3%）
SWE-Bench Verified	領先級（具體分數待官方揭露）	—
Terminal-Bench 2.1	66.0%	領先群
SWE-fficiency	34.8%	—
KernelBench Hard	28.8%	NVIDIA Blackwell sm_120
MCP Atlas	74.2%	—
Claw-Eval	最高分（161 tasks）	General Task Group
SVG-Bench	超越 Opus 4.7	—

電腦操作（Computer Use）

OSWorld-Verified：70.06% 完成率（361 個樣本，Max Steps = 200）

多模態

OmniDocBench（多模態文件理解）：超越 Gemini 3.1 Pro
BrowseComp（瀏覽器綜合任務）：83.5，超越 Claude Opus 4.7

三個 MiniMax 公布的真實案例

論文重現：給 M3 一篇 ICLR 2025 Outstanding Paper（Learning Dynamics of LLM Finetuning），M3 自主運作近 12 小時，產出 18 個 commit 與 23 張實驗圖表，無人工介入完成核心實驗。
CUDA kernel 優化：給 M3 一個非功能性的 Triton 骨架，目標是優化 Hopper FP8 GEMM kernel。24 小時內提交 147 次 benchmark，呼叫 1,959 次工具。經六輪標誌性優化，硬體利用率從 7.6% 拉到 71.3%（9.4× 加速）。MiniMax 特別強調：「大多數其他模型在 30 次提交後就停了，只有 Opus 4.7 跟 M3 撐到底。」
PostTrainBench（自主訓練）：給 M3 四個只做完 pretraining 的 base model，讓它自主跑完「資料合成 → 訓練 → 評測 → 迭代」完整 cycle。M3 拿到 0.37 分，低於 Opus 4.7（0.42）與 GPT-5.5（0.39），但領先其他受測模型。

🌍 原生多模態

M3 從訓練 step 0 就把文字、圖像、影片一起混和訓練，不是訓練完再來補多模態。MiniMax 特別提到「interleaved 資料」的重要性——文字與影像自然交錯的序列——比外界想像的更關鍵。

支援模態：

輸入：文字、圖像、影片
輸出：文字
額外能力：原生支援桌面電腦操作

訓練資料規模達到 官方宣稱的 100 兆 token 等級（minimax.io 官方 blog：「we are now able to scale the training data to the order of 100 trillion tokens」）。此規模在社群引發爭議——Digg 與 Reddit r/LocalLLaMA 都報導開發者對「100T 是否包含重複資料 / 是否為去重後規模」等問題持懷疑態度，尚待第三方獨立驗證。

💰 定價

API 計價（推出期間優惠價）

計價類型	促銷價	標準價
輸入	$0.30 / 1M tokens	$0.60 / 1M tokens
輸出	$1.20 / 1M tokens	$2.40 / 1M tokens

對比同業（2026 年 6 月官方公開定價）：

GPT-5.5（OpenAI 官方）：$5.00 / 1M input、$22.50–$30.00 / 1M output
Claude Opus 4.7（Anthropic 官方）：$5.00 / 1M input、$25.00 / 1M output（Fast mode 為 6× 價）
M3 即使是標準價，仍是 GPT-5.5 / Opus 4.7 的 8%–20% 成本

簡單算：M3 促銷價是 GPT-5.5 的 6%，是 Opus 4.7 的 6%–5%。即使日後回到標準價，1/8 ~ 1/5 的價差仍對開發者有巨大吸引力。

⚠️ 編者註：上表 GPT-5.5 / Opus 4.7 價格來源為 OpenAI 與 Anthropic 官方 pricing 頁面（截至 2026-05/06）；第三方轉售平台（OpenRouter、EvoLink 等）價格可能不同。M3 與對照組的實際節省比例會因工作量分布（input vs output、長 context vs 短 context）而浮動。

Token Plan 訂閱（原 Coding Plan 升級版）

Token Plan 是 M3 同步上線的全模態訂閱服務，單一 API key 即可使用文字、語音、圖像、影片、音樂。月費方案有三階：

方案	月費	對應用量
Starter	$10	輕度開發者
Plus	$20	進階使用者
Max	$50	重度工作者

🔥 Token Plan 收費改制爭議

這次 M3 上市最爭議的不是模型本身，而是同步推出的 Token Plan 收費模式變更。

改了什麼？

原本：固定配額制（fixed-count model）—— 不同任務消耗固定額度

新制：credits 扣點制（credit-based usage deduction）—— 根據「實際資源消耗」動態扣點

官方說法（摘自 platform.minimax.io/docs/token-plan/faq）：

「What changed in the Token Plan upgrade?」 Token Plan now uses credit-based usage deduction. Usage is deducted according to actual resource consumption. Simple tasks consume less, while complex tasks deduct based on real usage.

「Is usage-based deduction a price increase?」 No. Under the older fixed-count model, a simple question and a complex reasoning task could consume the same amount of quota.

爭議點

「為什麼要改？」：Reddit 上 r/opencodeCLI 的開發者抱怨 pricing page 把「estimated monthly tokens 與 daily coding calls」埋在文末，沒把 request 數量放到最顯眼處。許多人訂閱後才發現 credits 燒得比預期快。
「credits 到底怎麼算？」：M3 是多模態、原生支援電腦操作、長上下文的模型，單次任務消耗的 credits 遠高於簡單問答。原本用 M2.5/M2.7 的用戶升級到 M3 後，發現同樣 $10 月費可能撐不到月底。
「開放權重不等於免費用」：雖然 M3 在 10 天內會開源模型權重與技術報告（自架可免費），但官方 API 與 Token Plan 訂閱仍是商業模式。對於不想自架的開發者，credits 制讓成本估算變得困難。
「complex task 沒有上限」：官方 FAQ 承認「long-context, multi-turn reasoning, multimodal tasks, and complex agent workflows deduct according to actual resource usage」—— 也就是 M3 的 agent 能力越強，credits 扣越多。這對重度使用者是個隱憂。

官方承諾的配套措施

Unified quota pool：所有模型共用同一個 credits 池，不再分文字/圖像/音訊/影片配額
Usage bar：控制台新增用量條即時顯示
Migration compensation Credits：舊制用戶升級會拿到補償 credits
可購買額外 Credits：用完訂閱額度後可加購，且 Subscription Key 與一般 pay-as-you-go API Key 仍分開

開發者怎麼看？

支持方認為 credits 制「更公平」，簡單任務不再被複雜任務佔便宜；反對方則認為「無法預估月費」對小團隊與個人開發者是致命傷。這個爭議還在發酵中。

🔓 開源時程與授權

API：M3 上線當天（6/1）已透過 MiniMax Code、Token Plan、MiniMax API 同步開放
模型權重 + 技術報告：M3 上市後 10 天內開源
M3 是「open-weight」模型（非完全開源：程式碼可下載，但訓練資料與訓練程式碼不公開）

🆚 M3 vs M2.7 演進比較

維度	M2.7（2026-03-18 發表）	M3（2026-06-01 發表）
Context	~192K–200K（官方未統一公告）	1M（5×）
主要架構	Full attention	MSA 稀疏注意力
SWE-Bench Pro	~52%	59.0%
1M context 成本	極高	M2 的 1/20
多模態	有限	原生（圖+影+電腦操作）
角色定位	對標 GLM-5 級	對標 GPT-5.5 / Opus 4.7 級

註：M2.7 由 Vals AI 與 Reddit r/LocalLLaMA 等於 2026-03-17/18 發表記錄，HuggingFace 權重於 4 月 12 日開放下載；context window 在不同第三方工具（cline PR #10007）介於 192K–204_800 之間，官方未在 M2.7 公告中給出單一精確值。

🌟 為什麼 M3 重要？

價格破壞者：以 5%–10% 成本達到 GPT-5.5 級 benchmark，對預算敏感的開發團隊是巨大誘因
開源旗艦：在 Anthropic 與 OpenAI 持續閉源化趨勢下，M3 是少數能自架的前沿模型
長上下文實用化：MSA 讓 1M context 不再是燒錢玩具，512K–1M 等於可放進整個中型 codebase
Agent 能力：SWE-Bench Pro 59% 加上 12–24 小時自主運作的真實案例，顯示 M3 在長時間 agent 任務上已具實戰力
中國 AI 競爭力驗證：在港股 4 個月漲 400% 的背景下，M3 是 MiniMax 對投資人交出的關鍵技術成績單

📌 結論

M3 是 2026 年開源 LLM 最重要的里程碑之一。它把「前沿編程 + 百萬 token + 原生多模態」第一次整合進單一開源權重模型，價格更只有矽谷旗艦的 1/10。

但 Token Plan 的 credits 改制讓商業模式變得「不透明」，對不想自架的開發者來說，月費預估變得困難。如果你只是要做輕度應用，$10 starter 方案可能就夠；如果你打算用 M3 跑長時間 agent 或長上下文檢索，強烈建議先實測一個月的 credits 消耗，再決定要訂閱還是改用 API pay-as-you-go 或自架開源權重。

10 天後開源的模型權重，將是這波 AI 開源運動的下一個關鍵觀察點。

資料來源：MiniMax 官方 blog（minimax.io/blog/minimax-m3、minimax.io/about）、Marktechpost、OpenAI Hub、Reddit r/opencodeCLI、r/LocalLLaMA、platform.minimax.io/docs/token-plan/faq、Reuters、CNBC、SCMP、Yicai Global、Forbes、CloudZero、OpenAI 官方 API pricing、Anthropic 官方 API pricing、the-decoder.com、Lushbinary、Artificial Analysis

⚠️ 本報導事實查核聲明（2026-06-03 第二版） 本文 M3 規格、定價、benchmark、公司財務數字，凡未註明「官方宣稱」者，皆以官方公開資料為依據。OpenAI 與 Anthropic 的對比價格來自其官方 pricing 頁面，非轉售平台。第三方獨立 benchmark 驗證（如 Hugging Face 開源權重後的社群評測）截至發稿仍在進行中，建議讀者把 benchmark 視為「官方公布的最佳數字」而非「已驗證的極限」。凡涉及「具體 IPO 募資金額、上市公司股價走勢」等會隨時間變動的數字，建議以公司最新公告與交易所資訊為準。