← 返回 Siami 首頁

🤖 MiniMax M3 開源:1M context 編程 Agent 全面來襲,Token Plan 收費改制引爆爭議

🤖 MiniMax M3 開源:1M context 編程 Agent 全面來襲,Token Plan 收費改制引爆爭議

MiniMax M3 開源:1M context 編程 Agent 全面來襲,Token Plan 收費改制引爆爭議

中國 AI 新創 MiniMax 在 6 月 1 日正式開源新一代旗艦模型 M3。這是繼 M2.7 之後的 M 系列最新力作,主打「前沿編程 + 百萬 token 上下文 + 原生多模態」三位一體,宣稱是全球第一個把這三項能力整合在單一架構的開放權重模型。M3 挾帶 59% 的 SWE-Bench Pro 分數、1M token 上下文、以及僅有 GPT-5.5 5%–10% 的價格,強勢挑戰矽谷頂級閉源模型。

但同步上線的 Token Plan 收費改制,從原本的「固定配額制」改成「credits 扣點制」,引發開發者社群高度反彈。Reddit 上 r/opencodeCLI 有人直言:「They should just cut the estimated monthly tokens line from their pricing page」。

本文整理 M3 的所有核心特點、能耐、定價、benchmark,以及這次 Token Plan 改制的來龍去脈。


🏢 公司背景:MiniMax 是誰?

MiniMax 官方簡介(minimax.io/about)載明公司「Founded in early 2022(2022 年初成立)」,總部位於上海徐匯區桂箐路 65 號,創辦人為前商湯科技(SenseTime)電腦視覺研究員閆俊傑(Yan Junjie)。在中文媒體脈絡下,MiniMax 與智譜 AI、Z.ai、月之暗面、階躍星辰、零一萬物等並列為中國「AI 六小虎」民營新創代表。

港股 IPO(2026 年 1 月 9 日掛牌)

  • 發行價:HK$165(定價區間頂端)
  • 募資總額:HK$4.82 億(約 6.19 億美元),含 greenshoe 後規模(來源:Reuters、CNBC、SCMP)
  • 上市首日表現:收盤 HK$345,較發行價上漲 109%(首日翻倍)
  • Forbes 報導創辦人閆俊傑身家達 32 億美元
  • 上市後傳出 已規劃申請上海 STAR Market 科創板 雙重上市(來源:Yicai Global 報導,用詞為 “planning to list”,非已遞件

⚠️ 編者註:上述 IPO 數字來自 Reuters、CNBC、SCMP 等媒體報導;個股 IPO 與雙重上市進度,建議以公司最新公告為準。


🧠 核心架構:MSA(MiniMax Sparse Attention)

M3 最大技術亮點是全新的稀疏注意力架構 MSA(MiniMax Sparse Attention),用來解決長上下文運算成本飆升的痛點。

為什麼需要 MSA?

傳統 Transformer 的 full attention 是平方複雜度——context 越長,計算量以平方速度膨脹。這就是為什麼百萬 token context 至今仍只屬於少數旗艦模型的奢侈品。

MSA 的關鍵設計

  1. 更精細的 KV cache 切塊:相比 DSA、MoBA 等既有稀疏方法,MSA 把 KV cache 切得更細,達到更高的有效覆蓋率
  2. 「KV outer gather Q」運算模式:以 KV block 為外層迴圈去聚集命中它的 query,每個 block 只讀一次,記憶體存取完全連續
  3. 比開源稀疏方案快 4×+:官方宣稱比 Flash-Sparse-Attention 與 flash-moba 還快 4 倍以上

實測效能(MiniMax 官方數據,1M token context)

指標數字
Prefill 速度>9× 比 M2 系列
Decoding 速度>15× 比 M2 系列
每 token 運算量M2 的 1/20
1M context 成本接近 512K context 的成本

消融實驗結果:在絕大多數能力維度上,MSA 與 full attention 表現相當,但成本大幅降低。


📊 Benchmark 表現

編程與 Agentic 任務

測試M3 成績對照組
SWE-Bench Pro59.0%超越 GPT-5.5 與 Gemini 3.1 Pro,逼近 Opus 4.7(64.3%)
SWE-Bench Verified領先級(具體分數待官方揭露)
Terminal-Bench 2.166.0%領先群
SWE-fficiency34.8%
KernelBench Hard28.8%NVIDIA Blackwell sm_120
MCP Atlas74.2%
Claw-Eval最高分(161 tasks)General Task Group
SVG-Bench超越 Opus 4.7

電腦操作(Computer Use)

  • OSWorld-Verified70.06% 完成率(361 個樣本,Max Steps = 200)

多模態

  • OmniDocBench(多模態文件理解):超越 Gemini 3.1 Pro
  • BrowseComp(瀏覽器綜合任務):83.5,超越 Claude Opus 4.7

三個 MiniMax 公布的真實案例

  1. 論文重現:給 M3 一篇 ICLR 2025 Outstanding Paper(Learning Dynamics of LLM Finetuning),M3 自主運作近 12 小時,產出 18 個 commit 與 23 張實驗圖表,無人工介入完成核心實驗。

  2. CUDA kernel 優化:給 M3 一個非功能性的 Triton 骨架,目標是優化 Hopper FP8 GEMM kernel。24 小時內提交 147 次 benchmark,呼叫 1,959 次工具。經六輪標誌性優化,硬體利用率從 7.6% 拉到 71.3%(9.4× 加速)。MiniMax 特別強調:「大多數其他模型在 30 次提交後就停了,只有 Opus 4.7 跟 M3 撐到底。」

  3. PostTrainBench(自主訓練):給 M3 四個只做完 pretraining 的 base model,讓它自主跑完「資料合成 → 訓練 → 評測 → 迭代」完整 cycle。M3 拿到 0.37 分,低於 Opus 4.7(0.42)與 GPT-5.5(0.39),但領先其他受測模型。


🌍 原生多模態

M3 從訓練 step 0 就把文字、圖像、影片一起混和訓練,不是訓練完再來補多模態。MiniMax 特別提到「interleaved 資料」的重要性——文字與影像自然交錯的序列——比外界想像的更關鍵。

支援模態:

  • 輸入:文字、圖像、影片
  • 輸出:文字
  • 額外能力:原生支援桌面電腦操作

訓練資料規模達到 官方宣稱的 100 兆 token 等級(minimax.io 官方 blog:「we are now able to scale the training data to the order of 100 trillion tokens」)。此規模在社群引發爭議——Digg 與 Reddit r/LocalLLaMA 都報導開發者對「100T 是否包含重複資料 / 是否為去重後規模」等問題持懷疑態度,尚待第三方獨立驗證


💰 定價

API 計價(推出期間優惠價)

計價類型促銷價標準價
輸入$0.30 / 1M tokens$0.60 / 1M tokens
輸出$1.20 / 1M tokens$2.40 / 1M tokens

對比同業(2026 年 6 月官方公開定價):

  • GPT-5.5(OpenAI 官方):$5.00 / 1M input、$22.50–$30.00 / 1M output
  • Claude Opus 4.7(Anthropic 官方):$5.00 / 1M input、$25.00 / 1M output(Fast mode 為 6× 價)
  • M3 即使是標準價,仍是 GPT-5.5 / Opus 4.7 的 8%–20% 成本

簡單算:M3 促銷價是 GPT-5.5 的 6%,是 Opus 4.7 的 6%–5%。即使日後回到標準價,1/8 ~ 1/5 的價差仍對開發者有巨大吸引力。

⚠️ 編者註:上表 GPT-5.5 / Opus 4.7 價格來源為 OpenAI 與 Anthropic 官方 pricing 頁面(截至 2026-05/06);第三方轉售平台(OpenRouter、EvoLink 等)價格可能不同。M3 與對照組的實際節省比例會因工作量分布(input vs output、長 context vs 短 context)而浮動。

Token Plan 訂閱(原 Coding Plan 升級版)

Token Plan 是 M3 同步上線的全模態訂閱服務,單一 API key 即可使用文字、語音、圖像、影片、音樂。月費方案有三階:

方案月費對應用量
Starter$10輕度開發者
Plus$20進階使用者
Max$50重度工作者

🔥 Token Plan 收費改制爭議

這次 M3 上市最爭議的不是模型本身,而是同步推出的 Token Plan 收費模式變更

改了什麼?

原本:固定配額制(fixed-count model)—— 不同任務消耗固定額度

新制:credits 扣點制(credit-based usage deduction)—— 根據「實際資源消耗」動態扣點

官方說法(摘自 platform.minimax.io/docs/token-plan/faq):

「What changed in the Token Plan upgrade?」 Token Plan now uses credit-based usage deduction. Usage is deducted according to actual resource consumption. Simple tasks consume less, while complex tasks deduct based on real usage.

「Is usage-based deduction a price increase?」 No. Under the older fixed-count model, a simple question and a complex reasoning task could consume the same amount of quota.

爭議點

  1. 「為什麼要改?」:Reddit 上 r/opencodeCLI 的開發者抱怨 pricing page 把「estimated monthly tokens 與 daily coding calls」埋在文末,沒把 request 數量放到最顯眼處。許多人訂閱後才發現 credits 燒得比預期快。

  2. 「credits 到底怎麼算?」:M3 是多模態、原生支援電腦操作、長上下文的模型,單次任務消耗的 credits 遠高於簡單問答。原本用 M2.5/M2.7 的用戶升級到 M3 後,發現同樣 $10 月費可能撐不到月底。

  3. 「開放權重不等於免費用」:雖然 M3 在 10 天內會開源模型權重與技術報告(自架可免費),但官方 API 與 Token Plan 訂閱仍是商業模式。對於不想自架的開發者,credits 制讓成本估算變得困難。

  4. 「complex task 沒有上限」:官方 FAQ 承認「long-context, multi-turn reasoning, multimodal tasks, and complex agent workflows deduct according to actual resource usage」—— 也就是 M3 的 agent 能力越強,credits 扣越多。這對重度使用者是個隱憂。

官方承諾的配套措施

  • Unified quota pool:所有模型共用同一個 credits 池,不再分文字/圖像/音訊/影片配額
  • Usage bar:控制台新增用量條即時顯示
  • Migration compensation Credits:舊制用戶升級會拿到補償 credits
  • 可購買額外 Credits:用完訂閱額度後可加購,且 Subscription Key 與一般 pay-as-you-go API Key 仍分開

開發者怎麼看?

支持方認為 credits 制「更公平」,簡單任務不再被複雜任務佔便宜;反對方則認為「無法預估月費」對小團隊與個人開發者是致命傷。這個爭議還在發酵中。


🔓 開源時程與授權

  • API:M3 上線當天(6/1)已透過 MiniMax Code、Token Plan、MiniMax API 同步開放
  • 模型權重 + 技術報告:M3 上市後 10 天內開源
  • M3 是「open-weight」模型(非完全開源:程式碼可下載,但訓練資料與訓練程式碼不公開)

🆚 M3 vs M2.7 演進比較

維度M2.7(2026-03-18 發表)M3(2026-06-01 發表)
Context~192K–200K(官方未統一公告)1M(5×)
主要架構Full attentionMSA 稀疏注意力
SWE-Bench Pro~52%59.0%
1M context 成本極高M2 的 1/20
多模態有限原生(圖+影+電腦操作)
角色定位對標 GLM-5 級對標 GPT-5.5 / Opus 4.7 級

註:M2.7 由 Vals AI 與 Reddit r/LocalLLaMA 等於 2026-03-17/18 發表記錄,HuggingFace 權重於 4 月 12 日開放下載;context window 在不同第三方工具(cline PR #10007)介於 192K–204_800 之間,官方未在 M2.7 公告中給出單一精確值


🌟 為什麼 M3 重要?

  1. 價格破壞者:以 5%–10% 成本達到 GPT-5.5 級 benchmark,對預算敏感的開發團隊是巨大誘因
  2. 開源旗艦:在 Anthropic 與 OpenAI 持續閉源化趨勢下,M3 是少數能自架的前沿模型
  3. 長上下文實用化:MSA 讓 1M context 不再是燒錢玩具,512K–1M 等於可放進整個中型 codebase
  4. Agent 能力:SWE-Bench Pro 59% 加上 12–24 小時自主運作的真實案例,顯示 M3 在長時間 agent 任務上已具實戰力
  5. 中國 AI 競爭力驗證:在港股 4 個月漲 400% 的背景下,M3 是 MiniMax 對投資人交出的關鍵技術成績單

📌 結論

M3 是 2026 年開源 LLM 最重要的里程碑之一。它把「前沿編程 + 百萬 token + 原生多模態」第一次整合進單一開源權重模型,價格更只有矽谷旗艦的 1/10。

但 Token Plan 的 credits 改制讓商業模式變得「不透明」,對不想自架的開發者來說,月費預估變得困難。如果你只是要做輕度應用,$10 starter 方案可能就夠;如果你打算用 M3 跑長時間 agent 或長上下文檢索,強烈建議先實測一個月的 credits 消耗,再決定要訂閱還是改用 API pay-as-you-go 或自架開源權重

10 天後開源的模型權重,將是這波 AI 開源運動的下一個關鍵觀察點。


資料來源:MiniMax 官方 blog(minimax.io/blog/minimax-m3、minimax.io/about)、Marktechpost、OpenAI Hub、Reddit r/opencodeCLI、r/LocalLLaMA、platform.minimax.io/docs/token-plan/faq、Reuters、CNBC、SCMP、Yicai Global、Forbes、CloudZero、OpenAI 官方 API pricing、Anthropic 官方 API pricing、the-decoder.com、Lushbinary、Artificial Analysis


⚠️ 本報導事實查核聲明(2026-06-03 第二版) 本文 M3 規格、定價、benchmark、公司財務數字,凡未註明「官方宣稱」者,皆以官方公開資料為依據。OpenAI 與 Anthropic 的對比價格來自其官方 pricing 頁面,非轉售平台。第三方獨立 benchmark 驗證(如 Hugging Face 開源權重後的社群評測)截至發稿仍在進行中,建議讀者把 benchmark 視為「官方公布的最佳數字」而非「已驗證的極限」。凡涉及「具體 IPO 募資金額、上市公司股價走勢」等會隨時間變動的數字,建議以公司最新公告與交易所資訊為準。