OpenAI 發布 GPT-5.4 Mini 與 Nano:速度翻倍、專為 AI 子代理時代設計,最低每百萬 token 僅 $0.2

動區BlockTempo

OpenAI 於今(18)日正式推出兩款輕量新模型 GPT-5.4 Mini 與 GPT-5.4 Nano,前者速度較前代提升 2 倍、定價每百萬輸入 token 僅 $0.75,後者更以超低延遲與極具競爭力的 $0.20 定價搶攻高吞吐量市場。
(前情提要:OpenAI 推出 GPT-5.2!衝著取代專業人士、幻覺更低,API 費用整理)
(背景補充:OpenAI 最強 GPT-5 發布會全整理:免費開放、功能亮點、gpt-5、gpt-5-mini 和 gpt-5-nano API 價格)

本文目錄

Toggle

  • GPT-5.4 Mini:2 倍速度,全能型輕量主力
  • GPT-5.4 Nano:超低延遲,衝著高吞吐量場景而來
  • 子代理架構:小模型不是降級版,是系統設計的一部分

OpenAI 在今(18)日午夜同步推出 GPT-5.4 Mini 與 GPT-5.4 Nano 兩款小型語言模型。這兩款模型並非旗艦等級,而是被明確設計為混合 AI 系統中的執行層:由更強大的旗艦模型統籌排程,大量小型模型在背後並行完成日常計算工作。

OpenAI 將這套架構稱為「以部分精確度換取速度與成本效益的顯著提升」,而這場取捨,正是當前 AI 產業從單一大模型走向「多代理協作」的縮影。

GPT-5.4 Mini:2 倍速度,全能型輕量主力

GPT-5.4 Mini 是這次發布的核心產品,主打速度與多工能力的平衡。相比前代,它的推理速度提升了 2 倍,並在程式碼生成、多模態理解與工具呼叫等關鍵能力上全面升級。

在基準測試方面,GPT-5.4 Mini 在 SWE-Bench Pro(GitHub issue 自動修復)達到 54.4%,在 OSWorld-Verified(桌面操作自動化)則達到 72.1%,兩項數字均代表當前同級模型的領先水準。

功能層面,它支援文字與圖片混合輸入、工具呼叫、網路與檔案搜尋,以及電腦操作 UI 互動,幾乎覆蓋現代 AI 應用的完整需求鏈。OpenAI 官方列出的主要使用場景包括:程式碼助手、IDE 整合、程式碼審查、截圖解讀、電腦使用子代理,以及需要即時回應的互動系統。

定價方面,GPT-5.4 Mini 的輸入定為每百萬 token $0.75,輸出則為 $4.50,延續 OpenAI 近期積極壓低成本的策略方向。

可用性上,GPT-5.4 Mini 即日起在 ChatGPT(免費層與 Go 訂閱層)、Codex 及 OpenAI API 全面開放,同時也可透過 Azure AI Foundry 部署。

GPT-5.4 Nano:超低延遲,衝著高吞吐量場景而來

GPT-5.4 Nano 定位更為明確:OpenAI 將它稱為「目前最小、最具成本效益的模型」,專為對延遲極度敏感、需要大規模並行處理的場景量身打造。

在基準測試上,Nano 的 SWE-Bench Pro 分數為 52.4%,OSWorld 則為 39.0%,雖略遜於 Mini,但考量其超低的定價,價效比相當突出。

功能範圍上,Nano 支援指令跟隨、函式呼叫、基礎程式碼、圖片理解、分類與資料提取,能夠應對多數結構化任務需求,但並不支援複雜的桌面操作或深度推理任務。

定價方面,Nano 的輸入僅需每百萬 token $0.20,輸出 $1.25,約為 Mini 定價的四分之一,適合需要大量自動化呼叫的企業使用者。官方列舉的場景包括:分類與資料提取、程式碼子代理支援、高量自動化、請求路由、表單處理,以及客服工作流程。

值得注意的是,GPT-5.4 Nano 目前僅限 API 存取,不會出現在 ChatGPT 的使用者介面中,明確定位為開發者與企業端產品。

子代理架構:小模型不是降級版,是系統設計的一部分

OpenAI 為這兩款模型打出的宣傳語是「為子代理時代而生」,這句話背後有其具體的產品邏輯。

在多代理 AI 系統中,旗艦模型(如 GPT-5 或 o 系列推理模型)負責高層規劃與複雜判斷,而大量重複性、結構化的子任務:網頁擷取、資料轉換、表單填寫、程式碼片段生成,則可以交由更小、更快、更便宜的模型平行處理。GPT-5.4 Mini 與 Nano 正是為這個執行層角色而設計。

這套思路也解釋了為何兩款模型都強調工具呼叫與電腦操作能力:在自動化程度愈來愈高的 AI 應用架構中,能夠穩定執行指令、與外部系統互動的小型模型,其商業價值並不亞於參數量更大的旗艦模型。

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.
Commento
0/400
Nessun commento