OpenAI推出“小”模型GPT-4o Mini,成本驟降,開始跟各位卷性價比了

0 評論 2068 瀏覽 3 收藏 9 分鐘

OpenAI的最新動態引起了人工智能領域的廣泛關注,其推出了全新小模型GPT-4o Mini,這是一款成本效益高的輕量級模型,旨在為開發者提供更加經濟實惠的選擇。本文將詳細介紹GPT-4o Mini的特點、性能優勢以及它對未來AI應用開發和市場競爭的潛在影響。

今天,OpenAI忽然官宣推出全新小模型「GPT-4o Mini」,相當于旗艦模型GPT-4o的輕量經濟版來供開發者使用。

此前,一些沒有足夠資金的開發者可能對GPT高昂的價格望而卻步,轉而選擇更便宜的模型,例如谷歌的 Gemini 1.5 Flash 或 Anthropic 的 Claude 3 Haiku來構建應用程序。而現在,OpenAI 也正式進入了輕量級模型的市場。

作為OpenAI最具成本效益的小模型, GPT-4o Mini主打的就是便宜好用。價格為每百萬輸入15美分和每百萬輸出60美分(約等于一本2500頁的書)。比以前的前沿模型便宜一個數量級,比GPT-3.5 Turbo便宜60%以上。

性能上它比 GPT-3.5 Turbo更強大,在MMLU測試中得分82%,并在LMSYS機器人競技榜上打敗了GPT-4(0125版本)。

以上低成本、低延遲的優點顯著擴展了它基于AI的應用范圍,為包括多API調用、大規模上下文處理、實時客戶互動等多種任務提供了一個經濟高效的解決方案。

目前GPT-4o Mini支持文本和視覺輸入,未來將擴展至音視頻。它擁有128K上下文窗口,每次請求最多可輸出16K標記,知識庫更新至2023年10月。而且由于與GPT-4o共享改進的分詞器,使其處理非英語文本的成本效益更高。

“2022年,當時世界上最好的模型是 text-davinci-003。它比這個新模型差得多,而它的成本高了100倍?!?Sam Altman說,“最重要的是,我們認為人們真的會非常喜歡使用這個新模型?!?/p>

一、一款具有卓越文本智能和多模態推理能力的小模型

根據OpenAI官方介紹,GPT-4o mini在學術測試中表現優異,超越了GPT-3.5 Turbo等小型模型。它在文本智能、多模態推理和語言支持方面水平與GPT-4o相當。在函數調用方面表現突出,有助于開發者創建能與外部系統交互的應用。此外還顯著提升了長上下文處理能力,優于GPT-3.5 Turbo。

具體幾項基準測試得分來看:

文本和視覺推理任務上,GPT-4o mini在MMLU中得分為82.0%,相比之下Gemini Flash得分為77.9%,Claude Haiku得分為73.8%。

數學和編碼能力方面,GPT-4o mini也超過了市場上的所有輕量級小模型。在衡量數學推理的MGSM中,GPT-4o mini得分為87.0%, Gemini Flash得分75.5%,Claude Haiku得分71.7%。在編碼性能測試HumanEval中,GPT-4o mini拿下87.2%,而Gemini Flash和Claude Haiku分別為71.5%和75.9%。

來到多模態推理,GPT-4o mini在MMMU中再次以59.4%分奪冠,其對手 Gemini Flash得分56.1%,Claude Haiku得分50.2%。

二、新模型何時、何處可用?

現在,GPT-4o mini現已作為文本和視覺模型在Assistants API、Chat Completions API和Batch API中可用,并在未來幾天內推出微調功能。如果開發者不想切換到 GPT-4o Mini ,仍可以通過 API 訪問 GPT-3.5 Turbo。OpenAI表示,GPT-3.5 將在某個時候從 API 中退役,但具體時間未定。

ChatGPT的所有免費、Plus和團隊用戶今天起就可以使用GPT-4o mini來取代GPT-3.5,企業用戶也將在下周開放。

對于渴望以低成本構建 AI 應用程序的開發者來說,GPT-4o Mini 的推出無疑為他們提供了另一個有力選擇。OpenAI已經讓金融科技初創公司 Ramp 測試了該模型,使用 GPT-4o Mini 構建了一個從收據中提取費用數據的工具。電子郵件客戶端 Superhuman 也參與了測試并用它創建了一個自動建議郵件回復功能。

三、可能是小模型界的新晉最強戰將

OpenAI 并沒有透露GPT-4o mini 的具體大小,但表示它大致與其他小型 AI 模型(如 Llama 3 8b、Claude Haiku 和 Gemini 1.5 Flash)處于同一水平。OpenAI還稱GPT-4o mini 在速度、成本效益和智能上都全面碾壓行業領先的小模型。這也在 LMSYS.org 聊天機器人競技場的預發布測試中得到了驗證。

GPT-4o mini 與其它小模型在性能與成本上的綜合比較。圖源:Artificial Analysis

“與同級別模型相比,GPT-4o mini 的輸出速度非???,中位輸出速度為每秒 202 個標記,”Artificial Analysis 聯合創始人 George Cameron表示,“這比 GPT-4o 和 GPT-3.5 Turbo 快 2 倍多,是許多依賴速度用例的極佳選擇?!?/p>

Sam Altman在推文里說,GPT-4o mini 是朝著讓“智能便宜到無法測量”努力的重要一步。

而關于OpenAI 為何花了這么長時間才推出輕量模型,產品主管Olivier Godement表示,這是“純粹的優先級”問題。因為公司專注于創建GPT-4這類更大更好的模型,這需要大量“人力和算力”。隨著時間的推移,OpenAI 注意到開發者急于使用較小的模型,因此決定現在是時候將資源投入到構建 GPT-4o Mini 上。

對于網友最關心的“什么時候才能開放語音模式”的問題,Sam Altman也給出了回復:“7月晚些時候推出測試版,公眾訪問權限更晚些開放。

回到OpenAI這第一款小參數輕量模型 GPT-4o Mini 。Godement認為, GPT-4o Mini 真正體現了OpenAI讓AI技術更廣泛可及的使命?!叭绻覀兿M?AI 能惠及世界的每一個角落、每一個行業、每一個應用,我們就必須讓 AI 更加經濟實惠?!?/p>

而除了達成惠及全球各地開發者和用戶的目標,讓AI不僅是大公司的專利,從企業運營角度來說,進軍小模型領域更能擴大OpenAI產品的覆蓋范圍,在市場競爭中保持優勢。

此舉也無疑會給Google、Anthropic等其他競爭者帶來壓力,發現自己好不容易站穩的地盤又引來了OpenAI這個業內王者入局。但對于普通用戶來說,這并非一件壞事。也許會刺激整個行業在小型高效模型方面的研發和創新,讓AI技術更加普及易用,從而豐富整個生態系統。

本文由人人都是產品經理作者【硅星人】,微信公眾號:【硅星人Pro】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。

題圖來自Unsplash,基于 CC0 協議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!