GPT5暫時沒戲了

0 評論 886 瀏覽 0 收藏 7 分鐘

隨著o1-preview和o1-mini的推出,我們站在了探索AI新邊界的門檻上。本文將帶您深入了解"o1"模型的獨特之處,以及它們如何重新定義我們對AI能力的期待。

自從OpenAI于2023年3月推出強大的專有大型語言模型GPT-4(距今已有 18 個月)以來,用戶和開發者們一直在猜測,這家引領硅谷乃至全球生成式 AI 熱潮的公司何時會推出下一代模型,大家普遍認為這一新版本會被稱為 GPT-5。

然而,事實證明,GPT系列暫時被跳過了,取而代之的是一個全新的模型家族。

今天,經過數月的傳聞和最近幾天愈演愈烈的報道,OpenAI宣布推出了其 “o1” AI模型家族,首先推出的是兩個模型:o1-preview和o1-mini。公司表示,這些模型的設計旨在“通過復雜任務的推理,解決比GPT系列更難的問題”。

目前,這兩個模型已經向ChatGPT Plus用戶開放,但o1-preview每周消息數量限制為30條,o1-mini為50條。

然而,OpenAI也提醒道:“作為早期模型,它尚不具備使ChatGPT實用的許多功能,比如瀏覽網絡獲取信息或上傳文件和圖像。在許多常見情況下,GPT-4o在短期內可能會更為出色?!?/p>

根據OpenAI在其API平臺網站上的說明,該模型家族在測試階段只支持“文本,不支持圖像”。

一、o1 模型相較于GPT的優勢

OpenAI聲稱,其全新的o1系列特別適合處理科學、醫療和技術等領域中的復雜問題。

OpenAI設想這些模型將被廣泛應用于多個領域:從幫助物理學家生成量子光學的數學公式,到協助醫療研究人員為細胞測序數據做注釋。

開發者也發現,o1-mini模型在構建和執行多步驟工作流、調試代碼以及高效解決編程挑戰方面表現出色。

二、o1-preview的表現

o1-preview模型設計用來應對具有挑戰性的任務,其通過花費更多時間進行思考和優化響應,類似于人類處理復雜問題的方式。

測試顯示,這種方法使該模型在物理、化學和生物學等領域的表現接近博士生水平。

此外,o1-preview模型在編程方面表現出色,在Codeforces競賽中排名超過89%的其他模型,展現了處理多步驟工作流、調試復雜代碼和生成精準解決方案的能力。

在國際數學奧林匹克(IMO)預選賽等基準測試中,o1-preview展示了強大的能力,解決了83%的問題,而其前身GPT-4o僅成功解決了13%。

該模型現已向ChatGPT Plus和Team用戶開放,企業和教育用戶將于下周獲得訪問權限。開發者也可以通過OpenAI API使用該模型,但需達到API使用 5級的資格,并且最初會有速率限制。

三、o1-mini功能較弱但成本降低80%

與o1-preview同時推出的還有o1-mini模型,這是一種更精簡的版本,旨在提供更快且更便宜的推理能力。

雖然o1-mini主要針對編程和STEM任務進行了優化,但在數學和編程方面依然表現出色。

在IMO數學基準測試中,o1-mini得分為70%,幾乎與o1-preview的 74% 相當,同時推理成本卻顯著降低。在編程評估中,它在Codeforces上的Elo 分數為1650,躋身前86%的程序員行列。

與o1-preview相比,o1-mini的價格低80%,適合那些需要推理能力但不需要o1-preview模型廣泛知識的開發者和研究人員。

這一具成本效益的解決方案也將向ChatGPT Plus、Team(團隊)、Enterprise(企業) 和Edu(教育)用戶開放,并計劃在未來擴展至 ChatGPT免費用戶。

四、安全性與安全增強

秉承OpenAI對安全的承諾,o1系列模型采用了一種全新的安全訓練方法,提升了模型遵循安全和對齊準則的能力。

OpenAI強調,o1-preview在其最難的越獄測試中取得了令人印象深刻的 84 分,這相比GPT-4o的22分有顯著提升。這種在上下文中推理安全規則的能力,使得o1模型在處理不安全的提示時表現更好,能夠有效避免生成不當內容。

作為更廣泛安全工作的組成部分,OpenAI已與美國和英國的AI安全研究機構達成協議。根據這些合作關系,OpenAI向這些機構提供了o1模型的早期研究版本,以幫助評估和測試未來的AI系統。

此外,OpenAI的安全工作還包括全面的內部治理,與聯邦政府的合作,并通過定期測試、“紅隊”測試以及公司安全與安保委員會的董事會監督,確保模型的安全性和合規性。

五、OpenAI o1系列的下一步計劃

盡管o1-preview和o1-mini模型在推理和解決問題方面表現出色,OpenAI 也承認這僅僅是個開始。

公司計劃定期更新和改進這些模型,未來將添加瀏覽功能、文件和圖像上傳功能以及函數調用功能,這些功能目前尚未在API版本中提供。

展望未來,OpenAI將繼續發展其GPT系列和o1系列,不斷拓展AI在各個領域的能力。用戶可以期待持續的進步,隨著OpenAI努力提升這些模型的實用性和可及性,它們將在不同應用場景中發揮更大作用。(VentureBeat)

本文由人人都是產品經理作者【AI新智能】,微信公眾號:【AI新智能】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。

題圖來自Unsplash,基于 CC0 協議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!