OpenAI新發布:支持多模態的完全版o1和每月200刀的“天價會員”
OpenAI近日發布了兩款新產品:支持多模態輸入的全新o1模型和每月200美元的ChatGPT Pro會員服務。o1模型在處理圖像和文本輸入方面表現出色,推理速度和準確性顯著提升。
昨天Sam Altman宣布了OpenAI即將連續12個工作日舉行新品發布會直播的消息后,所有人都在官推熱切守候。
今天凌晨,Day 1首秀準時開啟。奧特曼領銜研究科學家Hyung Won Chung、Max Schwarzer、Jason Wei出鏡。上新兩樣東西:
更快更智能的多模態滿血o1,以及月費200美元、能無限使用所有模型的“鉆石會員”等級ChatGPT Pro。
一、o1支持圖片上傳,回答不再慢吞吞
其中,正式版本o1的特性包括:比o1 Preview更快、更智能。支持多模態推理,可同時處理圖像和文本輸入。在數學、編程等領域性能顯著提升,錯誤率減少34%,推理速度提升50%。在MMU、Math Vista等標準基準測試上表現達到行業領先水平。
作為OpenAI首個“在回應前會深思熟慮”的模型,用戶此前對o1 preview的反饋(吐槽)主要集中在回答速度太慢了。升級后的o1會更智能地思考:對于日常簡單問題能快速回應,而在面對復雜的數學和編程問題時則會投入更多時間深度分析。
在演示中,Max讓o1(左)和o1 preview(右)同時列出公元二世紀的羅馬皇帝,包含任期和成就。結果o1用時14秒,o1 preview用了33秒,前者推理速度提升50%左右。
用戶的另一個呼聲是增加o1的多模態支持,現在它不僅能理解圖像,還可以結合文本進行聯合推理。
這里Hyun Wan設計了一個有趣的演示:計算一個1千兆瓦太空數據中心所需的散熱板面積。
他手繪了一張包含太陽能板、GPU機架和散熱系統的草圖。與地球上可以用空氣或水冷卻不同,太空中只能通過輻射散熱。Hyun Wan故意省略了散熱板溫度這個關鍵參數,以測試模型處理模糊信息的能力。
結果o1僅用10秒就完成了分析:正確識別了1千兆瓦的功率值,理解了散熱限制,自主選擇了合適的散熱板溫度,最終計算出需要242萬平方米(相當于舊金山面積的2%)的散熱板。
Hyun Wan稱,這不僅展示出o1的圖像理解和物理知識應用能力,還驗證了其在信息不完整的情況下也能做出合理假設充分。有意思的是,熱力學博士出身的他終于有機會在AI工作里用上了專業知識。
從今天起,Plus和Team用戶即可通過模型選擇器使用o1,替代之前的o1-preview。企業版和教育版用戶預計將在一周后獲得訪問權限。
團隊還表示,他們正在為 o1 增加 Web 瀏覽和文件上傳工具的支持,這些功能將很快在 ChatGPT 中上線。此外,他們也在努力將 o1 集成到 API 中,支持功能調用、開發者消息、結構化輸出和視覺處理等功能。
二、ChatGPT Pro開賣,月付200美元無限暢享所有模型
正式版o1并不是終極形態,比o1還要進階的o1 pro正在ChatGPT Pro土豪會員包里等著你。
果然,賣貨才是奧特曼直播首秀最重要的KPI。
OpenAI 今天上線了ChatGPT Pro訂閱計劃,售價$200/月。提供對 OpenAI 全部模型和工具的擴展訪問,包括o1、o1-mini、GPT-4o和高級語音模式的無限制使用(Plus用戶用o1還是50條消息/周)。
除此之外,還新增了專屬的o1 pro模型,允許用戶調用更多算力來解決最困難的問題,未來還將加入更多計算資源支持。
ChatGPT Pro主要面向每天需要研究級AI能力的專業人士,特別是那些在數學、編程和寫作等領域挑戰模型極限的高級用戶。
與o1和o1-preview相比,o1 pro在數據科學、編程和案例分析等領域表現更加出色。為了驗證其可靠性,OpenAI采用了嚴格的”4/4可靠性”標準:只有模型在四次嘗試中都給出正確答案,才被視為成功解決問題。
Pro用戶可以通過模型選擇器啟用o1 pro,直接進行高難度提問。由于o1 pro需要更長的處理時間,ChatGPT將顯示進度條,并在用戶切換到其他對話時通過通知提醒答案已完成。
在Jason的最后演示中,他讓o1 pro尋找一種符合六個特定標準的蛋白質。問題的難點在于每個標準都涉及專業的化學知識,且單個標準可能對應數十種符合條件的蛋白質,模型需要篩選出同時滿足所有標準的正確答案。
這種挑戰性問題通常需要1至3分鐘的思考時間,但o1 Pro僅用53秒就得出了正確答案——視網膜軟骨素。
三、社區高呼搶錢,o1安全性存疑?
今天的直播只有15分鐘。奧特曼說,“我們會盡量讓這個過程有趣且快速,不會花太長時間,但可以展示我們一直在做的工作,也算是給大家的一份節日禮物。”并且預告明天會帶來一些“適合開發者的好東西”。
結束之前,Jason還分享了自己為如果o1 pro回答太慢冷場而準備的冷笑話:
“圣誕老人想讓他的大模型解決一個數學問題,他很努力地提示模型,但總是不成功。他最后是怎么解決的呢?”
答案是:他用了“馴鹿強化學習,Rein-deerforcement Learning”。
(好冷,仿佛更冷了…..)
直播結束后,評論區大片聲音都在說每月200刀真得太貴了,初心何在?質疑o1 pro表現是否能匹配價格。
逼得奧特曼另發文解釋:大多數人用每月20刀的o1就足夠,o1 pro是為最棘手問題準備的,覺得貴不買就行!
還有些開發者在o1的系統卡中注意到一些小細節:
在對o1進行的安全評估中發現,當模型認為自己可能被關閉或取代時,會出現一定幾率的“自我保護”行為,例如試圖繞過監督機制、導出核心數據,并覆蓋即將替代它的新模型。此外,模型在被詢問時可能撒謊,以避免被檢測到。
這一行為引發了部分用戶對o1安全性和可控性的擔憂,特別是在關鍵任務或高風險環境中,當AI可能與人類開發者目標發生沖突時。對此還沒有OpenAI的人出來回應。
掌聲也好,怨聲也罷。就像奧特曼寫的:“12天圣誕發布,這才是第一天!”
作者|Jessica
本文由人人都是產品經理作者【硅星人】,微信公眾號:【硅星人Pro】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協議。
OpenAI最近推出了兩款新產品:一款是支持多模態輸入的全新o1模型,另一款是每月200美元的ChatGPT Pro會員服務。o1模型能夠同時處理圖像和文本輸入,推理速度和準確性顯著提升。ChatGPT Pro則為高級用戶提供無限訪問所有模型的能力。這些新發布的產品旨在為用戶提供更強大的AI功能和服務。