再次炸天的OpenAI,大模型生態初現

1 評論 1710 瀏覽 1 收藏 18 分鐘

許多業內人士都在關注OpenAI的首屆開發者大會,而在這場發布會后,可以看到,OpenAI提供的生態能力或許將解決大模型發展的一些關鍵難點,大模型的應用層將迎來進一步爆發,大模型生態,正在初步顯現。

不出意外地,OpenAI的首屆開發者大會,讓人特別意外。

一夜醒來,大模型圈一只腳踏入了Agent的世界,另一只腳則踏入GPT Store生態的河流中。

美東時間11月6日,OpenAI開發者大會正式開啟,創始人兼CEO山姆·奧特曼站在臺上,45分鐘的密集輸出,再次展示了什么叫“遙遙領先”。

我們先簡單回顧一下這場發布會的所有重點,其實無非就是三件事:

一是技術能力:GPT-4 Turbo升級了6大新能力,包括128K的上下文長度、更強的控制能力,模型的知識升級、多模態能力(語音和CV)、模型微調定制和更高速率的限制,性能升級的同時,還對API調用的價格進行了下調;

二是可復制的能力:從原來的GPT到GPTs,用戶可以打造專屬于自己的GPT助手,企業可通過OpenAI提供的全套工具鏈“all tools”在企業內部建設有價值的工具,同時也可以深入讓GPTs進化為一個個Agents,為智能體做準備;

三則是生態能力:企業不僅可以打造GPTs,更能將其上架在市場內,即GPT Store,可分享給其他用戶使用,以及獲得分成,類App Store的商業生態由此為出發點。

正如網易有道CEO周楓所言,“這次模型上主要是性能和成本的優化,而在應用和生態方面,做了很多LangChain(開發工具鏈),LlamaIndex(開發數據框架)這些項目類似的工作,最終就是要實現以智能體作為AI App的愿景。”

總之,OpenAI提供的生態能力解決了當下大模型發展的幾個重要難點,而在此之上,大模型的應用層將迎來進一步爆發。

“很興奮,還有很多信息在消化?!?/p>

OpenAI發布之后,光錐智能在與多位國內知名大模型創業者交流中,也感受到了大家對行業前景的期待,“OpenAI的多模態能力開放,對開發者是很大的利好,可以做的事情的邊界得到進一步拓展,我預計會有很多新的玩法出現?!痹轮得鎰撌既藯钪谗雽忮F智能稱。

這45分鐘,為大模型火箭的二級爆發,再次添加燃料。

一、讓大模型,飛入尋常百姓家

“有需求,打造生態,找落地?!監penAI首屆開發者大會結束后,某家國內大模型明星公司 CEO 對光錐智能發表了極為簡短,卻信息量極大的點評。

市場對ChatGPT的需求,無疑是巨大的。在發布會的開始,奧特曼報告了 OpenAI 平臺和產品的一些數據,截至目前,已經有大約200萬開發人員在其API上構建各種各樣的應用,超過92%的全球500強企業正使用其產品,ChatGPT的周活躍用戶達到大約一億。

自GPT3.5問世到現在,每一次的升級都引領著大模型的下一個技術方向,不過,這次OpenAI GPT-4升級后的Turbo版本更像是查漏補缺。

首先是更長的上下文本長度,GPT-4Turbo上下文任務長度擴展至128K,相當于一本書的300多頁,是 GPT-4支持的8K上下文的16倍。不僅如此,奧特曼還強調在擴展文本長度的同時,還應該保持模型的準確性。

其次是彌補OpenAI一直以來的短板——安全可控和知識庫更新速度。針對前者,推出了名為Json Mode的新功能,確保開發人員更容易調用API,提升對模型輸入和輸出的控制;即將推出“Copyright Shield”(版權保護)功能,若其企業和API用戶面臨版權侵權訴訟,OpenAI將為其承擔相應費用。針對后者,OpenAI平臺支持用戶導入文檔、數據庫來更新大模型的認知,同時還將新升級后的GPT-4Turbo認知理解更新到了2023年4月。

最后,此次更新中,OpenAI的多模態能力開放進入到了一個全新的階段。上一個時期,OpenAI用了一年多的時間,實現了ChatGP能說、能看、能聽,而現在才到了多模態能力釋放的節點。DALL-E3、文生語音模型TTS(text-to-speech)、Whisper V3都將通過API的形式開放給開發者使用。

能力升級之后,為了讓更多的開發者用起來,還做了一個大降價。

奧特曼表示,不斷有開發者來向其抱怨,GPT-4定價太貴,也正是基于此,OpenAI這回干脆來了個大模型降價促銷。

降價后的GPT-4Turbo輸入token價格是GPT-4的三分之一,輸出token價格是原來的二分之一;GPT-3.5Turbo 4K 精調版本輸入token價格是此前的三分之一,輸出token價格是原來的二分之一;GPT-3.5Turbo 16K精調版本輸入token價格是之前的四分之一。

正如奧特曼所言開發者的需求是驅動OpenAI降價的根本原因,這背后還有技術、商業等多重因素。

從技術降本看,根據外媒爆料,OpenAI此次可能將Stateless API變為Stateful API,奧特曼此前曾表示,基于Stateful API,用戶不用再“重復一遍一遍地為同樣的歷史對話付費”,理論上Stateful API形式可將大模型應用的開銷削減為原來的二十分之一。

在商業上,OpenAI也一直在尋找突破點,從API、ChatGPT個人版再到企業版,一直在探索商業化。但其對手卻未給喘息的機會,微軟、Salesforce、開源生態主導者Meta都在以更具性價比的方式,背后“偷襲”OpenAI,商業化的緊迫感與日俱增。

OpenAI降價的背后,也代表著國外大模型已經進入到了普惠化、追求高性價比的新時期。

對初創企業、開發者而言是落地的機會,對OpenAI這類公司也是挑戰,由降價而帶來的或許是技術能力、資源分配、算力等多方面的挑戰。

“在綜合考量后,我們優先考慮了價格,但速度卻不能同時兼得,這將是接下來研究的重點”,奧特曼道。

據多名使用GPT-4開發工具的技術人員稱,GPT-4速率限制已經開始加倍。

“算力應該還好,OpenAI儲備足夠多”,楊植麟對此發表了意見。

二、為創業者提供“筑夢”工具

光錐智能在與多位大模型創業者交流過程中發現,很多創業者不是缺乏好點子和創業想法,而是受困于數據、算力、工具、部署、訓練、推理等一個個的技術難題。

比如,知乎上一位基于大模型開發的對話解謎小游戲的開發者,就因為游戲用戶數量遠超預期,導致算力不足而被迫關閉了整個游戲,留給玩家的只有一片遺憾和不舍。

同樣在國內,創業者們不是不知道Agent是未來的創業方向,而是心有余力不足。一位Agent創業者告訴光錐智能,“數據清洗、長文本記憶、代碼編寫、運行測試、部署落地、成本等等九九八十一難,關關難過,關關卡死每一個創業公司”。

據光錐智能了解,無論國內外,Agent離落地還差得很遠,目前比較確定的場景可能是Code Agent。原因在于,編碼本身就屬于大模型訓練推理和Agent執行任務的一環,距離最近,改造也越容易。

而現在,OpenAI發布的all tools工具、assistant API(助手API)則有希望使上述這些問題迎刃而解。

assistant API 是OpenAI專門為AI Agent開發者量身打造的工具助手,涵蓋了長線程(Threading)、知識庫(Retrieval) 、代碼解釋器(Code interpreter)、函數調用(Function calling)幾項工具。

持久且無限長的線程,允許開發人員將線程狀態管理移交給OpenAI并解決上下文窗口約束;支持檢索功能,利用模型之外的知識來增強,例如專有領域數據、產品信息或用戶提供的文檔;支持代碼解釋器功能,與ChatGPT Plus中一樣,可以在沙盒執行環境中編寫和運行Python代碼,生成圖形和圖表,并處理具有多種數據和格式的文件;函數調用功能也迎來更新,現在可以一次性調用多個函數,并把響應合并到消息輸出中。

總而言之,這些新功能精準切中了開發者們卡脖子的痛點,在OpenAI打造的全流程工具鏈上開發運行,將降低研發的門檻,縮短研發、測試周期,同時節省人力成本。

“我們對OpenAI又愛又恨,一方面它升級的工具有可能一瞬間讓我們的業務跑通,但另一方面,我們也得時刻警惕被OpenAI取而代之”,一位Agent創業者道。

讓我們聚焦這次發布會的主角——“Agent”。奧特曼給Agent下的定義為,人們利用工具、AI來建立更個人化和定制化的分身,這些分身可以代表個人做很多事情。用戶只需詢問計算機所想要的東西,Agent分身就能替你完成所有任務。

光錐智能梳理OpenAI做Agent思路后發現,Agent不是憑空而來,一切都基于GPT的大模型,在大模型基礎上先是長出了GPT的分身“GPTs”,而后才是“AI Agent”。

“在OpenAI,我們一直篤定漸進的、迭代的部署是解決安全問題的最佳方式,即人工智能的安全挑戰。我們認為謹慎對待面向未來Agent尤為重要,這需要大量的技術工作以及關于社會的深思熟慮,所以我們正在邁出通往未來的一小步——GPTs”,奧特曼表示道。

OpenAI通向未來Agent之路已初現雛形,正如其所言,“這還只是通向AI Agents邁出的第一步”,未來也許是多模態、多智能體。

三、初建大模型生態

技術的迭代固然讓人興奮,工具的推出也讓開發者們更加方便快捷,但更重要的是,OpenAI憑借一己之力,讓大模型的商業化進一步落地。

早在今年5月,OpenAI開放插件系統后,首批上線了70個大模型相關的應用,包括猜詞、翻譯、查找股票數據等等工具,彼時便有人預測到,大模型的App Store來了,但后期應用逐漸增加,卻并沒有跑出“爆款級”應用。

有投資人認為:現在的GPT Store很像剛剛面世時的小程序,處于能力逐步補齊中,此次升級便是逐漸走向成熟的象征,下一個微信或者抖音,很有可能在此誕生。

此次發布會中,OpenAI重新梳理了應用商店的體系,小幅調整了頁面布局,將ChatGPT變成了與第三方應用并列的應用層級,并將開發范圍擴大到了一個全新的范疇,按照奧特曼的說法,每一個GPT像是為ChatGPT的一個特殊目的,而量身定制的版本。

但讓人更為興奮的是,參考蘋果App Store,用戶可在GPT Store中搜索下載GPT應用,商店也將推薦生產力、教育和好玩等類別的優質產品,OpenAI也明確了創建者可根據自有GPT的適用人數進行分成。這意味著,基于大模型的應用有了“容器”,開發者找到了買賣的“市場”。

舉個簡單的例子:大模型本身一塊塊地皮,工具箱是錘子釘子,不同的開發者將蓋不同房子,GPT Store則是一個房地產市場,也就是說,蓋出來房子不僅能自用,還能租出去和賣出去。

有了商業化的“交易場”,創業者們就有了正反饋,這使得創業不再只靠激情和夢想,而是擁有了現實收益的可能。

這或許也正是大模型創業者所言的“找落地”,上半年的AI創業離不開兩個字“燒錢”,5000萬的融資金額對大模型創業而言簡直是“滄海一瓢”,投資人不敢出手,創業者們也講不出新故事。

在現場,OpenAI的工作人員展示了OpenAI搭建的一款旅游GPT的用法:它不僅能列出巴黎旅游建議,還能在地圖上將計劃中提到的地點按類別標記起來,而這完全可以對用戶收費或者進行會員制。

雖然,這并不代表每一個登陸了GPT Store的應用都能賺到錢,但至少有一個窗口可以獲得第一批種子用戶,從而反哺產品進步,形成增長飛輪。

參考移動互聯網應用爆發的年代,每一個細分領域創業者都能挖掘出無數的需求形成應用,這或許也正是創業者們為之興奮的原因。

這時,才按下了所有APP重新做一遍的啟動鍵。

“我們相信,AI會以一種前所未見的規模,予以個體和機構新的能力。這也將把整個人類提升到我們前所未見的規?!保瑠W特曼在結尾時提到。

顯然,OpenAI想做的,還有更多?;A設施已經初步搭建完畢,剩下的,就是等時間和生態的其他角色,來開花結果。

作者:郝鑫;編輯:劉雨琦

來源公眾號:光錐智能(ID:guangzhui-tech),前沿科技,數智經濟。

本文由人人都是產品經理合作媒體 @光錐智能 授權發布,未經許可,禁止轉載。

題圖來自Unsplash,基于 CC0 協議。

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 感謝分享,熱乎乎的前沿

    來自廣東 回復