GPT-4o新版本突然上線:絲滑解決9.11和9.9誰(shuí)大,更強(qiáng)也更便宜了

0 評(píng)論 558 瀏覽 1 收藏 6 分鐘

GPT-4o新版本上線,它不僅在性能上實(shí)現(xiàn)了全方位提升,還在成本效益上取得了顯著突破。這一新版本的出現(xiàn),無(wú)疑將為開(kāi)發(fā)者和用戶帶來(lái)更加流暢和經(jīng)濟(jì)的AI使用體驗(yàn)。

GPT-4o新版本突然上線,更強(qiáng)更便宜。

能力全方位提升,ZeroEval基準(zhǔn)測(cè)試直接躍居第一。

輸入和輸出分別節(jié)省50%、33%。

四舍五入就是API降價(jià)啊。

token輸出擴(kuò)展到16k,此前支持4k。

9.11和9.9誰(shuí)大這個(gè)問(wèn)題,也能絲滑解決。

這是因?yàn)镺penAI給API中引入了結(jié)構(gòu)化輸出。

通過(guò)JSON 模式確保模型輸出符合開(kāi)發(fā)者定義的結(jié)構(gòu),能讓模型變得更可靠安全。

最新版模型“GPT-4o-2024-08-06”在JSON模式評(píng)估中,得分100%。

相比之下,去年6月的版本得分還低于40%。

在代碼編輯方面,最新版本的基準(zhǔn)得分和此前版本相同,但是現(xiàn)在成本只有原來(lái)的一半。

還有人發(fā)現(xiàn),這個(gè)新版本是OpenAI在圖像輸入上最便宜的型號(hào)。

API支持結(jié)構(gòu)化輸出

去年OpenAI DevDay上,官方正式給GPT-4引入了JSON模式,可以幫助開(kāi)發(fā)者構(gòu)建應(yīng)用程序。

盡管JSON模式能提高模型可靠性,但是它并不能保證模型生成結(jié)果符合特定模式。

因此在這次更新中,OpenAI在API中引入結(jié)構(gòu)化輸出,可以確保模型生成內(nèi)容和開(kāi)發(fā)者提供的JSON模式完全匹配。

主要形式有兩種:

1、函數(shù)調(diào)用:通過(guò)在函數(shù)定義中設(shè)置strict:true來(lái)調(diào)用結(jié)構(gòu)化輸出。

此功能適用于所有模型型號(hào),包括gpt-4-0613和gpt-3.5-turbo-0613等。當(dāng)結(jié)構(gòu)化輸出被啟用時(shí),模型輸出將匹配提供的工具定義。

2、response_format參數(shù)新選項(xiàng)。

開(kāi)發(fā)者可以通過(guò)json_schema (response_format參數(shù)的新選項(xiàng))提供JSON模式。

當(dāng)模型不是調(diào)用工具,而是以結(jié)構(gòu)化的方式響應(yīng)用戶時(shí),這是有用的。該功能適用于gpt-4o-2024-08-06和gpt- 4o-mini-2024-07-18。當(dāng)response_format使用strict: true提供時(shí),模型輸出將與提供的模式匹配。

OpenAI更新了Python和Node SDK,支持本地的結(jié)構(gòu)化輸出功能。

此外,還強(qiáng)調(diào)了安全輸出。新模式將遵循現(xiàn)有的安全規(guī)則,并引入了refusal字符串值來(lái)幫助開(kāi)發(fā)者識(shí)別模型拒絕 unsafe 請(qǐng)求的情況。

結(jié)構(gòu)化輸出還可以用于動(dòng)態(tài)生成用戶界面、分離最終答案與推理過(guò)程、從非結(jié)構(gòu)化數(shù)據(jù)中提取結(jié)構(gòu)化數(shù)據(jù)等多種用例。

最后在價(jià)格方面,輸入價(jià)格為2.5美元/100萬(wàn)token,輸出價(jià)格為10美元/100萬(wàn)token。

由于新模型在輸入和輸出上能更節(jié)省,四舍五入也是降價(jià)了。

有人發(fā)現(xiàn),這個(gè)新模型的輸出沒(méi)有上一版本那么冗長(zhǎng),成本上更可控。

參考鏈接:

https://openai.com/index/introducing-structured-outputs-in-the-api/

明敏 發(fā)自 凹非寺

本文由人人都是產(chǎn)品經(jīng)理作者【量子位】,微信公眾號(hào):【量子位】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!