除了模型, GPT 們還在卷什么?
ChatGPT的問(wèn)世讓大模型成為了業(yè)內(nèi)關(guān)注焦點(diǎn),無(wú)論是大廠還是中小企業(yè),或者獨(dú)立開(kāi)發(fā)的開(kāi)源程序員,都在大模型上鉚足了力。除了關(guān)注模型本身,關(guān)于AI,他們還關(guān)注在哪些領(lǐng)域?本文作者對(duì)此進(jìn)行了分析,希望對(duì)你有幫助。
ChatGPT 問(wèn)世后,各大公司都在「大模型」上下了苦功,模型能力也成為大家最關(guān)注的話題。ChatGPT 雖直接定義了基于大模型的生成式對(duì)話機(jī)器人這個(gè)產(chǎn)品類型,其模型的強(qiáng)大也導(dǎo)致大家都忽略了它在產(chǎn)品使用上的問(wèn)題。
其實(shí)不管是底層模型開(kāi)發(fā)的大廠還是專注于應(yīng)用層的小廠,又或者是開(kāi)源的獨(dú)立開(kāi)發(fā)者,都在模型能力之外的產(chǎn)品體驗(yàn)上暗自較勁,以不同的姿態(tài)參與到這場(chǎng)能夠定義新的人機(jī)交互方式的對(duì)話革命中來(lái)。
那除了模型,他們還在「卷」些什么?
一、大廠:專注模型,體驗(yàn)略顯「簡(jiǎn)陋」,主打一個(gè) less is more
1. ChatGPT:三件套框架定義極簡(jiǎn)
ChatGPT 作為行業(yè)標(biāo)桿,直接定義了生成式對(duì)話機(jī)器人行業(yè)標(biāo)準(zhǔn)。免費(fèi)版本的 ChatGPT?早期只有對(duì)話、對(duì)話管理以及簡(jiǎn)單的主題設(shè)置功能,靠著模型能力席卷全球。隨著用戶的增多和抱怨,ChatGPT?的產(chǎn)品經(jīng)理也坐不住了開(kāi)始逐步增加一些功能。
最令人深刻的當(dāng)屬 Upgrade to Plus,牢牢霸占左下角的設(shè)置頁(yè),一眼望過(guò)去只有兩個(gè)字,「充錢」。除此之外,ChatGPT 也逐步增加了主題設(shè)置、隱私管理等功能,但仍然突出一個(gè)克制,頗有小龍哥真?zhèn)鳌?/p>
付費(fèi)版 ChatGPT 主要的區(qū)別在于增加了模型切換的按鈕,以及在設(shè)置中增加了 Beta Features 的功能,可以使用聯(lián)網(wǎng)搜索功能 Browsing 或者使用其他插件。
2. Bard & Bing:非差異化競(jìng)爭(zhēng)
三巨頭的剩下兩家 Google Bard 以及 Bing Chat 也都各有各自的風(fēng)格,但總體上還是維持著極簡(jiǎn)風(fēng)。
Bard 的功能設(shè)計(jì)邏輯與 ChatGPT 幾乎一致:對(duì)話功能為主,融合必要的對(duì)話管理、賬戶管理以及界面設(shè)置功能。作為搜索大拿,Bard 在對(duì)話的基礎(chǔ)上也引入了搜索的功能,能夠自然地根據(jù)問(wèn)題引入搜索,并呈現(xiàn)融合處理過(guò)的結(jié)果,體驗(yàn)上更加 up to date。對(duì)于天氣、實(shí)時(shí)信息的查詢都表現(xiàn)良好。
大模型在生成答案時(shí)會(huì)有多個(gè)答案并且有相應(yīng)的權(quán)重,Bard 的「查看其他答案」功能給用戶提供了更多選擇,當(dāng)我詢問(wèn)北京市天氣的時(shí)候,它甚至給出了文字版本、表格版本和極簡(jiǎn)版本,非常驚艷。
值得一提的是,Bard 的回答生成在交互方面是一次性生成而非打字機(jī)模式(文字一個(gè)一個(gè)出現(xiàn),有打字機(jī)效果,參考 ChatGPT),缺乏了生成過(guò)程,體驗(yàn)上感覺(jué)不夠絲滑。
與 ChatGPT 和 Google Bard 不同的是,Bing Chat 的定位是基于搜索的,它的工作原理是從輸入中總結(jié)搜索關(guān)鍵詞進(jìn)行搜索,然后對(duì)搜索結(jié)果進(jìn)行總結(jié)。每一條回復(fù)都會(huì)引用相應(yīng)的來(lái)源,這同時(shí)導(dǎo)致它在創(chuàng)造力方面更缺乏,但是來(lái)源可考、保證了準(zhǔn)確性。
Bing 同樣也是極簡(jiǎn)風(fēng),整體的產(chǎn)品界面設(shè)計(jì)與其他兩家區(qū)別不大,但色彩上明顯更活潑一些。功能上最開(kāi)始甚至連對(duì)話管理的功能都沒(méi)有,聊完了您就清空,不留下一絲痕跡。后來(lái)才增加「最近活動(dòng)」的功能,用戶能夠看到自己最近的對(duì)話。
Bing 唯一的特點(diǎn)在于設(shè)定了三種對(duì)話樣式:更有創(chuàng)造力、更平衡、更精確,能夠根據(jù)此參數(shù)確定模型是更精確還是更有創(chuàng)造性,這與 GPT 模型中的高級(jí)參數(shù) Temperature 是對(duì)應(yīng)的。然而因?yàn)闊o(wú)法同時(shí)對(duì)比幾個(gè)模式,在使用體驗(yàn)上用戶很難感受到差別,即使是更有創(chuàng)造力的選項(xiàng),受限于 Bing 更偏向搜索的定位,搜出的結(jié)果依舊缺乏創(chuàng)造力。
對(duì)比下來(lái),三巨頭比拼的主要還是模型能力,目前 ChatGPT 還是比較領(lǐng)先;Bard 比較好地融合了搜索和生成兩種模式,體驗(yàn)上是更優(yōu)秀一些,Bing 則缺乏使用上的亮點(diǎn),但靠著一句 GPT-4 模型就足以吸引大部分用戶。
二、中小廠:深耕體驗(yàn),能力之上體驗(yàn)狂卷
不同于大廠卷模型能力,中小廠和個(gè)人開(kāi)發(fā)者們更多將注意力放在了模型層上的應(yīng)用層,依托各家大廠的底層模型能力,在功能和體驗(yàn)方面卷的飛起。
1. Perplexity:基于搜索的 AI 對(duì)話產(chǎn)品該怎么做
首先要說(shuō)的就是?Perplexity,一家對(duì)話式的搜索引擎,體驗(yàn)上可以說(shuō)是完爆 Google Bard 和 Bing Chat。Perplexity 翻譯為「困惑度」,是人工智能領(lǐng)域用來(lái)描述語(yǔ)言模型效果的一個(gè)常用指標(biāo),模型困惑度越小,說(shuō)明模型越強(qiáng)大。Perplexity 是一家只有 14 個(gè)員工的小型跨學(xué)科團(tuán)隊(duì),但在產(chǎn)品力上可以說(shuō)是完爆大廠,堪稱 more is more 的典范。
在基本的 ChatGPT 式對(duì)話架構(gòu)三件套基礎(chǔ)上,Perplexity 融合了垂直領(lǐng)域搜索(學(xué)術(shù)、YouTube、Reddit、Wolfram 等)、搜索歷史、搜索熱榜、以及 Copilot(類似 AutoGPT)等功能。UI 設(shè)計(jì)采用了傳統(tǒng)的搜索布局,對(duì)話框在屏幕偏上方,而非對(duì)話類框架輸入框在下方的模式,讓人一眼就知道,這個(gè)產(chǎn)品是更「搜索」的產(chǎn)品。
從這點(diǎn)上來(lái)說(shuō),Perplexity 比 Google 和 Bing 更加突出了自己的搜索定位,旗幟鮮明、定位清晰。產(chǎn)品的邏輯則與 Bing 類似,是對(duì)搜索結(jié)果的總結(jié)(summerize),通過(guò)多次使用感覺(jué)對(duì)文獻(xiàn)的引用更加全面,比 Bing 更加具有創(chuàng)造性一些。在多輪對(duì)話當(dāng)中,Perplexity 還增加了相關(guān)話題,預(yù)測(cè)了根據(jù)答案你可能會(huì)有的其他疑問(wèn),順利的話只需要問(wèn)一次,剩下的問(wèn)題靠點(diǎn)擊就可以解決了,體驗(yàn)上很順暢。
對(duì)于「如何成為一名少數(shù)派作者」,筆者分別對(duì) Perplexity 和 Bing Chat 做了測(cè)試,從回答的內(nèi)容來(lái)說(shuō),Perplexity 的內(nèi)容更加詳實(shí),參考來(lái)源更多,同時(shí)搜索后的界面在延伸閱讀、follow up 提問(wèn)以及排版優(yōu)化上,都比 Bing Chat 體驗(yàn)要好。巨硬果然是拿腳做產(chǎn)品。
2. Poe:「美國(guó)知乎」的縫合怪
Poe?是「美國(guó)知乎」Quora 推出的官方 AI 聊天應(yīng)用,接入了 GPT-3.5、GPT-4、Claude、Midjourney 等多種 AI 服務(wù),是目前最官方的「AI 縫合怪」。
其最大的營(yíng)銷點(diǎn):可以免費(fèi)使用 GPT-4 和 Claude Instant,然而點(diǎn)進(jìn)去你就會(huì)發(fā)現(xiàn) GPT-4 每天只能用 1 次、每個(gè)月可以使用 30 次,只能說(shuō)是聊勝于無(wú)吧。另外除了縫合之外,其單個(gè)服務(wù)的產(chǎn)品體驗(yàn)非常簡(jiǎn)陋,幾乎只有對(duì)話功能,長(zhǎng)期使用體驗(yàn)較差。
其官方的 AI 對(duì)話助手 Sage 在使用體驗(yàn)上沒(méi)有什么獨(dú)特之處,應(yīng)該也是用了 GPT-3.5 之類的模型。
3. Forefront:ChatGPT 最佳代替品
免費(fèi) GPT-4 幾乎是所有套殼應(yīng)用最有效的宣傳方式,只要你有這個(gè)功能,哪怕是每天只能用 1 次,你都能騙來(lái)一大波流量(鞭尸 Poe)。
而?Forefront?幾乎做到了 GPT-4 的全免費(fèi)。它來(lái)自一個(gè) GitHub 項(xiàng)目,通過(guò)逆向工程 Poe、Bing 等使用了 GPT-4 的大廠,為普通網(wǎng)友提供免費(fèi)的 GPT-4 連接,在 GitHub 上狂砍 3.7 萬(wàn)星標(biāo),幾乎是最近增長(zhǎng)最快的項(xiàng)目。
Forefront 內(nèi)置了豐富的人格預(yù)設(shè),能夠滿足用戶多樣化的使用需求。人格化預(yù)設(shè)來(lái)自一個(gè)經(jīng)典的 prompt 技巧:讓 ChatGPT 扮演某一種角色,這樣它的回答能夠更加準(zhǔn)確。Forefront 可以一鍵選擇超多人格,達(dá)芬奇、喬布斯、軟件開(kāi)發(fā)工程師等,提供了豐富的場(chǎng)景模板,編程幫助、創(chuàng)意寫(xiě)作、學(xué)術(shù)研究等場(chǎng)景都可以滿足。
三、套殼應(yīng)用:細(xì)節(jié)爆炸,深度玩家福音
說(shuō)完了官方主力軍們,接下來(lái)介紹一下依托于官方 API 的各種套殼產(chǎn)品。它們主要是在模型能力上對(duì)前端交互進(jìn)行優(yōu)化并增加了一些輔助功能,用戶可以將自己的 API 填入并使用。
這類產(chǎn)品更適合深度體驗(yàn)者以及當(dāng)成生產(chǎn)力工具,能夠定制化的細(xì)節(jié)非常多。
1. ChatBox:多平臺(tái)客戶端之王
ChatBox?是目前最成熟的多平臺(tái) AI 聊天客戶端,用戶可以自主可以接入 ChatGPT、Azure ChatGPT 服務(wù)、Claude API 等,在 GitHub 上獲得了 11.7 萬(wàn)星標(biāo),橫掃客戶端界。對(duì)于對(duì)客戶端有執(zhí)念的用戶,它也是 Windows 上最好的選擇。
ChatBox 的架構(gòu)也是基于 ChatGPT 的三段式架構(gòu),但每個(gè)部分都增加了更多功能,滿足多樣化的效率使用體驗(yàn)。它在對(duì)話管理功能中還設(shè)置了多種預(yù)設(shè) pormpts,包括軟件開(kāi)發(fā)、私人助理、夸夸機(jī)等模式。
在設(shè)置中,ChatBox 也支持高級(jí)參數(shù)和更詳細(xì)地信息顯示:首先可以自定義 temperature 參數(shù),調(diào)整模型答案的隨機(jī)性、創(chuàng)造性;同時(shí)可以顯示 API 的 token 用量,可輸入輸出的 token 數(shù)量估計(jì),以及調(diào)整文字大小、默認(rèn)語(yǔ)言等功能。用下來(lái)應(yīng)該算是 Windows 上用起來(lái)體驗(yàn)最好的客戶端。
2. MacGPT:如果只能有一款 GPT 客戶端,那就是 MacGPT
至于為什么 ChatBox 只能是 Windows 最好用的桌面客戶端,因?yàn)?Mac 平臺(tái)上有更卷的產(chǎn)品:MacGPT。
得益于 Mac 系統(tǒng)的特點(diǎn),MacGPT 支持 5 種模式:Web、API、任務(wù)欄模式、全局呼出以及 Intext。任何場(chǎng)景都能夠滿足需求。
Web 模式相當(dāng)于一個(gè)簡(jiǎn)版瀏覽器窗口,整個(gè)使用體驗(yàn)與 ChatGPT 一致;API 模式體驗(yàn)與 ChatBox 類似,相當(dāng)于一個(gè)本地的 Mac 客戶端;任務(wù)欄模式可以支持從任務(wù)欄喚醒并且隨時(shí)開(kāi)啟對(duì)話,依托于任務(wù)欄可以保證在任何場(chǎng)景下都可以快速啟動(dòng) ChatGPT,非常高效;全局呼出模式則支持通過(guò)熱鍵呼出置頂?shù)膶?duì)話欄并立刻展開(kāi)對(duì)話,用過(guò)?Alfred?應(yīng)該都能明白這種體驗(yàn)是多么流暢。
Intext 模式更是 amazing,簡(jiǎn)直是文字工作者的大殺器。當(dāng)你在任何文本輸入的環(huán)境(備忘錄、Word 等)中打出?/gpt,隨后的內(nèi)容就會(huì)被作為 ChatGPT 的輸入,并且直接在當(dāng)前文本環(huán)境中生成回答,完全無(wú)需切換應(yīng)用就能使用 ChatGPT 進(jìn)行問(wèn)答,并且直接插入到文檔中,簡(jiǎn)直就是 Notion AI 的全局版本,必須吹爆。
3. ChatGPT-Next:每個(gè)人的云服務(wù) AI 助手
如果一定要選一個(gè) Web 端 ChatGPT 的套殼客戶端,那我愿稱?ChatGPT-Next?是個(gè)人助理之王。
它的作者不僅開(kāi)發(fā)了這個(gè) Web 端應(yīng)用,還開(kāi)發(fā)了一鍵部署到 Vercel(前端托管服務(wù)器)的功能。也就是說(shuō)只需一個(gè) API key 和幾次單擊,每個(gè)人都能擁有自己的專屬 ChatGPT 客戶端,自用、團(tuán)隊(duì)用或者作為服務(wù)提供給其他人,都像呼吸一樣簡(jiǎn)單。
筆者成功將自己部署的客戶端發(fā)給了爸媽和姥姥,給他們帶去了一點(diǎn)小小的 AI 震撼,姥姥甚至高興地給我做了一大碗紅燒肉。
產(chǎn)品功能方面 ChatGPT-Next 也是集大成者,預(yù)設(shè)了 20 種人格和應(yīng)用場(chǎng)景,且支持自定義;高級(jí)參數(shù)方面,模型選擇 model、隨機(jī)性 tempeture、單次回復(fù)限制 max tokens 以及話題新鮮度 presence penalty,都可以根據(jù)需求場(chǎng)景精準(zhǔn)調(diào)節(jié)。同時(shí)對(duì)話管理中的歷史消息長(zhǎng)度壓縮也堪稱王炸級(jí)別功能,能夠在上下文數(shù)量達(dá)到一定的 token 時(shí)對(duì)上下文進(jìn)行總結(jié),并清除之前的記憶,有效減少 token 占用,讓對(duì)話更持久。最后其界面也是所有 app 中可自定義程度最高的,字體、語(yǔ)音、發(fā)送預(yù)覽、緊湊邊框,全部可以自定義。
論套殼類產(chǎn)品在功能豐富度和自定義程度方面,ChatGPT-Next 是各個(gè)方向中最強(qiáng)的,長(zhǎng)期使用下來(lái)感受最好,使用 API 的速度也會(huì)比各種服務(wù)的官方速度更快,是生產(chǎn)力玩家的首選。
四、國(guó)內(nèi)大廠:生態(tài)迅速接入,創(chuàng)業(yè)公司更快一步
釘釘、飛書(shū)、微信作為國(guó)內(nèi)的三大辦公 IM 巨頭,截至目前都已經(jīng)有了非官方的開(kāi)源 AI 機(jī)器人接入。國(guó)內(nèi)某創(chuàng)業(yè)公司通過(guò)開(kāi)源社區(qū)的馬拉松項(xiàng)目,開(kāi)發(fā)了基于釘釘、飛書(shū)的 AI 對(duì)話機(jī)器人矩陣,融合多模態(tài)(ChatGPT、DALL·E + Whisper、Midjourney)、圖片創(chuàng)作、表格分析、文檔導(dǎo)出、多話題討論、公式計(jì)算等等功能全部可以實(shí)現(xiàn)。甚至連 API 也是免費(fèi)提供的,真正實(shí)現(xiàn)了賦能業(yè)務(wù),讓國(guó)內(nèi)打工人成為第一批無(wú)縫使用 AI 的選手。
在 ToB 功能方面,國(guó)內(nèi)創(chuàng)業(yè)公司應(yīng)該是走在了世界前列,已經(jīng)完成了產(chǎn)品化的開(kāi)發(fā),并且可以根據(jù)企業(yè)情況快速部署,依托 IM 實(shí)現(xiàn)辦公的 AI 提效。一鍵快速部署、企業(yè)級(jí)的AI權(quán)限管理、用戶導(dǎo)入導(dǎo)出使用記錄、風(fēng)險(xiǎn)詞攔截等,讓企業(yè)用戶順暢使用。
微信也有相應(yīng)的開(kāi)源機(jī)器人,但由于微信平臺(tái)本身的限制,微信機(jī)器人的功能就限制較強(qiáng)了,基本也就是官方的功能移植到了微信對(duì)話框中。
據(jù)悉美團(tuán)內(nèi)部也在進(jìn)行對(duì)話機(jī)器人的接入,幫助員工提升工作效率。其小美助手內(nèi)置了多個(gè)量身定制的場(chǎng)景和 prompts,幫助員工能夠快速上手。整體體驗(yàn)上與 ChatGPT 無(wú)異。
國(guó)內(nèi)其他模型大廠的官方客戶端整體都還在狂卷模型能以趕上 GPT-3 的水平,目前也都還處在遮遮掩掩的狀態(tài),想要獲得體驗(yàn)資格的難度比成熟產(chǎn)品要高的多,因此暫且不做評(píng)論,但應(yīng)該可以確認(rèn)不會(huì)有更令人驚喜的功能。
五、ChatGPT:App Store 登頂,移動(dòng) AI 時(shí)代到來(lái)
最后聊聊 ChatGPT 本尊。
5 月 18 日,ChatGPT 上線了 App Store 并迅速登頂 iOS 下載榜第一名。移動(dòng)端的 ChatGPT 也是突出一個(gè)簡(jiǎn)潔,但整體交互看得出來(lái)下了一些功夫:常規(guī)對(duì)話界面加入了回復(fù)的震動(dòng)反饋,感覺(jué)到對(duì)面的 AI 真的在打字,體驗(yàn)爆棚;同時(shí)左滑交互可以呼出對(duì)話管理功能,右滑交互能夠新開(kāi)對(duì)話,邏輯清晰;整體使用的流暢程度也非常優(yōu)秀,比 Web 端的體驗(yàn)好很多。
然而目前手機(jī)端的應(yīng)用場(chǎng)景非常有限,周圍的人也大多將其當(dāng)成 wiki 問(wèn)答來(lái)用,沒(méi)有插件和聯(lián)網(wǎng)的加持,移動(dòng)端目前并沒(méi)有太多應(yīng)用場(chǎng)景,而生產(chǎn)力場(chǎng)景 Web 端效率更高,協(xié)作也更加流暢——畢竟我不能上班的時(shí)候一直扣手機(jī)吧。
但 iOS 客戶端解決了 ChatGPT 充值 plus 難的痛點(diǎn),可以通過(guò) App Store 直接訂閱,讓不少用戶終于能夠方便地用上 GPT-4。
移動(dòng)端的潛力當(dāng)然是巨大的,現(xiàn)在 ChatGPT 剛剛下場(chǎng),但其戰(zhàn)略上的「我全都要」是可以窺探到的。在前有 Poe、Snapchat 移動(dòng)端的情況下,ChatGPT 無(wú)疑讓移動(dòng)端的競(jìng)爭(zhēng)格局一下子不同了起來(lái),未來(lái)會(huì)發(fā)展成什么樣子我們拭目以待。
六、小結(jié)
ChatGPT 帶來(lái)的 AI 變革將深刻改變社會(huì)的發(fā)展方向,現(xiàn)在是混沌的亂斗局面,大家都卯著勁想做出點(diǎn)什么。但模型又不是普通人能做的,所以出現(xiàn)了更多以場(chǎng)景應(yīng)用為主的產(chǎn)品,也給創(chuàng)業(yè)者和開(kāi)發(fā)者們提供了許多 AI 應(yīng)用的思路。
另外本土化是另一個(gè)重要的課題,國(guó)內(nèi)大廠在進(jìn)度上明顯落后,但應(yīng)用層已經(jīng)先行并且有了很多好用的產(chǎn)品,這將來(lái)也會(huì)是競(jìng)爭(zhēng)最激烈同時(shí)機(jī)會(huì)最多的地方。乘上這波 AI 的大浪吧,不妨做一頭飛起來(lái)的豬。
最后歡迎關(guān)注 PandorAI,我們致力于幫助 AI 創(chuàng)業(yè)者獲得更多洞察。
本文由 @PandorAI 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自 Unsplash,基于 CC0 協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
關(guān)注的所謂功能點(diǎn)還是在殼子上,這類產(chǎn)品核心功能是策略,即能問(wèn)什么,會(huì)有什么特點(diǎn)的回復(fù)、效果好不好。