GPT-4終于可以聯網、用插件了,我用完的評價是:拉了
最近,GPT-4又有了新功能,一是它終于可以聯網了,二是它可以使用插件。這個新功能效果如何,是否好用呢?本文作者在使用過后,分享了自己的看法,一起來看一下吧。
在被各種號稱“ 炸裂 ”、“ 顛覆 ”的 AI 新聞的轟炸下,說實話,差評君已經有點麻了。
但這次,差評君打起來十二分的精神,因為真正有料的的終于來了。
就在這兩天,隨著 OpenAI 向 Plus 用戶全面開放自己的第三方插件,差評君也有了使用插件的資格。
只要大家是 ChatGPT 的付費用戶,在設置里打開“Beta features”里的“Web browsing”和“Plugins”。
接下來,只要在聊天頁面選擇需要啟用的功能,就能在對話中使用了。
不過要注意的是,這個“Web browsing ”和“Plugins ”只能二選一,并不能同時使用。
而且GPT-4這次的圖標也改成了紫色:
不過這兩個功能都只能單獨使用,所以,我們先嘗試了一下 ChatGPT 自帶的網頁搜索功能。
我們都知道, GPT-4 的模型數據集只收集到 21 年 9 月份,所以我問了它一個最近很火的游戲,王國之淚。
這次它終于擺脫了單機模式,直接上網搜索了“王國之淚”的關鍵詞,然后找到了“王國之淚”的維基百科。
在閱讀相關內容后,輸出了回答,而且還順便給咱做了一個翻譯。
這么來看,聯網了的 GPT-4 的大腦,又擴容了。
不過呢,當我想要些更細致的信息時, GPT-4 雖然會嘗試去瀏覽網頁,但,都進不去。
于是我轉頭去試了試 NewBing ,就沒發現有類似的問題。
對此,差評君只能理解為 ChatGPT 在爬取國內內容時,爬取手段太過直白,直接被當成機器人給拒絕訪問了。
不過, ChatGPT 的網絡瀏覽也不是一無是處,相對于現在的 Newbing ,當我需要一個更加詳盡的回答時,比如讓它對暴雪收購案進行評價, Newbing 可能是由于限制問題,只給出了短短幾句的回答,數據還不新。
反觀 GPT-4 不僅獲取了正確信息,而且還對新聞的細節進行了總結。
唯一需要吐槽的,就是整個的生成過程速度有點慢。
而在第三方插件方面,這次剛好也有個名叫 KeyMate.AI Search 的工具能輔助搜索。
只不過,這插件反而不如上述 ChatGPT 自帶的網頁瀏覽功能好用。
雖然它按照要求給出了鏈接,但是,點進去,是一個無法訪問的視頻。。。至于知乎,依舊拒絕訪問。。。
最后,它出門左轉在 IGN 的官網,幫我找了一些資料。
除了這個實時搜索, ChatGPT 其它插件的能力又如何呢?
首先,就是在學術教育和數學能力上,有了插件的加持, GPT-4 再也不是從前的那個數學小白了。
原因就是這個能做數學題的神器:Wolfram 插件。
相對于原始網站,加載了插件的 GPT-4 ,更像是一個老師。
在答案上, GTP-4 除了能幫你把過程給寫出來,在解答過程中,當我要求它去對一些關鍵步驟進行解釋時,這個回答就更詳細了。
不過在一些難度更高的題目面前, Wolfram 就有點應付不來了。
比如這道 2022 年全國卷的數學最后一道大題,不管我嘗試幾次,它都沒辦法算出來。
但,問題也不止這一點,在我測試其它的一些插件時,比如這個 ScholarAI ,它是一個能幫我查找發表在 Springer Nature 上的期刊的插件。
因為這個插件只能尋找 Springer Nature 上的內容,所以在檢索時,經常會搜不到需要的文章,其次,它也無法直接幫我們閱讀全文,想要閱讀全文,還得點進去下載 PDF 。。。
這種檢索方式,和平常的搜索引擎基本沒啥區別,還不如去直接用搜索引擎去搜索,然后自己去選擇需要的論文呢。
當然了,決定 ChatGPT 的插件功能好不好,最重要的還是能不能解決問題。
大家還記得,上次 OpenAI 在發布插件預告的時候,最讓人驚艷的就是對生活出行的一鍵解決了。
正好,公司最近組織大家去日本大阪團建,這時候誰來做這個攻略就是個互相甩鍋的大問題了。
于是,不出意料的,這個問題被大家丟給 GPT 的新插件了。
結果,萬萬沒想到翻車竟然來的如此突然。
首先我使用了 Weather Report Data (天氣報道插件,這里有個伏筆), Expedia (旅游插件)還有 OpenTable (訂餐插件)這三個插件去幫忙制定這幾天的行程。
問了問 GPT , 5 月 24 日后 5 天的天氣情況,并要求它給我推薦幾個好吃的、好玩。
GPT 竟然傲嬌起來了, 5 月 24 號,也就是未來的天氣竟然不能實時顯示。
直接就讓隔壁的好兄弟, New Bing 看了個大笑話。
甚至連, GPT 家族中的沒有聯網能力的小弟弟 GPT-3 ,都憑借 21 年的數據猜出來。(雖然明顯是猜的)
多少讓我有些哭笑不得了。
不過,后來咱看了看這個 Weather Report Data ,發現它只提供實時的天氣信息,也就是沒法提供未來的天氣預測,而目前還沒有其它的天氣預報插件。
但這樣我就要吐槽了,光看名字,這個叫做“Weather Report Data”的插件,怎么看都是一個常用的天氣軟件吧。
就這取名規則,放在蘋果商店里,可是會因為“誤導性語言”要被一頓毒打,逐出蘋果生態圈的。
所以咱只好再重新切換使用“Web browsing”來查詢,這才知道未來的天氣。
如果這還算情有可原的話,那后面的內容可就不好洗了。
首先,在我沒有明確說明從哪出發的情況下,它直接給我推薦了從北京飛往日本的機票。
雖然言語間非常誠懇,甚至還表示要給我推薦大坂的租車服務。
但是有一說一,你把我 5 月 24 號的出發時間擅自改成 6 月 15 號,是不是有點不禮貌了。
其次,這次旅行的重點自然是旅游了。
于是,這個推薦的第二個項目“大阪步行游”成功的引起了我的好奇。
一個大阪步行游,就要了咱們 50美元,關鍵這是步行啊。難道里頭有什么大家“懂的都懂”的項目。
結果點到鏈接里一看,原來是悄悄給我安利了旅游跟團業務,這可就有玩“植入廣告”的嫌疑了呀。
沒想到 GPT 竟然比微軟還要早一步引進商業元素,這不純粹了呀。
當然了,在使用插件處理這種復雜問題的時候, GPT 也不總是出岔子的。
比如,這一回,我要求它根據天氣給我推薦一個適合的菜譜。
雖然問題挺不著調的,但它還是給了我一個希臘沙拉的食譜,
然后在計算價格的過程上,最神奇的事情發生了。GPT 給了我們一個鏈接,我們點擊之后,就可以直接進入一個叫 instacart 的購物平臺。
里頭關于希臘沙拉的食材全都已經加入購物車了,只要選好數量,就可以直接付款下單。
而且,在這 70多個插件里我還發現了一個非常牛 X 的應用—— Zapier 。
Zapier 本身呢是一款基于 web 的自動化工具,它能夠連接到各種應用上,讓它們之間可以相互協作。
而現在有了 ChatGPT 的加持,直接在對話框內就能處理工作,甚至 ChatGPT 還能幫忙打打下手。
比如說有個會議需要通知員工,直接在對話框內輸入要求就行。
ChatGPT 首先會生成一個 Zap 預覽,并且會自動擬好郵件的內容給我們過目。
除此之外,這回一起開放的 GPT 插件中,其實還有許多神奇的小功能。
比如高分電影、書籍推薦;
你甚至還可以和它玩一款名為 Algorithma 的模擬生活的文字游戲。
粗看起來,是有點 AI 版 APP Store 的味道了。
不過,整個測試下來,差評君還是略顯失望的,整個插件系統對 ChatGPT 帶來的提升有,但也沒有太大,并沒有之前我們預期的那樣,對咱們的生活帶來非常明顯的改變。
說到底,插件功能,其實是讓 ChatGPT 對自身的一些薄弱環節進行加強,比如提升數學能力,提升數據檢索能力,增加一些基本的網站操作能力等等。
但是現在測試看來,某些插件開發的不夠完善,嚴重影響了咱們的體驗,甚至給大家一種“不如不更新”的錯覺。
差評君覺得,主要還是因為,這一回的插件功能其實是由第三方,也就是由一部分獲得內測資格的開發者制作的,不免會出現水平參差不齊的問題。
然而話又說回來,在大模型即將成為平臺和大基建的未來,應用生態這塊兒,絕對是得邁的一道檻。
畢竟,即便強如微軟,不也曾吃過生態的虧。
所以,未來 ChatGPT 在生態方面要是沒有所突破的話,或者說沒在應用品質上做出保證的話。
目前的領先地位,也未必不會被后來者給超越。
不過,話雖如此,但是考慮到目前 GPT 的新功能其實剛剛小范圍測試,還有充裕的試錯空間。
而且程序嗎,哪有不出 BUG 的。
咱們不妨耐心一點, ChatGPT 宇宙可能才剛剛開始。
作者:晚上吃早飯&及格;編輯:江江&面線
來源公眾號:差評(ID:chaping321),Debug the World。
本文由人人都是產品經理合作媒體 @差評 授權發布,未經許可,禁止轉載。
題圖來自 Unsplash,基于 CC0 協議。
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
現在只有web聯網功能,卻沒有plugins的功能??戳四愕奈恼?,覺得還可以再等等