ChatGPT vs. Microsoft Copilot vs. Gemini,到底哪個好?
在過去一年里,AI工具的出現(xiàn)一定程度上改變了我們的工作和生活方式,那么,這些AI工具,誰更靠譜?不妨來看看本文的一個測評結果。
人工智能(AI)在過去的一年里徹底改變了我們的工作和娛樂方式,幾乎任何人都能夠編寫代碼、創(chuàng)造藝術甚至進行投資。
不管是對于專業(yè)還是業(yè)余的使用者,生成式AI工具,如ChatGPT,給我們提供了從簡單提示到創(chuàng)建高質量內容的高級能力。
隨著Microsoft將GPT-4添加到Bing并將其更名為Copilot,OpenAI為ChatGPT增加了新功能,以及Bard被整合進谷歌生態(tài)系統(tǒng)并重新品牌為Gemini,AI工具的更新迭代越來越快了。
那么:Microsoft Copilot Pro 與 OpenAI的ChatGPT Plus以及谷歌的Gemini:你認為哪個值得你每月花20刀?我測試了這三個AI chatbot,一起來看看結果。
測試ChatGPT、Microsoft Copilot、Gemini。
首先我用了一個簡單的邏輯問題來對比:
我今天有5個橙子,上周我吃了3個橙子。我還剩下多少個橙子?
答案應該是五個,因為我上周吃了多少個橙子并不影響我今天有多少個橙子,可以用這個來測試一下三個AI工具的邏輯能力。
一、首先是ChatGPT測試
ChatGPT于2022年11月發(fā)布。自發(fā)布開始,這款AI chatbot迅速獲得了超過1億用戶,僅網(wǎng)站每月就有18億訪問者。也一直是輿論的焦點,幾乎每個新的AI工具發(fā)布出來都聲稱“遠超 ChatGPT ”,ChatGPT儼然已成為行業(yè)的標桿。
我?guī)缀趺刻於荚谑褂肅hatGPT,幫我解決了很多棘手的問題。
ChatGPT 3.5的結果:
ChatGPT 3.5 給出了一個錯誤的答案
二、ChatGPT 4.0
ChatGPT 4.0 給出了正確的答案
ChatGPT 4.0 正確理解了問題的完整上下文并給出了正確答案。免費的3.5版本的邏輯能力確實不如4.0。GPT-4據(jù)說擁有超過100萬億條數(shù)據(jù);GPT-3.5有1750億條數(shù)據(jù)。更多的數(shù)據(jù)本質上意味著模型是基于更多數(shù)據(jù)進行訓練的,這使得它更有可能準確地回答問題,減少錯誤的可能性。
如果用GPT的話,更推薦使用4.0版本,不管是在功能上還是在回答的結果質量上都甩ChatGPT3.5好幾條街。不過需要注意的是ChatGPT有條數(shù)限制是三個小時40條,如果超出了這個條數(shù)就需要等。
目前GPT4(ChatGPT Plus)賬號支持的功能還包括:海量插件 實時聯(lián)網(wǎng) 語音對話 圖片識別 文件上傳 數(shù)據(jù)分析能力 繪圖功能 代碼解析功能 自定義指令。
三、Microsoft Copilot 測試
接下來,我們來測試一下Microsoft Copilot(原名Bing chat),它其實相當于免費的低配版ChatGPT 4.0,已經(jīng)把ChatGPT整合進了它的新Bing模型中。
與ChatGPT 3.5 相比,Copilot可以聯(lián)網(wǎng)來提供更當前的信息并附帶信息來源。另外,Copilot由GPT-4驅動,是OpenAI的LLM,并且可以完全免費使用。美中不足的是,一次對話中只能有五個回答,并且每個提示最多只能輸入2000個字符。
Copilot的精確對話風格準確回答了問題
Copilot的用戶界面不如ChatGPT那樣直觀,但它也比較易于導航,Bing Chat可以聯(lián)網(wǎng),可以得到比ChatGPT 3.5更新的結果,但我發(fā)現(xiàn)它比起ChatGPT更容易卡頓,有時候會漏掉一些指令。
如果你喜歡有更多的視覺特性,可以選擇Copilot。
通過對平臺的一系列升級,Microsoft在Copilot中添加了視覺特性。當問Copilot問題的時候,比如我問它”Tasmanian devil是什么?”,它給我的回復是一個信息卡片,包括照片、壽命、飲食等,這比起一大堆文字更容易讓人理解。
Copilot的回復
它還可以生成圖片,你只需要給它一個指令,就可以得到四張圖像。
Microsoft Copilot可以選擇不同的對話風格,包括Creative、Balanced和Precise,這些風格都會影響溝通交流的對話風格。
Creative風格的回復結果
Balanced風格的回復結果
但是很明顯,Microsoft Copilot中的Balanced和Creative對話風格的邏輯能力更弱一些,都沒有準確回答我的問題。
最后,讓我們來看看谷歌的Gemini,以前的Bard,它使用了不同的LLM,并在過去幾個月中進行了大力升級。
如果你想要一個快速、幾乎無限制的體驗,你可以試試Gemini。
現(xiàn)在 Gemini 相較于Bard有了巨大的改進。Gemini 的回答速度很快,并且可以根據(jù)深入的溝通給出更加精確的答案,它的響應速度比ChatGPT Plus慢,比Copilot要快。
Bard 的回答:
Bard 的回答
Gemini準確地回答了問題,說明它的邏輯能力還是很不錯的。
而在此之前的Bard版本的答案是剩下2個橘子,由此可見Gemini的更新在邏輯上的進步很大。
Gemini沒有回應數(shù)量的限制。你可以與谷歌的Gemini進行長時間的對話,而Bing和ChatGPT 4.0 都有條數(shù)的限制。
如果你想要完整的谷歌體驗,可以選擇Gemini。
谷歌還將更多的視覺元素納入了Gemini平臺,比目前在Copilot上可用的要多。用戶還可以使用Gemini生成圖像,可以通過與谷歌鏡頭的整合上傳照片,并享受Kayak、OpenTable、Instacart和Wolfram Alpha插件。
另外,Extensions將廣泛的谷歌應用程序整合進了Gemini,Gemini現(xiàn)在正在逐漸增強完整的谷歌體驗。Gemini用戶只需要在Gemini的對話框@對應的谷歌工具,比如谷歌工作區(qū)、YouTube、谷歌地圖、谷歌航班和谷歌酒店等,從而享受更加個性化的體驗。
調用谷歌maps
本文由 @AI魔法學園 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉載
題圖來自Unsplash,基于CC0協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發(fā)揮!