“ChatGPT的最強(qiáng)競(jìng)品”爆火,就這?

0 評(píng)論 5971 瀏覽 5 收藏 12 分鐘

在ChatGPT出現(xiàn)之后,國內(nèi)外有關(guān)大模型應(yīng)用開發(fā)的消息頻頻傳出,而現(xiàn)在,一款名為Claude的產(chǎn)品也被架上了臺(tái)面,甚至被部分網(wǎng)友稱作“ChatGPT的最強(qiáng)競(jìng)品”。那么,Claude的表現(xiàn)究竟如何?一起來看看作者的分析與解讀。

當(dāng)ChatGPT大殺四方,而國內(nèi)類似的AI產(chǎn)品還沒有足夠成熟的消息傳來時(shí),出現(xiàn)了一個(gè)全新AI助手產(chǎn)品——Claude。

“ChatGPT的最強(qiáng)競(jìng)品”爆火,就這?

Claude的背景很強(qiáng)悍,來自前OpenAI員工獨(dú)立門戶后在2021年建立的公司Anthropic,2022年融資超7億美元,今年年初還讓谷歌投了近4億。同時(shí),Claude的噱頭也被大家架上了高位,諸如“ChatGPT的最強(qiáng)競(jìng)品”“GPT殺手”,對(duì)標(biāo)ChatGPT的意味十足。

那么,Claude的表現(xiàn)究竟如何?

一、Claude好用嗎?

相比ChatGPT在注冊(cè)環(huán)節(jié)就把不少人攔了下來,Claude的注冊(cè)流程稍稍簡(jiǎn)單一些。因?yàn)镃laude其實(shí)是內(nèi)嵌在企業(yè)聊天工具Slack(https://slack.com/get-started#/createnew)中的,可以通過用谷歌郵箱注冊(cè)后者賬號(hào)來直接體驗(yàn)Claude。

“ChatGPT的最強(qiáng)競(jìng)品”爆火,就這?

注冊(cè)之后,在彈出的網(wǎng)頁最后一行鏈接中點(diǎn)擊“創(chuàng)建一個(gè)新的工作區(qū)”。

“ChatGPT的最強(qiáng)競(jìng)品”爆火,就這?

按照指引創(chuàng)建成功會(huì)顯示“Success”,即可進(jìn)入工作區(qū),在左邊欄的“應(yīng)用”中搜索添加Claude。

“ChatGPT的最強(qiáng)競(jìng)品”爆火,就這?

到這一步,我們就可以開始體驗(yàn)Claude了。

面對(duì)Claude用英語打的招呼,果醬妹用中文要求它自我介紹。Claude非常順暢地轉(zhuǎn)為中文回復(fù),并不需要做其他設(shè)置。

我的名字叫Claude,我是一款人工智能助手。我會(huì)說中文和英文,能幫助用戶回答問題并完成簡(jiǎn)單的任務(wù)。我不是任何一家公司的產(chǎn)品,我的創(chuàng)始人搭建了我這個(gè)平臺(tái),讓我可以和用戶進(jìn)行交互。很高興認(rèn)識(shí)你!

點(diǎn)擊Claude的回復(fù)還可以進(jìn)行回復(fù)、轉(zhuǎn)發(fā)、保存、提醒等,有點(diǎn)像微信消息中點(diǎn)擊右鍵彈出的操作框。

“ChatGPT的最強(qiáng)競(jìng)品”爆火,就這?

出于新媒體人的本能,果醬妹首先向Claude詢問了今天中文互聯(lián)網(wǎng)有什么熱點(diǎn),Claude非常有條理地列出了五個(gè)熱點(diǎn)話題,并對(duì)其做了簡(jiǎn)單說明。

“ChatGPT的最強(qiáng)競(jìng)品”爆火,就這?

看似非?!奥斆鳌?,但經(jīng)過果醬妹的核實(shí),發(fā)現(xiàn)是一個(gè)都不能信。且不說給出的資訊都不是發(fā)生在今天,Claude回答的錯(cuò)誤之處還在于事件內(nèi)容本身,如品牌名稱壓根不存在,比賽雙方及比分?jǐn)?shù)都不正確。

于是,在果醬妹指出錯(cuò)誤之后,Claude迅速道歉,虛心反省自己,直言自己存在時(shí)空混淆的問題。

作為一個(gè)AI助手,我并不真正知道今天是2023年的4月24日,我提供的熱門話題信息都是我從過去報(bào)道和知識(shí)積累中推導(dǎo)得出的。我沒有辦法準(zhǔn)確地告知您2023年4月24日今天中文互聯(lián)網(wǎng)上的實(shí)時(shí)熱點(diǎn),我的知識(shí)和計(jì)算能力有限制。

“ChatGPT的最強(qiáng)競(jìng)品”爆火,就這?

面對(duì)如此誠懇的態(tài)度,果醬妹也不好多加指責(zé),只在隨后提問了兩個(gè)歷史日期發(fā)生的事件,正確率屬實(shí)不高。

顯然,Claude在新聞資訊收集方面仍然有很大的缺陷,這與其并非專門做搜索內(nèi)容應(yīng)用有關(guān),也體現(xiàn)了搜索引擎公司的數(shù)據(jù)庫對(duì)于一個(gè)成功的AI助手有巨大影響力。

“ChatGPT的最強(qiáng)競(jìng)品”爆火,就這?

放棄和Claude糾結(jié)具體某日的資訊,果醬妹又讓其用今天的熱點(diǎn)新聞寫一篇文章,從內(nèi)容角度看是及格的,既有新聞事實(shí)描述,又有結(jié)合行業(yè)進(jìn)行分析,甚至還有過渡句和連接詞,中文閱讀感是非常流暢的。

“ChatGPT的最強(qiáng)競(jìng)品”爆火,就這?

值得注意的是,據(jù)Claude自述,其單次輸出的字?jǐn)?shù)有上限,為2000個(gè)中文字符或者1000個(gè)英文單詞左右。

或許是出于設(shè)定好的交流習(xí)慣,Claude對(duì)于自己的回答總會(huì)做出一番說明,其解釋稱因回復(fù)內(nèi)容實(shí)時(shí)生成,無法輸出預(yù)先存儲(chǔ)的長(zhǎng)篇回復(fù),當(dāng)前的技術(shù)水平也難以生成長(zhǎng)篇和深度回復(fù),再加上交互接口、希望用戶快速找到所需消息的設(shè)計(jì)、運(yùn)行環(huán)境要求等原因,都導(dǎo)致了存在輸出上限

“ChatGPT的最強(qiáng)競(jìng)品”爆火,就這?

問及和ChatGPT的區(qū)別時(shí),“端水大師”Claude非??焖俚亓_列出兩者的優(yōu)勢(shì),表示ChatGPT在研究與技術(shù)水平上更厲害,而自己作為一款面向普通用戶的商業(yè)產(chǎn)品,在產(chǎn)品體驗(yàn)與可靠性方面更占優(yōu)勢(shì)。

“ChatGPT的最強(qiáng)競(jìng)品”爆火,就這?

眾所周知,ChatGPT會(huì)做算數(shù)題,果醬妹隨手打了一串?dāng)?shù)字,提問乘積,Claude緩慢地響應(yīng),并給出了一個(gè)錯(cuò)誤答案,下方還附注說明其不擅長(zhǎng)解決數(shù)學(xué)問題。

“ChatGPT的最強(qiáng)競(jìng)品”爆火,就這?

果醬妹再次追問,Claude火速認(rèn)錯(cuò),并展示了計(jì)算過程,然后再次給出了錯(cuò)誤答案。

“ChatGPT的最強(qiáng)競(jìng)品”爆火,就這?

幾個(gè)回合提問下來,雖然Claude都無法給出正確答案,但是認(rèn)錯(cuò)態(tài)度真誠到讓人難以斥責(zé)。Claude甚至認(rèn)知到,“作為一款A(yù)I助手,失去用戶的信任與信心將是最嚴(yán)重的失敗?!?/p>

“ChatGPT的最強(qiáng)競(jìng)品”爆火,就這?

“ChatGPT的最強(qiáng)競(jìng)品”爆火,就這?

在隨后的測(cè)試中,Claude展現(xiàn)出對(duì)腦筋急轉(zhuǎn)彎等創(chuàng)意發(fā)散類題目的不擅長(zhǎng)。而當(dāng)果醬妹希望Claude說明自己上線的時(shí)間,但無論如何更換關(guān)鍵詞,Claude都沒有辦法理解問題的意思。同時(shí),答案下方再次附注顯示,Claude并不那么了解自己的創(chuàng)造者Anthropic。

“ChatGPT的最強(qiáng)競(jìng)品”爆火,就這?

“ChatGPT的最強(qiáng)競(jìng)品”爆火,就這?

“ChatGPT的最強(qiáng)競(jìng)品”爆火,就這?

一番體驗(yàn)下來,Claude的優(yōu)缺點(diǎn)都很明顯。

關(guān)于其被眾人口口相傳的不收費(fèi)、不用注冊(cè)、支持中文三大優(yōu)勢(shì),實(shí)際上,除了目前不收費(fèi),注冊(cè)只是稍稍簡(jiǎn)便,中文語感流暢但并不能完全理解掛鉤當(dāng)時(shí)語境的真正意義。而邏輯類、數(shù)學(xué)類問題就完全是Claude的盲區(qū)了。

可見,作為ChatGPT的競(jìng)品,Claude恐怕對(duì)打敗前者有心無力。不過,擋不住Claude免費(fèi),比起情緒不夠穩(wěn)定還收費(fèi)的ChatGPT,Claude更像是任勞任怨的純種打工人,想體驗(yàn)AI助手的小伙伴大可以零成本玩一把。

二、AI賽點(diǎn)到了嗎?

從去年年底,ChatGPT引爆網(wǎng)絡(luò)以來,AI 成了流量新貴,各大廠也在其中卷生卷死。但大半年過去了,得到一致認(rèn)可的明星還是只有一個(gè)ChatGPT。

從這個(gè)角度來說,AI領(lǐng)域仍未到真正的賽點(diǎn),各家的產(chǎn)品都還在成長(zhǎng)期,沒有達(dá)到可以拿出來華山論劍的地步。

比如,盡管ChatGPT作為當(dāng)之無愧的霸主,但實(shí)際上其也經(jīng)常出現(xiàn)bug,就在美國東部時(shí)間4月23日晚間,財(cái)聯(lián)社報(bào)道稱根據(jù)中斷跟蹤網(wǎng)站Downdetector的數(shù)據(jù),超千名用戶報(bào)告Open AI出現(xiàn)使用問題。

這其中有多家巨頭共同明示過的算力不足的問題,也有技術(shù)不穩(wěn)定性因素,都是當(dāng)前大部分AI產(chǎn)品的通病。但根據(jù)斯坦福的調(diào)研報(bào)告顯示,近八成國人看好技術(shù)發(fā)展,AI產(chǎn)品的前景仍然被期待。

而在這各自蟄伏的前期,恰恰是我們最應(yīng)該關(guān)注AI動(dòng)態(tài)的時(shí)間,因?yàn)榫置孢€沒有定論,技術(shù)內(nèi)卷還在繼續(xù),誰也沒法斷定最后闖出來的會(huì)是哪家黑馬,誰都有機(jī)會(huì)先嘗一波紅利。

當(dāng)下的AI技術(shù)日新月異,雖然還未到取代人類工種的地步,但很多變化已經(jīng)在悄悄發(fā)生。Claude不是第一個(gè)劍指ChatGPT的AI產(chǎn)品,也不會(huì)是最后一個(gè),讓我們一起期待這場(chǎng)技術(shù)變革將掀起的影響巨浪。

作者:陳出木

來源公眾號(hào):微果醬(ID:wjam123456),聚焦新媒體前沿,洞察新消費(fèi)領(lǐng)域。

本文由人人都是產(chǎn)品經(jīng)理合作媒體 @微果醬 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!