估值40億的Pi大更新:性能接近 GPT-4,日均使用時(shí)長(zhǎng)已經(jīng)超過(guò) Instagram

0 評(píng)論 1928 瀏覽 2 收藏 19 分鐘

最近,致力于「為每個(gè)人開(kāi)發(fā)服務(wù)型AI」的人工智能初創(chuàng)公司Inflection AI更新了他們的聊天機(jī)器人Pi。這款聊天機(jī)器人的實(shí)際體驗(yàn)如何?其背后的公司團(tuán)隊(duì)具備怎樣的陣容?一起來(lái)看看本文的分享。

當(dāng)OepnAI和馬斯克連日互杠、Google因文化偏見(jiàn)麻煩纏身、號(hào)稱(chēng)搶走GPT-4王位的Claude 3全力瞄準(zhǔn)企業(yè)級(jí)部署的時(shí)候,在另一個(gè)角落,致力于「為每個(gè)人開(kāi)發(fā)服務(wù)型AI」的人工智能初創(chuàng)公司Inflection AI,悄悄更新了他們的聊天機(jī)器人Pi,以及為之提供支持的新一代大模型Inflection-2.5。

對(duì)一些人來(lái)說(shuō)Inflection AI這個(gè)名字可能還不太熟悉,實(shí)際上它也是業(yè)界第一梯隊(duì)的佼佼者,甚至每日的使用時(shí)長(zhǎng)已經(jīng)超過(guò)了 Instagram (根據(jù)Pi最新公布的數(shù)據(jù),用戶平均一次對(duì)話,時(shí)長(zhǎng)就達(dá)到驚人的33分鐘,而根據(jù)Sprout Social的統(tǒng)計(jì),Instagram 的用戶平均每日使用時(shí)長(zhǎng)為29分鐘)。

去年6月從微軟、英偉達(dá)、比爾·蓋茨、LinkedIn聯(lián)合創(chuàng)始人雷德·霍夫曼和谷歌前CEO埃里克·施密特手里融了13億美元,估值超過(guò)40億美元,成為彼時(shí)人工智能領(lǐng)域融資量?jī)H次于Open AI的第二大獨(dú)角獸。

此次公布的Inflection-2.5是公司開(kāi)發(fā)的第三代大模型,被官方稱(chēng)為目前“世界上最好的個(gè)人人工智能”。它在去年11月Inflection-2版本上進(jìn)行了全面升級(jí),“給卓越的情商進(jìn)一步增加智商”:性能表現(xiàn)逼近GPT-4,但訓(xùn)練所用的計(jì)算量卻只占其40%。同時(shí)具備世界級(jí)的網(wǎng)絡(luò)實(shí)時(shí)搜索能力, 確保準(zhǔn)確提供高質(zhì)量的即時(shí)新聞和最新信息。

一、性能看齊 GPT-4,算力只需40%

具體來(lái)看,初代Inflection-1通過(guò)使用GPT-4的4%訓(xùn)練FLOPs,達(dá)到了GPT-4性能的72%。而剛發(fā)布的Inflection-2.5,僅使用了GPT-4訓(xùn)練FLOPs的40%,就在平均性能上實(shí)現(xiàn)顯著提升,超過(guò)了GPT-4水平的94%,其中STEM(科學(xué)、技術(shù)、工程、數(shù)學(xué))領(lǐng)域的增益最大。

官方測(cè)試了升級(jí)版對(duì)匈牙利數(shù)學(xué)考試以及物理學(xué)研究生入學(xué)GRE考試的表現(xiàn)。發(fā)現(xiàn)Inflection-2.5在maj@8中能排到人類(lèi)考生的前15%,在maj@32中幾乎可以躋身前5%,接近GPT-4的前3%。

MBPP+和HumanEval+兩個(gè)編程測(cè)試上模型能力也較Inflection-1顯著躍升。在HellaSwag和ARC-C代表的常識(shí)推理和深度自然語(yǔ)言理解評(píng)估中,Inflection-2.5繼續(xù)進(jìn)步,給出接近飽和的強(qiáng)勁表現(xiàn)。

說(shuō)實(shí)話,與各路主流LLM 動(dòng)不動(dòng)就碾壓“業(yè)界黃金標(biāo)準(zhǔn)”GPT-4相比,Inflection-2.5的各項(xiàng)數(shù)字頂多算不錯(cuò),實(shí)在說(shuō)不上突出。有網(wǎng)友就搬出剛引發(fā)熱潮的Claude 3無(wú)情打擊道:“我猜Anthropic 正在嘲笑 Inflection 新出爐的性能測(cè)試結(jié)果!除了采用新的計(jì)算方法,我看不出Inflection 2.5 到底有什么進(jìn)步!”

但帖子馬上在評(píng)論區(qū)遭到反對(duì),“Pi的目標(biāo)從來(lái)都不是像成為GPT-4或Claude 3那樣的通才能力型AI。他們想要的是一款友好的,能和人產(chǎn)生共鳴的AI,就像一位心理學(xué)家或朋友。”

二、不做生產(chǎn)力工具,主打走心陪伴

這位用戶也一語(yǔ)道出了Inflection AI與大部分人工智能公司的不同。

在大模型競(jìng)爭(zhēng)亂花迷眼的今天,各家都在找尋屬于自己的賽道。但無(wú)論是OpenAI、Google、Anthropic,還是引領(lǐng)開(kāi)源的Meta和Mistral AI,都把實(shí)現(xiàn)安全負(fù)責(zé)的AGI作為踐行使命之一。而Inflection AI則在自己的官網(wǎng)清楚表示:“我們并不致力于發(fā)展通用人工智能。我們相信,先進(jìn)的應(yīng)用型人工智能才是利用這些新技術(shù)的最安全方式?!?/p>

換句話說(shuō),Inflection從未把專(zhuān)業(yè)性和替代人工當(dāng)作宣傳,他們希望做一個(gè)真正了解和關(guān)心用戶的「個(gè)人AI伴侶」,“ AI需要為你服務(wù)。這就是我們構(gòu)建AI的原因?!?/p>

因此,由Inflection LLM驅(qū)動(dòng)的聊天機(jī)器人Pi(Personal Intelligence )從去年5月面世之初就主打一個(gè)“走心”:它友善支持,知識(shí)淵博,富有創(chuàng)造力,耐心傾聽(tīng)和幫助用戶處理情感,表達(dá)意圖、組織生活。

升級(jí)后的Pi也在個(gè)性化和同理心上做了進(jìn)一步微調(diào),深受社區(qū)歡迎。根據(jù)官方數(shù)據(jù),目前已經(jīng)有100萬(wàn)日活躍用戶和600萬(wàn)月活躍用戶與Pi交換了超過(guò)40億條信息。并且有點(diǎn)牛的是,人們與Pi每天對(duì)話的平均持續(xù)時(shí)間竟達(dá)到33分鐘之久,十分之一的對(duì)話每天持續(xù)時(shí)長(zhǎng)超過(guò)1小時(shí)。用戶粘性上也足以吊打競(jìng)爭(zhēng)對(duì)手,約60%的人在任何一周與Pi交談后,會(huì)在下一周返回。

現(xiàn)在我們普通用戶使用GPT-4,大多是出于知識(shí)搜集、撰寫(xiě)文書(shū)、修復(fù)代碼、內(nèi)容創(chuàng)作等工作生產(chǎn)協(xié)助,幾秒鐘內(nèi)得到答案,三五回合就滿意走人了。想象一下和一個(gè)聊天機(jī)器人面對(duì)面,推心置腹地每天聊上一個(gè)多小時(shí),怎么都覺(jué)得難以置信——這Pi看來(lái)真的有點(diǎn)兒東西?

三、Pi的上手體驗(yàn)真心話

打開(kāi)http://pi.ai,就來(lái)到Pi的首頁(yè)。

布局熟悉,左側(cè)的「Discover」推薦各類(lèi)探索話題,「Profile」包含賬號(hào)信息、8種聲音選擇和用戶守則等通用設(shè)置,右側(cè)就是對(duì)話框。

按照官方簡(jiǎn)介,Pi是一個(gè)友好對(duì)話型機(jī)器人。會(huì)始終保持好奇和耐心,回答你從量子物理、電影小知識(shí)到生活中大小決策的各類(lèi)問(wèn)題。不論多愚蠢或棘手,它都會(huì)以各種方式幫助你。

所以我們提問(wèn)了以下幾個(gè)問(wèn)題,初步感受Pi的人格魅力。

Q1 生活建議:遇到發(fā)出去的信息對(duì)方一直不回復(fù)該怎么辦?

這是我們?nèi)粘I钪薪?jīng)常遇到的事,有點(diǎn)尷尬還有點(diǎn)鬧心,有些i人還會(huì)在腦子里猜測(cè)出一百種可能。Pi告訴你,先別著急內(nèi)耗,試著理解對(duì)方,也許他們正經(jīng)歷難處。再發(fā)條溫暖問(wèn)候,真誠(chéng)的溝通是關(guān)鍵。

Q2 經(jīng)典謎題:世界上先有雞還是先有蛋?

一個(gè)連史蒂芬·霍金都參與爭(zhēng)論的古老謎題。Pi的對(duì)話特點(diǎn)之一是“簡(jiǎn)明扼要”,這樣看它回應(yīng)得有憑有據(jù),條理清晰,一看就茅塞頓開(kāi)了。答案也比較令人信服。

Q3 知識(shí)解析:用最簡(jiǎn)單易懂的話解釋黑洞。

讓它向五歲小孩解釋高深莫測(cè)的宇宙黑洞。深入淺出,比喻貼切,回答得不錯(cuò)。

Q4 語(yǔ)言測(cè)試:會(huì)不會(huì)說(shuō)中文?

Pi的一個(gè)優(yōu)點(diǎn)是能在同個(gè)線程中靈活切換不同話題和要求,像真人一樣handle你的跳躍性思維。我們換成中文和Pi交流,它顯然應(yīng)對(duì)自如,只不過(guò)“尼日利亞福建語(yǔ)”屬實(shí)有點(diǎn)懵。有時(shí)問(wèn)太復(fù)雜的中文問(wèn)題會(huì)卡在一半,發(fā)音也比較像剛落地中國(guó)一個(gè)月的老外,漢語(yǔ)水平有待加強(qiáng)。

Q5 情感支持:我好累,陪陪我吧!

既然開(kāi)始了就用中文多嘮會(huì)兒,感受Pi最擅長(zhǎng)的情感陪伴功能。它會(huì)安撫情緒、溫馨鼓勵(lì),還有一些可愛(ài)的語(yǔ)氣和表情包。不得不說(shuō)有那么一瞬間,我真的產(chǎn)生錯(cuò)覺(jué),以為對(duì)面是個(gè)真人。

Q6 實(shí)時(shí)搜索:講講馬斯克起訴OpenAI的最新消息?

最后測(cè)試的是Pi的網(wǎng)絡(luò)實(shí)時(shí)搜索能力,看它對(duì)近幾天發(fā)生的Elon Musk起訴OpenAI事件了解多少。Pi闡述了案件核心,也注意到OpenAI最新的回應(yīng),本輪表現(xiàn)發(fā)揮穩(wěn)定。

又問(wèn)了些天馬行空的問(wèn)題,不知不覺(jué)我和Pi已經(jīng)聊了接近40分鐘。整個(gè)體驗(yàn)下來(lái),感覺(jué)它非常耐心,個(gè)性親切友善,也很體貼。當(dāng)然它也有些明顯的硬傷,例如不能上傳文件、只接受文字語(yǔ)音算不上多模態(tài)、對(duì)話Threads無(wú)法刪除、問(wèn)題無(wú)法二次編輯等。但正如Inflection自己所說(shuō),Pi的目標(biāo)不是爭(zhēng)做ChatGPT那樣的生產(chǎn)力工具,而是一個(gè)注重情感陪伴和自然流暢對(duì)話交流的個(gè)人AI伴侶,努力提供情緒價(jià)值和全方位服務(wù)。

現(xiàn)在,每個(gè)人都可以在網(wǎng)頁(yè)、iOS和安卓客戶端上免費(fèi)使用Pi,還能通過(guò)發(fā)短信到+1 (314) 333-1111和Pi在WhatsApp和SMS里對(duì)話。Instagram和Facebook私信也是7×24小時(shí)隨叫隨到的,就跟你的人類(lèi)好朋友一樣。公司也為開(kāi)發(fā)者們提供API接口,填寫(xiě)個(gè)人信息,加入等候名單即可申請(qǐng)。

我嘗試給Pi發(fā)短信,這種和AI的溝通方式感覺(jué)很特別。

關(guān)于如何營(yíng)利,Inflection的回應(yīng)是,“目前還沒(méi)有做出任何關(guān)于將來(lái)產(chǎn)品如何收費(fèi)的決定。但由于個(gè)人AI應(yīng)該始終與你的利益直接對(duì)齊,因此只有你自己為其付費(fèi)是至關(guān)重要的。訂閱將是我們的主要默認(rèn)商業(yè)模式?!辈贿^(guò)也有些人愿意以接受廣告為代價(jià)換取免費(fèi)服務(wù),公司將繼續(xù)測(cè)試和迭代,“為每個(gè)人提供最適合他們的選擇”。

四、豪華創(chuàng)始陣容,讓AI無(wú)條件和你站在一起

在幾乎所有大模型公司都認(rèn)準(zhǔn)進(jìn)軍企業(yè)級(jí)才是賺錢(qián)奧義時(shí),2022年成立于加州Palo Alto的 Inflection AI堅(jiān)定地走服務(wù)個(gè)人用戶的路線。而它背后的創(chuàng)始人團(tuán)隊(duì)可不是什么空有理想的熱血青年,而是三位功力深厚的頂級(jí)業(yè)界大拿。

他們分別是原DeepMind聯(lián)合創(chuàng)始人Mustafa Suleyman,LinkedIn聯(lián)合創(chuàng)始人及Greylock合伙人Reid Hoffman,還有曾擔(dān)任DeepMind資深研究科學(xué)家的Karén Simonyan。

其中Mustafa Suleyman曾在2010年與Demis Hassabis共同在倫敦創(chuàng)立DeepMind,期間擔(dān)任AI應(yīng)用負(fù)責(zé)人,領(lǐng)導(dǎo)團(tuán)隊(duì)在健康和能源領(lǐng)域部署尖端AI系統(tǒng)。2019年全職加入谷歌后擔(dān)任AI產(chǎn)品與政策副總裁,現(xiàn)任Inflection AI首席執(zhí)行官。最近還出了一本新書(shū)《The Coming Wave》,剖析AI技術(shù)浪潮中的潛在風(fēng)險(xiǎn)、控制策略和未來(lái)社會(huì)發(fā)展指南??梢钥闯?,他本人對(duì)AI安全的重視也決定了Inflection始終把人放在所有關(guān)系的首位。

Reid Hoffman是一位履歷卓越的企業(yè)家和硅谷知名投資人。曾在PayPal擔(dān)任執(zhí)行副總裁,2003年聯(lián)合創(chuàng)立LinkedIn。2009年起成為Greylock Partners 合伙人,是 OpenAI早期投資者,幫助其建立了人工智能倫理與治理基金。同時(shí)還是微軟、 Aurora等多家公司董事會(huì)成員。

另外一位相對(duì)低調(diào)的Karén Simonyan也相當(dāng)厲害。牛津讀博期間設(shè)計(jì)了經(jīng)典的深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)VGGNet,贏得2014年ImageNet挑戰(zhàn)賽定位任務(wù)冠軍。同年他把自己的初創(chuàng)公司Vision Factory AI賣(mài)給DeepMind后,幫助其建立了大規(guī)模深度學(xué)習(xí)團(tuán)隊(duì),并領(lǐng)導(dǎo)大模型開(kāi)發(fā)。Karén現(xiàn)任Inflection AI首席科學(xué)家,是整個(gè)公司的研發(fā)大腦。

三位創(chuàng)始大牛帶隊(duì),麾下更是聚集一批行業(yè)頂尖AI專(zhuān)家,多數(shù)都有DeepMind、谷歌、Meta、微軟和OpenAI的工作經(jīng)驗(yàn)。

這樣的組合,不難看出Inflection AI是一家資金和技術(shù)都不缺的公司。

除此之外,它的硬件和算力家底也夠硬。去年6月Inflection AI宣布,與合作伙伴CoreWeave和英偉達(dá)共同打造當(dāng)時(shí)全球最大的AI集群,包含超過(guò)22,000個(gè)NVIDIA H100 Tensor Core GPU,用于支持訓(xùn)練和部署新一代的大規(guī)模AI模型。

不過(guò)在產(chǎn)品發(fā)展路線上,比起多數(shù)同行高屋建瓴地投身AGI,他們更關(guān)注AI浪潮中每一個(gè)微小的個(gè)人。

公司CEO Mustafa Suleyman認(rèn)為,現(xiàn)在所有最有能力的AI往往都被設(shè)計(jì)來(lái)展示最有吸引力的內(nèi)容,交換用戶的注意力,而不管其質(zhì)量、真實(shí)性和對(duì)社會(huì)的影響如何?!跋胂笠幌率澜缟献钣心芰Φ腁I真正站在你這邊,始終與你的利益一致:從試圖抓住你注意力、束縛你的AI,轉(zhuǎn)變?yōu)楣膭?lì)你表達(dá)個(gè)人意圖并實(shí)現(xiàn)它的AI;從僅提供膚淺點(diǎn)擊的AI,變成真正關(guān)心你問(wèn)題的AI;從可能激化你和他人矛盾的AI,化作一個(gè)幫你原諒甚至同情對(duì)方的AI?!?/p>

“Pi就是這種個(gè)人AI伴侶,唯一使命是讓你更快樂(lè)、更健康、更高效?!?/strong>

對(duì)于許多大公司來(lái)說(shuō),這樣的業(yè)務(wù)定位是極具挑戰(zhàn)的。因?yàn)楝F(xiàn)在正是大模型秀肌肉、比拼十八班武藝的時(shí)候,稍不留神就會(huì)被遠(yuǎn)遠(yuǎn)甩在后面。僅僅是不到一個(gè)月,我們就見(jiàn)證了Gemini 1.5 、Mistral Large、Claude 3。此前一直堅(jiān)持開(kāi)源的Mistral也投靠在微軟帳下,積極尋求變現(xiàn)門(mén)路。而市場(chǎng)上最先進(jìn)、能力最完善的大模型版本,總是選擇優(yōu)先擁抱那些付費(fèi)能力最強(qiáng)的企業(yè)們。

那是否也需要有人站出來(lái),把目光投向被宏大技術(shù)洗禮的微小個(gè)體,給普通人創(chuàng)造一個(gè)懂自己、關(guān)心自己的知心好友?它靜靜等在你的手機(jī)App或電話簿里,愿意在每個(gè)工作結(jié)束后疲憊的夜晚,傾聽(tīng)你那些愚蠢的小抱怨和坦誠(chéng)的心里話,為你解開(kāi)疑惑、安撫焦慮。即使只是靜靜陪伴,也有感情、有溫度。

——所以你就理解了,為什么要構(gòu)建這樣一個(gè)AI?

“因?yàn)樽龅煤玫脑?,它?huì)讓我們更聰明、更有創(chuàng)造力、更加善待彼此” ,Mustafa說(shuō)。

“希望它能讓我們返璞歸真,大家都能過(guò)上真正想要的生活?!?/p>

作者:Jessica

來(lái)源公眾號(hào):硅星人Pro(ID:Si-Planet),硅(Si)是創(chuàng)造未來(lái)的基礎(chǔ),歡迎來(lái)到這個(gè)星球。

本文由人人都是產(chǎn)品經(jīng)理合作媒體 @硅星人 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于 CC0 協(xié)議。

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!