免費,才是最強殺招

0 評論 1839 瀏覽 2 收藏 17 分鐘

本文深入探討了OpenAI最新發(fā)布的GPT-4o模型,這一全能大模型在多模態(tài)輸入輸出上實現(xiàn)了重大突破,不僅在效率、性能上大幅提升,而且對交互性進行了革命性的改進。文章詳細分析了GPT-4o的強大功能,并對其免費開放策略進行了深入解讀,展望了這一技術(shù)進步如何推動社會財富的增長和新時代的適應(yīng)。對于關(guān)注AI技術(shù)發(fā)展及其對社會影響的讀者來說,本文提供了獨到的見解和前瞻性思考。

科技巨頭之間的競爭,越來越不講武德了。

原本,OpenAI的“春季新品發(fā)布會”定于5月9號,結(jié)果硬生生拖到了現(xiàn)在。

為什么呢?因為谷歌明天開開發(fā)者大會……

就是要騎臉輸出,不給友商任何活路!

于是今天凌晨1點,山姆·奧特曼口中“就像魔法一樣的東西”,終于揭開了面紗。

不是大家想象中的GPT-5,而是GPT-4的迭代版本,GPT-4o。

o是omni的縮寫,源于拉丁語的omnis,意思是無所不在、無所不知、無所不能。

聽起來神神叨叨的,頗有點佛祖、上帝的味道。

GPT-4o,也就是全能大模型。

全能?這就很有意思了。

一、強在哪里

所謂全能,當然不是真的指全知全能。

至少現(xiàn)在不可能。

如果人造“上帝”真的被造出來,我們所有人都可以立刻躺平、混吃等死了,統(tǒng)治世界or解放世界都在這家伙的一念之間。

目前的GPT-4o,能做到的是文字、圖像、音頻、視頻任意組合的全模態(tài)。

OpenAI的原話是:GPT-4o是第一個融合所有模態(tài)的模型,我們只是觸及到其能力的表面。

盡管只是表面,但也極其強大了。

先看橫向測評。

簡單總結(jié)就是:更快、更強、更便宜。

首先是效率。GPT-4o 的處理速度是 GPT-4 Turbo 的兩倍,速率限制提高了五倍,最高達到1000萬token/分鐘,價格還降低了一半。

其次是性能。在所有語言基準測試中,GPT-4o都比GPT-4更強大,還能在50多種語言之間無縫翻譯。

然后是最重要的一點:多模態(tài)輸入輸出。

GPT-4o 能夠處理文本、音頻和圖像的任意組合輸入,并實時生成相應(yīng)的輸出與用戶互動。

注意,是實時!實時!

下面再看看其具體表現(xiàn)。

發(fā)布會上,測試者對著手機說:我第一次來直播,有點緊張。

ChatGPT立刻回答:你可以深呼吸。

男子照辦。

ChatGPT立刻又開玩笑道:你不是吸塵器吧,不要喘。

當聽到對方終于平穩(wěn)呼吸時,它居然還會開口鼓勵。

看到這,蘋果手機用戶很快就能察覺出有啥不同了。

我們此前用的Siri之類的語音助手,反饋慢倒還罷了,你還必須要等它說完,才能進行下一輪對話。

非常呆板,且浪費時間。

其實這也正常,它畢竟只是個很原始的程序。

之前我們與AI對話,都要經(jīng)歷3個步驟:

1.人說話,AI將音頻轉(zhuǎn)成文本代碼;

2.AI回答它自己翻譯的這段文本;

3.將回復(fù)的內(nèi)容轉(zhuǎn)化成音頻輸出。

這就相當于一來一回的回合制,不論怎么樣都會有延遲,現(xiàn)在業(yè)界最快的反應(yīng)速度是2秒。

別的先不說,至少用戶很難有真實交流的沉浸感。

但用GPT-4o,平均反應(yīng)時間只有0.32秒,基本就是你剛問完、它立刻就能回答你,和真人聊天沒啥區(qū)別。

更關(guān)鍵的是什么?

因為人與人之間對話,是充滿了各種即時反應(yīng)的,比如嗯嗯啊啊各種預(yù)期助詞,以及手勢、停頓、咽口水等等。

但你過去與AI 聊天,卻根本不會存在這些因素,即便AI回答得再完美,你依然無法擁有沉浸感。

而現(xiàn)在,你不僅能隨時打斷GPT-4o,它甚至能根據(jù)你的語速、語調(diào)、呼吸乃至面部表情來判斷你的情緒,并依次表達出對應(yīng)的情緒。

這就很Nice了。

不僅僅只是語音對答,GPT-4o的文本、音頻、視頻所有輸入和輸出,都由同一個神經(jīng)網(wǎng)絡(luò)處理。

也就是說,它在各種維度上,都能有同樣強大的表現(xiàn)。

簡單來說,就是GPT在能看、能聽、能說話方面,更加“通人性”了。

它不一定真的懂情感這回事,但能夠模仿。

現(xiàn)階段而言,只要能模仿就夠了,完全夠投入商用了。

以上種種,你覺得意味著什么?

意味著ChatGPT在交互性上,又做出了巨大突破。

比如,你可以在睡前,要求GPT用女神的聲音、舔狗的語氣,講故事、唱歌哄你入眠。

又比如,你可以把自己的日常資料發(fā)給GPT,讓它根據(jù)每天的天氣、突發(fā)事件等等狀況,生成工作、生活計劃。

乃至輔導(dǎo)小孩寫作業(yè)等等等等……

千萬不要小看交互性,它的價值遠超想象。

二、為什么免費

除了功能強大,GPT-4o更讓人關(guān)注的是什么?

免費!

不僅僅是 GPT-4o 免費,更刺激的是 GPT Store、Vision (包含代碼解釋器、聯(lián)網(wǎng)功能等),都會陸續(xù)開放出來。

為了讓用戶們用得方便,新版ChatGPT還開放了桌面端。

關(guān)于這一點,山姆·奧特曼專門發(fā)了博客說明:

OpenAI的核心使命之一,就是免費為人類提供頂尖的AI工具,為世界創(chuàng)造各種利益,讓所有人從中受益。在未來,所有人都能免費獲得 GPT 的算力,可以使用、轉(zhuǎn)售或捐贈。

你們之前批評我不開源,現(xiàn)在我直接免費,甚至都不用注冊,還有話說嗎?

按照我們的商業(yè)邏輯來看,這不是純純的做慈善?

當然不是,至少不完全是。

首先,新模型變小了,運行成本大幅降低。

前文提到過:GPT 4o處理速度翻倍,價格只有GPT 4 Turbo的一半。

原先輸入、輸出一百萬token的價格是10、30美元,現(xiàn)在則只要5、15美元。

其次,是先舍后得的商業(yè)邏輯。

免費是有限制的。

官方文檔里都說了,免費用戶目前每3個小時只能使用10條GPT-4o,用完了就回落到GPT-3.5版本。

10條,夠什么用的?

想繼續(xù)玩?想玩得爽?給我充錢!

只要20美刀/月,你就能成為尊貴的plus會員,每小時能享用80條GPT-4o!

這簡直!太不劃算了!

就目前的情況而言、對絕大部分人而言,你只要不是無聊到什么都去試著玩,每3小時10條內(nèi)容完全是足夠了。

照OpenAI這么搞,如今ChatGPT的忠實付費用戶(原來免費的只能使用GPT-3.4),恐怕都不會充錢了。

為什么OpenAI 要承擔丟失付費會員的風險,去給全民提供免費服務(wù)?

其實,我們的目光可以放長遠一點。

想想看,人人都能免費用上高質(zhì)量的AI,這意味著什么?

你如果悲觀地去看,這很可能對現(xiàn)在社會的分工結(jié)構(gòu)造成重大沖擊,造成廣泛的失業(yè)潮。

看到這里,別的不敢說,我們至少能確定一件事:除非自己感興趣,以后的小孩都不用再學英語了。

GPT-4o完全可以做到各種口譯、同聲傳譯,甚至還帶感情、帶理解。

除此之外,大量的普通家庭教師、程序員、設(shè)計師等等,基本都會被取代。

這是不可避免的事。

但就像前幾次技術(shù)革命一樣,在一些行業(yè)消亡的同時,一定會有新的財富風口出現(xiàn),整個社會的財富總量必然是增加的。

樂觀點看,就是另一回事。

三、財富大爆炸

《易經(jīng)》“乾”卦“用九”:見群龍無首,吉。

王陽明也曾說:人人心中有仲尼。心之良知之謂圣。

真正偉大的時代,應(yīng)該是人人平等、人人如龍、人人成圣的。

從古至今,這都只能是幻想,但如果能善用AI、善用工具,我們未必不能接近這種境界。

其實從GPT-3.5→GPT-4→GPT-4o,我們能很明顯概念感受到,OpenAI想干什么:

他們要讓GPT這個人造大腦,越來越符合“人”的標準。

人是什么?

人不僅僅是勞動力,不論是什么時候、用什么工具,人才是創(chuàng)造財富的主體。

隨著多模態(tài)越來越完善,現(xiàn)有的部分行業(yè)將會被怎樣改變?

我們的主要關(guān)注點應(yīng)該在娛樂方面。

因為物質(zhì)世界的體力勞動必然與人類越來越遠,人類創(chuàng)造財富的方向肯定將加速集中在精神方面。

從之前投資Descript的舉動可以看出,OpenAI早就有意把AI技術(shù)引入到影視創(chuàng)作領(lǐng)域。

即便他們不這么干,其他的影視公司也一定會干。

因為未來的趨勢就是——“交互式傳媒”。

你可以把這種模式,理解為短視頻,每個人都是創(chuàng)作者,沒有誰更專業(yè)一說。

各種短視頻平臺上,如今已經(jīng)充斥著大量AI制造的內(nèi)容。以前我們還能看得出來,現(xiàn)在越來越逼真。

而以后,只要你善用能模仿人情感的多模態(tài)大模型,創(chuàng)造出的內(nèi)容也將徹底脫離“機械感”。

每個人都是最佳導(dǎo)演,一天拍十幾部大片都沒問題。

想要出圈,就看誰的點子更有新意,更迎合受眾口味。

與之相對的,各種影視公司,包括現(xiàn)在的一大堆流量明星,都將沒有任何發(fā)展空間。

未來,能存活下來的,只有平臺,和無數(shù)個個人。

除了影視之外,包括音樂、動漫、游戲等任何具備消費價值的娛樂領(lǐng)域,都將變得一樣:

去中心化。

每個人都是完美的音樂家、漫畫家、游戲設(shè)計師,只要你有足夠的耐心。

你能想象,這些將催化多大的市場嗎?

以游戲為例,到2025年,全球?qū)⒂?5.3億游戲玩家。數(shù)十億人,有多少千奇百怪的點子?

以前,99%人限于技術(shù),只是單純的玩家,屬于被收割者,只有游戲公司賺錢。

從市場的角度考慮,這個發(fā)展效率是非常低下的。

以后,就相當于是這35億人相互買單,金錢流通速度何止提升10倍!?

再比如社交媒體。

從前是沒有技術(shù),當網(wǎng)友分享他的游戲、電影、音樂交互體驗后,其他用戶除了評論就沒啥后續(xù)了。

但以后,我們都能在此基礎(chǔ)上,讓AI定制自己的二次體驗,不論是語音、視頻還是漫畫形式,與其他人分享。

然后其他人看到了,再定制,再分享……

就這樣病毒式傳播。

這些描述,很像去年底炒作的Web3.0概念。

它的目的,是創(chuàng)造一個去中心化、交互式的互聯(lián)網(wǎng)世界,打破已經(jīng)見頂?shù)幕ヂ?lián)網(wǎng)現(xiàn)有桎梏。

它的驅(qū)動力,就是多模態(tài)大模型、乃至以后真正完善五感的更高級AI。

擁有五感的GPT,不僅僅是一種技術(shù)進步,更是現(xiàn)代商業(yè)社會的一次徹底的娛樂、消費、社交革命。

總而言之,讓每個人都能免費使用頂級AI,就相當于把生產(chǎn)力賦能給每個人,每個人的價值將進一步凸顯,整個互聯(lián)網(wǎng)世界也將創(chuàng)造出更大的價值。

等到你發(fā)現(xiàn)其中的財富效應(yīng),乃至未來大多數(shù)人或許都要在這樣的大環(huán)境中生活……

等到AI真正成為每個人創(chuàng)造財富的重要工具,3小時使用10條GPT-4o,你還覺得夠嗎?

每個月20美刀的會員費,你還覺得貴嗎?

就算再貴十倍,你也心甘情愿搶著買!

我們真正應(yīng)該擔心的,不應(yīng)該是這點雞毛蒜皮的事,而是:AI 科技的推進速度太快,你有沒有意識到要去適應(yīng)新時代。

千萬不要做落后的那一批人。

本文由人人都是產(chǎn)品經(jīng)理作者【格隆匯】,微信公眾號:【格隆匯APP】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!