GPT-4o手寫(xiě)板書(shū)以假亂真驚呆網(wǎng)友!殺死谷歌翻譯,代碼建模無(wú)所不能

0 評(píng)論 1067 瀏覽 1 收藏 13 分鐘

GPT-4o到底有多強(qiáng)?只有用過(guò)才能知道。這兩天,網(wǎng)友們不僅探索出了很多全新ChatGPT的炫酷用法,也逐漸開(kāi)始意識(shí)到,這標(biāo)志這OpenAI將逐漸替代谷歌曾經(jīng)的地位,全面接管AGI時(shí)代。

隨著越來(lái)越多人開(kāi)始試用GPT-4o,大家發(fā)現(xiàn)發(fā)布會(huì)上的demo真的只是冰山一角,官方后續(xù)發(fā)出的用例以及網(wǎng)友們的整活才是更精彩的部分。

生成手寫(xiě)體文字

OpenAI聯(lián)創(chuàng)Greg Brockman今天po出一張GPT-4o生成的圖片,他興奮地宣布:

「僅用GPT-4o的圖像生成功能就可以探索很多東西。團(tuán)隊(duì)正在努力將這些內(nèi)容推向世界」

可以看到,這張圖片中,黑板上的手寫(xiě)體達(dá)到了以假亂真的程度!

網(wǎng)友表示,看到這張圖片的一瞬間還以為是Greg講座現(xiàn)場(chǎng)的板書(shū)呢。

不知道筆跡專家看到了會(huì)作何感想,是否能讀解出這面黑板上「機(jī)器書(shū)寫(xiě)」背后的人格特征呢?

看來(lái)GPT-4o不僅能模仿人類的語(yǔ)音語(yǔ)調(diào),連字體也開(kāi)始向人類手寫(xiě)體接近了。

1分鐘從屏幕截圖生成視頻游戲

推特網(wǎng)友從網(wǎng)上找了一張Breakout游戲的截圖,丟給ChatGPT并問(wèn)它「你能把這個(gè)用Python編碼出來(lái)嗎?」

一分鐘之后,ChatGPT就生成了一份沒(méi)有bug、可以直接執(zhí)行的Python文件,完全復(fù)刻了截圖的效果。

而且Breakout這個(gè)游戲也是大有來(lái)頭,是一款1976年雅達(dá)利公司發(fā)行的街機(jī)視頻游戲,Steve Jobs和Steve Wozniak曾經(jīng)參與設(shè)計(jì)和開(kāi)發(fā)工作。

用文字提示進(jìn)行3D建模

前幾天,有人曾經(jīng)放出用GPT-4o將平面圖片進(jìn)行3D重建的之后的效果,已經(jīng)十分驚艷。

但沒(méi)想到,GPT-4o生成3D效果甚至都不需要給它平面圖片,一段文字提示就夠了,比如下面這個(gè)用戶讓ChatGPT創(chuàng)建一個(gè)STL文件,建模一個(gè)有四條腿的桌子,并添加一些隨機(jī)特征。

ChatGPT不僅能給你渲染出的3D效果圖,還能馬上出一份原始的STL文件,就不用自己費(fèi)力從頭開(kāi)始建模了。

這一版ChatGPT的更新就是瞄準(zhǔn)了個(gè)人AI助手的方向,工作狂Sam Altman最近在接受采訪時(shí),也分享了自己使用ChatGPT提高工作效率的方法。

他說(shuō),在電腦上工作時(shí),想搜索一些東西就不得不在頁(yè)面之間不斷切換。有了ChatGPT在旁邊,就可以「隨叫隨到」直接問(wèn)它,讓自己能始終保持在專注的狀態(tài)。

一、GPT-4o vs. 谷歌翻譯

OpenAI的發(fā)布會(huì)展示了GPT-4o的實(shí)時(shí)翻譯能力,實(shí)現(xiàn)了英語(yǔ)和意大利語(yǔ)之間的無(wú)縫轉(zhuǎn)換,幾乎沒(méi)有響應(yīng)延遲,讓網(wǎng)友再次驚呼「翻譯要失業(yè)了」,這次連同聲傳譯行業(yè)也要一鍋端了。

與此同時(shí),也掀起了一場(chǎng)和谷歌翻譯之間的較量。

有網(wǎng)友表示「谷歌和三星在手機(jī)上開(kāi)發(fā)過(guò)類似的功能,但是做得很爛。你必須要說(shuō)得很慢,而且確保吐字清晰,不然識(shí)別出的文本就會(huì)一團(tuán)糟,也得不到正確的翻譯?!?/p>

谷歌翻譯到了要和大家說(shuō)再見(jiàn)的時(shí)候了嗎?隨著OpenAI的語(yǔ)言能力不斷擴(kuò)展,這并非完全沒(méi)有可能。

GPT-4o使用了新的分詞器,不僅英語(yǔ)的效率更高(token減少了1.1倍),而且還提高了許多其他語(yǔ)言的使用效率。

Greg Brockman發(fā)文稱「我們還顯著提高了非英語(yǔ)語(yǔ)言的性能,包括改進(jìn)分詞器以更好地壓縮其中的許多語(yǔ)言」。

OpenAI現(xiàn)在支持50多種語(yǔ)言,從Greg Brockman放出的圖片中可以看出,包括阿拉伯語(yǔ)、俄語(yǔ)、印地語(yǔ)在內(nèi)的多種語(yǔ)言的token數(shù)量都得到了壓縮。

但是,OpenAI的翻譯功能也并非無(wú)懈可擊,有很多網(wǎng)友質(zhì)疑發(fā)布會(huì)上ChatGPT生成的意大利語(yǔ)聽(tīng)起來(lái)有點(diǎn)奇怪。

于是有意大利用戶在線答疑,「其實(shí)這不是一種口音,只不過(guò)是AI語(yǔ)音在單詞之間插入了間隙。說(shuō)英語(yǔ)時(shí)還好,但在意大利語(yǔ)中,這聽(tīng)起來(lái)非常奇怪和呆板,因?yàn)樗鼣_亂了節(jié)奏。」

更要命的是,GPT-4o分詞器語(yǔ)料庫(kù)中,中文數(shù)據(jù)污染非常嚴(yán)重。

有老哥寫(xiě)了個(gè)腳本篩選ChatGPT新詞表中最長(zhǎng)的100個(gè)中文字符,結(jié)果發(fā)現(xiàn)里面大部分賭博網(wǎng)站廣告,剩下一小部分是色情網(wǎng)站廣告。

面對(duì)這種景象,網(wǎng)友不禁感嘆「為什么GPT-4o如此horny?」

既然這樣,還是多用GPT-4o「練習(xí)練習(xí)英語(yǔ)」吧。

二、「后瀏覽器世界」:ChatGPT后再無(wú)谷歌搜索

OpenAI同時(shí)發(fā)布了兩項(xiàng)成果:GPT-4o及其新的ChatGPT桌面應(yīng)用程序。有專家預(yù)測(cè),雖然 GPT-4o因其多模態(tài)而大放異彩,賺足了眼球,但桌面應(yīng)用程序才有可能真正挑戰(zhàn)谷歌主導(dǎo)地位,改變當(dāng)今互聯(lián)網(wǎng)的形態(tài)。

GPT-4o的主要特點(diǎn)是多模態(tài)和低成本的低延遲,實(shí)現(xiàn)了人機(jī)之間更自然的對(duì)話和交互,而且與GPT-4Turbo相比似乎有了模型能力和智能的增長(zhǎng)。

但當(dāng)我們回顧幾年后的2024年5月13日時(shí),最重要的消息可能是ChatGPT桌面應(yīng)用程序。

ChatGPT桌面應(yīng)用程序?qū)⑾葘?duì)MacOS適用,隨后推出Windows版本,目前官網(wǎng)已發(fā)布了移動(dòng)端iOS和安卓系統(tǒng)的下載鏈接。

該應(yīng)用程序可以快速訪問(wèn)ChatGPT,并且你可以選擇讓它「透視」你的屏幕,實(shí)現(xiàn)「看你所看」,還可以像使用ChatGPT一樣,和它實(shí)時(shí)語(yǔ)音交互。

這完全超出了傳統(tǒng)瀏覽器的功能想象,從瀏覽器進(jìn)入桌面,OpenAI邁出的這一小步,有可能是人機(jī)交互方式向前發(fā)展的一大步,OpenAI希望的,是完成一場(chǎng)「搜索革命」。

OpenAI希望擺脫瀏覽器并進(jìn)入桌面

瀏覽器是舊的互聯(lián)網(wǎng),萬(wàn)維網(wǎng)的世界是谷歌的主場(chǎng)。

但OpenAI對(duì)這種舊的方式say no,它帶來(lái)是一種使用計(jì)算機(jī)和網(wǎng)絡(luò)的新方式——一個(gè)可以為用戶完成一切的助手,用戶需要什么,只需大聲說(shuō)出來(lái)。

Sam Altman在他關(guān)于GPT-4o的博客文章中明確表示「對(duì)我來(lái)說(shuō),與計(jì)算機(jī)對(duì)話從來(lái)沒(méi)有感覺(jué)很自然,但現(xiàn)在情況發(fā)生了改變。隨著我們?cè)黾樱蛇x的)個(gè)性化功能、訪問(wèn)你的信息、協(xié)助你采取行動(dòng),我真的看到了一個(gè)令人興奮的未來(lái),我們能夠利用計(jì)算機(jī)做比以往更多的事情?!?/p>

ChatGPT桌面應(yīng)用程序可以獲取訪問(wèn)麥克風(fēng)、攝像頭、文件、登錄信息以及用戶屏幕的權(quán)限,是「?jìng)€(gè)人助手」的最佳位置。

有了這個(gè)「助手」,即使是智能手機(jī)用戶,也很難被谷歌和網(wǎng)絡(luò)所吸引。

在這種與計(jì)算機(jī)交互的新方式中,萬(wàn)維網(wǎng)幾乎沒(méi)有立足之地。充其量,它充當(dāng)?shù)氖切畔⒌奶峁┱摺?/p>

事實(shí)上,OpenAI將自己定位為聊天機(jī)器人生態(tài)系統(tǒng)的看門人,它推出了「出版商優(yōu)選計(jì)劃」,正在把選定的媒體機(jī)構(gòu)發(fā)展成為合作伙伴,美聯(lián)社、Axel Springer、金融時(shí)報(bào)、世界報(bào)等媒體已加入該計(jì)劃。

如果OpenAI 成功(目前還無(wú)法確定),那么它對(duì)我們信息生態(tài)系統(tǒng)的市場(chǎng)影響力將遠(yuǎn)遠(yuǎn)超過(guò)今天的谷歌。

參考資料:

https://x.com/gdb/status/1790869434174746805

https://analyticsindiamag.com/openai-just-killed-google-translate-with-gpt-4o/

https://the-decoder.com/openais-most-important-message-isnt-gpt-4o-its-the-post-browser-world/

https://x.com/rowancheung/status/1790783202639978593

https://x.com/tianle_cai/status/1790109646205890723

https://x.com/sherwinwu/status/1790854473260388814

https://x.com/op7418/status/1790292330156863964

https://www.reddit.com/r/singularity/comments/1cse5j7/major_issue_discovered_in_gpt4o_the_new_optimized/

https://the-decoder.com/openai-thinks-it-knows-what-media-is-high-quality-and-thats-a-problem/

編輯:?jiǎn)虠?庸庸

來(lái)源公眾號(hào):新智元(ID:AI_era),“智能+”中國(guó)主平臺(tái),致力于推動(dòng)中國(guó)從“互聯(lián)網(wǎng)+”邁向“智能+”。

本文由人人都是產(chǎn)品經(jīng)理合作媒體 @新智元 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自 Unsplash,基于 CC0 協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!