GPT-4o再秀神操作,“復(fù)現(xiàn)”O(jiān)penAI總裁講課,網(wǎng)友當(dāng)真了
最近,OpenAI總裁兼聯(lián)合創(chuàng)始人Greg秀了一波GPT-4o操作,結(jié)果不少用戶開始緬懷起了DALL-E。那么,GPT-4o的圖像生成能力,究竟怎么樣?
再見了,DALL-E!
OpenAI總裁兼聯(lián)合創(chuàng)始人Greg再次大秀GPT-4o操作,結(jié)果網(wǎng)友直接緬懷DALL-E。
直接看效果。
文本拼寫達(dá)到驚人的一致!手部細(xì)節(jié)、光照全都有,甚至后背上的Logo也完全正確。
有網(wǎng)友表示:恍惚間還以為真的是本人在講課。
也有人感嘆圖像生成技術(shù)發(fā)展的飛躍:Holy Cow!
從完全破碎的文本到風(fēng)格一致、拼寫正確的寫作,只用了一次迭代。
一、GPT-4o讓網(wǎng)友直接緬懷DALL-E
GPT-4o發(fā)布以來,簡直就被玩兒瘋了,尤其是圖像生成這塊。
比如有網(wǎng)友發(fā)現(xiàn),GPT-4o在組合任意圖像上面就像是打通了任督二脈。
給它兩張完全不相干的圖。
結(jié)果搖身一變,“悲傷蛙版的麥片”,這不廣告設(shè)計公司直接可以用了。
不過像生成統(tǒng)計圖,就有點(diǎn)子翻車…比如這個,將正態(tài)分布的前 10%染成紅色,就沒有完成。
還有更翻車的效果……
于是乎,就有人認(rèn)為這應(yīng)該是DALL-E,GPT-4o現(xiàn)在還沒辦法生成圖像。
如今Greg親自下場展現(xiàn)GPT-4o的圖像生成效果,應(yīng)該也算是一種回應(yīng)。
當(dāng)然在評論區(qū)有網(wǎng)友質(zhì)疑:這確定是同一個版本嗎?能不能給完整的提示?
但不管怎么說,OpenAI這次免費(fèi)大開放,讓更多的人探索到GPT-4o的能力。
比如在上下文能力上面,有網(wǎng)友發(fā)現(xiàn)它就比GPT-4-Turbo好太多。
而在從情景對話這個場景中,GPT-4o也比ChatGPT更樂意談?wù)撟约旱母惺芎鸵庾R。
二、Omni團(tuán)隊大揭秘
Omni團(tuán)隊負(fù)責(zé)人Prafulla Dhariwal也在社交網(wǎng)絡(luò)上表達(dá)了自己團(tuán)隊成員的感謝,并坦言這項工作是從一年前開始的。
Prafulla Dhariwal本科畢業(yè)于MIT,隨后就前往OpenAI已經(jīng)待了7個年頭。
他首先表示GPT-4o是他們團(tuán)隊推出的第一個模型,也是OpenAI首個原生多模態(tài)大模型。
隨后就來了一個團(tuán)隊大點(diǎn)名。
James Betker,負(fù)責(zé)圖像和音頻生成、數(shù)據(jù)準(zhǔn)備、集成以及后續(xù)訓(xùn)練。
Jamie Kiros:負(fù)責(zé)GPT-4o的視覺感知。
Rowan Zellers:讓模型/產(chǎn)品能夠像人類一樣自然地觀看視頻。
Alexis Conneau:首個在OpenAI提出Her愿景的人。他在個人簡介中提到是音頻AGI主管。
Gabriel Goh、Ishaan Gulrajani:負(fù)責(zé)Scaling Law相關(guān)的工作。
Alex Nichol、Heewoo Jun、Li JING,保障GPT-4o的圖像生成、3D生成的能力。
……
隨后奧特曼也隨手一個轉(zhuǎn)發(fā)評價,并表示這項工作引發(fā)了一場革命,它能改變我們使用計算機(jī)的方式。
所以,有使用過GPT-4o的朋友嗎?歡迎在評論區(qū)分享你們的體驗。
參考鏈接:
[1]https://twitter.com/gdb/status/1790869434174746805
[2]https://twitter.com/sama/status/1790816449180876804
作者:白交 發(fā)自 凹非寺
來源公眾號:量子位(ID:QbitAI),追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @量子位 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!