OpenAI一夜顛覆AI繪畫!DALL·E 3+ChatGPT強強聯合,畫面直接細節爆炸

2 評論 4229 瀏覽 33 收藏 14 分鐘

可以看到,最新發布的DALL·E 3,不僅省去了提示詞工程,還把語言理解能力提升了一個檔次。具體DALL·E 3展示的效果體現出了哪些能力和細節?一起跟著作者來看看吧。

起猛了,OpenAI竟然把AI繪畫ChatGPT合 并 了!

這不,最新發布的DALL·E 3,直接給AIGC帶來了兩大震撼——

  • 提示詞門檻極大降低
  • 理解語意的細微差異的細節描述,準確到令人發指

沒錯,新版DALL·E 3,不僅省去了提示詞工程,還順帶把語言理解能力提升了一個檔次!

你只管隨意想象。,ChatGPT幫你拓展;,DALL·E 3給你精確到細節。

AI就能像拍電影一般,保證從背景到人物,細節一字不差地復刻出來:

滿月下的街道,熙熙攘攘的行人正在享受繁華夜生活。

街角攤位上,一位有著火紅頭發、穿著標志性天鵝絨斗篷的年輕女子,正在和脾氣暴躁的老小販討價還價。

這個脾氣暴躁的小販身材高大,老道,身著一套整潔西裝,留著引人注目的小胡子,正在用他那部蒸汽朋克式的電話興致勃勃地交談。

除了基礎細節,DALL·E 3甚至能將模糊的形容詞如繁華、討價還價、脾氣暴躁演繹得活靈活現,和CLIP已經不在一個檔次了。

同時,相比上一代老模型,DALL·E 3自身的畫技也前進了一大步:

這般操作,直接把網友看愣了。

有網友已經決定取消Midjourney訂閱了。“如果Midjourney無法準確理解文本,這甚至稱不上是同臺競技?!?/p>

還有網友調侃,這簡直就是給即將到來的谷歌Gemini上壓力。

更多細節,我們從DALL·E 3展示的效果一一來看。

一、在ChatGPT里直接用

相比前兩代,DALL·E 3最大的優勢在于原生構建在ChatGPT之上。

不僅意味著語言理解能力大幅飛躍,甚至提示詞都可以讓ChatGPT自己來寫。

更多細節藏在奧特曼都忍不住自夸可愛的宣傳視頻里。

這是一個家長把5歲小朋友腦海里的幻想變成現實的故事。

首先家長詢問ChatGPT,“我家5歲寶寶一直在說一個’超級向日葵刺猬’,它該長什么樣?”

可以看到ChatGPT同時寫了四段不同風格的提示詞,并給出對應圖像。

家長選擇其中偏童話插圖風格的一張后,故事的主角小刺猬形象似乎就能固定下來了,可以繼續請ChatGPT畫出更多。

順便給小刺猬一個名字Larry,后面的對話中就不用每次都說“超級向日葵刺猬”了。

主角定好了,接下來再添加更多元素,讓整個童話故事更豐富,比如給Larry畫個房子。

這里既展示出了DALL·E 3創作一致形象的能力,也展示出郵箱上正確寫上了LARRY的名字,解決了之前版本DALL·E不會寫字的問題。

反正都用上ChatGPT了,不如把故事情節也完善一下?

剛編好的情節立馬就可以有配套的插畫了。

保持角色形象,遷移到完全不同的貼紙畫風也沒問題,可以直接打印出來。

注意了,最絕的地方來了,直接讓ChatGPT總結前面對話中所有內容,寫成一個完整的睡前故事。

雖然演示到此結束,但完全可以想象配合ChatGPT插件功能,還可以直接生成一本電子書出來。

就讓人想起之前網友提議,確保AI安全的最佳方法是讓OpenAI、Anthropic等公司的員工都有孩子。

這樣他們就有動力確保AGI到來時世界是安全的。(手動狗頭)

雖然DALL·E 3現在還不能馬上玩到,一次放出的大量樣張也可以先看個飽了。

每一張點開還可以看到提示詞,都是直接用人話描述,沒怎么加復雜咒語的那種。

復雜場景與不存在的概念組合,效果很驚艷。

搞室內設計概念圖,光影明暗關系乍看也挑不出毛病。

配合正確寫字能力,直出海報也是生產力拉滿(沒指定文字的小字部分還有些問題)。

剛加入OpenAI不久的德撲AI之父Noam Brown也曬出了他試玩的機器人打牌圖。

CEO奧特曼最喜歡的則是這張“牛油果看醫生”。

有網友去試了同樣的提示詞用在DALL·E 2的效果,只能說字也不對、牛油果中間的洞沒話出來,治療是更是沒有……

還記得2021年1月DALL·E 1剛出的時候嗎?夢開始的地方就是一組“牛油果做的沙發”。

也難怪網友感嘆:看看它走了多遠!

二、“如有侵權,請來刪圖”

當然,除了上述特性以外,OpenAI也預告了一些神奇的新功能。

例如,DALL·E 3即將配套推出一個圖像鑒別器。

這個分類器可以幫助識別圖像是否由DALL·E 3生成,不僅能避免誤傷(手動狗頭),也能在DALL·E創作出好作品時快速將它認領成自己的。

至于在生成圖像上,OpenAI自述也做了大量工作,防止其生成暴力、色情或其他有害圖片,或是帶有公眾人物(明星、名人等)姓名的圖像生成。

關于隱私方面,之前紐約時報就曾爆料稱,OpenAI正在通過某些技術,模糊掉上傳到ChatGPT的圖像中的人臉。

這也是為了避免ChatGPT變成一個徹底的“人臉識別工具”,尤其是已經有不少照片流傳到互聯網上的名人明星們。

如今這個技術可能也被用到了DALL·E 3中,防止生成侵權圖像。

同時,OpenAI也與安全紅隊合作,提高了圖像風險評估的能力。

除此之外,在訓練數據上,有了Midjourney的“前車之鑒”,OpenAI這次也學會了保護自己。

相比于直接和畫手打官司、或者等著被起訴,OpenAI在官網放出了一則訓練數據“免責聲明”

您可以填寫表格,禁止我們的網絡爬蟲GPTBot訪問您的網站?;蛘?,您也可以發送您想要保護隱私的圖像,我們會把它從訓練數據中刪掉。

不過也有網友對DALL·E 3演示效果不滿意,認為比不上MidJourney資深玩家出的圖,OpenAI的資金可是充裕n多倍啊。

還有網友開啟列文虎克模式,開始挨個挑演示圖中漏掉的提示詞細節。

比如這張杯子里缺少微型閃電。

這張散落在海底的只有大炮殘骸,沒有寶藏。

具體這些問題能不能通過調整提示詞改善,就要等實際上手玩過才知道了。

那么DALL·E 3具體什么時候上線呢?劃重點了:

  • ChatGPT Pro會員(20美元/月)和企業版在10月可用。
  • 獨立版在今年秋天晚些時候提供(目前價格15美元可以玩115次)。

參考鏈接:

[1]https://openai.com/dall-e-3

[2]https://www.nytimes.com/2023/07/18/technology/openai-chatgpt-facial-recognition.html

[3]https://twitter.com/sama/status/1704547625482203560

作者:夢晨,蕭簫

來源公眾號:量子位(ID:QbitAI),追蹤人工智能新趨勢,關注科技行業新突破

本文由人人都是產品經理合作媒體 @量子位 授權發布,未經許可,禁止轉載。

題圖來自Unsplash,基于CC0協議。

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 未來國內大模型也會收費嘛

    來自天津 回復
  2. 會員太貴

    來自上海 回復