為了集福,我生成了100個福字
一年一度的集五福又開始了,不過有了AI的幫助,我們可以直接自己生成福字,不用再考慮到處找“?!弊值膯栴}。這篇文章,我們來看看作者測試的效果,AI的表現如何。
臨近過年啊,一年一度的集福大戰又雙叒叕拉開帷幕啦!之前家人不理解,說弄這個能給幾百塊錢啊,我說沒有,人均幾塊錢,或者十幾塊錢的樣子吧,運氣好了,能有個幾十左右吧。然后媽媽給我拿了 100 塊錢,說:放下手機,去打掃衛生。
將近 40 歲的年紀啊,還被這么一個小小的利益給拿捏了。當集福已成為習慣,越是到了年底,就會不由自主的想起來這個游戲。看到 “?!?字就像被施了定身咒,挪不動腳,眼睛直勾勾地盯著,滿心想著趕緊掏出手機掃一掃,說不定就能掃到稀缺???。我也完全被這股集福熱潮給 “拿捏” 得死死的,深陷其中,無法自拔。
但,一天了不起能找到十幾二十多個福字,概率還是很低的。如果說依靠數量取勝,那為什么我不能先給自己生成 100 個福,讓就掃個過癮呢。
一、工具先行
說干就干,我一頭扎進了互聯網的海洋,開始瘋狂搜索如何利用 AI 生成福字的方法 。
我先是考慮使用專門的圖形設計軟件,如 photoshop 、Illustrator 、CorelDRAW,畢竟咱是做設計出身的,這幾個軟件基礎功能還是掌握的。專業的設計圖形軟件功能強大,可以通過直接選擇字體生成,后面再進行配圖就可以了。但萬事開頭難啊,第一步安裝軟件,就花費了我好幾個小時。打開軟件后,發現一臉的茫然,畢竟十多年沒有碰過了,我覺得我和這三個軟件關系很熟,都是鐵汁,但這三個軟件對我一臉的茫然。又是一個小時,只生成了幾個,還要排版,調整,眼瞅著天都黑了,我這點產出量,還不如直接用搜索得到的結果快呢。
但,大活人哪能讓尿給憋死啊。于是我放棄了專業的圖形軟件,改用 AI 工具來實現我的需求。
Kimi
我現打開了常用了kimi,發現kimi默認界面沒有生圖功能。給了我一段字體類型的介紹,然后又給我一些網頁搜索結果。這 AI,和我想象的有點不不一樣啊。不是說 AI 能夠代替人類寫作、畫畫和思考嗎,這也沒理解我的意思,也沒達到我的要求啊。
雖然能夠解決問題,但這次的結果不滿意,放棄~
文心一言
因為文心一言本質上也是文生文的 AI 工具,所以我在開始指令的時候,直接添加了場景的條件“畫”。很多小伙伴都說自己對 AI 軟件熟悉,但大多數都是在常用的基礎上,還有一些細節技巧的東西也需要知道和了解。
相對于Kimi的回答,文心一言的答案才是我這個場景需要的。雖然只生成了 9 個(大概率是排版的問題),雖然在同一個對話中我更改了場景,讓其解釋這 10 個福字都是使用什么字體,沒有給我生成答案,而是繼續生成福字。但相對于第一目標而言,結果還是令人滿意的。
文心一言似乎對上下文關聯的理解有時候不是很好?;蛘哒f,它只是在車轱轆話,很少看到真正的「生成式內容」。所以理解文心一言的底層模型邏輯上并不是這么簡潔的,很可能也加入了很多中間層的處理,也就是把文章里完整的詞組、句子甚至段落也當成了可檢索的對象,并且直出了(還要考慮一些指向性的關鍵詞觸發)。所以這里就會出現在同一組對話中,如果你突然做了場景變更,文心一言就難以跳出這個邊界的范圍。那么如果我們需要一個不同的場景回答,就需要新建一組對話。
比如我新建了一組對話,沒有加上畫這個關鍵詞做條件觸發,那么就是文生文的結果。
我以為我找到了竅門,所以我又返回了Kimi,告訴他,畫:10 個字不同字體的福字。結果還是文生文。
豆包
再次使用豆包來生成,最近用豆包比較多,覺得豆包文生文,文生圖,對于場景的理解,對于概念的敘述性都很強。我已經逐步從文心一言替換到 Kimi,現在又替換到豆包,作為 AI 常用工具了。
先來看結果:幫我生成圖片:生成 10 個不同字體的福字。
為了避免重復,我直接把場景“圖片”這個要求先加上了。所以給的結果是圖片,這個是符合要求的。
我是要 10 個不同字體,數量上不精準符合要求。但大總比少要少。
最后就是不同字體:肉眼對比了一下,有近一半的字體應該是相同的。
相對于 Kimi和文心一言,豆包生成的結果還是令人滿意的,至少在便利性上面來說,一次就能解決問題。搜索了一下關于豆包的 AI 功能,在 24 年的 12 月份智能AI助手豆包升級文生圖能力,支持一鍵生成指定文本。用戶可以在生圖提示詞中加入文本要求,如“一張帶有‘新年快樂’的圖”,即可生成帶有指定文字的圖片。
那么根據這樣的要求,我又重新提出了一個指令:一張帶有“?!钡膱D。結果令人意想不到。
豆包生成的圖片,更加具有美感,不光是字體樣式有了變化,連帶圖案也有了新的變化。這里猜測,豆包應該是在推理模塊增加了一些場景關聯。比如福字,在過年時候的使用場景,是有寓意的代表。那么單純一個字的結果是不能滿足用戶需要的,所以可以增加一個裝飾性的設計。也就是說豆包能理解對話之間的關系、場景布局以及鏈路的整體含義。其次,豆包是具有復雜推理能力,不僅能更好地識別內容,還能根據所識別的文字和圖像信息進行復雜的邏輯計算。
在回到我們最開始的主題:生成 100 個福字。豆包給出了近乎滿意的結果(70 來個)。
Midjourney 和 StableDiffusion
這里有小伙伴會說了,國外的MJ和 SD 不是很強大嗎,為啥不用呢。其實我在寫文章最開始的時候也是考慮了這倆軟件,畢竟之前用來做過一些比較特殊的內容。但不知道為啥今天一直登錄不上去,折騰了一下沒辦法操作,也就放棄了。
二、AI的理解與未來
隨著 AI 技術的不斷發展,未來我們有望看到更強大的通用人工智能出現。這將使 AI 能夠在更多領域發揮作用,如科學研究、藝術創作等。量子計算技術的發展也可能為 AI 帶來巨大的計算能力提升,加速模型的訓練和優化。如果說計算機還是一個機械化的工具,那么 AI 就是自動化的升級應用。計算機畢竟需要人去設定指令,需要人去下達指令;而 AI 則是具有一定的思考性,能夠擬人定義,能夠做出自一定的自我決策。
AI 作為一項具有深遠影響力的技術,已經在眾多領域展現出巨大的應用潛力和價值。通過深入理解 AI 的技術原理和應用場景,我們能夠更好地把握這一技術帶來的機遇,推動各行業的創新發展。然而,AI 的廣泛應用也面臨著諸多挑戰,需要政府、企業、科研機構和社會各界共同努力,加強技術研發、完善法律法規、培養專業人才,以確保 AI 技術的健康、可持續發展。
展望未來,AI 將繼續深入滲透到各個領域,與其他新興技術如物聯網、區塊鏈、量子計算等融合發展,創造更多的創新應用和商業模式。我們有理由相信,AI 將為人類社會帶來更加美好的未來。
最后放上三張來自大設AI特效字工具生成的福字,祝福大家新年快樂~
借鑒文章:1天100張福字海報,真的有人接嗎……
圖片生成:Kimi、文心一言、豆包、大社
內容生成:豆包(50%),手打(50%)。
專欄作家
老虎~色,公眾號:產品經理有話說,人人都是產品經理專欄作家。13年產品經理經歷,涉及商業設計、業務轉型、產品架構定義、個成成長等方面。自學AIGC落地應用,目前在鴻蒙場景做產品服務工作。
本文原創發布于人人都是產品經理。未經許可,禁止轉載
題圖來自 Unsplash,基于CC0協議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發揮!