AIGC 中的大模型摩爾定律與范式轉移
AIGC的發展,將使得知識性與創造性工作的邊際成本降至0,從而產生巨大的生產效率和經濟價值,每一個需要我們原創的領域都或多或少將有AI的參與。AIGC 的產品形態未來會是什么樣的呢?它的細分機會又在哪里?本文作者對此進行了分析,一起來看一下吧。
本文核心觀點來自紅杉在 9 月發布的一篇文章《Generative AI: A Creative New World》,我按大白話翻譯并做了刪減和補充。
原文想要表達的意思是——“隨著 AIGC(AI Generative Content)變得更快更強以及更低成本,在某些程度上將比人類手工創作得更好,AIGC 將使得知識性與創造性工作的邊際成本降至 0 ,從而產生巨大的生產效率和經濟價值,它將有潛力產生數萬億美元的經濟價值,這些領域不限于社交媒體、游戲、廣告、建筑、設計、法律、銷售以及營銷,每一個需要我們原創的領域都或多或少將有 AI 的參與。”
01 Why Now?為什么是現在
原作者將 AI 模型的發展劃分為四波浪潮:
1)2015 年以前,小模型占優
小模型在當時被認為是最優選,它們擅長分析任務,并應用在各類預測和欺詐分類的工作上,但是這些模型對通用任務的處理表現并不好,想要讓 AI 輸出人類水平的內容或者代碼是不可能的。
2)2015 年至今,大模型發展
Google Research 在 2017 年發表了一篇里程碑意義的論文《Attention is All You Need》,通過被稱為 Transformer 的神經網絡架構來生成高質量的語言模型,同時提高了并發處理能力,降低了訓練時間,這些模型可以容易地針對特定領域進行定制。
隨著這些 AI 模型變得越來越大,開始提供人類水平的處理能力。在 2015 年~2020 年期間,這些模型的計算量提高了 6 個數量級,這意味著在輸出結果上超過了人類在書寫、語音、圖像識別、閱讀和語言理解上的基準。
Source:公開網絡
2020年 5月,OpenAI 推出的 GPT-3 模型從中脫穎而出,相對于此前的 GPT-2 是一個巨大的飛躍,它的參數量是前代的百倍之多,達到 1750 億個參數量, GPT-3 能通過輸入的自然語言判斷和生成我們想要的內容,從某種意義上說它更像人類了,但是該模型并沒有人類那樣的價值觀和約束,只是在形式上依靠龐大的數據量和更優的算法更加接近人類智能。
當然,這類模型取得了研究上的進展,但離商業普及仍然有一段距離,無非是部署起來成本高,存在諸多方面的商業化限制。
3)2022年開始,多快好省
2022 年開始至今的數月,AIGC 的發展可以說是超預期的,先是去年 10月一名叫 Somnai 的工程師在 Github 上發布了名為 Disco Diffusion 的 text2img (文本到圖像)項目開始走紅網絡,再是今年 4 月 OpenAI 發布了 DALL.E 2 模型,一款融合了藝術家達利+機器人瓦力能力,能夠生成高度逼真的原創圖像的模型。
再到 5 月,Google 推出了在精度和質量上更出色的 Imagen 模型,7 月原 Leap Motion 聯創 David Holz 的項目 Midjourney 開始走進大眾視野,例如少楠的《產品沉思錄》近期的封面創意就來源于此,還是宮崎駿風味的:
Source:shaonan with Midjourney
接下來是 8 月 Stable Diffusion 項目開源,Stable Diffusion 項目帶來的主要革新是大幅降低了模型對內存和計算的要求,舉個例子,原先 512 x 512 對圖像一下子變成了 64 x 64,需要的內存減少了 98%!這就像是在上世紀把一臺 Eniac 計算機塞到了喬布斯的 Apple II 個人電腦里,這種普及為技術的商業化提供了合適的條件。
Stable Diffusion 的革新或許刺激到了資本們敏銳的神經,今年以來 AIGC 的概念也是非?;?,感興趣的朋友可以訪問我近日寫的這篇《從 Stability AI 和 Stable Diffusion 看 AIGC》展開閱讀。
4)當前,殺手應用的養料
就像是 4G 移動網絡的成熟,千元機、網絡速度提升以及網絡資費下降,讓大眾進行短視頻內容消費成為可能,隨之出現的一波短視頻&直播創業中殺出了抖音和 Tiktok,在 AIGC 領域預計或許也會出現這樣的押韻,甚至也會有平臺的出現,但紅杉認為這個機會還是比較小的,更偏向于垂直應用。
02 市場生態和細分機會
AI 不僅影響業務和行業層面,按照技術語言叫多模態,按照大白話就是文字、代碼、聲音、圖像、視頻、3D 模型以及其它基礎性載體,如生物化學分子等產生碰撞,這些不同的內容載體在更好的 AI 模型加持下,產生質量更高、容量更大、領域更垂直以及更創意有趣的市場機會。
Source:Sequoia
如果把這些參數量和晶體管對照,將大模型對照成 AI 領域的摩爾定律,紅杉美國的觀點是在 2025 年及以后看到較為成熟的商業化案例。
以下是紅杉觀察到的幾個場景案例供參考:
- 文案(Copywriting):隨著個性化和電子郵件需求增長,銷售、營銷以及客戶支持這些場景都是 AI 模型的用武之處,這些場景下對文本的要求簡潔明了,對時間和成本有一定要求, 在這些 B 端領域做自動化和增效解決方案是一個不錯的機會;
- 專業寫作(Vertical specific writing assistants):不像是通用的文本創作,在專業領域如法律合同起草和劇本創作會有機會,當然不同的垂類其工作流程和用戶體驗會有差異;
- 代碼生成(Code generation):GitHub Copilot 是一款 AI 編程工具,它為當前使用這款工具的開發者創造了近 40% 的代碼,未來將有機會服務于更廣大的消費者,而不僅僅是軟件工程師,畢竟在硅谷,工程師是個創造型的職業「doge」;
- 藝術生成(Art generation):目前藝術和潮流內容都已經可以通過 AI 大模型去完成,人人都可以通過這些模型創作以前只有專業藝術人員才能完成的風格,例如騎馬的宇航員和在古埃及買面包的泰迪熊;
- 游戲(Gaming):理想情況是通過自然語言腳本敘述來創建復雜的游戲場景或模型,但這是最終狀態,從當前看還有很長的路要走,當然短期來講也有可行的機會,例如在微觀的素材創作上,生成紋理這些;
- 媒體/廣告(Media/Advertising):這是非常好的落地場景,將銷售信息與動態視覺效果以多模態的形式展現在消費者面前,我展開舉個栗子(未經嚴格驗證)——抖音里的廣告都是廣告商的分發,或許未來是通過算法根據你的數據推薦生成展現在你面前,而不是推薦分發;
- 設計(Design):對于像我這樣學設計和藝術背景的同學太有感觸了,你還在為賽博網絡畫線搭模型而煩惱么?動嘴就能生成的模型誰不喜歡,無論是交給你的導師還是交給老板,AI 模型為你省去了繁重的執行工作,剩下需要的只是你的創意!最近在建筑領域已經看到了不少的案例,以及你或許有一天在 Photoshop、Figma 以及 Sketch 這些平面設計領域通過 AI 插件或者小功能一句話找到你心水的素材;
- 社交媒體和數字社區(Social media and digital communities):這個我就直接以國內的場景和個人理解表述吧,比如我在某博某紅書某刻發一個有趣的圖文動態,這個圖可能是平臺提供給我的有趣 AI 小工具,它可能是集成在表情包下面,我原來的搜索動作變成了即時的 AI 生成,可能有一天我的微信容量也不用這么大了……
03 產品形態與技術趨勢
AIGC 的產品形態未來會是什么樣的?以下是紅杉的預測:
1)關于模型
AIGC 的產品構建在 GPT-3 或者 Stable Diffusion 等大模型上面,并且隨著產品的應用以及用戶數據的增長,將會反過來促進模型的優化:
- 模型在特定問題上的質量與性能
- 模型的大小和成本優化
2)關于產品
部分 AIGC 產品將作為現有軟件生態系統中的插件存在,融入在 IDE、Figma 和 Discord中,例如 Midjourney 就一款依托于 Discord 的文本到圖像創作工具,另外還有少量以獨立形態存在的產品,例如:
- 文案創作:Jasper 和 Copy.ai
- 視頻編輯:Runway
- 記筆記的:Mem
從現有的軟件生態以插件形式存在,然后獨立出來或許是一個冷啟動的好方式,紅杉表示已經在消費和社交領域觀察到這種策略的成功。
3)關于交互
當前許多 AIGC 的 Demo 產品幾乎是一次性完成的,即用戶輸入內容,模型輸出結果,這些結果可以自動保存,又或者放棄重新生成,模型也在持續迭代,用戶也可以將模型生成的結果進行進一步編輯、優化或二創。
今天,AIGC 的結果可以被用在原型或初稿制作中,這類產品很擅長將不同的創意點子融入其中,以推進整個創作過程,例如在建筑設計領域或者平面設計中起草各種 Logo 方案,然后由用戶來做進一步“精修”。
隨著模型越來越聰明,并積累了使用者越來越多的數據,這些原型或初稿也將越來越完善,直到縮短整個創作周期,甚至被作為成品。
4)關于品類
最好的 AIGC 公司通過打造用戶使用數據與模型性能之間的飛輪來持續建立競爭優勢。初創企業想要贏得這一勝利,必須建立這樣的商業模型:
- 第一步:更多用戶參與,迭代產品與數據積累;
- 第二步:更好的模型,反哺更好的產品體驗;
- 第三步:進一步用戶增長和更多參與。
這樣的商業模型將會誕生在比較垂類的市場中,比如代碼、設計或者游戲,而不是妄想做個大產品,什么群體都想服務。最好的切入方式還是在一些現有的應用體系中深嵌來得到增長,然后通過原生的 AI 方式慢慢替代落后的服務流程,當然積累數據和用戶是需要花時間的,相信這是一種行之有效的增長策略。
04 風險提示
最后,紅杉在文章中提示—— 雖然 AIGC 具有很大的潛力,但是就當前而言還有很多商業模式和技術上的問題沒有解決,例如在版權、隱私安全和成本等方面。
總的來說,AIGC 還處在一個早期階段,平臺層的發展還不錯,應用層還有很大的發揮空間;需要澄清的是,用戶并不需要一些大的語言模型來長篇大論寫一篇托爾斯泰式的小說,現有的模型已經足夠創作一些博客初稿了,后期還有很多可以被釋放與創造的價值。
第一波 AIGC 的產品猶如 iPhone 剛剛誕生的那樣,充滿噱頭但還沒有明確的商業模式和差異價值,雖然我們能從現有的產品和技術中對未來管中窺豹,例如刷到一些 AI 生成的精美圖片。
最后,談一點個人理解,這里的機會可能是模型在某個垂類上的內容供給效率高于當前人類工作人員的效率才會出現,就像推薦算法當初改變了傳統的內容和商品分發效率那樣,但就當前而言還不會有一個通用大模型一招吃遍鮮去生產所有各種形態的內容、腳本、方案、配方、公式、素材等等。
Reference:
[1] 《Generative AI: A Creative New World》,Sequoia
免責聲明:在任何情況下,本文信息或表述,不構成任何投資建議;若有侵權,請后臺聯系刪除。
作者:TimJ;來源公眾號:江天Tim
本文由 @江天Tim 原創發布于人人都是產品經理,未經許可,禁止轉載
題圖來自 Unsplash,基于 CC0 協議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發揮!