AI時(shí)代,大語言模型下的機(jī)會與不適
近幾個(gè)月,人們一次次在被AI技術(shù)實(shí)際應(yīng)用刷屏的同時(shí)開始產(chǎn)生專業(yè)領(lǐng)域的工作者即將被取代的恐懼。如何沉著面對AI時(shí)代下的機(jī)會與不適?希望作者在本文的闡釋能夠帶給你一些啟發(fā)。
2013年,iPhone搭載多點(diǎn)觸摸屏幕技術(shù)開創(chuàng)了一個(gè)全新的智能手機(jī)界面交互模式,由此孕育了移動互聯(lián)網(wǎng)。
而2022年年底的ai繪畫到近幾個(gè)月,ChatGPT生成的文章,Copilot 生成的代碼,Midjourney、Stable Diffusion和DALL-E 僅靠一些關(guān)鍵詞就能快速生成圖片,人們一次次在被ai技術(shù)實(shí)際應(yīng)用刷屏的同時(shí)開始擔(dān)心在不久的未來人類的絕大部分工作是否要被人工智能替代。
同一時(shí)間,各個(gè)行業(yè)巨頭也紛紛下場,前有Google圖像生成模型Imagen,Meta的文本轉(zhuǎn)視頻模型的Make-A-Video,微軟則另辟蹊徑,將 DALL-E 2 內(nèi)置在新服務(wù) Microsoft Designer 中,滿足普通用戶的邀請函、明信片等日常設(shè)計(jì)需求。
人們在面臨科技帶來的便利的同時(shí)伴隨著專業(yè)領(lǐng)域的工作者即將被取代的恐懼。
這次我們來聊聊AI時(shí)代下的機(jī)會與不適。
ChatGPT、Mid-Journey、Stable Diffusion 等 AI 超級應(yīng)用的出現(xiàn),標(biāo)志著加速計(jì)算和AI技術(shù)的成熟已邁入成熟,看著一連串陌生的單詞,做完互聯(lián)網(wǎng)打工人的我們,雖然不太明白到底意味著什么,但也真切感受到我們的生活或?qū)l(fā)生如電影《I, Robot》的變化和恐懼。
AI正以一個(gè)前所未有的速度滲入各行各業(yè),推動一場一場新的科技革命。
經(jīng)過近幾年AI技術(shù)的不斷發(fā)展,強(qiáng)大算力和先進(jìn)的大語言模型為AI提供了合適的應(yīng)用平臺,促使各個(gè)頭部廠商重新構(gòu)建自己的產(chǎn)品和商業(yè)模型,市面上常見到的AI工具如圖:
另一方面人性中對于安全、穩(wěn)定的追求,致使更多人對AI工具及產(chǎn)生的內(nèi)容持觀望態(tài)度或抗拒新的改變。
,隨著各個(gè)頭部公司投入的資源,如英偉達(dá)、微軟、Google、Adobe以及國內(nèi)互聯(lián)網(wǎng)等廠商在相差無幾的時(shí)間里相繼退出各自的AI服務(wù),在當(dāng)今內(nèi)卷到不行的時(shí)代【如果不想被人顛覆,就要先顛覆別人】或許我們應(yīng)該先放下懷疑、抗拒,了解這次的新技術(shù)。
01 AI的技術(shù)發(fā)展史
人們都在說是今年是一個(gè)AIGC(AI generated content)爆發(fā)的時(shí)代,討論度最高的幾款工具ChatGPT、Stable Diffusion、Mid-Journey等都可以被稱為AI,那么什么是AI?
AI是指利用人工智能技術(shù)生產(chǎn)內(nèi)容,也就是說我們在互聯(lián)網(wǎng)上瀏覽到的信息內(nèi)容制作者從人【UGC(User-generated Content)用戶原創(chuàng)內(nèi)容,以提倡個(gè)性化為主要特點(diǎn)】或機(jī)構(gòu)【PGC(Professional Generated Content)專業(yè)生產(chǎn)內(nèi)容,內(nèi)容設(shè)置及產(chǎn)品編輯均非常專業(yè)】變成了通過各種類型的人工智能工具制造出來。
1. 從深度模型概念GAN到Transformer深度學(xué)習(xí)模型架構(gòu)
AI的概念于2014年由人工智能專家Ian Goodfellow在一次酒后想到的,可以基于CNN(深度卷積神經(jīng)網(wǎng)絡(luò),通過問題開始學(xué)習(xí)一個(gè)陌生事物,提取特征)的深度模型概念GAN【Generative(生成) Adverserial(對抗) Nets(網(wǎng)絡(luò))】,通過GAN將兩個(gè)神經(jīng)網(wǎng)絡(luò)進(jìn)行對抗,即生成器與判別器。
生成器通過輸入生成圖像即用于生成“造假數(shù)據(jù)”,判別器用于判斷數(shù)據(jù)的真?zhèn)?,在?xùn)練過程中,兩者交替進(jìn)行,使得生成器生成的圖像越來越逼真,而判別器的判別能力也越來越強(qiáng),如果想了解更多關(guān)于GAN算法模型可以點(diǎn)擊查看更詳細(xì)的解釋,涉及到模型算法等專業(yè)性內(nèi)容這里不做過多說明。
GAN算法做為當(dāng)時(shí)AI技術(shù)革命的基礎(chǔ),后來被廣泛運(yùn)用到圖像生成(Ai換臉)、高清重建、黑白電影上色、視頻生成、語音合成、圖像風(fēng)格轉(zhuǎn)換等等領(lǐng)域,被稱為21世紀(jì)最強(qiáng)大的算法模型之一,Ian Goodfellow也成為了AI領(lǐng)域最知名的專家之一。
2015年開始,GAN開始被投入實(shí)際運(yùn)用中,相關(guān)的論文也爆發(fā)式增長,也成為AI生成圖像、處理圖像任務(wù)里最常見的算法模型。
同一年,一家被“鋼鐵俠”埃隆·馬斯克、Y Combinator總裁阿爾特曼、天使投資人彼得·泰爾等一眾硅谷大佬投資的公司 OpenAI 成立。
當(dāng)時(shí) OpenAI 的初衷是預(yù)防人工智能帶來的災(zāi)難性影響,推動人工智能發(fā)揮積極作用。
2016年,OpenAI推出了自己的AI訓(xùn)練架構(gòu) Universe,通過網(wǎng)絡(luò)利用全世界的游戲、網(wǎng)頁和其他應(yīng)用,來測量和訓(xùn)練AI的普通智力,使得AI 智能體可以通過虛擬鍵盤和鼠標(biāo)像人類一樣使用電腦進(jìn)行任何維度的自我學(xué)習(xí)解決任何問題。
當(dāng)時(shí)的AI 技術(shù)雖然在特定領(lǐng)域很強(qiáng)大,但一旦超過這個(gè)特定領(lǐng)域就無法工作,即AI 技術(shù)逃脫不了“窄AI”的范疇,比如AlphaGo可以在圍棋輕松贏過任何人,卻沒有辦法玩其他棋類游戲。
直到2018年,Transformer(深度學(xué)習(xí)模型)架構(gòu)的發(fā)展改變了NLP(自然語言處理)技術(shù)的發(fā)展。
在NLP領(lǐng)域中主要存在三種特征處理器——CNN、RNN以及Transformer,Transformer拋棄了傳統(tǒng)CNN和RNN神經(jīng)網(wǎng)絡(luò),整個(gè)網(wǎng)絡(luò)結(jié)構(gòu)完全由Attention機(jī)制以及前饋神經(jīng)網(wǎng)絡(luò)組成,使得Transformer不同于CNN的單向處理數(shù)據(jù),可以并行處理所有輸入數(shù)據(jù)更快、更高效。
另一方面Transformer的自我注意機(jī)制,通過捕獲句子中單詞或標(biāo)記之間的關(guān)系,提高語言翻譯和情感分析任務(wù)中的表現(xiàn),更好的處理自然語言任務(wù)中的長文本或語音序列。一定程度上解決了傳統(tǒng)RNN等序列模型中長序列計(jì)算效率低下、梯度消失等問題。
此時(shí)的OpenAI也推出在NLP(自然語言處理)領(lǐng)域打造的模型GPT系列,第一款產(chǎn)品GPT-1也在2018年正式推出。
GPT-1不同于其他AI模型之處,在于他的“半監(jiān)督”,在此之前的NLP模型中,AI需要基于特定任務(wù)對大規(guī)模數(shù)據(jù)進(jìn)行學(xué)習(xí),而這些數(shù)據(jù)需要人為“監(jiān)督”,進(jìn)行數(shù)據(jù)標(biāo)注。
GPT-1則可以在一開始先進(jìn)行無監(jiān)督的學(xué)習(xí)預(yù)訓(xùn)練,通過對數(shù)據(jù)的學(xué)習(xí)增強(qiáng)語言能力,最后進(jìn)行部分監(jiān)督的微調(diào)。簡單來說,就是GPT-1可以用更少的資源和數(shù)據(jù)進(jìn)行更有效率的學(xué)習(xí),但當(dāng)時(shí)的GPT-1一方面由于訓(xùn)練數(shù)據(jù)的有限,一方面性能并不算好,并沒有到達(dá)對話的能力。
2020年OpenAI推出了GPT-3,相較于前兩代,GPT-3的參數(shù)超過1750億個(gè)(GPT-2約為15億個(gè)參數(shù))相當(dāng)于人腦神經(jīng)連接的十分之一。另一方面GPT-3使用人類反饋優(yōu)化語言模型RLHF(Reformer Language model with Hybrid Flow)通過監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的組合方式對ChatGPT進(jìn)行微調(diào),將強(qiáng)化學(xué)習(xí)和人類反饋結(jié)合到NLP中,以最小化無益、失真或偏見的輸出。
當(dāng)語言模型經(jīng)過RLHF預(yù)訓(xùn)練后,可以對一段對話生成不同的響應(yīng),同時(shí)讓人對結(jié)果進(jìn)行排名。RLHF的關(guān)鍵3個(gè)步驟如下:
- 預(yù)訓(xùn)練一個(gè)語言模型(LM)+有標(biāo)簽數(shù)據(jù)微調(diào)
- 收集數(shù)據(jù),訓(xùn)練獎(jiǎng)勵(lì)模型
- 用強(qiáng)化學(xué)習(xí)針對獎(jiǎng)勵(lì)模型優(yōu)化策略
預(yù)訓(xùn)練語言模型的使用提升的GPT-3性能,使其能夠識別更深層次的文本含義,通過不斷地監(jiān)督學(xué)習(xí)、人工糾錯(cuò)、強(qiáng)化學(xué)習(xí)進(jìn)行對話模擬,自然而然的與人類進(jìn)行對話并進(jìn)行反饋,最終形成越來約接近人類語言的模型。
另一方面圖像生成領(lǐng)域,雖然GAN已經(jīng)可以生產(chǎn)較高質(zhì)量的圖片及內(nèi)容,但效率較低,另一方面生成的圖像也始終難以令人滿意。而Transformer架構(gòu)的出現(xiàn),使得圖像合成領(lǐng)域告別了GAN時(shí)代,迎來了NLP(Natural Language Processing,自然語言處理)與計(jì)算機(jī)視覺技術(shù)相結(jié)合,產(chǎn)出更貼合用戶需求的圖片。
上面關(guān)于AI的進(jìn)化過程中,除了GAN語言、Transformer架構(gòu),還有關(guān)于語言模型的訓(xùn)練,那么什么是NLP(natural language process,自然語言處理)?為何在年初突然各大公司紛紛開始搭建自己的大語言模型?
2. 從自然語言模型(NLP)到大語言模型(LLM)
在系列電影《猩球崛起》中,由于病毒大范圍的擴(kuò)散,猩猩會因病毒變得聰明,而受感染的人類則會失去語言能力且智商大幅降低,直至稱為猩猩的奴隸。
其中的反派上校說到“病毒不會殺死我們,但會奪走那些之所以使我們稱為人類的東西,我們的語言我們的思想,它會把我們變成野獸?!?/strong>可見語言對于人類文明存在的重要。
語言作為人類特有的用來表達(dá)情感、交流思想的工具,是一種特殊的社會現(xiàn)象,由語音、詞匯和語法構(gòu)成。語音和文字是構(gòu)成語言的兩個(gè)基本屬性,語音是語言的物質(zhì)外殼,而文字是記錄語言的書寫符號系統(tǒng)。
在人類長期的進(jìn)化過程中,采用一套共同的符號、表達(dá)方式以及處理規(guī)則進(jìn)行溝通,即交流觀念、意見、思想。其中符號以視覺、聲音、觸覺的方式進(jìn)行信息傳遞,現(xiàn)代人類擁有現(xiàn)在的高度文明,并不是當(dāng)代人類的獨(dú)立創(chuàng)作,離不開前人對于自己發(fā)明成果的記錄與留存,使得我們可以在前人的基礎(chǔ)上進(jìn)行迭代與新的創(chuàng)造。
當(dāng)然人類也并非天生具備語言能力,需要后天經(jīng)過學(xué)習(xí)才能獲得。
語言模型(language model,LM)是根據(jù)客觀事實(shí)而進(jìn)行的語言抽象數(shù)學(xué)建模,通過計(jì)算句子(單詞序列)的概率或序列中下一個(gè)單詞的概率的模型。自然語音模型(natural language process,NLP)則是從人類的角度,人與人及人與計(jì)算機(jī)交際的語言問題,語句是否正常合理。
當(dāng)一句話種的單詞總是順序出現(xiàn),每個(gè)單詞通過前面所有單詞計(jì)算出概率,把所有這些單詞的概率相乘,總概率數(shù)值越大,說明越像人類語言,語言模型協(xié)助解決了AI出現(xiàn)的語句是否合理。而語言模型也經(jīng)歷從專家語法規(guī)則性模型到統(tǒng)計(jì)語言模型,進(jìn)而到神經(jīng)網(wǎng)絡(luò)語言模型階段。
專家語法規(guī)則性模型-(至80年代)
在計(jì)算機(jī)編程語言的初期,通過歸納針對自然語言的語法規(guī)則方式建立模型,多應(yīng)用在提升語音識別和機(jī)器以及機(jī)器翻譯的性能。
整個(gè)過程中需要人先從數(shù)據(jù)中獲取知識,歸納出規(guī)則,寫出來交給機(jī)器,然后機(jī)器來執(zhí)行這套規(guī)則,從而完成特定的任務(wù)。
但由于自然語言本身的多樣性及口語化,隨著時(shí)間性發(fā)展不同語法或流行語的迭代,以及空間性不同國家地區(qū)語言語法的本地話,同時(shí)人本身強(qiáng)大的糾錯(cuò)能力,導(dǎo)致語法規(guī)則急劇膨脹,沒辦法持續(xù)迭代使用。
傳統(tǒng)的自然語言處理系統(tǒng)主要依靠人工基于上述組成元素來編寫出各種規(guī)則,從實(shí)踐結(jié)果來看,這種方式耗時(shí)耗力,而且效果并不理想。
在圖像識別領(lǐng)域也同樣存在。例如,在圖像識別領(lǐng)域的早期,如果要識別一只貓,那么首先就要提取和制定出貓的各種特征規(guī)則。
由于貓的形態(tài)多種多樣,而且當(dāng)出現(xiàn)遮攔、扭曲等情況時(shí),人工提取特征將會變得更困難。
統(tǒng)計(jì)語言模型-(至00年代)
計(jì)算句子(單詞序列)的概率或序列中下一個(gè)單詞概率的模型,通過給定的上文來預(yù)測句子的小一個(gè)詞,如果預(yù)測的詞和下一個(gè)詞一致,那么上文+該詞出現(xiàn)的概率比上文+其他詞的概率更大,則系統(tǒng)判斷上文+該詞則更為合理,即概率高的語句比概率低的語句更像人類語言。
與上階段統(tǒng)不同的是,統(tǒng)計(jì)語言模型由之前的需要通過人轉(zhuǎn)述知識變成了機(jī)器自動從數(shù)據(jù)中學(xué)習(xí)知識,再加上大量的語料數(shù)據(jù)。
神經(jīng)網(wǎng)絡(luò)語言模型-(至今)
在統(tǒng)計(jì)語言模型的基礎(chǔ)上,通過網(wǎng)絡(luò)的疊加和特征的逐層提取,可以表征除了詞法外,相似性、語法、語義等多方面的表示。
相較于傳統(tǒng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)模型可以處理單詞之間的長期依賴關(guān)系,捕捉到單詞的上下文及句子中其他單詞的關(guān)系,同時(shí)隨著時(shí)間的推移神經(jīng)網(wǎng)絡(luò)語言模型可以使用更多數(shù)據(jù)自主進(jìn)行學(xué)習(xí)迭代,而傳統(tǒng)語言模型則需要手動更新以提高其準(zhǔn)確性。
ChatGPT現(xiàn)階段的自然語言模型正是“神經(jīng)網(wǎng)絡(luò)語言模型”階段。
2023年很多公司基于深度學(xué)習(xí)架構(gòu),通過大量的文本數(shù)據(jù)訓(xùn)練,從而擁有包含了數(shù)十億參數(shù)規(guī)模龐大的大語言模型LLM(Large Language Model),用來處理多種自然語言任務(wù),目的在于讓機(jī)器能聽懂人的命令、遵循人的價(jià)值觀,意味著AI的使用并不局限于專用領(lǐng)域,而是通用任務(wù),即通過自然語言鏈接人與機(jī)器,滿足機(jī)器能夠獨(dú)立、準(zhǔn)確理解完成相應(yīng)指令同時(shí)完成自主學(xué)習(xí),比如文本總結(jié)分類、問答、對話等等。而人的角色也會從教導(dǎo)者逐漸轉(zhuǎn)向監(jiān)督者,甚至從人機(jī)協(xié)作、機(jī)器向人學(xué)習(xí),發(fā)展為人向機(jī)器學(xué)習(xí),甚至由機(jī)器拓展人類。
目前常見的大語言模型有:
GPT-3(OpenAI):Generative Pre-trained Transformer 3(GPT-3)最著名的LLM(Large Language Model)之一,擁有1750億個(gè)參數(shù)使用單向語言模型預(yù)訓(xùn)練。該模型在文本生成、翻譯和其他任務(wù)中表現(xiàn)出顯著的性能,在全球范圍內(nèi)引起了熱烈的反響。
BERT(谷歌):Bidirectional Encoder Representations from Transformers(BERT),該模型基于谷歌的大語言模型LaMDA驅(qū)動,使用雙向方法從一個(gè)詞到左右兩邊捕捉上下文,使得各種任務(wù)的性能提高,適合于理解類、做理解類、某個(gè)產(chǎn)經(jīng)的具體任務(wù),如情感分析和命名實(shí)體識別。
T5(谷歌):文本到文本轉(zhuǎn)換器(T5)是一個(gè)LLM,該模型將所有的NLP任務(wù)限定為文本到文本問題,簡化了模型適應(yīng)不同任務(wù)的過程。T5在總結(jié)、翻譯和問題回答等任務(wù)中表現(xiàn)出強(qiáng)大的性能。國內(nèi)許多大型語言模型都采用T5模式。
ERNIE 3.0 文心大模型(百度):百度推出的大語言模型ERNIE 3.0首次在百億級和千億級預(yù)訓(xùn)練模型中引入大規(guī)模知識圖譜,提出了海量無監(jiān)督文本與大規(guī)模知識圖譜的平行預(yù)訓(xùn)練方法,底層邏輯是通過百度智能云提供服務(wù),吸引企業(yè)和機(jī)構(gòu)客戶使用API和基礎(chǔ)設(shè)施,共同搭建AI模型、開發(fā)應(yīng)用,實(shí)現(xiàn)產(chǎn)業(yè)AI普惠。
而現(xiàn)在的大型語言模型也多應(yīng)用于提升AI的自動回復(fù)能力、意圖識別能力、優(yōu)化人機(jī)交互的體驗(yàn)以及其他更多的實(shí)際使用場景。
3. AI 繪畫-文本生成圖像
在美國科羅拉多州博覽會的藝術(shù)比賽中,參賽者 Jason Allen 使用AI繪畫工具M(jìn)idJourney生成的作品《空間歌劇院(Théatre D’opéra Spatial)》獲得了數(shù)字藝術(shù)獎(jiǎng)項(xiàng)的第一名。在當(dāng)時(shí)引起極大的爭議,甚至有人提出“藝術(shù)消亡”的言論,但隨后兩名評審表示即使提前得知此事,也依舊會把首獎(jiǎng)?lì)C給Allen。
在實(shí)際創(chuàng)作過程中這張畫也不是一次性完成的,整個(gè)繪制過程中經(jīng)過了上千次修改、完善,花費(fèi)了將近80個(gè)小時(shí)才完成。
而差不多時(shí)間段Stable Diffusion、Disco diffusion等多個(gè)高精度、高效率的AI繪畫平臺開始在全世界范圍內(nèi)引起關(guān)注。
很多人理解的AI繪畫應(yīng)該一鍵生成完全符合用戶心中所想的圖像,而在實(shí)際操作過程中需要通過不斷輸入關(guān)鍵信息生成圖像,其操作邏輯跟畫家進(jìn)行創(chuàng)作有很大的區(qū)別。
實(shí)際上AI繪畫與ChatGPT等大型語言模型相似,都需要操作人對于想要的圖像先進(jìn)行抽象化文字理解,比如畫面的構(gòu)圖、曝光、置景、角度等都需要先通過哪些精準(zhǔn)化、具像化的語言表達(dá)出抽象的畫面,整個(gè)創(chuàng)作過程也需要多次的人為干預(yù)優(yōu)化,進(jìn)行多次輸入調(diào)整,而系統(tǒng)則根據(jù)對于語義理解能力、充分的數(shù)據(jù)標(biāo)注、細(xì)節(jié)處理、用戶的Prompt提示詞相互作用,才能得到符合操作人的想要的畫面。
我們在各大社交媒體會看到各種各樣的不同風(fēng)格對應(yīng)的Prompt提示詞整理,因此如果你使用MidJourney生產(chǎn)的畫面差強(qiáng)人意不妨先找找對應(yīng)風(fēng)格的描述詞(比如主題、媒介、背景、燈光、顏色、氣氛、視角、構(gòu)圖、藝術(shù)風(fēng)格等等)。
因此AI圖像的生成不是簡單的結(jié)果,更多是將操作人進(jìn)行表達(dá)的過程。而由于自然語言中的語義表達(dá)比詞組空間更大,AI對于語義的理解和人類本身不可避免的會出現(xiàn)偏差,因此AI繪畫的本質(zhì)是協(xié)作與表達(dá),因此在使用Midjourney過程中描述詞越詳細(xì),生成的圖片相對也就越精準(zhǔn)。
當(dāng)你需要修改AI生成圖像的某一細(xì)節(jié)時(shí),就需要重新修改Prompt,而我們無法知道AI是否將你輸入的Prompt拆解成對應(yīng)圖片上的修改,也就無法保證此次輸入修改是否有效,因此在Midjourney生成圖片后還是需要經(jīng)過ps、ai等工具進(jìn)行二次加工,或許才能得到我們想要最終效果。
AI繪畫并非在近兩年才開始投入研究,也并非一開始就采取文本生成圖像的方式,在算力和模型不斷的技術(shù)迭代下,促使各個(gè)公司及相關(guān)人員不斷嘗試構(gòu)想實(shí)現(xiàn)產(chǎn)品落地及商業(yè)模式,因此Chat GPT、Midjourney等AI工具的出圈及更新迭代的速度并非一蹴而就:
- 2012年,吳恩達(dá)和Jef Dean使用1.6萬個(gè)CPU以及來自YouTube的1000萬個(gè)貓臉圖片來訓(xùn)練當(dāng)時(shí)最大的深度學(xué)習(xí)網(wǎng)絡(luò),耗時(shí)3天,用來指導(dǎo)計(jì)算機(jī)畫出貓臉,最終得到模型,以及一張非常模糊的貓臉。正式開啟深度學(xué)習(xí)模型支持AI繪畫這個(gè)“全新”的研究方向。
- 2015年,Google開源項(xiàng)目deep dream,根據(jù)AI指令,完成迷幻超現(xiàn)實(shí)圖畫。同一年,智能圖像識別,通過算法識別并標(biāo)記圖像中的對象,而同時(shí)一群研究員開始嘗試思考反向操作用文本生成圖像。
- 2016年,模型Diffusion Models提出使用隨機(jī)擴(kuò)散過程生成圖像。
- 2021年1月,OpenAI 公布了DALL-E,底層技術(shù)為Diffusion Models,奠定了擴(kuò)散模型在這一波技術(shù)發(fā)展中的重要性。
- 2022年2月,由somnai等開源社區(qū)工程師開始訓(xùn)練自己的AI生成器-Disco? D infusion,此后相當(dāng)多的基于此的產(chǎn)品出現(xiàn)。
- 2022年3月,由Disco diffusion的核心開發(fā)參與建設(shè)的AI生成器Midjouney正式發(fā)布。
- 2022年4月,OpenAI旗下人工智能在線繪圖應(yīng)用DALL·E 2公測。
- 2022年7月,stability.ai 開源了stable-diffusion,這是目前可用性最高的開源模型,很多商業(yè)產(chǎn)品都基于此,如 NovelAI。10月18日,Stability.ai 宣布完成1.01 美金的種子輪融資,估值達(dá)10億美金。
我們可以看到市面上有各種各樣的AI繪圖工具,Midjouney、Stable Diffusion、Disco Diffusion等等。相較于其他同類型的AI 繪畫工具,Midjourney通過社群的形式,注冊Discord賬號之后即可進(jìn)入到Midjourney頻道,加入公測服務(wù)器開始使用了。
使用方式也很簡單,用戶只需要輸入命令提示符,1min左右就可以得到對應(yīng)的高品質(zhì)圖片。
Midjouney借助Discord社區(qū)持續(xù)迭代,大量免費(fèi)試用新用戶涌入,有時(shí)甚至?xí)?dǎo)致付費(fèi)用戶的服務(wù)器癱瘓。低用戶門檻,簡單上手的使用方式,以及快速得到反饋使得即使Midjourney即使叫停了免費(fèi)試用,需要用戶花費(fèi)每月30美元的費(fèi)用,也依舊抵擋不了大量用戶對于Midjourney AI繪畫的著迷。
而Midjouney公司也靠著訂閱服務(wù)在沒有融資的情況下,實(shí)現(xiàn)年?duì)I收1億美元。
在Stable Diffusion發(fā)布前,AI繪畫最好的開源工具是Disco Diffusion,但Disco Diffusion存在生成速度慢、成本高昂、生成圖片邏輯差導(dǎo)致的畫面結(jié)構(gòu)混亂等等問題,而且無法生成人和物體。Stable Diffusion解決了Disco Diffusion存在的這些問題,另一方面Stable Diffusion作為免費(fèi)的開源工具,用戶可以進(jìn)行本地配制,能夠保證信息安全,配制出合適的數(shù)據(jù)庫后,AI定向?qū)W習(xí)畫畫風(fēng)格,完成定向風(fēng)格圖片的批量生產(chǎn)。
雖然Stable Diffusion相對Midjourney都有著高可控性,但要駕馭Stable Diffusion,需要在服務(wù)器或本地端布置一個(gè)強(qiáng)大的計(jì)算環(huán)境供其運(yùn)行。
也就是說,即使你有強(qiáng)大的想象里,沒有強(qiáng)大的自然語言學(xué)習(xí)、處理能力,以及AI算力作為支持,依然無法使用Stable Diffusion。
因此如果是完全新手可以先嘗試Midjourney體驗(yàn)AI繪圖工具,但如果有很大的工作商業(yè)需求,則可以選擇Stable Diffusion部署定制自己的AI繪畫數(shù)據(jù)庫。
02 關(guān)于AI的不同聲音
在AI討論如火如荼的當(dāng)下,很多人已經(jīng)體驗(yàn)過AI生成文字或AI繪畫,對于AI的使用感受、擔(dān)心、發(fā)展各個(gè)行業(yè)開始出現(xiàn)不同的聲音。
1. 學(xué)術(shù)論文劇本創(chuàng)作
一開始ChatGPT被人們關(guān)注到除了ChatGPT無障礙的對話模式外,很多學(xué)生開始使用ChatGPT完成論文,甚至得到A+的高分。老師們不得不仔細(xì)辨別,學(xué)生的作業(yè)是否使用ChatGPT完成。
在紐約和西雅圖的公立學(xué)校系統(tǒng),學(xué)校的wifi網(wǎng)絡(luò)和設(shè)備上已經(jīng)全面禁止ChatGPT。港大也明令禁止使用chatGPT或其他AI工具上課、做作業(yè)或考試。
如果必須使用,需事先獲得相關(guān)課程導(dǎo)師書面許可,違反上述臨時(shí)措施的行為被視為【潛在抄襲】行為;如果教師懷疑學(xué)生使用hatGPT,可要求學(xué)生討論相關(guān)論文或作品,設(shè)額外的補(bǔ)充口試、新增課堂考試等。
學(xué)生使用ChatGPT完成作業(yè)、論文等,可以輕松的解決一些需要查詢,思考的問題。
但在學(xué)校方面則認(rèn)為這項(xiàng)技術(shù)對于沒有使用ChatGPT的同學(xué)來說是首先是不公平的,另一方面使用人工智能幫助完成作業(yè)及論文這種行為在當(dāng)時(shí)沒有明確的規(guī)定是否屬于抄襲行為。
而對于學(xué)生來說,過度依賴人工智能完成課程,在整個(gè)學(xué)習(xí)過程中無法發(fā)展出自己的邏輯推理、批判性思維和語言技巧,同時(shí)也會失去獨(dú)立自主的學(xué)習(xí)過程以及對知識的驗(yàn)證過程。
而28所英國大學(xué)已經(jīng)明確規(guī)定禁止在論文和課程作業(yè)中使用Chatgpt,否則將被視為學(xué)術(shù)不端行為?,F(xiàn)在很多學(xué)校已經(jīng)在嘗試加入AI 相關(guān)的課程或更換其他考核方式,比如課堂作業(yè)、手寫論文、小組作業(yè)和口試等。
ChatGPT除了可以用來完成課業(yè)論文,也可以用來寫小說、詩歌或進(jìn)行編劇。
當(dāng)?shù)貢r(shí)間5月2日,美國編劇協(xié)會(WGA)和好萊塢等影視巨頭談判宣告破裂。11500名協(xié)會成員舉著統(tǒng)一制作的標(biāo)語牌,涌上紐約和洛杉磯的街頭,進(jìn)行罷工游行。而他們抗議的并不是AI,而是那些幕后使用、訓(xùn)練AI的電影公司。
由于AI的生成并不是基于自主創(chuàng)作,而是在于喂給機(jī)器相關(guān)文筆、故事梗概、畫面風(fēng)格的基礎(chǔ)上進(jìn)行的【模仿創(chuàng)作】,所有的創(chuàng)作都是建立在現(xiàn)有的數(shù)據(jù)基礎(chǔ)上,而對于很多創(chuàng)作者來說相當(dāng)于用自己的作品,斷送了自己的生計(jì)。這就牽扯到版權(quán)問題,之后會有專門的說明討論。
2. 自動化編程導(dǎo)致程序員將被取代
CSDN 曾提出自動化編程的 5 個(gè)等級:
- 第一個(gè)等級(C1):基于當(dāng)前行代碼自動補(bǔ)全。
- 第二個(gè)等級(C2):編寫代碼時(shí) AI 可以預(yù)測下一行代碼。
- 第三個(gè)等級(C3):基于自然語言生成代碼;基于自然語言完成編程語言翻譯功能。
- 第四個(gè)等級(C4):高度自動編程??梢曰谧匀徽Z言生成項(xiàng)目及注釋,基于自然語言生成模塊及注釋,基于自然語言生成函數(shù)及注釋,函數(shù)、模塊、項(xiàng)目粒度自動化測試生成;主流編程語言正確互譯;基于當(dāng)前行代碼生成下一行代碼;代碼調(diào)試 (bug 定位及正確修正建議);基于當(dāng)前行代碼自動補(bǔ)全;代碼檢查(自然語言提示問題)。
- 第五個(gè)等級(C5):完全自動編程。可以基于自然語言生成系統(tǒng)及注釋;基于自然語言生成項(xiàng)目及注釋;基于自然語言生成模塊及注釋;基于自然語言生成函數(shù)及注釋;函數(shù)、模塊、項(xiàng)目、系統(tǒng)粒度自動化測試生成;全編程語言最佳互譯;基于當(dāng)前行代碼生成下一行代碼;代碼調(diào)試 (bug 定位以及自動修正);基于當(dāng)前行代碼自動補(bǔ)全;代碼檢查(自然語言精準(zhǔn)提示問題);代碼自動最佳糾錯(cuò)。
目前對于程序員來說,ChatGPT更像是最強(qiáng)輔助,使用ChatGPT可以在幾秒內(nèi)解決編碼的代碼補(bǔ)全、編譯錯(cuò)誤、語法錯(cuò)誤等問題,并在不同語言和框架下,提供有關(guān)如何使用特定語言、API和框架的信息等等(也就是C1-C3的部分工作)。
但ChatGPT只能用于快速、準(zhǔn)確地調(diào)用事實(shí)答案,幫助提升程序員的生產(chǎn)力,沒有辦法適用于需要【邏輯推理】等高精度需求的任務(wù)領(lǐng)域。也就是在最終仍然需要人類確認(rèn)和測試代碼的正確與否并進(jìn)行修改。
而初級程序員將被取代的情況早在十幾年前就已經(jīng)出現(xiàn)了,很多企業(yè)很早就已經(jīng)開始用低代碼開發(fā)的方式節(jié)省時(shí)間,而GPT的出現(xiàn)讓這種趨勢更加明顯,創(chuàng)造性較低的開發(fā)活動很容易被取代。但對于沒有系統(tǒng)學(xué)習(xí)過編程的小白用戶來說,編程的門檻也相對容易了很多。
其他類似金融、律師、教育等職業(yè)也是類似情況,AI降低了我們與某些專業(yè)性職業(yè)的門檻距離,他可以準(zhǔn)確、快速的找到專業(yè)性信息,將信息數(shù)據(jù)結(jié)構(gòu)化,替代基礎(chǔ)的信息收集及普及工作,但還是需要更高專業(yè)的相關(guān)人員進(jìn)行信息補(bǔ)充與校正,以提供真實(shí)的、不同場景下的解決方案。
3. 設(shè)計(jì)行業(yè)
由于Midjourney、Stable Diffusion等AI 繪畫工具的爆火,使得設(shè)計(jì)、原畫、插畫等設(shè)計(jì)師感到岌岌可危,在AI 繪畫工具的加持下,仿佛人人都可以進(jìn)行高質(zhì)量的創(chuàng)作。
一部分畫手對于AI繪畫采取抵制、排斥的態(tài)度,而有些則開始嘗試將AI繪畫作為生產(chǎn)力,試圖從另一個(gè)方向突破。
各大公司則態(tài)度明顯很多,都在再嘗試使用Midjourney、Stable Diffusion等AI 繪畫工具實(shí)現(xiàn)降本增效,降低低端重復(fù)工作內(nèi)容的投入比例。
但在實(shí)際的執(zhí)行過程中還是會有各種各樣的問題,由于AI無法理解畫面元素與元素之間的關(guān)系,畫面的視覺統(tǒng)一性無法保證、生成的內(nèi)容不可控、無法進(jìn)行特定部分的修改等等,比如衣服上的褶皺、logo、特定花紋、紋路等等,需要有專門的人進(jìn)行修改,使得AI 繪畫好像并不像傳說中的那么容易應(yīng)用于商業(yè)領(lǐng)域。
這是由于AI 繪畫的底層邏輯其實(shí)是自然語言模型,AI對于語義的理解和人類本身不可避免的會出現(xiàn)偏差。
技術(shù)的進(jìn)步,伴隨了舊工作形式的消失,同時(shí)也伴隨了工作內(nèi)容的出現(xiàn),上面我們大概了解到部分AI對部分職業(yè)的影響。而AI和人類也對現(xiàn)在的工作進(jìn)行了評估,并引用“暴露值”(Exposure)這一新的標(biāo)準(zhǔn)來來評估哪些工作形式將被AI將取代。
接下來我們來聊一聊,AI 影響下對已有職業(yè)的影響及新職業(yè)的產(chǎn)生。
03 AI帶新的工作方向
蒸汽機(jī)剛誕生時(shí),部分紡織工人對機(jī)器給人類帶來人類失業(yè)的災(zāi)難感到憤怒,并砸毀了機(jī)器。
在一開始人們確實(shí)會因?yàn)樾录夹g(shù)的誕生導(dǎo)致大量傳統(tǒng)工作消失,但新的進(jìn)步終究會創(chuàng)造出更好的工作崗位,實(shí)現(xiàn)新的經(jīng)濟(jì)增長和創(chuàng)造力。
當(dāng)時(shí)的工業(yè)革命創(chuàng)造了大量的高度自動化的機(jī)器,替代體力勞動,使得人類開始從事大量腦力勞動工作,而AI的出現(xiàn)也導(dǎo)致很多工作職業(yè)受到影響。
1. AIOE暴露值評估工作是否會被AI工具影響
3月20日,在人類評估和GPT-4共同調(diào)研評估的結(jié)果中顯示,口譯員和筆譯員、調(diào)查研究人員、數(shù)學(xué)家、新聞分析師、記者和新聞工作者等職業(yè)受GPT技術(shù)影響最大,其次是作家、稅務(wù)人員、書信員、區(qū)塊鏈工程師、法律秘書和行政助理等行業(yè)。
調(diào)研過程中使用AIOE(AI Occupational Exposure),引入了“暴露值”(Exposure)這一新的標(biāo)準(zhǔn)來衡量確定工作和行業(yè)對AI進(jìn)步的“暴露”,其定義為使用GPT模型及其相關(guān)技術(shù)是否會將人類執(zhí)行特定任務(wù)所需的時(shí)間減少50%。
- E0:沒有暴露。
- E1:直接暴露,僅使用大型語音模型(比如GPT-4 聊天界面),可以將時(shí)間至少減少50%。
- E2:間接暴露,單獨(dú)使用大型語音模型無法達(dá)到效果,但在它的基礎(chǔ)上開發(fā)額外軟件(比如圖形生成),可以將時(shí)間減少50%。
E0等級,主要包括體力勞動,比如:
最終,人類評估員將15種職業(yè)的“暴露值”標(biāo)記為100%,即使用GPT技術(shù)將使人類執(zhí)行該職業(yè)中特定任務(wù)所需的時(shí)間減少50%,包括作家、數(shù)學(xué)加、保稅員、金融量化分析師、網(wǎng)頁與數(shù)字界面設(shè)計(jì)師等。
GPT-4則將86種職業(yè)的“暴露值”標(biāo)記為100%,包括數(shù)學(xué)家、會計(jì)與審計(jì)、新聞從業(yè)者、臨床數(shù)據(jù)助理、法律秘書和行政助理、氣候變化政策分析師等,是人類評估結(jié)果的近6倍。
總體來說,如果工作對科學(xué)方法和判斷性思維依賴性較強(qiáng),那么就不會過多接觸GPT技術(shù),而如果涉及編程和寫作技能,就會更容易接觸GPT技術(shù)或受影響。
而從行業(yè)層面來看,受GPT技術(shù)影響最大的五大行業(yè)依次為證券商品合同和其他金融投資行業(yè)、保險(xiǎn)行業(yè)、數(shù)據(jù)處理托管行業(yè)、信息服務(wù)行業(yè)、出版業(yè)。
而受影響最小的五大行業(yè)則是以體力勞動著稱的行業(yè),比如農(nóng)業(yè)和林業(yè)、木制品制造業(yè)、伐木業(yè)、食品制造業(yè)、采礦業(yè)(不包括石油和天然氣)。也就是說收入越高的“白領(lǐng)”越可能收到影響,原因在于,這部分人群更可能接觸和需要使用ChatGPT和相關(guān)工具。
2. AI帶來的新機(jī)會
之前人們的猜想是,隨著科技的進(jìn)步大量體力勞動工作將被取代,之后是認(rèn)知?jiǎng)趧?,而隨著AI的到來促使我們提前進(jìn)入了新的時(shí)代,而最不受影響反而是體力勞動。
另一方面,AI也催生了新的職業(yè),由于AI的缺點(diǎn),比如編造事實(shí)、無法進(jìn)行邏輯推理等等,在真實(shí)的工作場景中,AI只有有可能出錯(cuò),就無法放任其獨(dú)立完成工作。
因此AI 的火爆同樣也帶來了新的熱門高薪職業(yè),如提示詞工程師、AI訓(xùn)練師等職位,也成為了近段時(shí)間招聘的熱門:
- 提示工程師——負(fù)責(zé)開發(fā)和優(yōu)化人工智能提示算法的工程師,訓(xùn)練大模型。需要具備對人工智能、自然語言處理、機(jī)器學(xué)習(xí)等技術(shù)的深刻理解,以及對人類語言表達(dá)的熟練掌握。日常工作為各種應(yīng)用和平臺設(shè)計(jì),優(yōu)化提示詞,以提高用戶的使用體驗(yàn)和效率。
- 人工智能訓(xùn)練師——為機(jī)器學(xué)習(xí)模型設(shè)計(jì)和實(shí)施訓(xùn)練計(jì)劃,即讓機(jī)器人懂用戶在說什么。使用一系列的方法來改善機(jī)器學(xué)習(xí)模型的性能,包括數(shù)據(jù)清洗、超參數(shù)調(diào)優(yōu)、正規(guī)化等。還會負(fù)責(zé)從可用數(shù)據(jù)中提取,篩選和編寫有意義的結(jié)構(gòu),以便訓(xùn)練機(jī)器學(xué)習(xí)模型,并解決訓(xùn)練中出現(xiàn)的問題。另一方面需要收集有關(guān)機(jī)器學(xué)習(xí)技術(shù)的最新進(jìn)展,不斷改進(jìn)訓(xùn)練方法,以提高模型的準(zhǔn)確性和可靠性。
- AI代碼整理員——將AI生成的代碼進(jìn)行整理、糾錯(cuò),最終獲得一個(gè)完整、邏輯上能跑通的代碼文檔。(大學(xué)生兼職)
- AI作圖家——通過AI作圖工具“midjourney”,根據(jù)需求提煉關(guān)鍵詞,通過提示詞或關(guān)鍵詞,讓工具生成一副畫。拆分關(guān)鍵詞是這個(gè)工作的核心,關(guān)鍵詞越精細(xì),做出的畫越符合想要的。同時(shí)需要對生成的圖片進(jìn)行細(xì)節(jié)修改。
- AI敘事員——利用基于ChatGPT的AI工具去寫網(wǎng)文、故事。需要先想象一個(gè)故事背景,然后將這個(gè)故事進(jìn)行細(xì)枝末節(jié)的拆分,必須要拆分的足夠詳細(xì),這樣可以讓AI反饋出的文字更加詳盡和真實(shí)。
隨著AI的爆火,作為一個(gè)全新的工具,AI的影響已經(jīng)自然而然的開始蔓延到各個(gè)階層和角落,而另一方面我們也需要看到AI的風(fēng)險(xiǎn)與局限。
04 AI的局限與潛在風(fēng)險(xiǎn)
1. AI的局限
無論是文生文還是文生圖,AI 以自然語言模型以及大量數(shù)據(jù)算力為基礎(chǔ),本身還是在理解、信息數(shù)據(jù)方面存在問題。ChatGPT可以快速、準(zhǔn)確、持續(xù)的進(jìn)行信息的收集、整理、反饋,但同時(shí)也會犯些明顯的錯(cuò)誤,包括編造信息,因此在真實(shí)工作環(huán)境中必須要有相關(guān)人員監(jiān)督其工作,無法獨(dú)立完成工作。
而在AI繪畫方面,生成圖片的隨機(jī)性、無法進(jìn)行細(xì)節(jié)調(diào)整、對輸入Prompt及輸入信息用戶的認(rèn)知依賴、指向性差(無法生成數(shù)字或精確到像素)等,都需要在生成的圖片上進(jìn)行二次加工或作為創(chuàng)意概念靈感使用,無法直接作為商用結(jié)果進(jìn)行上線使用。
2. AI的潛在風(fēng)險(xiǎn)
在3月底,包括2018年圖靈獎(jiǎng)得主 Yoshua Bengio、馬斯克、史蒂夫·沃茲尼亞克、Skype 聯(lián)合創(chuàng)始人、Pinterest 聯(lián)合創(chuàng)始人、Stability AI CEO等多位知名人士簽名支持,呼吁所有AI實(shí)驗(yàn)室立即暫停至少6個(gè)月的時(shí)間,不要訓(xùn)練比GPT-4更強(qiáng)大的AI系統(tǒng)。
而在這個(gè)暫停期間需要AI 實(shí)驗(yàn)室和獨(dú)立專家共同制定和實(shí)施一套共享的先進(jìn)AI設(shè)計(jì)和開發(fā)安全協(xié)議,這些協(xié)議應(yīng)該由獨(dú)立的外部專家嚴(yán)格審核和監(jiān)督。
在AI 進(jìn)步如此神速的當(dāng)下,相關(guān)的監(jiān)督、審計(jì)手段卻依然遲遲沒有跟上,也就是說沒人能保證AI工具及使用AI工具的過程中的安全性。呼吁信中提出疑問:
- 我們應(yīng)該讓機(jī)器充斥我們的信息渠道,傳播宣傳和謊言嗎?
- 我們應(yīng)該將所有工作都自動化,包括那些令人滿足的工作嗎?
- 我們應(yīng)該發(fā)展可能最終超過、取代我們的非人類思維嗎?
- 我們應(yīng)該冒失控文明的風(fēng)險(xiǎn)嗎?
需要注意的是這封倡導(dǎo)信并不是說暫停AI的發(fā)展,而是希望將研究開發(fā)重點(diǎn)放在提高現(xiàn)有強(qiáng)大、先進(jìn)系統(tǒng)的準(zhǔn)確性、安全性、可解釋性、透明度、穩(wěn)定、一致、可信度和忠誠度。并在信中提出需要AI開發(fā)人員與政府合作,至少需要:
- 專門負(fù)責(zé)AI有能力的新機(jī)構(gòu);
- 監(jiān)督和跟蹤高性能人工智能系統(tǒng)和大型計(jì)算能力池;
- 用來幫助區(qū)分真實(shí)與合成的出處及水印系統(tǒng),并跟蹤模型泄漏;
- 強(qiáng)大的審計(jì)和認(rèn)證生態(tài)系統(tǒng);
- 人工智能造成的傷害責(zé)任;
- 為技術(shù)人工智能安全研究提供強(qiáng)大的公共資金;
- 資源充足的機(jī)構(gòu)來應(yīng)對人工智能將造成的巨大經(jīng)濟(jì)和政治破壞(尤其是對民主的破壞)。
附上原信件鏈接,希望了解更多的同學(xué)可以自己查看,《Pause Giant AI Experiments: An Open Letter》。
而另一方面AIGC模型的完成和完善依賴于大量的數(shù)據(jù)訓(xùn)練,而用于訓(xùn)練的數(shù)據(jù)中往往包含受版權(quán)保護(hù)的內(nèi)容(比如圖片版權(quán)商圖庫里的圖片、知名藝術(shù)家的作品等等),另一方面藝術(shù)家是否有被AI模仿的意愿。
因此對AI生成物用于商用的版權(quán)問題一直存在諸多爭議。而通過AI生產(chǎn)的圖片版權(quán)到底是歸用戶、平臺或是需要版權(quán)注冊后才擁有或者以CC0(知識共享許可協(xié)議)協(xié)議發(fā)布,不同的平臺或用戶都有自己的一套想法。
直到2023年3月16日,美國版權(quán)局(USCO)發(fā)布的美國法規(guī)第202部分,才有說明AI自動生成的作品,不受版權(quán)法保護(hù)。
USCO表示,作者通過Photoshop進(jìn)行的創(chuàng)作圖片作品是受保護(hù)的,從最初的構(gòu)思到完成創(chuàng)作,在整個(gè)過程中有人工參與進(jìn)行創(chuàng)作。而AI工具自動生成的作品,整個(gè)過程由機(jī)器人自動完成,并且訓(xùn)練的數(shù)據(jù)需要基于人類創(chuàng)作的作品,因此不受版權(quán)法保護(hù)。
而國內(nèi)目前還沒有明確的法律關(guān)于AI生成物的版權(quán)問題。
也就是說無論是通過何種AI工具生成的劇本、小說、畫作、音樂等等創(chuàng)作,任何人都無法擁有版權(quán),任何人都可以進(jìn)行使用。
05 尾聲
還沒有試過任何AI工具,可以先接觸下ChatGPT、Midjourney或其他AI工具,但目前ChatGPT需要進(jìn)入OpenAI官網(wǎng),根據(jù)提示進(jìn)入ChatGPT頁面。
目前暫不支持國內(nèi)手機(jī)號,需要第三方平臺輔助接碼,如果想快速體驗(yàn)可以嘗試Notion或Writesonic等門檻低的其他平臺。Midjourney同樣的情況目前有大量的教程怎樣注冊使用及關(guān)鍵詞講解,這里也不做過多說明。
歷史上的數(shù)輪創(chuàng)新浪潮從來沒有淘汰人類,也并未導(dǎo)致大規(guī)模失業(yè),反而使勞動需求空前增加。
比如,機(jī)器雖然部分替代了人工耕種,卻也圍繞農(nóng)業(yè)機(jī)械催生并聯(lián)通了制作、維修等上下游行業(yè),每個(gè)行業(yè)都包含大量的工作崗位。電腦普及后,數(shù)字經(jīng)濟(jì)、平臺經(jīng)濟(jì)在今天依然在擴(kuò)展著我們的生活和工作的邊界。
對于AI的探索從來不是突然的爆發(fā),技術(shù)跟新帶來更多的可能,或許更多時(shí)候我們需要保持對技術(shù)的樂觀及敏感,在不斷的局勢變化中找到自己的方向。
資源來源:
- 《penAI CEO最新訪談,3萬字全文詳述技術(shù)、競爭、恐懼和人類與AI的未來》
- 《LLMs 大語言模型是對實(shí)體世界的抽象》
- 《什么是LLM大語言模型?Large Language Model,從量變到質(zhì)變》
- 《transformer通俗理解》
- 《什么是GAN(生成對抗網(wǎng)絡(luò))?》
- 《別讓 GPT-4 再進(jìn)化!馬斯克帶頭簽署千人聯(lián)名信,緊急呼吁 AI 實(shí)驗(yàn)室立即暫停研究?》
- 《當(dāng) AI 沖擊自動化編程,誰將成為受益者?》
- 《“你的AI侵犯了我的版權(quán)”:淺談AIGC背后的版權(quán)保護(hù)問題》
作者:查無此人;公眾號:9號自習(xí)室;知乎專欄:9號自習(xí)室。
本文由 @9號自習(xí)室 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
該文章從展示AI技術(shù)的進(jìn)步,討論了人們在面對這種進(jìn)步時(shí)的機(jī)會和擔(dān)憂。通過提供一些例子和細(xì)節(jié),也展示了AI技術(shù)對我們生活的潛在影響和應(yīng)用領(lǐng)域。然而,文章沒有深入探討技術(shù)對社會的影響,如失業(yè)率增加等問題。