AIGC產業生態迎來爆發期:一份ChatGPT調研報告

1 評論 10444 瀏覽 27 收藏 39 分鐘

AI技術正在飛速地發展和進化中,而在這股AI發展浪潮中,AIGC這一概念成功出圈,人們逐漸可以借用AI自主生成各式各樣的內容或數據。那么,當前AIGC行業發展到了怎樣的階段?其中的關鍵性應用模型ChatGPT,又有著怎樣的表現?

一、AIGC行業介紹及發展趨勢

1. AIGC產業生態迎來爆發期

AIGC(AI-Generated Content,人工智能生產內容)最基本的能力是生成內容,包括文本、圖像、視頻、代碼、3D內容或者幾種媒介類型轉換組合,形成的“多模態內容”。生成算法、預訓練模型、多模態等AI技術累積融合,以及深度模型方面的技術創新,共同催生了AIGC的大爆發。

AIGC是相對于過去的PGC、UGC、AIUGC而提出的。過去的傳統AI偏向于分析能力,基于已有內容 ;現在的AI基于訓練數據和生成算法模型,可以自主生成各種形式的內容和數據。

2022年,AIGC(AI-Generated Content,人工智能生成內容)爆火出圈。

2022年10月,Stable Diffusion、DALL-E 2、Midjourney等可以生成圖片的AIGC模型風行一時。

2022年12月,OpenAI發布能夠回答問題、生成代碼、構思劇本和小說的聊天機器人模型ChatGPT ,將人機對話推向新高度。 目前,從提供預訓練模型的基礎設施層公司到專注打造AIGC產品和應用工具的應用層公司,圍繞 AIGC生長出繁榮的生態,技術創新引發的應用創新浪潮迭起,中國有望憑借領先的AIGC技術賦能各行各業。

2. AIGC市場規模到2025有望達500億元

在傳統PGC和UGC模式下,內容生成領域存在產能約束和質量約束,PGC受制于人力資源的供給側限制,UGC 雖然降低了PGC的生產門檻,但因用戶創作能力和工具 功能的局限存在質量約束。AIGC突破內容生成產能和質量約束,應用廣泛,市場規模將會大幅擴大。

根據《中國AI數字商業產業展望2021-2025》報告預測AI數字商業內容的市場規模將從2020年的40億元,增加到2025年的495億元。

3. AIGC產業生態體系呈現上中下三層架構

目前AIGC產業生態體系的雛形已現,呈現上中下三層架構,第一層為上游基礎層,是由預訓練模型為基礎搭建的AIGC技術基礎設施層。

第二層為中間層,即垂直化、場景化、個性化的模型和應用工具。在預訓練的大模型基礎上快速抽取生成 場景化、定制化、個性化的小模型,實現在不同行業、垂直領域、功能場景的工業流水線式部署。

第三層為應用層,即面向C端用戶的文字、圖片、音視頻等內容生成服務。

4. AIGC落地場景:AI繪畫、AI建模、聊天機器人ChatGPT等

2022年被稱為AIGC元年,多個AI領域迅速發展,繪畫、音樂、新聞創作、主播等諸多行業被重新定義 。目前AIGC正在從簡單的降本增效(以生成金融/體育新聞為代表)向創造額外價值(以提供繪畫創作素材為代表)轉移,文本-圖像-視頻的跨模態/多模態內容生成正在進展中。

已有的落地場景包括AI繪畫、AI建模、聊天機器人ChatGPT等。

二、ChatGPT介紹及發展趨勢

1. 文本生成式AI:聊天機器人ChatGPT

OpenAI:由馬斯克、美國創業孵化器Y Combinator總裁阿爾特曼、全球在線支付平臺PayPal聯 合創始人彼得·蒂爾等硅谷科技大亨于2015年12月創立,主要用于制造“通用”機器人和使用自然語言的聊天機器。

2020年5月, OpenAI 發布了以Transformer為基礎的NLP(自然語言生成)預訓練模型GPT-3,此前已經歷過GPT-1、GPT-2。

2022年11月30日,OpenAI公司發布聊天機器人模型ChatGPT,ChatGPT對GPT-3模型進行微調, 并引入RLHF(基于人類反饋的強化學習)方法。只需向ChatGPT文字提出需求,即可讓其完成回答問題、書寫代碼、創作文本等指令,發布一周內用戶量超過百萬。

ChatGPT的連續對話能力、強大的理解力、回答的準確度和創造性使其迅速走紅。World Of Engineering數據顯示,ChatGPT發布短短兩個月時間,用戶數便突破1億。具體而言,ChatGPT能理解并生成文字,屬于AIGC(AI-Generated Content,人工智能生產內容)技術應用中的文本生成模態應用模型。

2. ChatGPT可能改變搜索引擎使用方式

ChatGPT屬于AIGC的范疇,能夠回答連續性的問題、質疑不正確的假設,甚至拒絕不合理的要求,大幅提高了AI在人機對話時的準確度和可控性,將有望改變人類使用搜索引擎的方式。

Open AI的CEO稱AIGC的最終目標是做一個類似于新時代的搜索引擎。目前ChatGPT展示出來的內容輸出質量和內容覆蓋維度,已經可以直面“搜索引擎”與“問答社區”。

外媒The Information 報道顯示,微軟可能在2023年3月之前將ChatGPT引入自家的搜索引擎Bing,用人工智能來回答一些搜索查詢,此舉或將改變搜索引擎的運行模式,革新性地提升搜索引擎效率。

StatCounter數據2020-2022谷歌全球市場份額超90%,ChatGPT出現將挑戰谷歌搜索引擎的霸主地位。

3. ChatGPT已能覆蓋較多能力域

由于ChatGPT包含了更多主題的數據,能夠處理更多小眾主題。ChatGPT能力范圍可以覆蓋回答問題、撰寫文章、文本摘要、語言翻譯和生 成計算機代碼等任務。

4. ChatGPT具備諸多先進性特征

chatGPT嵌入了人類反饋強化學習以及人工監督微調,因而具備了理解上下文、連貫性等諸多先進特征,解鎖了海量應用場景。當前,ChatGPT所利用的數據集只截止到2021年。在對話中,ChatGPT會主動記憶先前的對話內容信息(上下文理解),用來輔助假設性的問題的回復,因而ChatGPT也可實現連續對話,提升了交互模式下的用戶體驗。同時,ChatGPT也會屏蔽敏感信息,對于不能回答的內容也能給予相關建議。

5. ChatGPT商業化進程加快

微軟近日考慮宣布將向OpenAI進行近百億美元的投資,此前微軟分別于2019年和2021年對OpenAI進行投資,若此次投資完成微軟將擁有OpenAI 49%的股權。微軟對單個100GPU的收費是3美元/時,按照 ChatGPT加載模型和文本的速度,生成一個單詞的費用約為0.0003美元;而ChatGPT的回復通常至少有30個單詞,因此ChatGPT每回復一次,至少花OpenAI 1美分。微軟既能提供錢,又能提供算力。

2023年1月,ChatGPT的活躍用戶數或已達1億,可能是史上增長最快的消費者應用。因訪問量過大, OpenAI對ChatGPT進行了大規模限流,包括限制每小時的提問數量,以及高峰時段排隊等舉措。

OpenAI于2023年2月正式推出ChatGPT Plus版本(率先對美國地區用戶開放),收費20美元/月,Plus版 ChatGPT全天可用,無需排隊。

6. 國內外科技巨頭積極布局生成式AI,部分公司已有成型產品

在ChatGPT發布后,谷歌CEO在公司內部發布了“紅色警報” (Code Red),敦促團隊解決ChatGPT對公司搜索引擎業務構成的威脅,同時批準了在谷歌搜索引擎中加入AI聊天機器人的計劃。2月4日,谷歌注資3億美元投資ChatGPT競品——Anthropic,谷歌將獲得約10%的股份, Anthropic計劃將次輪資金用于購買谷歌云計算部 門的計算資源;Anthropic開發了一款名為Claude的智能聊天機器人,據稱可與ChatGPT相媲美(仍未發布)Anthropic和Open AI淵源頗深,其聯合創始人曾擔任OpenAI研究副總裁。

微軟將ChatGPT視為新一代技術革命,將ChatGPT整合進Bing搜索引擎、Office全家桶、Azure云服務、Teams程序等產品中,微軟近期宣布推出視頻會議及遠程協作平臺的高級付費版Microsoft Teams Premium,訂閱者可享用OpenAI GPT提供支持的大型語言模 型技術,用AI自動生成會議筆記,此舉或對Zoom、谷歌會議等平臺形成巨大沖擊。

百度:1月10日,百度宣布將升級百度搜索的“生成式搜索”能力,智能解答用戶的搜索提問;2月7日,百度宣布將在3月份 完成其ChatGPT產品的內測,面向公眾開放,該項目名字為文心一言(ERNIE Bot),百度指出,生成式AI和搜索引擎是互補關系而不是替代;據路透社報道,百度計劃于 3 月將類似 ChatGPT 的 AI 對話服務作為獨立應用推出,之后再逐步將其合并到搜索引擎中。

騰訊:2月3日,騰訊公布一項人機對話專利,能夠實現機器與用戶之間自然且順暢的溝通 ,廣告為主,支持廣告智能制作,以 AIGC技術生成廣告文案和視頻,降低 了制作成本,目前市場規??焖僭鲩L,未來 5 年內 AIGC 產生的圖片的占比預計會達到 10-30% 前期可作為UGC和PGC的輔助,幫助廣告主設計文案,到后期就是AI技術整體的發展,后期可能是有望代替人工的工作。

字節:已經開始布局,主要是 AI+內容,比如自動生成投稿和輔助寫作,在今日頭條上利用AIGC生產內容,目前 AIGC 整體的生成質量的內容還是較好的,要好于普通的UGC,但和PGC相比還有所欠缺。抖音方面也有應用,通過 AI 的模式來生成短視頻。

阿里、京東等電商類平臺:在智能客服領域有布局,其次是 AI+營銷,例如阿里巴 巴,可以結合商品,自動生成高質量文案描述商品,提高營銷效率 。

三、ChatGPT商業化

1. ChatGPT試點訂閱計劃

2023年2月2日,OpenAI發布ChatGPT試點訂閱計劃——ChatGPT Plus,每月20美元 ChatGPT Plus訂閱者可獲得比免費版本更穩定、更快的服務,及嘗試新功能和優化的優先權。

2. 類人聊天機器人

類人聊天機器是一種旨在模擬與用戶進行類人對話的電腦程序。它們已被應用于多個行業,包括客戶服務、電子商務和娛樂等。

ChatGPT帶來的變革:此前的聊天機器人只能根據設定問題 回復固定內容,同chatGPT融合之后,將文本生成、圖像生成、多模態轉換技術融合起來,環境感知、理解能力在大幅增強,實現和人的形似到神似?;贑hatGPT的類人聊天機器人可以提供客戶服務、虛擬代理、內容創意和文本生成、 以及信息知識提供等服務。

1)國外重點企業

openAI:公司核心宗旨在于“實現安全的通用人工智能(AGI)”,目前推出的“ChatGPT類人聊天機器人”火爆全球,其公司在圖片生成和視頻生成的應用上也有很深的造詣。

Google:公司在AIGC領域布局很久,目前也有“bard”類人聊天機器人的誕生試用,在AIGC的多種技術領 域也處于前列。

2)國內重點企業

百度:是國內布局AI賽道最早的公司之一,目前已宣布“文心一言”類人聊天機器人將很快進入公測環節,圖片 生成方面也有突破。

小冰:從微軟獨立拆分出來的人工智能公司,推出的 “小冰”機器人是目前全球范圍內承載交互量最大的人工智能系統。

3 月 9 日消息,在批準通過 BlueMail 應用程序之后,蘋果近日再次批準了一款適用于 Apple Watch 的 ChatGPT 應用程序 watchGPT,用戶可以在 Apple Watch 上和 ChatGPT 聊天了。

3. ChatGPT+傳媒:實現智能新聞寫作,提升新聞的時效性

ChatGPT可以幫助新聞媒體工作者智能生成報道,將部分勞動性的采編工作自動化,更快、更準、更智能地生成內容。

  • 2014年3月,美國洛杉磯時報網站的機器人記者Quakebot,在洛杉磯地震后僅3分鐘,就寫出相關信息并進行發布;
  • 美聯社使用的智能寫稿平臺 Wordsmith 可以每秒寫出2000篇報道;
  • 中國地震網的寫稿機器人在九寨 溝地震發生后7秒內就完成了相關信息的編發;
  • 第一財經“DT稿王”一分鐘可 寫出1680字。

4. ChatGPT+影視:拓寬創作素材,提升作品質量

ChatGPT可以根據大眾的興趣身定制影視內容,從而更有可能吸引大眾的注意力,獲得更好的收視率、票房和口碑。

ChatGPT可以為劇本創作提供新思路,創作者可根據ChatGPT的生成內容再進行篩選和二次加工,從而激發創作者的靈感,開拓創作思路,縮短創作周期。

ChatGPT 有著降本增效的優勢,可以有效幫助影視制作團隊降低在內容創作上的成本,提高內容創作的效率,在更短的時間內制作出更高質量的影視內容:

  • 2016年,紐約大學利用人工智能編寫劇本《Sunspring》, 經拍攝制作后入圍倫敦科幻電影48小時前十強;
  • 2020年,美國查普曼大學的學生利用OpenAI 的GPT-3模型創作劇本 并制作短片《律師》;
  • 國內海馬輕帆科技公司推出的“小說轉劇本”智能寫作功能,服務了包括《你好,李煥英》《流浪地球》 等爆款作品在內的劇集劇本30000多集、電影/網絡電影劇本8000多 部、網絡小說超過500萬部。

5. ChatGPT+營銷:打造虛擬客服,賦能產品銷售

ChatGPT虛擬客服為客戶提供24小時不間斷的產品推薦介紹以及在線服務能力,同時降低了商戶的營銷成本,促進營銷業績快速增長。

ChatGPT虛擬客服能快速了解客戶需求和痛點,拉近商戶與消費人群的距離,塑造跟隨科技潮流、年輕化的品牌形象。

ChatGPT虛擬客服比人工客服更穩定可靠,在人工客服有限并且素質不齊的情況下,虛擬客服展現的品牌形象和服 務態度等由商戶掌控,比人工客服的可控性、安全性更強 。

2月10日,京東云宣布將推出產業版ChatGPT:ChatJD、ChatJD智能人機對話平臺,預計參數量達千億級,將率先落地在零售、金融等兩個領域。

6. ChatGPT+娛樂:人機互動加強,激發用戶參與熱情

ChatGPT可以成為線上的實時聊天對象,增加互動的趣味性和娛樂性。

2月8日,悅商集團也宣布將推出類ChatGPT技術的DEMO產品,在微信,支付寶,百度等小程序里應用,進一步完善用戶交互體驗。并且依托支付寶、微信、百度等多平臺生態服務商的身份,悅商集團可快速融合多家互聯網巨頭推出的類ChatGPT產品進一步完善YCloud系統,為客戶打造最前端的技術服務。

YCloud主要面向全球微商行業,致力于為高速增長的靈活就業人員提供數字化服務工具??梢赃M一步幫助客戶縮減人員成本,降本增效,實現用科技助力個體、實體經濟發展的目標。

游戲:國內《逆水寒》宣布首個游戲版ChatGPT,玩法加持,為游戲行業普及打下技術基礎。據國信證券研報梳理,目前完美世界、昆侖萬維、騰訊、網易、世紀華通、三七互娛、天娛數科、湯姆貓、愷英網絡、凱撒文化等公司均已布局游戲AI業務。

7. ChatGPT+教育: 賦予教育教材新活力,讓教育方式更個性化、更智能

ChatGPT給教育工作者提供全新的教學工具,學生可以通過自主提問的方式快速查缺補漏,讓每個學生得到更個性化、更智能的教育。

8. ChatGPT+金融:幫助金融機構降本增效,讓金融服務更有溫度

金融機構可以通過ChatGPT實現金融資訊、金融產品介紹內容的自動化生產,提升金融機構內容生產的效率。

通過ChatGPT塑造虛擬理財顧問,讓金融服務更有溫度。

9. ChatGPT+醫療:賦能醫療機構診療全過程

ChatGPT賦能優化問診、治療、康復等多環節,快速了解患者的病情并給出較合理的及時反饋,通過人性化的方式第一時間撫慰患者,從而舒緩患者的情緒,加速其康復;同時,讓醫者有更多的時間和精力集中在關鍵患者的關鍵治療環節。

2021年11月開始,九峰醫療在江西省11個地市上百個縣城的鄉鎮衛生院部署了上千家AI工作站。該系統的AI培訓模塊為基層放射科醫生提供教學數據(影像片、標注、影像學征象、診斷建議)。

10. ChatGPT+辦公:大幅提升辦公效率

ChatPDF:上傳PDF文件然后通過問答形式讓它幫你檢索信息,相當于AI幫你讀完了整個PDF文件,你想知道什么直接問它就行,中英文都能支持目前的免費版最大可傳200頁的PDF,超過了就要用自己的OpenAI API了。

平替版有Humata(humata.ai),功能相同,頁數上限是60,2款同時用可以交叉對比,避免錯漏。

ChatExcel:北大團隊做的,和上面相似,只不過上傳的是Excel,然后可以通過自然語言下命令,對表格進行任意調整,調用的是OpenAI專為表格處理做的API服務OpenAI Tabulate。

美中不足的是這還只是一個demo,只支持1MB以內、不超過10列的excel文件,也沒有收費選項,局限性很大。

Chat思維導圖:

  • boardmix AI助手 https://mp.weixin.qq.com/s/A0verAqqSXDcd83Gt0xU_g
  • https://new.qq.com/rain/a/20230224A06UPN00

代碼開發:利用 ChatGPT 輔助開發代碼,提高開發效率,包括代碼補全、自然語言指令生成代碼、代碼翻譯、bug 修復等。

四、ChatGPT相關核心算法

1. 基于 Transformer 的預訓練語言模型

ChatGPT 強大的基礎模型采用 Transformer 架構,Transformer是一種基于自注意力機制的深度神經網絡模型,可以高效并行地處理序列數據。

原始的 Transformer 模型包含兩個關鍵組件:編碼器和解碼器。編碼器用于將輸入序列映射到一組中間表示,解碼器則將中間表示轉換為目標序列。

編碼器和解碼器都由多層的注意力模塊和前饋神經網絡模塊組成。其中自注意力模塊可以學習序列中不同位置之間的依賴關系,即在處理每個位置的信息時,模型會考慮序列中其他所有位置上的信息,這種機制使得 Transformer 模型能夠有效地處理長距離依賴關系。在原始 Transformer 模型基礎上,相繼衍生出了三類預訓練語言模型:編碼預訓練語言模型、解碼預訓練語言模型和編解碼預訓練語言模型。

2. 編碼預訓練語言模型

這類模型在預訓練過程中只利用原始 Transformer 模型中的編碼器。相應的預訓練任務通常選用掩碼語言建模任務(Masked Language Modeling), 即掩碼?。ㄓ锰厥庾址?[MASK] 替換)輸入句子中一定比例的單詞后,要 求模型根據上下文信息去預測被遮掩的單詞。其中有有代表性的工作包括 BERT,ALBERT,RoBERTa等。

BERT 模型是最經典的編碼預訓練語言模型,其通過掩碼語言建模和下一句預測任務,對 Transformer 模型的參數進行預訓練。

ALBERT 是一個輕量化的 BERT 模型,作者通過分解詞向量 矩陣和共享 Transformer 層參數來減少模型參數個數。

RoBERTa 相較于 BERT 模型,RoBERTa 在預訓練階段,采用了更多的語料以及動態掩碼機制(不同輪次同一樣本掩碼不同的單詞),去掉了下一 句預測任務,同時采用了更大的批大小。

3. 解碼預訓練語言模型

GPT (Generative Pre-trained Transformer) 是由 OpenAI 提出的只有解碼器的預訓練模型。相較于之前的模型,不再需要對于每個任務采取不同 的模型架構,而是用一個取得了優異泛化能力的模型,去針對性地對下游任務進行微調。包括 GPT-1、GPT-2 和 GPT-3,上圖列舉了 GPT 若干模型的信息。

GPT-1 在文章“Improving Language Understanding by Generative PreTraining”中被提出。在 GPT 被提出之前,大多數深度學習方法都需要大量人工標注的高質量數據,但是標注數據的代價是巨大的,這極大程度上限制了模型在各項任務性能的上限。如何利用容易獲取的大規模無標注數據來為模型的訓練提供指導成為 GPT-1 中需要解決的第一個問題。

另外自然語言處理領域中有許多任務依賴于自然語言在隱含空間中的表征,不同任務對應的表征很可能是不同的,這使得根據一種任務數據學習到的模型很難泛化到其他任務上。因此如何將從大規模無標注數據上學習到的表征應用到不同的下游任務成為 GPT-1 需要解決的第二個問題。

GPT-1 的結構很簡單,由 12 層 Transformer Block(自注意力模塊和前饋神經網絡模塊)疊加而成。針對第一個問題,GPT-1 中使用了自左到右 生成式的目標函數對模型進行預訓練。這個目標函數可以簡單理解為給定前 i ? 1 個 token,對第 i 個 token 進行預測?;谶@樣的目標函數,GPT-1 就可以利用無標注的自然語言數據進行訓練,學習到更深層次的語法信息與語義信息。

針對第二個問題,在完成了無監督的預訓練之后,GPT-1 接著使用了有標注的數據進行有監督的微調使得模型能夠更好地適應下游任務。給定輸入 token 序列x1, x2, …, xm 與標簽 y 的數據集,對模型的參數進行再次訓練調整,用到的優化模型是在給定輸入序列時預測的標簽最接近真實值。

具體來說,GPT-1 在大規模無標注語料庫上預訓練之后,再利用有標注數據在特定的目標任務上對模型參數進行微調,實現了將預訓練中獲得的 知識遷移到下游任務。

在 GPT-1 提出之前,自然語言處理領域常用的預訓練方法是 Word2Vec在此之后,GPT-1 提出的兩步走的訓練方法成為許多大型語言模型的訓練范式。

從這個角度來看,GPT-1 和 Word2Vec 在 具體下游任務中發揮的作用是類似的,通過無監督的方法獲取自然語言的隱含表示,再將其遷移至其他目標任務。但是從更高的層面來看,GPT-1 與以 往的詞向量表示方法是不同的,其數據量與數據規模的增大使得模型能夠學習到不同場景下的自然語言表示。圖 2.1是 GPT-1 原文中的總覽圖,左側是 GPT-1 的架構以及訓練時的目標函數;右側是對于不同任務上進行微調 時模型輸入與輸出的改變。

與 GPT-1 中的通過預訓練-微調范式來解決多個下游任務不同,GPT-2更加側重于 Zero-shot 設定下語言模型的能力。

Zero-shot 是指模型在下 游任務中不進行任何訓練或微調,即模型不再根據下游任務的數據進行參數 上的優化,而是根據給定的指令自行理解并完成任務。

簡單來講,GPT-2 并沒有對 GPT-1 的模型架構進行創新,而是在 GPT-1 的基礎上引入任務相關信息作為輸出預測的條件,將 GPT-1 中的條件概率 p(output|input) 變為 p(output|input;task);并繼續增大訓練的數據規模以及模型本身的參數量,最終在 Zero-shot 的設置下對多個任務都展示了巨 大的潛力。

雖然 GPT-2 并沒有模型架構上的改變,但是其將任務作為輸出預測的條件引入模型從而在 Zero-shot 的設置下實現多個任務的想法一直延續至今。這樣的思想事實上是在傳達只要模型足夠大,學到的知識足夠多,任何有監督任務都可以通過無監督的方式來完成,即任何任務都可以視作生成任務。

GPT-3使用了與 GPT-2 相同的模型和架構。文中為了探索模型規模對于性能的影響,一共訓練了 8 個不同大小的模型,并將最大的具有 1750 億參數的模型稱為 GPT-3。上圖綜合統計了 GPT-1、GPT-2 和 GPT-3 的 參數量,模型架構以及預訓練的數據集,方便讀者直觀上理解 GPT 的迭代趨勢。

GPT-3 最顯著的特點就是大。大體現在兩方面,一方面是模型本身規模大,參數量眾多,具有 96 層 Transformer Decoder Layer,每一層有 96 個 128 維的注意力頭,單詞嵌入的維度也達到了 12,288;另一方面是訓練過程中使用到的數據集規模大,達到了 45TB。

在這樣的模型規模與數據量的情況下,GPT-3 在多個任務上均展現出了非常優異的性能,延續 GPT-2 將無監督模型應用到有監督任務的思想,GPT-3 在 Few-shot,One-shot 和 Zero-shot 等設置下的任務表現都得到了顯著的提升。

雖然 GPT-3 取得了令人驚喜的效果,但是也存在許多限制,例如天然的從左到右生成式學習使得其理解能力有待提高;對于一些簡單的數學題目仍不能夠很好完成,以及模型性能強大所帶來的社會倫理問題等。

同時由于 GPT 系列模型并沒有對模型的架構進行改變,而是不斷通過增大訓練數據 量以及模型參數量來增強模型效果,訓練代價巨大,這使得普通機構和個人無法承擔大型語言模型訓練甚至推理的代價,極大提高了模型推廣的門檻。

今年1月24日,即ChatGPT發布第二個月,微軟宣布數十億美元投資 OpenAI,并且計劃在算力、商業化以及 AI 技術方面進行長期合作。據報道,本輪融資后OpenAI公司估值高達290億美元,接近2000億元人民幣。隨后2月7日,微軟推出ChatGPT版Bing(必應)搜索引擎和Edge瀏覽器,并在3月更新GPT-4后同時升級,引發全球廣泛關注。

如今新的 AI 浪潮下,微軟開始希望全面評估GPT大模型對于人類、整個 AI 技術行業發展的影響。具體來說,本論文核心主題是關于GPT-4的人工智能系統,它展示了人工智能的一種形式,即人工通用智能(AGI)。論文通過實驗研究與討論GPT-4在推理、創造力、演繹等核心思維能力方面的表現,以及它在文學、醫學和編碼等領域獲得專業知識的范圍,和它所能執行的各種任務。

此外,該文件還探討了如何定義AGI本身,構建缺失組件以實現AGI,并更好地理解最近LLMs所展示的智能起源。論文指出,微軟團隊測試了語言理解方面的反饋。最終,GPT-4很好地完成了多個任務并超過ChatGPT水平。

另外,微軟團隊還利用1994年國際共識智力定義執行多個實驗測試,以觀察GPT-4在推理、解決問題、抽象思考、理解和快速學習等方面能力,最終現實,GPT-4擁有對世界的常識并在這基礎上做出推理的能力,甚至可以用ABC記譜法創作音樂,并按人類要求修改。

所以結果表明,微軟認為,GPT-4是一種非常強大的人工智能系統,它在許多任務和領域中表現出了驚人的能力,并且在某些方面甚至可以與人類相媲美。然而,GPT-4仍然存在一些局限性和挑戰,需要進一步研究和發展才能實現更深入、更全面的AGI系統。

高盛3月27日發布報告指出,全球預計將有3億個工作崗位最終被 AI 取代。假設生成式 AI 實現了各企業承諾的能力,勞動力市場將面臨挑戰,AI 可以接手美國和歐洲高達四分之一的工作。報告預計,隨著勞動生產力提高,AI 應用有望使全球在下一個10年內,推動全球GDP(國內生產總值)年復合增長率將達到7%。

五、ChatGPT可能遇到的問題

1. 合規性問題

ChatGPT產生的答復是否產生相應的知識產權?

ChatGPT進行數據挖掘和訓練的過程是否需要獲得相應的知識產權授權?

ChatGPT是基于統計的語言模型,這一機制導致回答偏差會進而導致虛假信息傳播的法律風險,如何降低其虛假信息傳播風險?

2. 技術性問題

ChatGPT的回答可能過時,因為其數據庫內容只到2021年,對于涉及2022年之后,或者在2022年有變動的問題無能為力。

ChatGPT在專業較強的領域無法保證正確率,即使在雞兔同籠此類初級問題中仍然存在錯誤,并且英文回答和中文回答存在明顯差異化。

ChatGPT對于不熟悉的問題會強行給出一定的答案,即使答案明顯錯誤,依然會堅持下去,直到明確戳破其掩飾的內容,會立馬道歉,但本質上會在不熟悉的領域造成誤導。

本文由 @情入藥 原創發布于人人都是產品經理。未經許可,禁止轉載。

題圖來自 Unsplash,基于CC0協議。

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 優秀

    來自廣東 回復