GPT-4o深度解析:5大行業(yè)場(chǎng)景將加速演進(jìn),國(guó)產(chǎn)AI迎來(lái)4項(xiàng)挑戰(zhàn)
GPT-4o被OpenAI譽(yù)為“全能模型”,那么,“全能模型”的出現(xiàn),可能會(huì)加速哪些行業(yè)場(chǎng)景的演進(jìn)?國(guó)產(chǎn)AI廠商又可能面臨哪些挑戰(zhàn)?一起來(lái)看看本文的解讀。
一、GPT-4o的三項(xiàng)核心能力
OpenAI將GPT-4o譽(yù)為“全能模型”,這一概念將在本文中反復(fù)提及。讓我們先來(lái)回顧一下GPT-4o的三個(gè)優(yōu)勢(shì):
- 實(shí)時(shí)交互接近人類(lèi):歸功于端到端多模態(tài)神經(jīng)網(wǎng)絡(luò),將視覺(jué)、語(yǔ)音等多種模態(tài)訓(xùn)練成一個(gè)模型,簡(jiǎn)化模型服務(wù)工程復(fù)雜度,使反應(yīng)速度接近人類(lèi)。
- 多模態(tài)意圖理解:感知物理世界的視覺(jué)、語(yǔ)音,理解環(huán)境、人物、事件。
- 精通全球語(yǔ)言:實(shí)時(shí)翻譯表現(xiàn)出色,根據(jù)不同的語(yǔ)境調(diào)整翻譯的風(fēng)格和語(yǔ)氣,模仿不同語(yǔ)言的風(fēng)格,中文水平刷新SuperCLUE榜單。
二、全能模型將加速5大行業(yè)場(chǎng)景演進(jìn)
方向1 —— 家庭教育:兒童陪伴機(jī)器人將迎來(lái)第二曲線
家庭教育對(duì)孩子的價(jià)值觀、習(xí)慣、社會(huì)適應(yīng)能力產(chǎn)生深遠(yuǎn)影響,當(dāng)代家長(zhǎng)在教育過(guò)程中的溝通意愿、溝通方法、時(shí)間精力普遍受限,全能模型能以溝通互動(dòng)的方式輔助解決這類(lèi)問(wèn)題。
我的觀點(diǎn):全能模型在素質(zhì)教育方向的潛力,遠(yuǎn)大于課程輔導(dǎo),這恰恰是國(guó)民教育最缺失的部分。潛在用戶(hù)群體可能是一二線城市的80、90后的職場(chǎng)人士,他們的特點(diǎn)是重視啟蒙教育、經(jīng)濟(jì)充裕、敢于嘗試、缺少時(shí)間。
看好三種全能模型溝通互動(dòng)式輔導(dǎo)方向:
1)課程輔導(dǎo):GPT-4o發(fā)布會(huì)中展示了數(shù)學(xué)課程輔導(dǎo),實(shí)測(cè)確實(shí)能夠逐步講解高考數(shù)學(xué)的解題思路。學(xué)生也可以一邊聽(tīng)AI講解編程,一邊在屏幕上查看代碼示例和運(yùn)行結(jié)果。這種指導(dǎo)方式非常個(gè)性化,從設(shè)定問(wèn)題到啟發(fā)思考,再到糾正錯(cuò)誤,最后給予鼓勵(lì),全能模型有潛力輔助完整的PDCA學(xué)習(xí)過(guò)程。過(guò)去的AI,絕對(duì)做不到。
2)素質(zhì)能力輔導(dǎo)
- 心理自查:例如“兒童繪畫(huà)心理評(píng)估”,模型通過(guò)做畫(huà)的內(nèi)容來(lái)推斷兒童的心理狀態(tài)、認(rèn)知和興趣愛(ài)好等。理性答題會(huì)刻意遮掩很多東西,但藝術(shù)表達(dá)、故事性溝通會(huì)將真實(shí)心理展露無(wú)疑。類(lèi)似的需求還有兒童抑郁、焦慮評(píng)估等。故事性、鼓勵(lì)、尊重和易懂的方式與孩子溝通,增強(qiáng)他們的自信心和自我效能感。
- 底線教育:校園霸凌成為今年的熱議話題,為了培養(yǎng)孩子的反霸凌意識(shí),通常會(huì)使用有聲繪本,但繪本缺乏互動(dòng)性。全能模型的交流能力可以彌補(bǔ)這一點(diǎn),通過(guò)互動(dòng)增強(qiáng)孩子的學(xué)習(xí)效果。同樣重要的還有性啟蒙、法律常識(shí)、道德規(guī)范、社交邊界感和坦誠(chéng)溝通等,它們對(duì)個(gè)人安全和社會(huì)競(jìng)爭(zhēng)力有著深遠(yuǎn)影響,卻常常被家長(zhǎng)所忽視。
- 天賦系統(tǒng):智商不代表孩子的全部,兒童天賦系統(tǒng)還包括人際交往、口才表達(dá)、自然認(rèn)知等8個(gè)維度。全能模型可以發(fā)揮個(gè)性化、互動(dòng)性的優(yōu)勢(shì),結(jié)合兒童陪伴機(jī)器人幫助孩子發(fā)展自己的天賦,提高綜合能力的同時(shí),也在自己擅長(zhǎng)的領(lǐng)域內(nèi)取得進(jìn)步。
3)環(huán)境氛圍輔導(dǎo):家庭環(huán)境對(duì)孩子的學(xué)習(xí)動(dòng)力和習(xí)慣非常重要。如果家長(zhǎng)的情緒失控、過(guò)度施壓,可能會(huì)對(duì)孩子的心理產(chǎn)生負(fù)面影響。現(xiàn)在職場(chǎng)人士壓力都很大,回家面對(duì)孩子時(shí)難免會(huì)力不從心。
如果有一個(gè)全天候的氛圍輔導(dǎo)AI助手,就可以幫助實(shí)時(shí)分析家庭氛圍和孩子心理狀態(tài),及時(shí)提醒,每日復(fù)盤(pán)總結(jié)給到家長(zhǎng)輔導(dǎo)建議,督促家長(zhǎng)成為孩子的榜樣,而不是等娃抑郁后再去看心理醫(yī)生。
我的觀點(diǎn):家庭教育機(jī)器人這一輪機(jī)遇,AI+機(jī)器人的公司會(huì)更有優(yōu)勢(shì),互聯(lián)網(wǎng)教育平臺(tái)將受到一定沖擊。因?yàn)橐曨l課件類(lèi)的材料數(shù)據(jù)獲取門(mén)檻不高,容易在拼夕夕等渠道獲得后作為RAG外掛知識(shí),或者訓(xùn)練到全能模型。這意味著未來(lái)的課程輔導(dǎo),比以往更加考驗(yàn)產(chǎn)品設(shè)計(jì)與工程整合能力,變相削弱了教研、教學(xué)的壁壘。
方向2 —— 具身智能:將重塑單身經(jīng)濟(jì)、老年經(jīng)濟(jì)、家庭服務(wù)的場(chǎng)景體驗(yàn)
2024年的具身智能跟過(guò)去不再是一個(gè)物種,有3項(xiàng)顛覆式技術(shù)突破:
1)精細(xì)化動(dòng)作學(xué)習(xí):基于端到端神經(jīng)網(wǎng)絡(luò)的動(dòng)作學(xué)習(xí),打工機(jī)器人擎天柱、特斯拉FSD采用同款技術(shù),理論上機(jī)器人可以學(xué)會(huì)任何手藝活并且比人更加精準(zhǔn)。國(guó)內(nèi)類(lèi)似賽道比較看好初創(chuàng)公司星塵智能。
2)電機(jī)驅(qū)動(dòng)替代液壓:電機(jī)搭配高性能伺服系統(tǒng),一次性突破控制精度、瞬時(shí)響應(yīng)、能耗、體積、安全性等5項(xiàng)瓶頸,最具代表性的就是波士頓動(dòng)力電機(jī)板Atlas的那段宣傳視頻。
3)GPT-4o真人級(jí)交互:全能模型可以為具身智能注入靈魂,但靈魂與神經(jīng)系統(tǒng)的連接還需要補(bǔ)全和增強(qiáng)。我預(yù)判OpenAI后續(xù)版本將針對(duì)空間智能來(lái)強(qiáng)化,尤其補(bǔ)全觸覺(jué)模態(tài),增強(qiáng)全能模型與邊緣計(jì)算的實(shí)時(shí)協(xié)同,提升機(jī)器人精細(xì)化的決策、規(guī)劃、控制能力。類(lèi)似方向也建議持續(xù)關(guān)注Figure、李飛飛創(chuàng)業(yè)項(xiàng)目的進(jìn)展。
單身群體的特征是更注重個(gè)人生活品質(zhì)、沒(méi)有家庭負(fù)擔(dān),可支配收入更多用于消費(fèi),同時(shí)潛在大量情感、社交、生理等需求,對(duì)定制化體驗(yàn)情有獨(dú)鐘。全能模型加持后的具身智能可以滿(mǎn)足:
1)情感陪伴:“具身”意味著可以在陪伴中提供更強(qiáng)的物理存在感、場(chǎng)景帶入感,GPT-4o可以理解用戶(hù)的信念、欲望、意圖來(lái)擬人式交流陪伴,并且擁有無(wú)限的心力、時(shí)間、知識(shí),可以Cosplay各種人設(shè),這是人類(lèi)無(wú)法做到的。
2)社交技能:具身智能可以幫助性格內(nèi)向、社恐的人做模擬演練,扮演成客戶(hù)、同事或朋友等角色,幫助練習(xí)各種場(chǎng)景下的溝通和應(yīng)對(duì)技巧,輔導(dǎo)表情管理和情緒管理,克服緊張焦慮,增強(qiáng)自信。
3)情趣體驗(yàn):試想如果有這樣一個(gè)情趣機(jī)器人,形象、聲音、性格、動(dòng)作、技能、劇本都按照你的要求來(lái)定制,會(huì)是一種什么樣的體驗(yàn)?這里的風(fēng)險(xiǎn)是可能導(dǎo)致單身人群比例進(jìn)一步上升,也伴隨倫理合規(guī)的問(wèn)題。
隨著人口老齡化,老年人對(duì)健康護(hù)理的需求日益增加,具身智能可以提供支持:
1)安全護(hù)理:協(xié)助老年人完成日?;顒?dòng),如穿衣、洗漱和進(jìn)食,并監(jiān)測(cè)他們的健康狀況,在緊急情況下,它能迅速呼叫救援并通知家人。此外,它還能提供心理支持和思維訓(xùn)練,幫助預(yù)防腦力衰退。
2)教育娛樂(lè):提供文娛內(nèi)容和知識(shí),幫助老年人學(xué)習(xí)新知識(shí)和技能。比如播放音樂(lè)、電影、有聲書(shū),陪伴老人聊天,提供健康養(yǎng)生知識(shí)。模擬社交、游戲互動(dòng),讓老人在娛樂(lè)中學(xué)習(xí)新知識(shí),保持大腦活躍,豐富老年人的精神生活。
3)數(shù)字永生:全能模型可以通過(guò)具身智能記錄老人的日常多模態(tài)數(shù)據(jù),包括環(huán)境、形象、人格、重要時(shí)刻等信息,上傳到云端重建逝者的孿生分身,讓親友能夠在虛擬世界中與逝者“相聚”。云端提供數(shù)字族譜、家族故事、數(shù)字殯葬、數(shù)字祭掃等業(yè)務(wù),降低殯葬、墓園的資源消耗,低碳環(huán)保。
智能家居領(lǐng)域,當(dāng)前有兩個(gè)局限:處理復(fù)雜場(chǎng)景、學(xué)習(xí)能力。例如:掃地機(jī)器人,當(dāng)人遇到地上有一條數(shù)據(jù)線時(shí)會(huì)撿起它并放置到正確的位置,但掃地機(jī)器人就搞不定。具身智能如果發(fā)揮精細(xì)操作、模仿學(xué)習(xí)的優(yōu)勢(shì),有機(jī)會(huì)解決烹飪、清潔、收納等復(fù)雜的家務(wù)問(wèn)題,幫助家人專(zhuān)注做他們內(nèi)心真正熱愛(ài)的事情。
方向3 —— 超級(jí)助理:Her無(wú)處不在,人類(lèi)將淪為硅基文明的引導(dǎo)程序?
我們可以試想這樣一種畫(huà)面,全能模型在云端作為超級(jí)助理,其分身遍布在生活中作為終端入口,大概會(huì)發(fā)生小明這樣的故事:
1)出發(fā)地:家
早晨,小明在助理的呼喚中醒來(lái),超級(jí)助理已經(jīng)讓廚師機(jī)器人準(zhǔn)備好早餐,并根據(jù)小明的健康數(shù)據(jù)調(diào)整了營(yíng)養(yǎng)配比。它挑選了小明可能感興趣的新聞?wù)?,如果需要的話可以跟小明討論。它提醒小明?dāng)天的日程、交通和天氣情況,并為他準(zhǔn)備了合適的衣服、出行物品,調(diào)整了室內(nèi)的溫度和濕度。
2)途中:車(chē)內(nèi)
去往綠道的途中,助理通過(guò)FSD幫助小明解放雙手,監(jiān)控實(shí)時(shí)交通狀況,自動(dòng)避開(kāi)擁堵路段。車(chē)內(nèi),安排了一位機(jī)器人美女伴侶分身,陪他聊天、玩游戲。家里的機(jī)器人已經(jīng)處理了早餐的廚余垃圾等清潔工作,開(kāi)窗通風(fēng)、照顧寵物。剛好,助理注意到小明的投資組合中有一各交易策略被觸發(fā),它自動(dòng)執(zhí)行了交易,將虛擬幣的浮盈落袋為安。
3)目的地:綠道徒步
到達(dá)徒步的綠道后,助理通過(guò)智能手表與小明保持聯(lián)系,提供實(shí)時(shí)的天氣更新和安全提示。它幫助小明規(guī)劃了一條既安全又風(fēng)景優(yōu)美的徒步路線,推薦最佳的拍照地點(diǎn)。在小明享受徒步時(shí),助理監(jiān)測(cè)他的健康狀況,確保不會(huì)過(guò)度勞累。徒步結(jié)束時(shí),家里的廚師機(jī)器人已經(jīng)開(kāi)始在洗菜、切墩,伴侶機(jī)器人已經(jīng)采購(gòu)好消費(fèi)品回到車(chē)上,準(zhǔn)備幫小明放松肌肉疲勞、聊聊徒步體驗(yàn)。
全能模型為上述場(chǎng)景帶來(lái)了兩個(gè)體驗(yàn)變革:
- 單場(chǎng)景體驗(yàn)極致閉環(huán):全模態(tài)理解用戶(hù)的意圖,用接近真人、替代人的方式來(lái)解決細(xì)分場(chǎng)景的全量問(wèn)題。
- 跨場(chǎng)景體驗(yàn)無(wú)縫銜接:通過(guò)主動(dòng)交流+學(xué)習(xí)用戶(hù)習(xí)慣的方式,來(lái)實(shí)現(xiàn)跨越時(shí)間、空間的全場(chǎng)景行動(dòng)規(guī)劃與動(dòng)作銜接。
我的觀點(diǎn):為什么馬斯克說(shuō)特斯拉不是車(chē)企?因?yàn)樘厮估举|(zhì)上是做AI機(jī)器人的公司。我相信,未來(lái)凡是把車(chē)當(dāng)成“車(chē)”來(lái)做的車(chē)企都會(huì)陷入競(jìng)爭(zhēng)劣勢(shì),把車(chē)當(dāng)成AI機(jī)器人、超級(jí)助理入口、能源管理節(jié)點(diǎn)做的公司更有機(jī)會(huì)。全能模型,將加速這種Her無(wú)處不在的智能化趨勢(shì)。
方向4 —— 智能咨詢(xún):認(rèn)知繭房加速形成,咨詢(xún)分身增強(qiáng)領(lǐng)域IP的睡后收入
互聯(lián)網(wǎng)時(shí)代,搜索實(shí)現(xiàn)了信息平權(quán),大幅降低信息獲取的門(mén)檻。Feeds流構(gòu)筑了信息繭房,幫助一部分人進(jìn)化認(rèn)知、做好流量生意,也讓另一部分人沉迷于人性弱點(diǎn)。
我的觀點(diǎn):AI時(shí)代,全能模型將加速認(rèn)知繭房的形成,在局部范圍內(nèi)做到科技平權(quán)。因?yàn)轭I(lǐng)域IP獲得了更強(qiáng)的咨詢(xún)服務(wù)輸出能力,用戶(hù)有了更加高效學(xué)習(xí)、解決問(wèn)題的沉浸式入口,認(rèn)知成長(zhǎng)的門(mén)檻將越來(lái)越低。
未來(lái)智能咨詢(xún)可能的服務(wù)模式:
新模式可以帶來(lái)哪些明顯的變化?
1)需求端_用戶(hù)
- 解決效率:用戶(hù)可以用實(shí)時(shí)溝通的方式享受咨詢(xún)服務(wù),不需要等IP本人。
- 價(jià)格便宜:比IP本人咨詢(xún)要便宜很多,比如10元一次的輕量咨詢(xún),用完即走。
- 咨詢(xún)體驗(yàn):全能模型以更接近與真人溝通的方式進(jìn)行咨詢(xún),高情商、人性化。備案后的全能模型將擁有相對(duì)較正的三觀,沒(méi)有主觀偏見(jiàn)和人性弱點(diǎn)。
2)供給端_IP、領(lǐng)域?qū)<?/strong>
- 生產(chǎn)效率:領(lǐng)域IP們通過(guò)錄制視頻、隨口記錄等方式借助全能模型快速生成原生態(tài)知識(shí),過(guò)去很多沒(méi)有精力梳理材料、做IP的人也可以參與。
- 服務(wù)效率:全能模型可以同時(shí)向所有客戶(hù)提供實(shí)時(shí)、個(gè)性化的咨詢(xún)服務(wù)。
- 精準(zhǔn)分流:全能模型分析客戶(hù)意圖生成畫(huà)像,將高凈值客戶(hù)轉(zhuǎn)給人工做深度咨詢(xún),幫IP本人更聚焦高價(jià)值區(qū)域。
- 運(yùn)營(yíng)效率:全能模型極大降低了知識(shí)的生成門(mén)檻,擴(kuò)大了知識(shí)數(shù)據(jù)的來(lái)源,提升了問(wèn)題解決覆蓋范圍,IP根據(jù)用戶(hù)與AI分身的交流反饋動(dòng)態(tài)優(yōu)化知識(shí),形成數(shù)據(jù)飛輪的復(fù)利效應(yīng),讓分身的咨詢(xún)能力可以快速進(jìn)化。
- 產(chǎn)權(quán)保護(hù):IP的私域知識(shí)不透明,競(jìng)爭(zhēng)保護(hù)窗口期比以往更長(zhǎng)。只要定價(jià)合理,至少能讓原創(chuàng)者先賺到一波,不至于像網(wǎng)課那樣苦苦研發(fā)出內(nèi)容一經(jīng)發(fā)布就為他人做嫁衣。通過(guò)認(rèn)知升級(jí)和知識(shí)更新,還可以動(dòng)態(tài)加固壁壘。
預(yù)判一個(gè)財(cái)富密碼,認(rèn)知差 + RAG + 全能模型 = 睡后收入。
未來(lái)將有大量領(lǐng)域IP和有咨詢(xún)需求的人從模式中受益。IP甚至不需要規(guī)?;鳂I(yè),僅靠幾人就可以獲取過(guò)去十人、百人級(jí)別的商業(yè)價(jià)值!
方向5 —— 軟件服務(wù):整合企業(yè)全量知識(shí)、增強(qiáng)服務(wù)體驗(yàn),數(shù)據(jù)要素是關(guān)鍵賣(mài)鏟人
1)全量知識(shí)高效利用:這里我想重新定義下“知識(shí)”這個(gè)概念。
- 傳統(tǒng)的知識(shí):是指文檔、FAQ、規(guī)則或者圖譜等,可以被人和AI直接利用的信息。
- 未來(lái)的知識(shí):物理世界中能被模型理解的數(shù)據(jù),都可以成為知識(shí)。例如:某段Top Salse成功銷(xiāo)售轉(zhuǎn)化的錄音或視頻,其中蘊(yùn)含的溝通技巧和銷(xiāo)售策略就可以給模型來(lái)分析運(yùn)用。
企業(yè)若能為知識(shí)管應(yīng)用體系建立正向循環(huán),將獲得更好的市場(chǎng)機(jī)會(huì)和客戶(hù)口碑。
2)增強(qiáng)客戶(hù)服務(wù)體驗(yàn)
- 多模態(tài)體驗(yàn):企業(yè)有機(jī)會(huì)實(shí)現(xiàn)多模態(tài)交互的智能客服系統(tǒng),利用更豐富的圖片、視頻數(shù)據(jù)來(lái)給到客戶(hù)更直觀高效的體驗(yàn)。例如:客戶(hù)可以要求APP分析過(guò)去一年的消費(fèi)數(shù)據(jù),并生成包含趨勢(shì)圖、餅圖、條形圖和節(jié)省建議的報(bào)告。這種個(gè)性化服務(wù)在過(guò)去是無(wú)法即時(shí)提供的。
- 體驗(yàn)效率提升:按用戶(hù)需推薦、溝通商量的體驗(yàn),肯定比主動(dòng)搜索更爽。舉個(gè)例子:旅游APP,未來(lái)的核心應(yīng)該是AI交互入口,而不是給一堆酒店、機(jī)票、游輪等選項(xiàng)。因?yàn)樗挟a(chǎn)品和攻略都可以被視為AI的知識(shí)庫(kù),可以像吩咐秘書(shū)一樣讓APP來(lái)完成所有安排。
我的觀點(diǎn):從客戶(hù)體驗(yàn)的角度,催生了大量企業(yè)軟件服務(wù)的商業(yè)機(jī)遇。因?yàn)榇蠖鄶?shù)現(xiàn)有C端APP都值得用全能模型重構(gòu)一遍。
3)數(shù)據(jù)要素:AI軟件服務(wù)的鏟子是數(shù)據(jù),高質(zhì)量、細(xì)分場(chǎng)景的數(shù)據(jù)將催生至少5年的數(shù)據(jù)要素產(chǎn)業(yè)增長(zhǎng)。有兩個(gè)跡象表明,即便是OpenAI也非常缺數(shù)據(jù):
- GPT-4o免費(fèi):就是因?yàn)槿鄙俑哔|(zhì)量的數(shù)據(jù)。多模態(tài)的場(chǎng)景多樣性決定了它需要積累幾年。實(shí)驗(yàn)前期數(shù)據(jù)質(zhì)量重要性遠(yuǎn)大于規(guī)模,因?yàn)楦哔|(zhì)量數(shù)據(jù)代表著一種工藝標(biāo)準(zhǔn),代表對(duì)天花板的極致追求,無(wú)法繞過(guò)大量人工處理數(shù)據(jù)的過(guò)程。
- OpenAI跟Reddit合作:昨天的新聞,雙方合作主要就是交易數(shù)據(jù),Reddit也是Google的數(shù)據(jù)供應(yīng)商。
三、國(guó)內(nèi)AI廠商面臨4個(gè)挑戰(zhàn)
挑戰(zhàn)1 —— GPT-4o技術(shù)成熟度
OpenAI為了確保發(fā)布會(huì)演示效果,一定會(huì)精選GPT-4o最擅長(zhǎng)的場(chǎng)景來(lái)展示,實(shí)際測(cè)試的平均水平應(yīng)該多少打點(diǎn)折扣。Sora的宣傳視頻也有很大水分,實(shí)際出圖可用率只有1/300,主要靠后期,GPT-4o的體驗(yàn)還有待更多迭代與實(shí)測(cè)。
挑戰(zhàn)2 —— 影響國(guó)內(nèi)復(fù)現(xiàn)基模型的主要因素
國(guó)內(nèi)在跟進(jìn)ChatGPT、GPT-4的過(guò)程中沒(méi)有展現(xiàn)出體系化的獨(dú)創(chuàng)性,Sora發(fā)布后僅有生數(shù)科技勉強(qiáng)跟進(jìn),GPT-4o發(fā)布時(shí)已經(jīng)領(lǐng)先國(guó)內(nèi)2代以上。
OpenAI的核心優(yōu)勢(shì)到底是什么?我認(rèn)為是:創(chuàng)新文化>人才>算法>數(shù)據(jù)>算力>系統(tǒng)工程。
以數(shù)據(jù)為例:
- 2018年:OpenAI開(kāi)始標(biāo)注GPT時(shí)應(yīng)該初步構(gòu)建了數(shù)據(jù)生產(chǎn)流水線、效果實(shí)驗(yàn)工程
- 2021年:OpenAI開(kāi)始標(biāo)注GPT-3.5,并構(gòu)建支持RLHF體系的數(shù)據(jù)。早期模型版本的發(fā)布可加速獲得高質(zhì)量數(shù)據(jù)喂給新版本,形成數(shù)據(jù)飛輪的復(fù)利效應(yīng)。
- 2023年:國(guó)內(nèi)的大模型數(shù)據(jù)產(chǎn)線基于開(kāi)源模仿構(gòu)建,工藝細(xì)節(jié)還在持續(xù)完善,數(shù)據(jù)質(zhì)量、數(shù)據(jù)規(guī)模還遠(yuǎn)遠(yuǎn)不足。
這只是數(shù)據(jù)視角的差距,更不用說(shuō)各維度綜合差距。
我的觀點(diǎn):國(guó)產(chǎn)AI至少落后5年。一些投資人、CEO們的樂(lè)觀自嗨聽(tīng)聽(tīng)就好,問(wèn)他們自家大模型什么時(shí)候能拿出平替GPT-4o的效果來(lái)公測(cè)?一問(wèn)一個(gè)不吱聲。
國(guó)內(nèi)廠商如何才能復(fù)現(xiàn)GPT-4o?很大程度上取決于Meta何時(shí)開(kāi)源。當(dāng)然,也看到國(guó)內(nèi)以月之暗面、生數(shù)科技等清華姚班系為代表的初創(chuàng)大模型公司,成立1年就取得矚目的進(jìn)展,國(guó)內(nèi)AI“產(chǎn)-學(xué)-研”聯(lián)動(dòng)已初見(jiàn)成效。
挑戰(zhàn)3 —— 全能模型應(yīng)用的安全性
就在昨天,Bengio、Hinton和姚期智三位圖靈獎(jiǎng)得主領(lǐng)銜25位全球頂尖AI科學(xué)家,在權(quán)威科學(xué)期刊 Science 呼吁各國(guó)領(lǐng)導(dǎo)人針對(duì)AI風(fēng)險(xiǎn)采取更有力的行動(dòng),并警告近六個(gè)月所取得的進(jìn)展還不夠。剛好2天前OpenAI解散超級(jí)對(duì)齊團(tuán)隊(duì),安全部門(mén)拿不到算力。我認(rèn)為AI安全之所以難做的核心原因是:
1)對(duì)抗性攻擊的復(fù)雜性:大模型底層基于概率,如果攻擊者精心設(shè)計(jì)引導(dǎo)模型出錯(cuò),防不勝防。更何況OpenAI處于技術(shù)快速演進(jìn)的檔口,安全體系無(wú)法預(yù)判涌現(xiàn)的臨界點(diǎn),GPT-4o帶來(lái)更多的模態(tài)和場(chǎng)景,更加大了安全的復(fù)雜性。
2)黑箱中自主拆解目標(biāo):如果AI具備定義目標(biāo)、拆解目標(biāo)、規(guī)劃路徑的“絕對(duì)權(quán)限”,哪怕只具備其一,就可能發(fā)生這樣的場(chǎng)景:人讓AI去除掉全球所有垃圾,AI認(rèn)為人就是垃圾的源頭,所以AI把人類(lèi)滅了。這里的悖論在于對(duì)指令的理解可能偏差,AI執(zhí)行路徑的規(guī)劃過(guò)程不可解釋、難以干預(yù)、瞬間執(zhí)行。
挑戰(zhàn)4 —— 領(lǐng)域模型與私有化存在客觀局限
1)國(guó)產(chǎn)化算力:國(guó)產(chǎn)化需要適配,性?xún)r(jià)比有待提升,熱門(mén)型號(hào)華為昇騰910B需要排隊(duì)采購(gòu)。
2)模型參數(shù)量與性能:相同硬件條件下,模型參數(shù)量越高,涌現(xiàn)效果越好,但響應(yīng)延時(shí)也越高。所以如果要精打細(xì)算,就得拆分業(yè)務(wù)場(chǎng)景,具體分析選型搭配。那問(wèn)題來(lái)了,GPT-4o這類(lèi)全能模型增加了多種模態(tài),對(duì)模型參數(shù)、性能的要求會(huì)更高。
3)私有化大模型的可控性:企業(yè)容易陷入一種誤區(qū),希望采購(gòu)1個(gè)大模型解決全部業(yè)務(wù)需求。但實(shí)際上目前的私有化大模型大致可以分成三類(lèi),如圖:
我的觀點(diǎn):從私有化業(yè)務(wù)落地的角度,我的看法是:L1、L2必備,L0是選配或走公有云。完備方案是“多種大模型 + 傳統(tǒng)NLP + 專(zhuān)家系統(tǒng)”,發(fā)揮各自的優(yōu)勢(shì)。
4)私有化大模型訓(xùn)練:業(yè)務(wù)往往期望可訓(xùn)練大模型,但目前做過(guò)嘗試的AI廠商都遭遇諸多挑戰(zhàn),包括項(xiàng)目虧損、數(shù)據(jù)運(yùn)營(yíng)投入不足、訓(xùn)練效果難以達(dá)到預(yù)期,以及難規(guī)?;桓?。私有化環(huán)境下的產(chǎn)品交付是個(gè)體系化工程,復(fù)雜度遠(yuǎn)超一般想象。
我的觀點(diǎn):現(xiàn)階段務(wù)實(shí)點(diǎn)的思路是不強(qiáng)求私有化訓(xùn)練,要求AI廠商在出廠前就針對(duì)業(yè)務(wù)需求,評(píng)估好需求滿(mǎn)足度。一旦實(shí)際交付驗(yàn)證時(shí)不及預(yù)期,優(yōu)先嘗試調(diào)整知識(shí),其次調(diào)整Prompt,最后調(diào)整工程邏輯、閾值配置。若試過(guò)多種方法依然不及預(yù)期,說(shuō)明應(yīng)該返廠,待廠商AI實(shí)驗(yàn)室中優(yōu)化到達(dá)可用標(biāo)準(zhǔn),給出效果評(píng)測(cè)報(bào)告,再發(fā)布更新到私有化。需要甲乙雙方擁有較強(qiáng)的信任基礎(chǔ)與開(kāi)放心態(tài)。
作者:于長(zhǎng)弘;公眾號(hào):弘觀AI
本文由 @于長(zhǎng)弘 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自 Unsplash,基于 CC0 協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!