我,花3天時間做了這件事 | 普通人視角下的WAIC
有幸作為螞蟻觀察團角色參加2023年WAIC大會(上海-世界人工智能大會),“走馬觀花”式的看到了人工智能領域的最新趨勢和創新成果。雖然有些技術和場景應用都是“老生常談”了,但整體參觀下來,還是有些非常觸動的點。周六日抽空將參展經歷以及個人想法簡單梳理了下,分享給大家。
作為一個普通人,我花了3天時間參看了WAIC大會。
WAIC大會從6號持續到8號,主題是“智聯世界,生成未來”。
大會展館是在世博展覽館搭臺展示,論壇演講在世博中心,不同大廳有不同的分享主題,還有很多其他地方的分論壇。所以如果想針對性看展或聽講,需要提前規劃好行程。
不過,即使是自由行,到處逛逛也會很有收獲。
回到正題,這篇文章主要講四個事情:
- 核心廠商“展示”了什么
- 不同領域的“黑科技”
- 大模型時代的個人思考
- 一些有意思的天馬行空
一、核心廠商“展示”了什么
整個展館很大,分為兩個展覽區(一個通鋪走廊將展區一分為二),一邊是以機器人+硬件為主,一邊是以AI大模型+應用為主,參考下圖:
先說下我個人的感受:因為這一年AIGC技術突破帶來的高預期,所以整場看下來就是——已有的能力和模型卷的可以,但是更多創新性的產品和商業模式反響平平,大家依然都在摸石頭過河,探索式前進。
- 各個大廠均是AI大模型,以及主流的AIGC場景應用,除去大模型本身標榜都是自研外,應用場景無一例外,基本上都是直接利用AIGC的產出做場景封裝
- 小廠扎根垂類系分賽道,百花齊放,這塊還是有些亮點的,畢竟小廠資源吃緊,所以大部分都是在做非常細分的賽道里的AIGC模式
- 傳統廠商不甘落后,諸如中國電信、移動等也都在AI大模型領域做出自己的模型和場景產出
- 硬件廠商努力跟進,在大模型急需的算力層面,鍛煉Show肌肉
熱,我說的是天氣太熱;多,參會的人多,可見參展商和參會嘉賓用戶還都是挺重視的。
1. 出門問問展示了什么
出門問問本次算是全家桶上線了,展示了內測的序列猴子、AIGC藝術展覽、AIGC配音助理、AIGC繪畫助理以及數字人互動大屏等解決方案產品。
- 序列猴子:這個是大語言模型,能夠支持知識、對話、數學、推理等能力,并且還能做文字、圖片甚至3D生成,可以理解為相當于市面上多引擎集成模式。目前計劃將該模型走MaaS部署模式,推向教育、醫療、汽車甚至金融等領域,方向前景我覺得還是很看好的。
- AIGC藝術展覽:這個是出門問問給大家展示的各種AIGC藝術產品,最核心的一個是“交響”,展板介紹是“藝術與科學交融之處,蒙德里安和莫奈相逢在時空的交疊?;煦缗c秩序共舞,揭示宇宙中隱藏的奧秘?!边@介紹…確實很藝術,讀不懂,不過聽說讀不懂的就是藝術。
- AI繪畫:另外有很多精美的畫作展示,全部由他們的繪畫產品制作的,看著都很精致。值得一提的是,問問家的繪畫模型聽說可以做GIF、短視頻,最高可以到2k畫質,有點意思。
- 動捕體驗區:算小驚喜,也算是熱門區域,簡單理解就是,先在大屏幕上選擇一個卡通形象,然后帶上動捕服,通過實時驅動展示數字人搭配負責、人機互動、場景更換等功能,整個虛擬數字人在大屏幕里可以算是惟妙惟肖了。
- AI數字人:沒有驚喜,常規功能都有,支持給企業定制等等,不贅述了。
- AIGC其他能力:都是基于自家大模型做了很多場景Prompt封裝、身份Prompt封裝,對C展示,可以現場體驗。
2. 蜜度展示了什么
首先也是自詡發布了3款自研垂直領域大語言模型,在我一再探討模型細節后,就比較模糊了。
其次,我覺得蜜度在現場的沉浸感做的不錯,用場景讓用戶來沉浸式體驗。
- 蜜度大模型:大模型能力基本上和市面上一致,但主攻場景是TOB和TOG領域,面向政府和企業內部做定制化內容生產。我覺得作為中小公司,這個賽道切入的是有競爭力和先行優勢的,畢竟單純卷大模型性能意義不大,或者單純做TOC應用,也需要突出差異化競爭。
- 蜜度文修模型:主要解決較對問題,比如拼寫錯誤、語法錯誤等,使用場景面向政府公文、媒體文稿這些,不過我總覺得這個模型可以和第一個模型做結合。
- 蜜度輿情分析模型:這個能夠自動寫輿情分析報告,據稱是通過十幾年的分析報告作為訓練數據搞出來的,期待效果吧,我對輿情這塊也不專業,沒細琢磨。
蜜度體驗區:有很多,比如AI明信片生成(你寫一個詞,給你打印出來一個紙質版的明信片,上面AI生產一首詩外加一幅圖),AI中國游(你拍個自拍照,上傳到小程序,AI把你的形象卡通化,同時背景換成中國的旅游勝地),給你做詩(就是幫你寫詩,放在古代,應該可以給李白李賀杜甫提效),這些TOC體驗區的場景搭建讓用戶很有沉浸感。
值得一提的是,在另一個論壇里,發現蜜度還和科大訊飛達成了合作,有個合作儀式,訊飛也是主攻TOB和TOG賽道的,所以你看,蜜度對自己本次參會的目的還是很清楚的,不單純是來Show肌肉。
3. 華為展示了什么
華為一直是國人之光,在我印象中華為一直在做正確的事情。這次展覽,也感受到了。
首先,華為并沒有急躁躁的展示說我也有大模型,我也有很多應用場景,華為的昇騰(念:sheng,讀書少,我百度了下…)推出了大模型一體化解決方案。
硬件我是外行,結合現場的學習以及會后簡單查詢了下,華為的這個事情主要是解決企業在進行大模型開發過程中的幾個核心問題:切換硬件集群、適配底層硬件以及模型微調優化等全都是復雜的問題。
所以我理解,華為是給企業做大模型開發這事制作了一個SOP化的企業級方案,可以讓很多中小企業想做、想下海的時候能夠“開箱即用”。
所以這應該是一個企業級的提效和降低企業應用大模型門檻的事情,這事做的利他,當然最后也會利己。
這個事不是華為自己搞定的,聯合了科大訊飛、云從科技還有面壁智能以及智譜一塊做的,打出的標語是“昇騰持續開放,與伙伴們共同繁榮產業生態”。
你看看這格局,一下子上升到生態層面了,其他還在做AIGC場景應用的廠商有點汗顏吧…
4. 商湯展示了什么
作為AI行業的佼佼者,商湯直接展示了他們的大模型的性能、效果、參數等等,我理解其實就是表達了“你無我有,你有我優”的卷。
商湯的大模型推出了適配多終端的需求,這個算是小突破,可以做不同端的部署了,另外參數提升到70億級別,宣稱是可以實現專業攝像級別的繪畫畫質要求。
另外還有商湯的數字人,可以做語音、口型的匹配甚至唱歌等,對外宣稱是4k電影這種級別的清晰度。
落地這塊,商湯目前在積極的與銀行、保險、券商探索和合作,比如做智能客服、智能營銷、研報分析、智能合規等,這些功能不新鮮,不過有個細節點我發現還不錯,支持掛載知識庫的模式,基于知識庫做內容理解和問答,這個模式有點意思。
另外一塊是商湯在醫療的探索,因為我之前做過智慧醫療,所以商湯基于大模型的醫療產品矩陣,更多的是換湯不換藥,把之前算法那一套換做大模型,來支撐智能導診、智能問診、健康咨詢、智能輔診等功能。
未來他們想做的多模態病種分析是個不錯的方向,期待+1。
5. 高通展示了什么
人工智能的發展依賴幾個要素:數據、算法、算力,在這三個協同發展的情況下,人工智能才有可能形成基于算法框架、場景應用以及底層硬件等組合一體的產業體系。
高通本次就在展示算力+計算架構的肌肉。
WAIC上,已經可以看到搭載了高通驍龍8芯片的手機,直接在移動端這個手機上運行StableDiffusion,什么概念啊?!
現在再玩AI繪畫的各位,相信大部分都是在Discord里玩Midjourney(手機QQ里的Midjourney頻道是接口集成形式),或者在網頁端玩國內大廠的應用,或者在手機端玩一些野路子開發公司做的小程序繪畫,進階一些的會部署SD自己跑模型玩,畢竟mac都帶不動SD。
所以一個普通手機上可以玩SD是什么概念,相當于你上大學的時候在XP系統上玩鬼泣…
如果你覺得很厲害,那么高通又展示了,ControlNet也在手機端本地運行成功了……厲害+1(ControlNet最初是應用在SD里,解決AI繪畫可控性的問題的,比如AI繪畫的人手指的問題就可以通過CN來處理),補一句,ControlNet大概15億參數左右…
技術細節在現場沒有很詳細的闡述,不過整體思路肯定是“云端+終端”模式,我覺得高通展示的不只是算力+架構的突破,而是大家都在努力互卷大模型的時候以及尋找場景應用的時候。
高通提前布局從底層芯片到軟件架構再到上面的生態模式,畢竟在“現在所有的應用都值得重做一遍”的市場情況下,未來一定變成“所有的終端以及智能硬件賽道也都值得重做一遍”。
高通要做的是:未來,讓你我,人手一個大模型。
6. 燧原科技展示了什么
燧原的展臺也很大,我逛了好久,總結下來就是,燧原對外展示了一整套MaaS的產品服務矩陣,并且搭載自己的底座算力,好像再說:我自己做的是全套的!
最核心的文生圖產品,基礎的功能都有,不過燧原的這個產品是基于自家的算力的,所以從算力使用到算法訓練,再到企業部署,再到TOC使用甚至Prompt構建都是一整套的流程。
結果就是對于企業來說,如果想使用,可以直接基于燧原的這套整合進自己的業務鏈或工作流程,然后在這個基礎上做升級和迭代,你想想,是不是很香!
并且支持很多場景繪圖的生產,效果很細致,媲美相機了,現場拍的不清晰,從燧原官網找到一個他們的圖,可以感受下,是不是有點感覺像自己拍的了:
MaaS模式在大模型時代大家都知道是主流方式,我簡單查了下,燧原之前就是做算力的,所以他們這算是從算力起家,然后做到了MaaS平臺模式,然后推出了自己的AIGC全家桶上層應用,未來肉眼可見的會往生態模式發展,可見還是有一定的護城河和競爭力的。
另外燧原還展示了很多硬件以及智算中心,名稱叫“智算中心2.0下的AIGC MaaS模式”,參數一大堆,硬件不太懂,反正就是不明覺厲吧!
7. 科大訊飛展示了什么
訊飛分為兩塊,展館產品展示+高峰論壇,另外還有一個就是訊飛聽見同傳給整個大會開幕式以及主論壇提供的技術支持。
先說高峰論壇:訊飛在論壇上聯合國家衛健委、中國信通院等機構,成立了醫療健康領域大模型標準研究。
這就有很有意思,你想想,這事仿佛再說,不管你怎么卷,我在和國家一起定標準,標準落定后,大家都要按標準來玩,最重要的是,我不僅是運動員,我還是裁判員,然后大家一起賽跑,DDDD了吧。
訊飛強大的TOB和TOG基因在這個時候就越發顯示出了優勢,當然這個前瞻性的戰略決策也很重要。我記得最開始四五月份訊飛發布會上劉慶峰就提到訊飛的“1+N”大模型戰略體系,其中醫療就是其中一個。
再來看展館:訊飛在展館展示的“醫療康復管理”平臺一直都是人頭攢動,傳統的患者管理一般是通過外呼、短信等將患者的情況收集到結構化到醫生后臺系統進行醫患鏈接,目前看訊飛的新版的診后康復管理,在大模型的加持下,大部分的診后康復管理內容都由大模型支撐。
我看了下訊飛官網,大模型的內容85%都是審核一次性通過,另外90%的康復管理動作也都由AI自動執行,可以說全新賦能了診后鏈路。
另外據訊飛醫療陶曉東陶總表示,在下半年的1024開發者節中,訊飛醫療還將公布醫療大模型的標準化要求,以及訊飛星火大模型在醫療應用的成果,可以說很前瞻和扎實了。
另外一個亮點就是訊飛做的數字人新聞官,一方面可以實時交互,另外主要就是找她詢問關于大會的各種內容,所以應該是提前基于大會內容和資訊知識庫來做的,唯一美中不足的可能就是3D感、沉浸感還有待加強。
8. 政府展示了什么
到了這個重要環節了,先點贊。整體政府表態支持,扶持,要健康可持續發展,在政府的良好引導下,期望國內做出AI突破性進展,做可信賴的AI,做有利于民有利于政有利于國的AI,所以你好我好大家好,做有助于人民發展的AI,人人有責!
并且整個論壇的各個分論壇,以政府牽頭形成的各個人工智能標準化、大模型標準政策、可信AI研究等等都在穩步推進。
政府在忙著攢一個局,定一套標準,選幾位優秀者,讓大家對標優秀者在這個臺子上按照既定的規則一起玩AIGC。
二、不同領域的一些“黑科技”
1. 物流領域,美團/第四代無人機
在用戶對于目前“線上購物”已經很熟悉的同時,美團推出了無人機外賣概念。
現場展示的硬件參數是不明覺厲的:雙目立體相機、4D雷達、防水性能、槳葉材料等等。在主打“兩點之間直線最短”的概念下,主打3公里半徑內15分鐘即可送達。
2. 工業領域,特斯拉/仿真機器人
現場特斯拉展示的Optimus機器人可以說是爆款了,基本上排隊才能到跟前觀看。
和真人大小差不多,據展牌介紹,機器人全身有28個自由度的零件,手部更是有11個自由度的零件,可以說很靈活了,不過現場只是靜態展示,沒有動起來。
3. 算力領域,燧原/液冷集群
燧原推出了針對AIGC大模型訓練專用的液冷集群,很吸睛,我對硬件產品不太熟悉,但液冷的核心優勢主要是節能、提效且穩定,最重要的是“綠色”。
要知道“綠色”是最近幾年衡量企業效能的新標桿,所以這個液冷集群是很厲害的。插個彩蛋,流浪地球2影片里也曾出現過全浸式“缸式”液冷計算機。
4. 可信AI領域,螞蟻/“蟻鑒2.0”
螞蟻金服咱們的這個也算是黑科技之一,聽說還獲選了本次大會的“鎮館之寶”,主要是利用AIGC技術應用在AIGC模型的多維度檢測上,結合邏輯推理以及因果推斷等技術,最終對AIGC系統給出全方位的量化分析結果,包括數據安全、內容安全、倫理道德等多方面的風險。
5. 醫療領域,京東/健康機器人
京東推出了一款智能健康篩查機器人,現場排隊很多人。通過放上雙手手掌,然后綜合檢查和判斷你的心率、血氧等等狀況,給出身體的多維度健康指數及營養建議,還能給出中醫體質和風險提醒。從醫療視角來看,非常驚嘆。
另外補充一個,會展期間,還有一家小公司也做了類似的產品,產品名稱叫健康拍,模式上比京東的這個更先進一步,只需要拍一張臉部照片上傳到小程序即可分析出心率、呼吸、血氧、血壓等等狀況,并給出指導建議,至于效果兩家哪個更優秀,還需要單獨評估。
三、大模型時代的6點個人思考
1. MaaS模式的生態已經到來
大模型作為目前AI的基礎設施(起碼短中期內),在這個基礎上能夠快速的提取出各種垂類、定制化、私有化的小模型,這些小模型可以直接作為工具、服務來支持場景(當然封裝、調整不可避免)。
那么可以看到模型即服務的形式就形成了,最后在這個基礎上搭配移動端、Pad等多端適配,云端+終端結合,那么面向個人用戶的“P-MaaS”模式(這個名稱是我自己隨便想的,Personal-MaaS)也將越來越可實現。
2. 垂類模型是未來競爭高地
從22年年中接觸到AIGC技術后,我一直覺得這個領域“場景為王”,誰能最快最好的切入最佳場景,那么誰就能快速的構建最佳的商業模式。經過這大半年的摸索,開始覺得利用AIGC技術構建起來的場景切入。
目前市面上依然沒有非常成熟的商業模式凸顯出來,并且護城河較低,用戶的遷移成本也較低。
那么未來對于個人或企業難道場景就失效了嗎?
答案是:否。
場景固然重要,但壁壘存在于該場景里的垂類大模型以及通過該大模型逐漸積累起來的用戶數據,在垂類場景里的大模型,就像當年的Android或IOS系統一樣,是一個底層應用,通過生成式AI來不斷挖掘海量數據以及利用垂類場景數據為企業帶來比決策式AI時代更精準的商業指導。
所以,最終的場景、數據的體現是在垂類模型里。
3. 大模型+數字人的概念會重新再起
數字人概念不新鮮,前幾年已經火了,火到各個大廠也是快速推出自己的數字人,但是沒有場景和商業模式,也僅僅停留在大家各自比拼“我也能做出來”的地步。
現在生成式AI時代所獨有的強內容性、強交互性、強“恐怖谷”性都讓數字人開始整體邁入一個新時代,更加自然、流暢,并且其意義還遠不至于此。
隨著AIGC的到來,多模態交互的門檻越來越低,所以未來數字人存在的形式、和真人的交互的形式都遠不止于目前看到的這些樣式。
4. “超級個體”概念
玩過紅警的伙伴都知道,小兵是最弱的兵種,但是一旦摁下D鍵,“坐下”之后,就變成了超級兵,甚至可以一個人硬鋼一個坦克。
AIGC時代也如此,傳統的作業流程,哪怕是最新的自媒體運營,可能都需要一個編輯、一個UI來協作分工,AIGC時代,文本生成、圖像生成、視頻生成、3D全息投影生成等等全部涌現,這些工具囊括了從創意思考、信息收集、信息整理、智能推薦、規則改進等等。
所以新一代的人機協同,會徹底改變個人的能力矩陣以及影響力覆蓋面,將人機模式推向另一個高潮。
5. “Prompt模式”未來可能不會存在
現在的大模型以及大模型工具,都很依賴Prompt的輸入進行調教,所以優質的Prompt基本上就可以約束大模型做優質的輸出,本質上目前的Prompt充當了人機交互的媒介,也就是俗稱的計算機語言。
提到計算機語言,學習弱電專業的肯定第一反應會想到匯編語言,沒錯,當時的人機交互語言,晦澀難懂。
再往前看,當年的搜索引擎剛出來的時候,搜索詞也是人與搜索引擎的交互語言,所以冒出來了一堆所謂的“搜索詞結構”、“搜索詞大全”、“常用搜索詞”,現在看來其實大部分形如雞肋。
所以Prompt在未來一定會被更人性化的交互替代掉,目前有個新的概念,叫NUI,從當年的CUI、GUI,再到目前的NUI,但是具體NUI最終的承載形式是什么,期待著吧。
6. AI版權、倫理、可信等基礎
整個論壇最有意思是,遇到了一家創業公司專門在做大模型、AIGC標準制定(當然,很多大廠也在做),我想說的是,他們的初心和方向點贊!
目前AIGC可以說已經裸奔快一年了,技術突破和產品應用跑得很快,產業變革和政策法律稍顯滯后,這種現狀本身無可厚非,畢竟政策、變更都需要考慮方方面面,所以制定周期會長一些。
那么在這個空白期內,作為企業或個人可以做什么呢?
我個人也在AIGC商業化上折騰小半年了,體感最強的就是,每個企業或個人都需要具備最起碼的底線思維、自我思維,灰色地帶里是允許你快跑,快跑期望的是帶來更多的創意和方向,不是允許你亂跑。
所以期待大模型時代的標準以及更多的關于可信AI、版權AI、倫理AI的明亮!
畢竟,商業模式決定你能否賺錢,商業道德決定你是否能持久賺錢。
四、一些有意思的想法
1. 關于數據模式
MaaS已經呼之欲出了,未來“模型即數據”怎么看待,會不會存在“MaaD”概念?
核心數據訓練出來的垂類模型本身就代表了某種形式的數據,所以層級的“數據中臺”是否還有存在的意義?或者在大模型時代數據平臺、數據中臺如何應對?
從目前來看,是否是一個需要提前考慮的問題。
2. 關于AI虛擬人
“流浪地球”里的丫丫(即虛擬人在虛擬空間里可以和真人交流,但虛擬人不知道自己是虛擬人,思維和認知完全真實)是否會在不久的未來真實出現?
當全真的一個“AI的你”出現的時候,就是一個真人,并且存在于你的生活中,你睡覺的時候,ta替你上班,你吃飯的時候,ta給你寫作業,你度假的時候,ta在給老家幫你陪伴父母,這種情況下,你怎么證明你還是你?
或者你和ta比,你的優勢是什么(非常推薦花3分鐘看下視頻號「TeachFuture蔚」里的“2023年被AI取代的老師出現了!”這集)。
3. 關于數據訓練
大模型的核心就是數據,所以未來大概率變成數據競爭,據說人類的所有數據內容在不久會被AI訓練完,那么接下來AI是否會開始訓練AI自身產出的數據?
這種情況下AI最終是否會完成數據-訓練-學習-產出-數據自己的閉環?
這樣最終學習出來的就是完全智能了,而不是人工智能了,AI思維是否會基于此產生。
4. 關于創新認知
以“GPT”為代表的技術突破,從國外開始從無到有的被創新出來,國內在給定了既定目標的前提(已有這樣一個東西)才可以快速跟進,百花齊放,這兩種現象的出現,是否反應了國內外對“創新”“創業”概念的思維認知不同?
國內的這個大環境,是從我們的基礎教育模式上出的問題,還是什么環節導致的思維差異?
5. 關于AI安全
大模型對于普通人的沖擊已經如此明顯了,那么在軍事領域,大模型是否能夠有更突出的助力,構建出等同于“核彈”時代一樣有威懾力的“武器”。
這種“大模型AI武器”是否也需要多方制衡才能構造“和平”的穩態,或者對于這樣的AI智能體,是全世界只有一個智能體最佳,還是多個超級智能體共同制衡才是權衡下的全局最優。
6. 關于認真生活
太多人都在卷焦慮感了,大模型時代可能是一場小革命,不過最終都會收益于普通人,不過so what,who cares?
快樂生活最重要,找到適合自己和這個時代的“交互方式”顯然更重要,“你覺得”才是最重要的。
以上就是參展世界人工智能大會的感想,分享給大家。
期望AIGC時代一起思考、沉淀和成長。
專欄作家
楠神,公眾號:音波楠神,人人都是產品經理專欄作家。大廠AI高級產品經理,AIGC商業模式探索家,長期探索AI行業機會,擅長AI+行業的解決方案設計及AIGC風口、流量感知。
本文原創發布于人人都是產品經理,未經許可,禁止轉載
題圖來自 Unsplash,基于 CC0 協議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發揮!