24年WAIC世界人工智能大會- AI應用觀察
探索2024年WAIC展示的AI創新,從WPS的企業大腦到AI教育工具,這些toB解決方案展現了AI技術的潛力和行業對未來應用的期待??靵砹私膺@些前沿進展!
24年的WAIC在上海世博中心舉辦,7月4號到7號,共4天展覽的時間,我是在5號花了一天左右時間去參觀了一下,我比較感興趣是基于大模型的AI應用,基本上大部分時間都在有眾多AI廠商的展廳逛,展廳內參展商像華為、騰訊、阿里一線互聯網大廠包括頭部AI的科技公司商湯、科大訊飛、百川以及像特斯拉、蔚來等車企都參與了這次的活動。
在逛的過程中也和一些AI廠商的業務人員關于產品的使用場景背后用到的技術商業模式等聊了一些,這篇文章就把目前最前沿的部分有意思的AI應用帶給大家。
先說結論:絕大部分AI廠商還都是依賴于自己研發的【小模型】來滿足所在領域的場景需求,【大模型】僅作為一個輔助的技術;小部分廠商底層依賴【大模型】驅動做了一些產品,但還是要通過一些額外的輔助手段,例如小模型的加入來保證產品能夠商業化落地。
大模型還未大規模作為toB領域底層AI技術的原因我認為主要有兩個:一個是模型存在幻覺,所謂的幻覺是你在問模型一個問題時會有一定概率胡說八道,而toB的絕大部分場景容錯率都是很低的。其二是原有的依賴小模型產品有的已經能夠商業化規?;?,把原有的底層技術替換成本是大的。
這里說明下大模型和小模型區別:
- 小模型:指廠商自研或采購的針對某垂直場景的AI模型,例如TTS、NLP、ASR等。
- 大模型:生成式大語言模型,我們熟知的GPT、Gemini都屬于大模型。
舉辦展會是toB領域的一種會銷行為,參展商和舉辦商舉辦活動的目的不僅僅是行業的交流,核心還是能夠獲取一些客戶名單,銷售導向,所以展會上較少有toC的產品亮相,確切來講這篇文章所介紹的基本都是toB領域的當下最前沿的AI應用了。
一、按產品為單位介紹AI產品
1、WPS AI – 企業大腦
金山辦公早在幾年前就推出了自己的AI文檔產品,作為終端用戶有些伙伴已經體驗到了,這次WAIC大會,金山辦公展覽的AI辦公文檔應用主要面向企業,官方稱之為企業大腦,所謂的企業大腦,相當于將企業所有的關于產品、業務、運營等文檔內容一并給到應用,應用通過底層大模型的能力實現企業員工知識問答。原本要找一個資料可能要問其他同事要或者在企業自己維護的企業網盤中尋找,找來之后還要在文檔中找到你需要的信息,效率是低的,而有了企業大腦,就可以直接通過文字交互的形式問應用就可以了。
類似企業大腦、企業知識庫產品背后的模型有點像RAG(檢索增強生成),這里也簡單介紹一下此模型原理。
- RAG,即Retrieval-Augmented Generation,中文翻譯為”檢索增強生成”。這是一種結合了檢索和生成技術的模型,它通過引用外部知識庫的信息來生成答案或內容,具有較強的可解釋性和定制能力;
- RAG模塊的工作原理可分兩部分組成,分別是檢索層部和生成層;
- 檢索層:將用戶輸入的檢索信息通過檢索層神經網絡生成檢索需求給到數據庫,數據庫根據需求輸出檢索結果;
- 生成層:將檢索層輸出的數據結果結合用戶的檢索信息給到大語言模型(LLM)生成最終結果。
基于大模型知識庫產品會存在一個問題就是剛才所說的模型幻覺,模型的回答不是每次都準確的,可能會出現胡說八道的情況,WPS AI給了一個解決方案,就是每次在模型回答的內容里面顯示原始文檔來源,如果模型引用了文檔那么內容大概率是可信的,如果沒有引用自由發揮的,那就需要進一步確認他的準確度了;另外一個好處是員工可以點擊引用的文檔查看更詳細的信息,通常大模型回答的內容比較精簡的。
這讓我想到了toC產品領域KIMI,也是通過給出引用的原始內容的方式來進一步增加回答內容的置信度和進一步查看內容明細,KIMI背后的技術模型也是類似RAG。
WPS AI企業版的行業解決方案負責人提到了目前針對toB的實踐,面向金融保險領域,保險的產品種類是比較多的,保險內的條款內容變化也比較快,內部員工和外部客戶都需要通過問答的形式來獲取最新的保險產品信息,原先的解決方式是人工去維護問答知識庫,這樣效率就比較低,而如果運用了基于大模型的AI數字員工,維護成本會降低。具體的實現路徑和效果在現場沒有展示,目前他們這個針對保險領域的這一行業場景實踐還在共創階段。
WPS AI其余的能力都還是圍繞大模型針對內容領域的基礎能力:內容擴寫、內容格式化、內容提取等。
2、海豚-AI解題助手
AI解決數學題的能力在剛發布的GPT-4o就可見一斑,展廳內不止一家教育機構圍繞底層大模型應用提供教學產品,我主要和海豚教育的業務人員聊了一些并且體驗了他們的產品,他們的產品是面向學生群體的數學解題助手,一道數學題模型有能力將其拆分成若干的解題步驟,每個步驟是一個子問題,模型引導用戶回答子問題直到最終答案。
在整個體驗過程中AI給出的子問題和對我給的答案判斷及引導體驗下來沒什么問題,只是在識別我的回答時出現一次將“兩天”識別成“2000”的錯誤,我和機器間的交互有4次,如果單從這一次的樣本來看,語音的識別成功率在百分之75。
針對他們家的產品,我也同樣問到了模型幻覺的問題,像拆題和解題包括和用戶的交互過程中模型出現幻覺怎么處理,概率大概多少?現場的工作人員給我的答復是概率大致在百分之98,問題出現需要人工來干預,且不談這個概率的可靠性,就教育場景來說,哪怕百分之2的錯誤率意味著每一道題都要經過人工確認才行。
所以他們這個產品還是需要家長或老師的陪同下才好進行,或許這個產品的目標群體可以是家長,告訴家長解題步驟,家長掌握后再給孩子做輔導。
3、獵聘多面- AI面試官
大會來了一些做招聘試這塊兒業務的公司,我們平常在找公司的時候經常用像BOSS、智聯招聘這種產品,看上去都是面向toC的,實則這些招聘軟件公司同樣有很多toB業務且toB業務才是他們最主要的營收來源。
獵聘估計大家沒用過但也有所聞,他們在大會上展示的AI能力簡單用一個詞來概括就是- AI面試官,解決的核心問題是幫助企業提升面試效率確切來說是首輪面試效率,從面試者的視角來看,簡歷通過初篩后,會進入到AI面試環節,面試者將面對AI數字人進行面試,而AI數字人所問的面試題是根據崗位的JD,也就是說企業端只要給系統一份崗位JD,系統就可以生成面試題目。最終的企業根據AI的打分結合回答來判斷哪些候選人能進入到下一輪面試環節。
系統由大模型和小模型組成,大模型負責生成面試題且和面試者面試過程中的交互內容,小模型主要是指打分,獵聘通過他們私有的數據來訓練小模型的評分系統。當然因為是數字人形式呈現,那大概率也會用到一些像ASR文字轉語音,TTS語音轉文字的小模型。
期間我問現場的工作人員,如果從降低企業面試成本的角度來說成立,但作為一個面試者,公司第一輪使用AI的方式進行面試,可能會讓他們感覺企業不夠重視自己,對企業的好感度的降低。他們給我的解答是,目前AI面試官還未普及的情況下有這種可能,但假如后面普及下來,絕大部分公司都采用這種方式那就不存在這個問題了。這就讓我想到了如今的新能源汽車產業,電車被廣大消費者接受不僅僅靠的是一家車企的努力,還需要整個產業中每個公司的貢獻,比如供應鏈、充電樁等。之前蔚來汽車的老板李斌也說過蔚來和其他國產的新能源車企既是競爭對手也是合作者。
目前他們這個產品的售價按照面試次數,一個面試單價在20元,如果按照初輪面試有20個候選人,首輪面試的成本在400元左右,大家如果熟悉招聘行業的,可以算一下如果企業用這套系統,不從效果單從成本上是否能覆蓋首輪人工面試的方式。
4、AI機器人
大會各廠商展示的AI機器人總體分兩類,一類是解決某垂直場景的機器設備,有的設備也有人的屬性,比如用來裝載貨物的機械臂等,另外一類就是長的像人類并且大多都帶兩條腿的人型機器人,像特斯拉的Optimus。
我和其中的一家叫達闥機器人的工作人員聊了聊,他們做的也是類似于人型機器人,大廳大屏上展示的場景是機器人在咖啡廳拿咖啡杯移動,估計是想呈現出機器人在咖啡店餐廳這種環境下的服務能力,但和現場員工聊了之后發現這也只是個概念,還無法商業化落地,目前能落地的場景在景區導覽這塊兒,機器人相當于充當一個導覽人員的角色。
實現方式是通過先將展館或周邊環境進行3D建模,再將建模等數據給到機器人進行訓練,機器人也結合了大語言模型的能力,只是在面對一些非特定任務場景的問題時可調用大模型進行回復。
這種方式實現意味著每開發一個新的客戶,都需要有數據采集和預訓練的環節。
大致詢問了一下機器人的售價 ,現場人員給我了一個很泛的數字:十幾萬。一個三線城市景區的導覽人員年人力成本在10萬,如果整個機器能撐兩年,意味著成本能降下來。
除了人型機器人以外,還有一些垂直場景的AI機器設備涉及像機器自動做咖啡、機器自動做冰激凌等工業化設備。
感覺機器人整個產業已經比較豐富了,因為我看到除了機器人產品之外還有像一些機器人組件的供應商,比如提供關節模組這種解決方案的廠商。
二、其他AI產品觀察
除了以上所述的幾個AI相關的產品服務之外,現場還有很多,部分沒來的及仔細研究,初淺的了解下,這里也介紹一些。
1、華為的大模型-盤古
華為的盤古大模型除了像GPT-4這種通用模型外還提供了更聚焦的行業大模型和場景大模型,問了現場的工作人員這種更聚焦的大模型和通用大模型的差別僅在數據,一般來說要解決垂直行業或場景問題,哪怕僅是一個簡單的知識庫也是需要企業內部數據支持的,僅憑大模型是不行的。
2、自動駕駛
有面向民用的,例如蔚來汽車、特斯拉、極越,也有針對場景的toB端的解決方案,例如無人礦車,針對物流場景的無人駕駛等。
3、AI體檢
通常我們要是想要得知自己身體的各項指標需要去醫院抽血,更細致的要拍片等,在大會現場看到可以通過識別人臉就能給出部分身體指標數據的AI體檢產品,例如血糖,血脂等,我沒去體驗,因為我不知道我實際的身體指標是多少,無從判斷它的準確度,萬一要是測出來有哪項指標不合格就挺糟心的。該產品背后的原理不難理解,就是一個通過人臉和對應指標數據訓練出來的一個模型。
4、AI海外服務
通過AI的方式把面向國內的一些內容,針對不同海外消費市場的特性轉換成面向海外的內容。
5、AI Coder
基于大模型提升code效率, 例如具備自動Debug、AI輸出一些代碼片段等能力。
三、結語:
大會來了不少互聯網領域的大咖,例如像百度的李彥宏、獵豹移動的傅盛,阿里云的王堅,李彥宏在會上也很尖銳的指出,今天各大廠商都在卷模型的性能,是一種資源的浪費,而真正能夠解決實際問題的AI應用才是更有價值的。
可以看出整個AI產業界都在探索和期待現象級的AI應用的誕生,而從歷史來看每一次大的技術革新都會孕育出超大規模公司。
本文由 @產品蕭書 原創發布于人人都是產品經理。未經作者許可,禁止轉載
題圖來自 Unsplash,基于CC0協議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務
- 目前還沒評論,等你發揮!