AI不應該把所有桌子都掀了

0 評論 934 瀏覽 0 收藏 15 分鐘

在人工智能領域,大模型技術的發展引發了廣泛的關注和討論。人們曾對AGI(通用人工智能)的快速實現抱有極高的期待,但現實情況是,這一目標并非一蹴而就。當前的AI產品正逐步從單純的技術展示轉向實際應用,通過與現有系統的融合,提升用戶體驗。本文將探討大模型技術在實際應用中的落地情況,以及它如何與現有技術資源相結合,服務于用戶的真實需求。

01 大廠的AI正踏入另一條河流

今天關于大模型的狂熱里充滿了各種誤解。

其中最深入人心的一個,就是“AGI” (Artificial General Intelligence,通用人工智能)馬上就要實現,而實現的方式是由一個全知全能的模型,解決你自己現在都不知道還需要去解決的某個無比重要的任務。實現的載體就是一個比人還聰明的對話框。

因此,一切都需要被立刻顛覆、馬上重來。

這可以是個令人期待的未來,但并不是馬上就要發生的事情。最近的一系列事情都在讓人們回過神來。比如作為標桿的GPT-5一再延遲,如扎克伯格首次明確了對ChatGPT類單一全能AI產品的拒絕;比如一份被稱為“AI墓地”的名單在網上熱傳,收錄了738個已死去或停止運行的AI項目。

與此同時,幾個重要的AI產品,都在體現另一種浪潮的方向:不是推倒重建,而是在已有大量用戶的系統里納入大模型能力,借此大幅提升用戶體驗;不是無中生有,而是用大模型把已積累的資源真正調用起來,更好服務用戶原本就存在的需求。

上個月的蘋果WWDC 發布會在第一時間被認為令人失望,很大程度就是因為外界對蘋果發布一個全知全能模型的預期太高了,但接下來股價高漲等市場的反饋扭轉了人們的判斷,也體現了人們對蘋果所代表的這條AI路線的重新思考。

蘋果沒有自己的全能模型,而是建設了一個三層的模型體系:本地模型用于處理簡單任務,私有云端模型來確保加密和安全,第三方的模型提供更多的能力。這個體系是為了它復雜的生態系統而建,為了增強它自己已有的能力而設,目的是提高用戶在已有需求上的體驗。

這也是為什么后來大家明白,OpenAI在里面并不是一個吃掉蘋果的角色,哪怕ChatGPT是目前最強的大模型產品,也無法“接住”蘋果的用戶需求,依然只有蘋果能服務他們。

再往前Google在年度大會Google I/O上的思路同樣如此,拋去在OpenAI壓力下應對性的“期貨”產品Astra,它更多的發布都是在把Gemini融入它已有的億萬級用戶產品線中,而非對一個單獨的全新Gemini app本身的更新。

在最近一些國內國民級產品的更新上,也有相似趨勢。在剛結束的世界人工智能大會(WAIC),支付寶重點展示了最新的AI應用——集成在支付寶App里的智能助理,你可以在支付寶首頁下拉找到它,過往多次點擊才能完成的如訂票、點餐、問診掛號等服務,用說話的方式就能更簡單地辦好。

與那些充滿科幻片色彩、但遲遲無法體驗的場景不同,蘋果在發布會上舉的例子是,“假設我的一個會議被重新安排到下午晚些時候,我想知道這是否會影響到我按時參加我女兒的演出”,在Siri后續更新后這些功能就可以實現。

相似的,支付寶同樣關心AI能幫人解決生活問題,在智能助理展示的已實現的功能中,就包括“幫我點一杯星巴克的大杯冰美式”、“幫我交200塊錢話費”、“上個月我花了多少錢”、“幫我查明晚七點后從上海飛北京的航班”等服務。

今年4月開始,支付寶就在首頁測試這個全新的智能助理,它不是側重聊天交流的“AI原生應用”,更像是融入支付寶平臺生態的AI生活管家,不只是“有腦有嘴能對話”,同樣“有手有腳能辦事”。

“生活搭子”之外,也有“工作搭子”—— 今年1月,釘釘上線的“AI超級助理”,就成了可調用釘釘幾乎所有功能的入口。更早之前,微軟同樣將Copilot(AI助手)嵌入Word、Excel等旗下所有的辦公應用中。

這些都是典型平臺或App的自我改造。他們沒有拋下原有億萬用戶的日常需求,它們不因AI大模型出現而改變,但新技術會使需求的滿足變得大不一樣。

這種對產品的自我重塑,從用戶需求出發,看起來不那么“炫技”,甚至是個下“笨功夫”的活兒,需要既有生態保障,甚至是系統性二次開發。

比如蘋果智能需要基于大模型,在安全的環境里對用戶的個人信息進行處理,從而進一步“判斷用戶的日程是否沖突”。支付寶智能助理要完成訂票這樣的任務,背后是系統性的生態和技術支撐形成閉環,需要在隱私保護基礎上對用戶個人信息進行個性化的處理。

這些公司往往也都是在隱私和數據保護上最在意的公司,因此你會看到相關功能發布時,都帶著“枯燥”的對數據隱私的配套技術保障的介紹,它們當然沒有一個斯嘉麗約翰遜口音的AI化身吸引眼球,但對在日常生活里依賴這些服務的人們是至關重要的。

AI要融入用戶的生活場景,提供更有人情味的服務。至于大模型本身,則無需喧賓奪主,非要出來把一切桌子都掀了,它完全可以躲在最后面。

“讓AI像掃碼支付一樣簡單”是一個很形象的說法。一個二維碼簡化了許多繁瑣的流程,同樣讓諸多技術上的復雜革新隱藏在了后面。支付寶提出的這句話,說清了許多國民級應用使用大模型的新方向,也是通往“AGI”的另一條路——不止是All in AI,更應該AI in All。

02 大模型落地的三股浪潮

諸多國民級產品的“不謀而合”背后,是把大模型放在更長的技術發展視野里來看待的產物。

從技術的演進來看,大模型的突破,可以被認為是機器智能漫長發展歷程里的一個全新階段,而非自成一體的某種“創世紀”時刻,拋棄過去、顛覆一切。

某種程度上,我們可以把互聯網基礎設施的成熟、因此而產生的大量數據及數據處理技術、因數據豐富而進步的算法模型、進一步誕生的推薦算法等,以及移動互聯網的最終繁榮,都看作一整個不間斷進程里的組成部分,而今天大模型的爆發,則提供了徹底釋放過往積淀技術和數據資產的能力。

這也意味著,大模型是個十分重要但依然獨木難支的“大腦”,它需要與其他重要技術一起發揮作用,需要一整個系統來支撐,才能幫助這個系統完成升級。

這與人們一開始的嘗試已經很不同。在如何把大模型通過應用落地的事上,短短不到兩年時間已經有了三股浪潮。

第一波浪潮是AI聊天應用。但人們總是忘記ChatGPT是個“意外”的產物,最初只是用來展示模型已有能力的一個demo,OpenAI自己也沒有準備好,沒人預料到它引發的一系列變革。

因此在最初的第一個階段,震驚的人們把一切幻想都寄托在一個神奇的對話框上——既然它可以表現出智能,那么我跟他對話就應該能解決一切問題。于是,各種大模型以一個對話框的形態變成產品,紛紛推出。

第二股浪潮,則是希望通過簡單的Prompt等方法,來把這個對話框變成某些垂直場景的專家,進而來重建對應的垂直應用。GPT store等就是這個階段的產物。

現在各個大廠正理性邁入第三階段:基于前兩個階段的嘗試,它們發現想要單純依賴一個對話框就重塑自己有些想當然,大模型的落地需要和已有的系統進行融合,利用已有的技術和資源來服務用戶,而不是徹底重新來過。

看一看微軟的一系列嘗試,就能更好地理解這樣的趨勢。作為OpenAI的最大推手,微軟在ChatGPT出現后,也第一時間希望通過一個萬能對話框來拯救Bing,成為未來AI時代的入口。

然而ChatGPT加持的Bing,在爭奪市場份額上效果一般。之后微軟快速擁抱了OpenAI的GPTs理念,在它提供給B端用戶的Copilot Pro服務中第一時間集成了GPT store的功能,但就在3個月后,它又決絕地下線了這個功能。

最終,微軟真正一直延續下來的AI戰略,還是把大模型融入已有的產品和生態中——從Office Copilot,到最新的AI PC里最明星的產品Recall,都是聚焦讓大模型在已有的復雜的資源里挖掘潛能,進而真正落地。

這個技術路線現在被很多人定義為“AI Agent”(智能體),一個明顯的共識是,AI Agent越來越多地強調大模型能智能調用現有工具、服務和計算資源的能力。

大模型不是一切,但它能真正智能地調用一切。因此,它也需要一切。而這個“一切”在哪里呢?

在那些已融入生活的國民級產品和它已服務的萬千復雜場景里。

蘋果展示的“大模型增強版Siri”可以帶來的服務,正是基于它各種軟硬件結合的系統級調用能力。支付寶智能助理在做的,同樣是一個系統級工程。

以支付寶智能助理正在測試的“智能點單”功能舉例:當用戶說出“請給我點一杯星巴克的大杯冰拿鐵”,大模型先讓AI具有屏幕感知能力,能“看到”小程序頁面,再通過仿真執行能力,快速完成所有過去需要用戶點擊的步驟,用戶確認并付款后,就能到附近的線下門店取咖啡了。

支付寶沒有選擇簡單調用數據接口,而是選擇這一名為ACT(Transformer for Actions)的智能服務技術,正是希望未來能通過AI,連接背后數百萬的小程序,乃至平臺原有的數千種數字生活服務。

我們可以想見,未來的智能助理可以用一句話就能幫我們訂票、掛號、制定出門行程……AI也能從“通用”的大模型,變成“有用”的小工具,服務更多的普通人。

可以看到,無論是蘋果或微軟,還是支付寶或釘釘,國內外的平臺產品,都不再執迷于以一種上帝視角去創造全新的需求。

它們決定讓大模型從幻想的全能對話框里走出來,讓AI融入生態,也讓AI落入生活——這也許并不前瞻,但人人可見的大模型落地路徑,反而能推動這個技術的真正潛能開始逐步兌現。

作者|玄寧

本文由人人都是產品經理作者【硅星人】,微信公眾號:【硅星人Pro】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。

題圖來自Unsplash,基于 CC0 協議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!