微軟CE0納德拉最新判斷:徹底取代SaaS,我們應該如何構建Al Agent生態
微軟CEO納德拉提出了全新的判斷,認為AI Agent生態將徹底取代傳統的SaaS模式。這一觀點引發了業界的廣泛關注和討論。本文將深入剖析納德拉的判斷依據,為讀者呈現一個清晰的AI Agent生態構建藍圖,供各位參考。
去年年末,微軟CE0薩提亞·納德拉曾大膽預言:
AI Agent將替代所有SaaS。
按照納德拉的預判,傳統的Saas(軟件即服務)模式正在走向衰退商業用戶熟悉的應用程序形式將逐漸被智能代理所替代。
毫無疑問,在AI落地的過程中,Agent將扮演越來越重要的角色。但如何更好地構建Agent生態,對產業各方來說,成為一個亟待解決的難題。
昨天,在班加羅爾舉辦的“Microsoft AI Tour ”大會上,納德拉再次發表了一場有關AI的重磅主題演講。其中,就詳細談到了其對于關智能體生態構建的最新觀點。
烏鴉君摘取了此次演講中的關鍵信息與觀點,相信會給你帶來啟發:
1)人工智能邁向新臺階的關鍵,更為高效的推理效率
2)智能體生態構建的三大關鍵能力
3)智能助手,全面革新工作流
4)算力,將成為衡量任何組織發展的核心變量
5)數據,AI 發展的根本支撐
6)明年,大模型本身將不再是業內焦點
7)工具屬性越來越重要
8)邊緣端正在崛起,任何應用程序都將成為混合應用程序
9)模型本身變化太快,設計決策更加重要
01 人工智能邁向新臺階的關鍵,更為高效的推理效率
回顧我在科技領域的35年從業經歷,背后一直有一股根本力量在發揮作用。
摩爾定律。
以前,比爾·蓋茨每年都會把我們一群人召集到一起,然后他會拿出摩爾定律,再講講內存方面的情況。
然后說“用軟件去填滿它吧”。
這就是,給整個公司下達的唯一指令了。即便到了今天,情況依然如此。
當我們思考,推動人工智能尤其是預訓練發展的擴展定律時,其實就是摩爾定律在再次發揮作用。
它首先得益于2010年的深度神經網絡(Dnns),之后,顯然是GPU(圖形處理器)又帶來了新變化。
或許是Transformer(一種深度學習模型架構)在數據并行方面的高效性,使得原本大概每18個月容量翻倍的情況,開始變成每6個月就翻倍一次。
這就是那些擴展定律的實際體現。
雖然,關于預訓練的擴展定律,目前存在諸多爭議。比如,它們是否還會延續?是否已經遇到瓶頸等。
但我們堅信,它依然有效,會持續發揮作用,只是難度確實增加了。
隨著數據量變得更大、參數數量增多,系統問題也變得更為復雜,不過它們仍會繼續發揮作用。
但現在更有意思的是,我們開始看到另一個與推理時間(或者說測試時間)相關的擴展定律,也就是計算擴展定律。
從某種程度上來說,預訓練有采樣步驟。
如何更高效地利用這個采樣步驟,實現在推理時間方面的擴展,我認為這將使人工智能發展邁向新臺階。
02 智能體生態構建的三大關鍵能力
如何“讓(AI)思考更深入”這個理念,是我一直關注的重點。
它不僅關乎采樣,還涉及在預訓練基礎上,在推理時運用它來更深入地思考,進而得到更好的結果。
我認為,這些能力最終歸結起來,體現在三個方面:
1. 多模態能力
這種能力,能讓我們與任何計算機系統進行操作,都可以熟悉、簡易的交互,將會改變每一個軟件類別。
例如,iPhone上的操作按鈕,我把它設置成讓智能助手(Copilot)為我服務。
現在,我可以很自信地用烏爾都語跟它交流,它能理解我的意思,就像在跟高中好友聊天一樣。
2. 規劃和推理能力
這是真正的智能體行為的開端。當你使用智能助手(Copilot)的辦公套件時,它就能喚起規劃,并將規劃作為多步驟流程,去執行的能力。
3. 記憶和工具使用能力
在我看來,這種能力是真正有助于我們,構建豐富多樣的智能體生態的關鍵所在。
它能使AI將系統之外,或模型記憶的上下文、所用工具以及權限范圍之外的事物整合起來。
我認為,這將是未來一年內,每個開發者的研發重點。
即,如何讓自己的模型知曉,它能用的工具,且不僅局限于函數調用;
如何確保它對自身權限有正確的理解;
如何保證它具備記憶能力,包括長期記憶。
當我們思考智能體時,將多模態能力、規劃推理能力、記憶能力以及所用工具,特別是權限范圍這些要素整合起來。
我們就能開始構建個人智能體、團隊智能體、企業級智能體以及跨企業的智能體。
03 智能助手,全面革新工作流
目前,微軟正在打造三大平臺。分別是智能助手(Copilot)、智能助手與人工智能技術棧(Copilot and AI stack),以及智能助手設備(Copilot devices)。
首先,是智能助手(Copilot):
將智能體理解為人工智能的用戶界面,是最合適的理解。
因為,智能體總需要與人交互,才能執行命令發揮作用。
如此,我們就需要一個用戶界面層,用以組織協調智能體的自主工作。
我們采取的方法,是將智能助手(Copilot)融入現有的工作流程當中。
例如,醫生們在準備一場高風險的腫瘤病例討論會。
這意味著,醫生們要閱讀所有相關報告,清楚知道在每個病例上要花多少時間。
所以,制定會議議程就是一項推理任務。智能助手(Copilot)在其中就起到了作用。
它能高效的制定出一份議程,清楚知道哪個病例更復雜,需要投入更多時間。
然后,進入會議環節,醫生們只需要全神貫注于病例討論本身就夠了,人工智能能夠幫忙做詳細的會議紀要。
會議結束后,如果這位醫生還是教學醫生。智能助手還能把腫瘤病例討論會上的內容整理出來,無論轉換成文檔,還是PPT都可以。然后,就可以輕松的去授課。
這是人工智能融入當前的工作流程的一個范例,簡單的流程卻能對生命有著重要的影響。
進一步看,有了頁面(Pages)、網絡聊天(Chat with web)以及工作范圍(Work scope)這些功能后。就又有一種新型的工作流程了。
無論是網絡上的信息,還是微軟365圖譜(Microsoft 365 Graph)里的信息,我們都能把數據提取出來。
然后,將其推送到一個名為頁面(Pages)的交互式人工智能優先畫布上。
一旦數據呈現在頁面(Pages)里,我就可以在頁面中使用智能助手(Copilot)來持續對其進行修改。
我借助人工智能思考,將內容推送到頁面(Pages)上,邀請其他人參與,與他人協作,而且人工智能在這個畫布上也全程參與。
聊天(Chat)加上頁面(Pages)將會成為人工智能新的重點應用。
未來,人工智能的擴展性是推動其持續發展的關鍵。
以在微軟生態中,智能助手操作(Copilot actions)為例。
對于熟悉 Outlook 規則的用戶而言,Copilot actions 可視為人工智能時代的規則進階。
它突破單一應用的限制,在整個微軟 365 系統中通用。
知識工作常涉及信息的收集與分發,以及人員與成果、人員間的關聯,而 Copilot actions 能將這些流程自動化設置,是人工智能擴展性的初步體現。
當然,大家還可以構建完整的智能體。
我們自己也正在構建很多這樣的智能體,其作用范圍涵蓋小組層面、流程層面等等。
比如,你可以有項目智能體,在團隊內部也有智能體在發揮作用,像口譯員、協調員這類智能體。
我們自己就構建了許多具有組級別和流程級別作用的智能代理。
04 算力,將成為衡量任何組織發展的核心變量
現在我想講講下一個平臺,也就是智能助手與人工智能技術棧(Copilot stack in the AI platform)。
我們一直將Azure(微軟的云計算平臺)視為全球計算機,并且會繼續堅定投入建設。
因為,我們認識到,人工智能無法獨立存在,它需要整個計算棧的支持。
計算棧是人工智能的基礎設施,從某種意義上來說,對于任何國家或任何公司而言,如今也就有了一個新的考量公式.
我把它看作,每/美元對應的算力(tokens per dollar)。
坦白講,無論是兩年后、五年后還是十年后,我們都會討論國內生產總值(GDP)增長與這個公式之間的關聯。
無論是在任何社區、任何國家、任何行業,甚至是公司層面,其自身的增長都與能否高效驅動這個公式緊密相關。
為此,基礎設施建設必須成為重中之重。
05 數據,AI 發展的根本支撐
如果有了基礎設施,下一個非常重要的考量因素就是數據。
在我看來,數據層是極為重要的一層,數據是創建人工智能的基礎。
預訓練需要數據、檢索增強生成(RAG)需要數據,訓練后處理需要數據、進行采樣在推理時計算,以改進預訓練需要數據。
所以,數據管道和數據至關重要。
我們打造的用于人工智能操作的存儲系統,無論是Cosmos DB(微軟的全球分布式數據庫服務),還是SQL Hyperscale。還是用于分析工作負載的Fabric(微軟的數據分析平臺)。
它們都已為人工智能做好了準備,以便后續,結合這些模型來使用數據以及構建模型。
這兩方面就是關鍵所在,一是基于數據進行模型訓練,二是利用數據進行檢索、增強生成等操作。
數據的臨近性、數據引力以及數據的局部性等因素都很重要。
06 明年,大模型本身將不再是業內焦點
一旦有了基礎設施和數據,接下來就是人工智能應用服務器。
回想當年,互聯網興起時,我們打造了IIS(互聯網信息服務)作為應用服務器;云計算出現時,我們又開始構建原生云應用服務器;移動時代也是如此。
每一個技術時代都需要對應的應用服務器,在人工智能時代,我們打造了Foundry(一個人工智能應用開發平臺)來擔當此任,并搭載了豐富的模型資源。
有了模型之后,接觸下來就是部署模型,對其進行微調、提煉,還要能夠對模型進行評估、做基礎測試、安全性檢測等一系列復雜的步驟。
我們直接將它們都整合到了應用之中。
在這些環節里,評估環節將會是重中之重,所以我給團隊的指導意見很簡單。
那就是,緊跟新模型的前沿動態,確保應用服務器層具備靈活性,這樣就能隨著模型的發展不斷跟進。
你可以先用最新的示例,然后進行成本優化、延遲優化,再針對自己的具體使用場景對其進行微調以用于評估。
這就是一個不斷循環的過程,而這也正是Foundry背后的理念,旨在簡化這一充滿活力的流程。
我認為,到了明年,整個行業將發生重大轉變。
行業內討論的焦點可能就不再是模型本身,而是模型編排、模型評估以及如何部署基于這些模型的應用。
例如,我看到巴羅達銀行(Bank of Baroda)的人員展示了他們構建的智能體;初創公司ClearTax,他們的智能體已經可以處理自己的稅務了,并且操作執行很簡單。
還有“農業人工智能”(Agripino of AI),它每天從土壤中收集實時數據,利用微軟的農業數據管理器(Microsoft Tissue Data Manager for agriculture)來做決策。
它運行著20多種算法,能夠基于歷史數據模式得出準確結果。
借助OpenAI,農民可以用當地語言提出問題,這些問題能通過WhatsApp傳達,他們可以精準地在農田里進行灌溉、整地以及使用農藥等操作。
對我來說,這真的把所有環節都串聯起來了。
它將我們構建的所有技術,從Azure物聯網(Azure IoT)實現的數據連接,到數據層面,再到能夠利用Azure人工智能(Azure AI),最終賦能農民提高農作物產量。
從某種意義上說,這體現了這項技術的強大力量以及我們能用它做的事情。
07 工具屬性越來越重要
接下來我想講講最后一層,也就是如果有了基礎設施、數據以及人工智能應用服務器,那么工具就是另一個關鍵要素了。
微軟最初就是一家工具公司,我們一直對工具開發滿懷熱情。
目前,我們在GitHub智能助手(GitHub Copilot)方面在持續取得重大進展。
我一直期待的一個功能現在已經實現了,那就是多文件編輯功能。
我們先是推出了代碼補全功能,接著有了聊天功能,然后把代碼補全和聊天功能整合到了一起,現在又實現了多文件編輯,這樣我就能在代碼倉庫(repo)層面進行編輯了。
當我第一次看到GitHub智能助手工作區(GitHub Copilot workspace)時,我感覺我們迎來了新的跨越時機,要從聊天邁向真正的智能體了。
在那里,你可以基于GitHub上的一個問題創建規范說明,對其進行編輯,制定計劃,然后編輯計劃,最后還能看到它在整個代碼倉庫中執行。
詳細來講:
智能助手(Copilot)能在開發者環境中,提供貼合上下文的人工智能輔助,而智能助手工作區(Copilot workspace)則是下一代具有智能體特性的人工智能原生開發者平臺。
能幫助大家,使用自然語言將想法轉化為代碼。
在智能助手工作區(Copilot workspace)中,頭腦風暴智能體(Brainstorm agent),可以基于上下文在智能助手工作區(Copilot workspace)中反復操作,通過請求修訂來不斷迭代計劃和實施過程。
最后,如果代碼測試通不過,也可以使用智能助手工作區(Copilot workspace)里的構建與修復智能體(Build and repair agent),它會給出解決這個錯誤的方案。
這些就是我們提供的人工智能原生的開發者環境,是一種智能體工作流程,它能跟上你的創意速度,快速推進項目進展。
08 邊緣端正在崛起,任何應用程序都將成為混合應用程序
最后我想講講智能助手設備(Copilot devices)。
我們前面講了這么多從芯片到云端的創新以及基礎設施建設,現在這些正在向邊緣端,延伸拓展。
我們與高通(Qualcomm)、超威半導體(AMD)、英特爾(Intel)在這方面的合作讓我們倍感興奮。
事實上,最近黃仁勛還提到了下一代將應用于普通個人電腦的GPU,有了它們,就能在本地運行整個英偉達的技術棧了。
但我們同樣對一些基礎功能也很期待,比如我使用智能助手電腦(Copilot PC)時,它的電池續航能支撐一整天,而且現在內置了這些新的人工智能功能。
而且,現在內置了這些新的人工智能功能,第三方開發者也開始利用這些功能了,像Adobe、剪映(CapCut)等公司都已經在使用了。
邊緣端一個全新平臺的正在開端,它將會和云端正在發生的變革一樣令人興奮。
實際上,我們不認為這是傳統的客戶端-服務器模式,這不是關于本地獨立模型的問題,而是混合人工智能。
也就是說,未來大家構建應用程序時,能夠將一部分任務卸載到本地的神經網絡處理器(NPU)上進行輔助分類,同時調用云端的大語言模型(LLMs)。
所以,任何應用程序都將真正成為混合應用程序,不再是單純在本地運行或者完全在云端運行,我認為這就是我們所期待的發展方向。
09 模型本身變化太快,設計決策更加重要
我們希望通過所有這些平臺展示三大關鍵設計決策:
Copilot 作為人工智能的用戶界面(UI)。
應用服務器作為構建人工智能應用的平臺(如 Foundry)。
數據架構(Data Fabric)。
相比模型本身,這些設計決策更加重要,因為模型每年甚至每月都會變化更新。
而用戶界面、數據架構和應用服務器是最基礎的核心層,能夠提供靈活性來適應新模型。
編譯/樹一
本文由人人都是產品經理作者【烏鴉智能說】,微信公眾號:【烏鴉智能說】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協議。
- 目前還沒評論,等你發揮!