深度分析:從智障到智能體,無用階級要到來了嗎?
AI技術(shù)的成熟與AI時代的到來無疑給我們造成了劇烈的沖擊,那么,AI的落地究竟可以給我們帶來哪些價值?其中釘釘AI這位先行者的進步,又可以給我們帶來哪些啟發(fā)和感受?
2022年11月30 OpenAI 發(fā)布了ChatGPT,一時間引爆人工智能話題。為什么這次ChatGPT反響如此之大,而在其它細分領域例如機器學習、圖片識別、OCR、圖片搜索、神經(jīng)網(wǎng)絡,決策樹、腦機接口、機器人輔助、機械臂、機器人、骨骼設備、自動駕駛、智能家居、智能推薦等一直都是平靜發(fā)展?
我個人認為,主要原因是這次大語言模型的突破似乎破解了人類思維的奧秘,對人類自以為至高無上、引以為傲、區(qū)別去其它物種的思考、創(chuàng)造、表達能力產(chǎn)生了劇烈的沖擊,讓人感受到了前所未有的被替代危機。面對這個危機,我們更需要樂觀地探索人工智能如何更好的造福人類,更應該多思考如何落地應用好這些智能科技,釘釘AI助手在這樣的背景下誕生,必將是一次偉大的嘗試與探索。本文將從自己的親身實測釘釘助手,結(jié)合自己5年的產(chǎn)品工作經(jīng)驗對AI進行思考,聊聊釘釘AI能否站在AI落地應用的浪潮之巔。
一、人工智能發(fā)展簡史與背景
討論AI之前我們先了解下它的歷史和背景。AI(Artificial Intelligence)–人工智能,這一概念是在1956年由一眾AI領域的科學家、數(shù)學家、教育者等在達特茅斯學院召開了一個研討會正式確立,之后被大家接受并推廣。這些開創(chuàng)者的代表人物有約翰·麥卡錫(John McCarthy), 馬文·明斯基(Marvin Minsky), 納撒尼爾·羅切斯特(Nathaniel Rochester)以及克勞德·艾爾伍德·香農(nóng)(Claude Elwood Shannon)。
● 在此之前人工智能已經(jīng)萌芽孕育了十多年,最早可追溯于1943年神經(jīng)生理學家麥卡洛克(W. S. McCulloch)和皮茨(W. Pitts)的神經(jīng)元模型。
● 20世紀60年代AI迎來了第一次浪潮期,發(fā)展出了符號邏輯,解決了若干通用問題,初步萌芽了自然語言處理和人機對話技術(shù),其中代表人物和事件有:
? 丹尼爾·博布羅(Daniel Bobrow)在1964年發(fā)表了《計算機問題解決系統(tǒng)的自然語言輸入(Natural Language Input for a Computer Problem Solving System)》。
? 約瑟夫·維森鮑姆(Joseph Weizenbaum)在1966年發(fā)表了《任務型對話系統(tǒng)研究綜述(ELIZA—A Computer Program for the Study of Natural Language Communication between Man and Machine)》。
但由于此時期的人工智能更多地側(cè)重底層的邏輯和通用問題的求解,大家對人工智能的熱情也逐漸褪去,人工智能也進入了近十年的“寒冬”。
● 20世紀70年代末至80年代迎來了人工智能的第二次的浪潮,各種人工智能框架、理論和產(chǎn)品在此期間涌現(xiàn),也標志著人工智能在細分領域開始蓬勃發(fā)展。其中代表人物和理論有:
? 1975年馬文·明斯基(Marvin Minsky)提出明斯基框架用于知識表示(Knowledge Representation),針對的是人們在理解事物情景或某一事件時的心理學模型。
? 1976年Douglas Lenat(道格拉斯·布魯斯·勒納特),發(fā)表啟發(fā)式搜索(Heristic Search)。
? 1976年Randall Davis發(fā)表大規(guī)模知識庫構(gòu)建與維護(Large Scale Knowledge-Base Construction),在基于知識的系統(tǒng)和人機交互領域做出了開創(chuàng)性的貢獻。
? 1982年David Marr 發(fā)表計算機視覺(Computer Vision),學習和運算能讓機器能夠更好的理解圖片環(huán)境,并且建立具有真正智能的視覺系統(tǒng)。
? 1979 年 7 月,Hans Berliner(漢斯·柏林格) 開發(fā)出一款名為 BKG 9.8 的計算機程序在蒙特卡洛舉行的世界西洋雙陸棋錦標賽中奪得冠軍,
? 朱迪亞·珀爾(Judea Pearl)提出貝葉斯網(wǎng)絡(Baysian Network),它可以模擬人類推理過程中因果關(guān)系的不確定性處理,其網(wǎng)絡拓撲結(jié)構(gòu)是一個有向無環(huán)圖(DAG),一種概率圖模型。
? 1986年,Brooks發(fā)表論文《移動機器人魯棒分層控制系統(tǒng)》基于行為的機器人(Behavior-based robotics)標志著基于行為的機器人學的創(chuàng)立。也讓人工智能在二個觀念上做了轉(zhuǎn)變:第一,智能不是符號化的模型;第二,智能不是由輸入得到輸出的計算過程。
之后經(jīng)歷10年的平穩(wěn)發(fā)展期
● 2006年以后進入了第三次浪潮與之前最大的不同,這次引領浪潮沖鋒的是企業(yè):
? 2006杰弗里·辛頓(Geoffrey Hinton)等人提出的深度學習。塞巴斯蒂安·特龍(Sebastian Thrun)在谷歌領導了自動駕駛汽車項目;
? IBM 的沃森(Watson)于 2011 年在《危險邊緣》(Jeopardy)中戰(zhàn)勝人類、獲得冠軍;
? 蘋果在 2011 年推出了自然語言問答工具 Siri 等;
? 2016年谷歌旗下DeepMind公司推出的阿爾法圍棋(AlphaGo)戰(zhàn)勝圍棋世界冠軍李世石。
? 特斯拉自動駕駛技術(shù)從2014年發(fā)布到如今FSD軟硬件逐漸成熟,已達到Level 3、Level 4高度自動化級別。
可以說這次人工智能浪潮的影響是前所未有的。
● 在2022 年在經(jīng)歷疫情沖擊,經(jīng)濟下行全球經(jīng)濟低迷之際,互聯(lián)網(wǎng)急需一針強心劑來改變現(xiàn)狀,ChatGPT橫空出世,一夜引爆人工智能話題,這一大語言模型讓大家切實感受到了AI從“智障”到真切智能的轉(zhuǎn)變。一時間資本趨之若鶩,進而促使AI更加風靡互聯(lián)網(wǎng)各行各業(yè)。不管是出于被資本的追捧、還是對于新技術(shù)的探索、再或怕落后時代的焦慮,互聯(lián)網(wǎng)公司紛紛如此,截止2024年市場上除ChatGPT 推出4.0版本外還涌現(xiàn)了眾多AI產(chǎn)品:
? Google 推出了Bard(現(xiàn)改名Gemini),F(xiàn)acebook開源了Llama模型,馬斯克開源了Grok模型,國內(nèi)也出現(xiàn)了百度文心一言,訊飛星火推出了天工AI搜索,字節(jié)的豆包,阿里的通義千問。
? 文生圖代表Midjourney,OpenAI DALL.E,生成式視頻代表Sora視頻生成,Gen-2, runway。
? 還出現(xiàn)眾多細分領域的小模型,例如圖片增強、去水印、摳圖、音視頻的增強等。
? 還有很多基于小模型,實施落地應用的各種聊天、文本生成式應用橫飛。
洶涌的AI浪潮滾滾而來,浪潮退下,經(jīng)過洗禮留下的AI應用才是真正的弄潮兒。
二、產(chǎn)業(yè)AI的迅速發(fā)展
在互聯(lián)網(wǎng)行業(yè)大家深知,一旦一項技術(shù)趨域成熟,在其垂直領落地應用的窗口期只有兩年。因此在AI火爆之后,國內(nèi)大廠紛紛入場,都想在這兩年窗口期中拔得頭籌,阿里自然也在其中,包括一個典型樣例-釘釘。
● 在2023年4月,釘釘宣布全面智能化,首先在B端發(fā)力,將所有產(chǎn)品要用大模型重塑一遍,截止目前釘釘不僅完成了在B端業(yè)務功能的智能化,釘釘這次的AI升級將智能化底座(AI PaaS)開放給生態(tài)伙伴和客戶,用大模型幫助生態(tài)把產(chǎn)品重新做一遍,并推出基于AI PaaS長出來的創(chuàng)新產(chǎn)品“數(shù)字員工”,以及多款智能化場景方案和智能化行業(yè)方案。這標志著釘釘智能化已全面進入生態(tài)層。
● 在to C 側(cè)2024年1月4日開放一款國民級工作應用釘釘個人版AI,并在不斷的升級,目前已上線圖片理解、文檔速讀、工作流等產(chǎn)品能力率先探索多模態(tài)、長文本與 RPA 技術(shù)在 AI 應用的落地。
● 除此之外,2024年4月18日,釘釘正式上線AI助理市場(Al Agent Store),個人用戶、企業(yè)、開發(fā)者開發(fā)的 AI 助理可通過上架市場,分享給更多企業(yè)。
釘釘AI官方為其功能和角色定義;
● 基于AIGC浪潮進入生產(chǎn)力和應用場景的最新判斷:AI Agent是最佳AI應用入口,釘釘要成為低門檻、高頻、開放的AI智能助理平臺。
● 其模型主要的能力是環(huán)境感知增強,記憶增強,推理規(guī)劃增強,行動系統(tǒng)增強。
● 主要的場景應用有工作流,工具插件,長文本,多模態(tài),分享進通訊錄摘要總結(jié),創(chuàng)作生成,數(shù)據(jù)分析,信息提取,客服咨詢。
由上我們可以得出釘釘AI 要持續(xù)智能化迭代發(fā)展的4個重要核心;
1. 模型基礎建設持續(xù)投入,不斷優(yōu)化提升智能性,讓自己在眾多模型中保持優(yōu)勢。
2. 推進生態(tài)的建設,開放智能化底座,三方的AI落地應用也可以接入釘釘,先前在App上已經(jīng)火了一把的妙鴨相機已同步上線自己的產(chǎn)品到釘釘?shù)膫€人版中。
3. AI Agent 概念,只需要簡單的場景預設,根據(jù)自己的垂直領域增加一些歷史知識庫就能創(chuàng)建屬于你自己的AI助手。同時釘釘AI還搭建了助手市場平臺,大家可以在上面發(fā)布分享彼此的AI助手??梢圆聹y后期平臺大概率會支持AI助手的交易,屆時將有一部分人在這里找到自己的財富機會。與此相似的是電商后臺的各種工具,不過釘釘AI開發(fā)門檻更低,這也讓更多人有了進入的機會。
4. 個人版的釘釘。垂直領域的終點必將是每個人的需求,一方面?zhèn)€人用戶的量級是to B 用戶無法比擬的,另一方面AI 助手更符合千人千面的需求場景,因此釘釘在此時推出個人版是極其關(guān)鍵的,可以猜測如果嘗試成功,釘釘個人版必將獨立面相市場。與其對標的就是文心一言,作為國內(nèi)首個推出對標ChatGPT的產(chǎn)品,它目前的產(chǎn)品生態(tài)建設是不容小覷的,同時在百度系生態(tài)下的功能應用也能見到AI的身影,搜索結(jié)果的AI智能回答,圖片搜索后對圖片的AI放大,去水印,擴展,局部替換、重繪,相似圖繪制等功能。
釘釘在AI落地應用上的全面、深入、徹底,在國內(nèi)甚至全球都是前所未有的。大力出奇跡,先天的大廠資源優(yōu)勢,加上如此的市場、技術(shù)風口,我對釘釘AI最后的成功持樂觀態(tài)度。
三、釘釘AI助理深入使用后的總結(jié)與感受
本人是從事互聯(lián)網(wǎng)工具類產(chǎn)品開發(fā)的產(chǎn)品經(jīng)理。下面是以一個自己曾經(jīng)做過的“屏幕錄制”工具的項目為主題,模擬產(chǎn)品經(jīng)理在接觸一個新事物到需求方案落地過程中釘釘AI助手能為我們提供哪些支持幫助。主要圍繞5個核心步驟:市場行業(yè)了解,基本原理了解,用戶場景分析,核心需求分析與提煉,需求文檔的編寫。
市場行業(yè)了解:在助手市場中搜索查詢“市場調(diào)研”關(guān)鍵字并未有結(jié)果,因此找了相關(guān)的通用角色的“產(chǎn)品經(jīng)理小助手”任務角色來幫助我解決了解市場。
問題:互聯(lián)網(wǎng)工具類產(chǎn)品的發(fā)展現(xiàn)狀
問題:現(xiàn)在開發(fā)一個“屏幕錄制”工具產(chǎn)品還有市場機會嗎?
可以看出,AI助手的回答確實能給出一些核心內(nèi)容和競爭對手,這對產(chǎn)品工作有很大的指導意義,但內(nèi)容過于模式化,籠統(tǒng),對于實際落地還是需要進一步細化,當然也可以用AI助手幫你進一步處理。
基本技術(shù)原理了解:屏幕錄制技術(shù)原理是什么?技術(shù)壁壘在哪里?
對于技術(shù)相關(guān)的回答,對產(chǎn)品經(jīng)理新接觸一個產(chǎn)品來講已足夠,對于經(jīng)驗深厚的產(chǎn)品經(jīng)理來講就很雞肋。
用戶場景的分析:有哪些核心的用戶場景
核心需求分析與提煉:用戶的需求痛點是什么
用戶場景和需求痛點分析,給出的答案是所有問題中我最滿意的,它很快地羅列出了這個產(chǎn)品在互聯(lián)網(wǎng)用戶中的需求情況。這個不錯的結(jié)果或許跟我選擇的是互聯(lián)網(wǎng)工具產(chǎn)品,在模型訓練數(shù)據(jù)中具有一定的優(yōu)勢。至于具體的核心痛點需求還是需要根據(jù)自己的開發(fā)市場情況選定一個方向。
需求文檔編寫:在助手市場找到了更相關(guān)的角色“產(chǎn)品需求文檔專家”,于是切換使用。
問題:我想要設計一個屏幕錄制產(chǎn)品
Q:請幫我詳細地寫出
此時發(fā)現(xiàn)給出的答案太不盡人意,需要提供的信息太多,對于一個新手的產(chǎn)品經(jīng)理來講門檻太高,于是轉(zhuǎn)回釘釘AI助手。
Q:寫一份關(guān)于屏幕錄制產(chǎn)品的需求文檔,盡可能詳細
此時長文本的結(jié)果的展現(xiàn),內(nèi)容結(jié)構(gòu)的完整給了我深深的震撼。AI 助手能幫助新手產(chǎn)品經(jīng)理提供這樣的產(chǎn)品文檔大綱是很有裨益的。
值得一提的是在文末它還提供了跳轉(zhuǎn)釘釘文檔的入口,你可以在此基礎上進一步細化完善,從這能看出釘釘AI在工作場景、工具間的銜接,體現(xiàn)出了它強大的整合能力。不足的是:會話會自動斷開,有時候會銜接不上,還會重復回答,當然這些瑕不掩瑜,畢竟產(chǎn)品開發(fā)迭代過程中bug才是推動進步的根本。
再談談交互與體驗。
使用一個產(chǎn)品給用戶的成本主要有三種:認知成本,視覺成本,行為成本;這三種成本從難易程度上來講,認知成本 > 視覺成本 > 行為成本。
● 認知成本:釘釘AI助手團隊版在標題欄右側(cè)用一個顯眼icon作為入口,這不難看出釘釘對AI助手的重視,用戶會很容易注意到。進入釘釘AI助手,為了降低認知成本,釘釘AI提供了常用的提示語,可以讓用戶快速的完成第一次提問試用,在整個對話過程中也有不斷的引導提示,保證用戶順暢的使用。
● 視覺成本:雖然釘釘AI支持多模態(tài),長文本交互,但是它會考慮人們常用的習慣以及對內(nèi)容的理解,一方面控制每次返回的長度和內(nèi)容的精準性(自然也會有成本的考慮),另一方面當每次新的會話出現(xiàn),舊的會話會折疊起來,幫助用戶區(qū)分分割內(nèi)容,同時整個界面風格也比較清爽。
● 行為成本:釘釘AI助手可以快速喚起,內(nèi)容輸入不僅可以文字輸入手機端也可以語音輸入。在助手市場中為用戶對角色進行分門別類,能很快的幫助用戶找到想要的AI助手角色。在人物角色的創(chuàng)建上面,把復雜的模型調(diào)參濃縮簡化成簡單的關(guān)鍵性字段,讓每個人創(chuàng)建合適的專屬助更加簡單。
總的來說,整個釘釘AI助手的產(chǎn)品體驗比較良好,能感受到釘釘強大的產(chǎn)品力。
四、AI目前到底為我們帶來了哪些價值
產(chǎn)品如果不能幫助用戶解決一些核心問題是無法持續(xù)的。新事物出現(xiàn)以后,涌入的用戶會有一部分是嘗鮮的心態(tài),如果不能快速創(chuàng)建讓用戶對產(chǎn)品念念不忘的錨,新鮮感過去產(chǎn)品終會難逃被冷落的命運。在使用完釘釘AI我感知到了以下的價值。
● 降本增效。對于to B的企業(yè)來講最核心的是降本增效,釘釘AI在各個領域的垂直落地應用,例如報表智能可視化,歷史內(nèi)容的學習檢索,內(nèi)容的總結(jié)提取,智能問題客服等確實可以為企業(yè)進一步降低成本。但不可忽視的是讓一個企業(yè)員工都學習使用最新的釘釘并接收這種工作方式也需要一個長期的適應和轉(zhuǎn)變成本,企業(yè)為此有可能面臨著整個員工的更換交替,這種不確定性做企業(yè)管理者是必須要考慮的。
● 娛樂屬性。釘釘AI助手確實變得更加智能,甚至可以創(chuàng)建出一個極為真實的具有感情色彩的虛擬人物對象,市場上對應的垂直領域的應用眾多,也獲得了不錯的效益。從這方面看AI助手在娛樂領域確實可以大有作為。釘釘AI出于對自身產(chǎn)品的定位,雖然在團隊版會弱化相關(guān)屬性,不過在活動組織,對話組織,一些周邊場景上也能感受到它的娛樂屬性,但釘釘AI的個人版將可以大力發(fā)展。
● 幫助與支持。AI助手縮短了人們對一個新事物的認知成本,從傳統(tǒng)的各種資料搜集理解到現(xiàn)在的即問即答,極大地縮短了時間。復雜的操作流程被語言對話指令替代,收到正確指令后它能在后臺幫你快速處理,比如快速訂票,查詢天氣,規(guī)劃路線等。
● 工作流中的深度結(jié)合使用。釘釘AI對垂直工作流的融合和服務支持,已經(jīng)能為互聯(lián)網(wǎng)從業(yè)者在日常工作的各個環(huán)節(jié)提供幫助,例如會議記錄總結(jié),周報匯寫,數(shù)據(jù)分析可視化等。極大了提高了個人的工作效率。
五、AI發(fā)展的反思
任何一個事物的發(fā)展都會對社會、環(huán)境以及周圍的事物產(chǎn)生沖擊和負面影響,AI 的發(fā)展也不例外。最近在美國有新聞事件報道,智能汽車上路,人物迫于對其工作替代的焦慮,出現(xiàn)了打砸自動駕駛汽車的惡性事件。表象之下,這是人們對科技AI發(fā)展焦慮的反應。
● 使用者內(nèi)心的安全感。AI 讓信息的獲取太過于簡單,決策也太過順利,對于我們大部分跟著互聯(lián)網(wǎng)發(fā)展起來的用戶來講,這份簡單會造成心里的不安全感,縱使你給的答案可能比我在各種費時費力權(quán)衡利弊之后的決定更優(yōu),我還是可能選擇相信自己。因此解決AI準確性,及時性將會是一條漫長的歷程。
● 中心化的依賴。模型的部署是高度中心化的,傳統(tǒng)離線的模型例如盤古,Siri,各種助手,迭代升級會受限,智能水平遠達不到高度集中部署的模型。深度依賴AI助手后,我們會退化獲取知識的能力,當AI設備損壞,寒冷,偏遠,深海等極限環(huán)境下,AI助手無法運行后我們最后的保障在哪里。同時這個超級中心大腦如果無法獨立運行,那當無網(wǎng)無電的時候我們將如何面對。
● 能源的限制。自然的規(guī)律總逃不過能量守恒定律,當AI為我們解決了問題提供了服務,自然會消耗更多的能量。大模型的訓練,運行會極大消耗能源,一旦AI高度普及,能源消耗將是指數(shù)級增長。雖然人類對能源的探索從未停止,但自發(fā)明電力以來,人類對能源的開發(fā)利用上還未有一個革命性的突破,能看到能源的問題將伴隨著AI的發(fā)展很快地到來。
● 道德與倫理。一部分在現(xiàn)實中受挫的人,在AI虛擬的人物形象中找到了安慰,幸福愉悅,虛擬對象的沉迷,虛擬世界沉迷,在這里所有的人生不如意都得到了實現(xiàn),人們將會沉淪,是人類的進步還是危害值得我們思考
六、總結(jié):未來已來,你準備好了嗎
釘釘AI在to B和to C的全力投入,落地應用不可否認讓我們看到了AI Agent的樣貌,這個全方位的落地探索也是獨一無二的探索。我對釘釘AI能否站在AI落地應用的浪潮之巔持樂觀態(tài)度。
正如哲學家、文化學者王東岳先生提出“遞弱代償”,時代潮流洶涌而至勢不可擋,能否對AI的恰當使用是決定一個人能否跟上時代潮流的重要能力,也終將成為拉開人與人之間距離的一個重要因素。
無用階級的到來,尤瓦爾·赫拉利在《未來簡史:從智人到神人》(Homo Deus: A Brief History of Tomorrow)中,提出了“無用階級”(useless class)的概念。隨著技術(shù)特別是人工智能和生物技術(shù)的迅猛發(fā)展,越來越多的傳統(tǒng)工作可能會被機器取代,導致大量人口變得經(jīng)濟上無用,即他們無法為經(jīng)濟體系貢獻足夠的生產(chǎn)力來維持自己的生計。這種情況下,社會結(jié)構(gòu)和人類身份可能面臨深刻的變革,許多人可能會發(fā)現(xiàn)自己屬于一個新的“無用階級”。而此刻的AI讓我們更加清晰地感受到這個時代的臨近。
未來已來,保持積極樂觀的心態(tài)擁抱迎接絢爛奪目的AI新時代。
本文由 @Charles 投稿發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于CC0協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發(fā)揮!