我看到了AI生產力工具的正確路徑
從ChatGPT的橫空出世到多模態功能的集成,AI生產力工具正變得越來越強大和實用。本文作者分享了他使用AI工具的深刻體驗,探討了AI生產力工具的發展歷程、當前優勢以及未來潛力,為我們揭示了AI如何成為提升工作效率和質量的關鍵因素。
當ChatGPT于2022年10月30日橫空出世之時,我跟周圍的很多朋友一樣,幾乎立即成為了它的用戶。我很快認識到了AI大模型在生產力方面的巨大潛力,尤其是在翻譯、回復郵件、撰寫周報、總結會議紀要等任務上。
此后大約一年半的時間里,我試用過市面上大部分流行的大模型聊天機器人,以及基于大模型的生產力工具,其中有些給我留下了深刻印象;但我一直是“淺嘗輒止”,站在旁觀者的角度進行研究和評判,從來沒有在真正的工作任務上依賴過它們。
為什么?
因為AI生產力工具還存在許多缺點。
- 它們普遍無法處理復雜的、結構化的信息(例如各種文件);
- 它們經常產生所謂“模型幻覺”(即瞎編的夸夸其談);
- 它們無法根據最新的外部信息調節其回答;
- 而且它們的用戶界面往往不夠友好。
總而言之,它們“能用”,但實用價值和可靠性有待提高。就像一支球隊中的青訓天才球員,偶爾能靈光一現、讓人眼睛一亮,卻無法成為值得長期依賴的主力球員。
相信很多經常接觸AI大模型的人,會跟我得出類似的結論。
然而,現在一切都不同了。
今年6月以來,AI大模型開始對我的日常工作發揮舉足輕重的作用;我已經在GPT-4o上面花費了上百小時,在騰訊元寶上面花費了幾十小時,它們分別是我處理英文和中文信息的最重要的生產力工具。我毫不猶豫地開始為GPT-4o付費;可惜元寶還沒有付費選項,不然我肯定會欣然接受。
為什么?
這是由一系列技術和產品革新決定的:
現在的大模型普遍具備了多模態功能,在輸入端和輸出端能同時處理文字、圖片和音頻信息;視頻功能暫時還沒有被整合進主流多模態大模型,但應該只是時間問題。
超長文本處理,以及對多種主流文件格式的解析,已經成為主流AI產品的標配。直接把一個大文件或者網頁鏈接扔給大模型解析的感覺非常好!
對外部信息的搜索和梳理功能也日益強大。上面提到的GPT-4o和元寶都可以隨時發動AI搜索,整合多個渠道的外部信息,并且列出可追溯的信息來源。
對我而言,從現在開始,AI生產力工具才算越過了從“能用”到“好用”的那根金線。這就好像當年的“法國小將亨利”去掉了“小將”前綴,“小小羅”在曼聯晉升為“C羅”——從靈光一現的神童變成了值得依賴的主力。
就在昨天晚上,我與GPT-4o進行了兩個多小時的對話,梳理了全球三大云計算平臺(AWS、Azure、GCP)的基礎知識;今天下午,則讓元寶幫忙總結了幾份很長的券商研究報告,從中找出了幾個值得閱讀的新穎觀點。
我有一種越來越強烈的感覺:這就是未來的工作方式,也是AI生產力工具的正確打開方式。它們會幫助我們節約無數的時間,徹底改造大部分傳統業務流程,把我們的工作效率帶到前所未有的高度。
舉一個剛剛發生的案例:我詢問騰訊元寶,如何看待未來幾個季度騰訊游戲業務的走向。AI深度搜索功能自動啟動(此功能7月1日剛剛上線),在半分鐘內搜索了40個信息源,引用了其中4篇作為參考(且附上了鏈接),向我提供了如下結論:
在DNF手游的推動下,騰訊游戲二季度收入將實現兩位數的增長;三季度產品排期尚不確定,但是海外市場將驅動游戲業務整體繼續增長。
除了游戲業務之外,還應該關注視頻號電商帶貨以及微信搜一搜場景的商業化,以及對AI算力的持續投資,乃至“AI+游戲”等下一代產品。
左圖為元寶APP的一般AI搜索結果,右圖為深度搜索結果
(在補充騰訊一季報文件之后,元寶又恰如其分地指出了Supercell和Riot Games對騰訊游戲海外業務的重要意義,包括前者的《荒野亂斗》和后者的《無畏契約》,等等。)
對于一個已經非常熟悉騰訊及其游戲業務的分析師而言,上述分析略嫌粗淺;可是對于一個沒有相關知識儲備的普通人而言,上述信息已經非常有用了。
幾乎所有的事實列舉都是正確的,論點和論據之間的結構關系明確,語言組織的方式也頗具可讀性。
我不禁想起了七年多之前,我剛開始研究包括騰訊在內的中國互聯網行業時,找資料、整理資料、確定資料可靠性,都是老大難問題;如果當時就有生成式AI該多好??!
值得特別指出的是,與其他具備搜索功能的AI工具相比,元寶有一個巨大優勢:對騰訊生態的信息覆蓋非常完善。
眾所周知,微信公眾號一直是中文高質量專業文字信息的主要發源地,就拿我熟悉的互聯網、AI行業來說,幾乎所有的優質原創文章都來自公眾號;對于上面那個騰訊游戲的話題,元寶援引的4條鏈接,就有兩條來自業內頗具影響力的公眾號。
除此之外,根據我的觀察,元寶似乎對財經專業信息的覆蓋尤其健全,這可能是源自騰訊自選股、騰訊新聞等平臺的財經內容。
我相信,除了財經之外,應該還有不少其他專業垂類受益于這種高質量的信息覆蓋,這對于生產力應用的意義怎么估計都不過分!
AI搜索非常重要,但它不能單獨解決一切問題。
長文本理解和文件解析也非常重要,例如在上面的案例中,我手工上傳的騰訊財報PDF文件就發揮了補充作用;其實我還可以上傳自己制作的Excel表格文件,讓元寶進行更深入的數據分析。讓我高興的是,元寶把“搜索”和“長文本/文件解析”兩項功能,比較良好的融合了起來。
當然,必須承認,與GPT-4o這種全球領先者相比,元寶還是有差距的,在不同信息來源的無縫融合方面還需要提高。不過我相信,這種差距不是出于大模型底層的缺陷,它可以通過良好的產品迭代得到解決。
今年3月的《哈佛商業評論》刊登了一篇題為《人們究竟如何使用生成式AI》(How People Are Really Using GenAI)的文章,其中提到了幾個有趣的發現:在全球的十多億“腦力勞動者”當中,只有大約15%在使用生成式AI工具。
剩下的85%為什么不使用呢?
有些是認為它們“沒有用”,有些是因為它們經常給出錯誤答案,還有些單純是因為用戶界面不夠友好。
時至今日,大模型自身的技術能力其實已經超過了許多重復性勞動的要求,所以很顯然,問題出在產品端。
其實,今年5月13日發布的GPT-4o就是一個典型的產品創新——它的底層完全是基于已有的GPT-4和DALL.E大模型,只是把多模態、搜索和文本解析功能做得更好了而已。
因此,我能夠理解,為何騰訊對于混元大模型(元寶就是建立在混元基礎之上)的定位是“實用級大模型”。
以前的大模型產品更像是給極客使用的,很有趣、很值得研究,可是易用性與普適性不足;元寶這樣的產品則是面向每個普通人的。
按照我的一位從事AI產品研發的朋友的話說:“元寶的進步相當快,我指的不是模型側的進步,而是應用層面的‘雕花’。從單純的技術角度看,‘雕花’好像沒什么大不了的,但那是用戶真正關心的。騰訊最擅長的不就是把用戶體驗做好嗎?我很期待再過幾個月的元寶會是什么樣子?!?/p>
對于這位朋友的觀點,我還想補充一句:我們都說“騰訊擅長產品”,這個“擅長”不僅僅在于重視用戶體驗,也在于把各項功能有機地捏合為一款產品的能力。
例如,在國內主流AI產品當中,秘塔很擅長搜索,Kimi Chat很擅長長文本分析,這些都得到了用戶的公認;而騰訊元寶則是兼具了這兩項能力,形成了一條更順暢的工作流,實現了“秘塔+Kimi”的效果。這背后折射的,是騰訊從QQ到微信、從PC端到移動端一以貫之的產品方法論,以及高度重視實用性的“產品經理文化”。
未來的元寶會不會像微信一樣,建立龐大的應用生態、添加越來越多的功能,乃至演化為一個完全融入工作和生活的“AI全能助理”?會不會與企業微信、騰訊會議、騰訊文檔等現有的生產力應用更深入地融合起來?
一切皆有可能,但是最終決定一切的,肯定是用戶的實際需求。
上面說的是比較長期的愿景。在短期,我認為AI生產力工具的“殺手級功能”已經出現了,那就是深度搜索、文件解析和多輪對話(記憶)功能的有機結合。
這三項功能足以有效地總結外部信息、用戶提供的內部信息以及模型自我生成的信息,對它們進行高效處理,同時最大限度地排除低質量信息和“模型幻覺”。
對于大部分組織和個人而言,這已經非常實用了!《哈佛商業評論》提到的“85%的腦力勞動者為什么還不使用生成式AI”的主要原因,由此得到了圓滿的解決。
生成式AI對人類工作流程的改變,才剛剛開始。今后還有更多、更復雜的問題需要解決,但是我們已經走在正確的道路上了。我迫不及待想看到各類AI生產力工具百花齊放、爭奇斗妍的那一天——應該很快就會到來。那些最先適應這個時代的組織和個人,無疑將受益匪淺。
本文由人人都是產品經理作者【互聯網怪盜團】,微信公眾號:【互聯網怪盜團】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協議。
- 目前還沒評論,等你發揮!