你會用200萬字處理能力的AI做什么?

1 評論 845 瀏覽 1 收藏 18 分鐘

自從生成式AI爆火之后,各個廠家都推出了自己的生成式AI產品。但大多數(shù)都是基于簡單的文字生成,少有處理文件和聯(lián)網(wǎng)的功能。前段時間Kimi Chat啟動200萬字長文本的內測,經(jīng)過體驗后,我有一些不一樣的心得。

請問:你知道Kimi Chat嗎?

產品出來時,我寫過一篇「測評文章」,許多讀者閱讀后表示用了起來。Kimi Chat不僅能搜索資料,還能處理PDF、doc、xlsx、PPT等格式文件,最大支持100MB,處理上限為20萬字。

我注意到,各種討論中,大家對Kimi有不同反應。

有人覺得不錯,稱其為國產之光;也有人覺得沒有達到預期,處理一些較長的內容、長期堅持一個對話時,會出現(xiàn)幻覺。

不過,3月18日,他們在上下窗口技術上,又取得一項新突破,現(xiàn)在Kimi能處理長達200萬字的“長文本”輸入,并且開啟了內測。

沒錯,短短5個月再次升級。

想要申請200萬字上下文功能的內測非常簡單,只需登錄Kimi Chat官網(wǎng),點擊對話框下方第一條提示,加入內測隊列,幾個小時后,就會收到新的通知。

嗯,經(jīng)過體驗我學到一些新知識,也有一些不同心得。

01

從哪里分享呢?就從「200萬字」的話題開始吧。

你可能遇到過這類情況:

當用AI工具處理一篇文章、一個網(wǎng)頁鏈接、一個PDF文件時,它卻跟你說,內容太長了,超出處理限值,請上傳一個字數(shù)更少的文檔。

咦,然后,你會疑惑的檢查下文檔大小,發(fā)現(xiàn)明明符合要求,怎么就不行了呢?別急,其實AI工具計算方式和你想的不一樣。

在計算機科學和自然語言處理(NLP)領域中,它們以“token”作為計量單位,token和普通的文字字符是不同的概念。

什么是token呢?

簡單講:一個單詞、一個數(shù)字、或一個標點符號。

比如:

拿句子“The quick,brown fox jumps over the lazy dog?!眮碚f,分詞后,可以得到The、quick、brown、fox等;在英文里,“I love apples”這句話分詞后會變成“I”、“l(fā)ove”、“apples”三個tokens。

處理文本數(shù)據(jù)時,自語言技術首先會進行“分詞”(tokenization),把整個文本拆分成一個個tokens,這樣做的目的,是它可以更好地分析、理解文本的具體含義。

我研究了一下,ChatGPT、Gemini、Claude國外AI模型,把一個漢字算作1到3個token,他們用一種叫字節(jié)對編碼(BPE)的方式來分解文字。

國內像文心一言、智譜AI更傾向于用WordPiece分詞策略,做法是將單詞分成更小的部分,即“子詞”,以便更好地理解罕見的詞和詞根。

簡單來說,將復雜的內容拆成簡單的小塊,讓模型學得更好。

所以,當你看到某AI模型聲稱能處理10萬字,實際處理不了這么多,因為一個漢字可能等于多個token,導致實際處理的字數(shù)比看上去的少。

明白這些你也就理解了,為什么有時文本看起來沒達到上限,卻說超過模型處理的能力了。

目前AI領域,比20萬漢字上下文高的只有谷歌的Gemini 1.5 Pro(100萬token),它主要針對情境學習能力,以及Claude 3定制版(100萬token)。

月之暗月團隊再一次將Kimi能力升級到200萬字,的確是一項重大突破。那么,問題來了:停留在20萬字時,你會用Kimi做什么呢?

02

我問了一圈,得到不少答案。一位朋友說:問想不起來的事兒。

我沒太懂,讓他解釋一下。他說:

前天,讀到一篇文章,講一個女孩在街上被人殺害,周圍有很多人看到了,但沒有人出手相助。他問這是什么情況,意味著什么?

于是這個問題交給AI。

AI告訴他,心理學中,該現(xiàn)象被稱為“旁觀者效應”,即緊急情況下有多個目擊者,個人采取行動的可能性會降低。AI還提供一些歷史上的案例作為參考。簡而言之,提供深刻的見解和背后的理論支撐。

另一個朋友說:問滅火器口訣含義。什么?口訣?

他說,前天消防安全培訓,講師提到一個口訣叫“提拔握壓”。當時沒懂啥意思,人多也沒敢提問,于是,回家后想到用AI來解答疑惑。

他問AI,「提拔握壓」口訣具體什么意思,操作滅火器要注意哪些要點,以及常犯的錯誤有什么?結果AI幫他解決了疑惑。

襖,我懂了。很多工具可以幫助我們解決問題,即使在人多不好意思問的情況下,回頭也能找到答案。

還有一個朋友說:幫我出謀劃策比較多一些。

前幾天,沒有經(jīng)過總經(jīng)理簽字的情況下,把一個文件送去了應急局;但總經(jīng)理明確提到他不同意按照我已經(jīng)報上去的信息上報材料?,F(xiàn)在材料送去了應急局了,總經(jīng)理又提出這個事兒,怎么處理比較好?

于是,他把問題甩給了Kimi。

Kimi告訴他,一,承認錯誤,向總經(jīng)理說明情況;二,嘗試聯(lián)系應急局,看看是否能暫時擱置那份文件;三,如果做不到,趕緊與總經(jīng)理討論,商定共同立場,以便在應急溝通時一致對外。

四,制定一個預防措施,以后遇到此類問題怎么改正流程;五,處理時,要保持積極樂觀的態(tài)度,不要因為領導生氣而抱怨。

嗯,按照此邏輯執(zhí)行,領導相當滿意,成功躲過一劫。

原來可以這樣。還有一個朋友說,他前兩天用Kimi搞定了一份安全檢查表。

他的職業(yè)是安全管理,在一家化工廠工作。最近因為社會上火災事故頻發(fā),對火災隱患的監(jiān)管變得更加嚴格了。所以,他要制定一個專門針對危險化學品生產企業(yè)的火災隱患排查表。

于是,直接把需求給了AI。告訴它需要一個包含車間、檢查項、檢查標準、檢查記錄、整改措施、整改負責人和完成日期等信息的表格。結果AI直接做好給了出來。

的確,每個人用法都不同。

我平時閱讀文章、整理別人文章的大綱、要么查找某個公司財報,有時也會讓它幫我把一些問題條理化。

前幾天接到一個小活兒,內部寫的文案有點啰嗦,想把整個公司介紹PPT修改下,我就把文案甩給了Kimi,分分鐘搞定。

所以,不難看出,針對AI,20萬字以內的處理能力,大家做的事情相似,包括搜索、提問、結構化內容,以及做表格等操作,還有一些朋友會用它寫Midjourney的提示詞等。

03

那么,當AI具備200萬字處理能力時,你會怎么看呢?

不妨從工作的角度想想該問題。

一個HR朋友說,最近BOSS直聘找工作的屬實多,我每天平均回復在50家以上,要篩信息,看履歷,看項目經(jīng)驗,真頭疼。

想象一下,一份簡歷大概500到800字,如果用AI,按1000字算,一次性能吃進去2000個簡歷;讓AI從2000份簡歷中篩選候選人,聽起來是不是挺方便?

人力資源評估這類事情,已經(jīng)有海外大廠在做了,AI 評估會更全面,而且不帶個人感情,這不一定是最好的辦法,至少給了更多選擇的可能性。

我最近看商業(yè)周刊,還翻一些外文書,但之前用AI幫忙讀書總被字數(shù)限制弄得頭大,有時,ChatGPT也不能直接處理,我不得不把書一分為二給AI。

就拿國外很火,但國內還沒上的《AI產品經(jīng)理》一書來說,之前讓Kimi來幫我讀,因為字數(shù)太多直接被卡殼了;不過,昨天解鎖200萬字能力后,再次一次性給它,不僅迅速搞定,還幫我把全英文內容翻譯成了中文,效率的確高不少。

還有一點,200萬字的AI學習能力的確很強。

拿編程來說:一般人想成為軟件開發(fā)專家,得下不少功夫,學好幾種語言,弄清楚算法和數(shù)據(jù)結構,才能對開發(fā)流程了如指掌。

但是,有能力處理200萬字的AI,情況完全不同,它能迅速吸收、分析海量編程資料、教程和代碼,很快掌握各種編程知識和技巧,還能針對具體問題提出更好的解決方案,這種學習和應用速度,對我們人類來說是難以想象的。

我試著把將要出版的第三本書的素材交給它,讓它幫我重新理一下思路,沒想到表現(xiàn)出乎意料,迅速分析并給出結構。

可能有些人用過之后就沒再繼續(xù)深究,但我覺得,這種能處理大量文字的技術,對于這些互聯(lián)網(wǎng)上班的人來說,工作方式又面臨一次變革。

為什么?AI 對我們的影響,有三種級別:

一,影響很低,可以不當回事;二,威脅到一部分腦力工作者的職位;三,徹底改變,甚至讓很多工作消失,

如果到達第三階段,你會怎么辦?

有人會拿蒸汽機初期的故事來比喻,記得當時紡織工人因為害怕失業(yè)而砸毀機器。但是,隨著技術廣泛應用,他們最終還是面臨著被淘汰的局面。

在我看來,之前機器主要取代體力勞動,讓人們轉向腦力工作。AI出現(xiàn)情況就不一樣了,它正在把我們從腦力工作中擠出去。

04

那問題來了,AI是不是要我們回到體力勞動呢?

我覺得并非如此。

AI學得快,處理信息也厲害,但有些事情還搞不定。比如:AI能查法律條文、分析案子,但它不能在法律上幫你辯護。

在美國,律師們已經(jīng)說了,如果AI想上法庭那就違法了,這些限制并非AI做不到,而是,人類給AI設定了一些規(guī)矩。

為什么要設定規(guī)矩呢?因為責任問題、傳統(tǒng)慣例、或出于倫理考慮。至少一段時間內,AI進入不了這些領域,但只是暫時的。就拿律師助理來說,如果AI做的比人好,那助理遲早被淘汰。

這就像大規(guī)模生產導致的產能過剩。所以,我們接下來要競爭的,是那些看不見摸不著的東西。

什么是看不見的呢?

第一點:隱性知識(Tacit Knowledge)。AI只能作為紙上談兵的咨詢師,它可以告訴你香蕉多好吃,它卻沒吃過香蕉,喬布斯在1992年演講時,這樣形容過某些咨詢公司。

所以可以肯定,AI當中也存在看不見的知識。你只有不斷總結個人經(jīng)驗,才能獲得一些競爭性優(yōu)勢,至于這種優(yōu)勢有沒有價值,就另當別論了。

時不時,我就碰上一些網(wǎng)友反復問的那些老問題。

比如:現(xiàn)在自媒體還能不能做?還有沒有前途?其實,這問題和寫作的根本道理挺像,大家都在寫東西,有的人甚至用AI幫忙寫。

每個人的內容,都有自己的風格,有的文章像紙上談兵,一看就不再看了;但有些內容一看就知道作者親身實踐出來,這種東西AI模仿不來;所以,雖然AI也有它自己的知識體系,但對我們來說,也有看不見的東西。

因此,隱性知識(Tacit Knowledge)是競爭力之一。

第二點:學會提出好問題和保持懷疑的能力。

提問有啥難的?確實,用5W2H、黃金圈法則這樣的技巧提問,看起來能得到你想要的答案。AI也能進行因果分析。

但你知道嗎?AI獲取信息的方式不是直接體驗,它提供給你的答案是根據(jù)數(shù)據(jù)模擬出來的,建立在統(tǒng)計學之上。

比方說,你打算在某個地方開家咖啡館,讓AI幫你分析那里的人流、消費水平、競爭對手數(shù)量,還有營銷策略。AI給出了答案,你真的敢信嗎?

它沒有親自去過,只是通過數(shù)據(jù)推算出來的。所以,反提問、質疑能力未來會成為一個人的基本功。

第三點:你可能要占領一定高地。

什么是高地?與別人拉開距離遙不可及的東西。影響力算,作品也算,優(yōu)勢也算。

要建立優(yōu)勢,得思考怎么做出與眾不同的事,找到獨特位置。這個過程需要時間,也要不斷的嘗試和實踐。

當你和別人做同樣的事時,再怎么努力也只是在維護系統(tǒng)中權力者地位,而自己想要獲得更多掌控力的可能性,卻在減小。

我觀察到,有些朋友糾結于原地,是因為他們從未考慮過在哪些方面構建起「可以持續(xù)積累的優(yōu)勢」。

真正好的機會往往不會有太多人和你爭,因為大多數(shù)人沒辦法堅持超過五年,這類機會,在短期內看起來平平無奇,不怎么樣,不能立刻給你積極的反饋。

而且,超過5年以上的機會,參與者安全感是匱乏的,他們在沒有信心時,總愿意問別人怎么看來獲取信心,其實,時間上能跨越五年以上的機會是靠心力積累出來的。

因此,如果你還沒找到自己的優(yōu)勢所在,不妨思考下,如何構建起「結構性優(yōu)勢」和「可以持續(xù)積累」的能力。

隱性知識(Tacit Knowledge)、學會提出好問題和保持懷疑的能力,以及結構性不斷累積的影響力,我想,是AI不可替代的稀缺能力。

總結而言:

陽光明媚時修屋頂。

想辦法把經(jīng)歷的事情,工作的思考沉淀下來,去挖掘它們和人生的關系,讓AI幫你優(yōu)化,你得到的數(shù)字資產,會比別人更具壁壘性。

對于線上從業(yè)者,未來要靠影響力和專業(yè)實力吃飯了。

專欄作家

王智遠,公眾號:王智遠,暢銷書《復利思維》作者,人人都是產品經(jīng)理專欄作家。互聯(lián)網(wǎng)學者,左手科技互聯(lián)網(wǎng),右手個體認知成長。

本文原創(chuàng)發(fā)布于人人都是產品經(jīng)理。未經(jīng)作者許可,禁止轉載。

題圖來自Unsplash,基于CC0協(xié)議。

該文觀點僅代表作者本人,人人都是產品經(jīng)理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 請問下書的英文全稱是啥?

    “就拿國外很火,但國內還沒上的《AI產品經(jīng)理》一書來說”

    來自江蘇 回復