估值20億的kimi-Chat真香
估值20億的kimi-Chat是什么,它的出現又會帶來什么影響呢?大家一起接著往下看,下邊筆者整理分享的關于kimi-Chat的相關內容,或許會收獲更多內容哦!
我每天都寫文章,并不稀奇。
然而,當涉及商業分析、數據處理相關問題時,不能馬虎處理;這些情況下,必須深入調查。 搜集公開網絡上的分析和財務報告,是一項艱巨的挑戰。
為什么?
準確性至關重要。 如果信源不準,會直接導致分析結論偏差。想必前段時間某大V翻車的事件,給大家諸多啟發。
避免信息過時。 今天的新聞,明天可能就過時了。所以,不停地搜索最新信息、數據,能確保分析、決策不會基于過時的情況發生。
真正了解市場。 光看數據還不夠,市場比較復雜,得深入挖掘才能看到有哪些潛在風險,這也能找到隱藏的不同角度。
所以,我最頭疼的一件事是 看報告、看財報、看數據。
怎么辦?我打算讓AI幫我處理,也遇到一些挑戰。在國內,很難找到有效閱讀PDF和其他文檔格式的高效AI大模型。
于是,我轉向ChatGPT-4。
用近四個月,最大問題是經常遇到長度限制,較大文檔你得切兩半才能上傳,要么,上傳文檔后解析結果不盡人意,這些問題非常困擾,比直接閱讀報告還頭疼。
直到前段時間遇到Kimi-chat,極大減輕了我的分析負擔,仿佛找到一個能理解復雜報告的助手。
一、Kimi-chat是什么呢?
如此卡哇伊的名字,這個答案隱藏在它的口號中: 別焦慮,Kimi幫你整理資料,文件,拖進來;網址,發出來。 一看就是一個有效整理、處理資料的工具;網址是: https://kimi.moonshot.cn。
打開網址,非常簡潔,對話框呈現在眼前,人工智能小人告訴你,可以把網址、文件發給它,可以幫你看看,既然是這樣,我們就一個一個測。
1. 讀文件
根據Kimi-chat官方宣傳,它最多支持20W字上下文輸入,也就是說,我把一篇PDF小說、書籍塞進去都沒問題。
我就試了一下,把自己2021年寫的《復利思維》.PDF塞給它,完全沒問題,這本書共計12萬字。
然而,當我嘗試輸入《信息論40講》時,系統提示我超過了對話長度的175%;而《被討厭的勇氣》這本書,則超出20%。
我輪番測試,把我第二本即將要出的書14萬字world塞給它,它顯示超出36%。 14萬字的百分之36%大約是5萬字; 換句話說,它支持一口氣10萬字以內的內容處理。
為繞過字符限制,我換了方法。
將一份10萬字的文檔分成兩半,分別輸入到Kimi-chat中,結果顯示系統能夠無障礙處理。但是,我注意到處理PDF文檔有個要求:掃描件不行。
我還發了兩篇大約3萬字的文檔給它,也沒問題。
比較驚訝的是,它能夠根據之前我發給它的信息來回答我的問題;也就是說, 不管我問什么,只要在這個對話框里說過,它都能記住,回答得更準確、更有條理。
這個功能對我來說特別有用,尤其是處理長篇大論的時候。
我還測試了表格總結能力,給它多個表格,讓它把重點羅列出來。 它能清楚地按邏輯順序歸納,還能基于提煉的內容,再做成表格,復制到Word、Markdown里都能用。
為了方便,我還讓它幫我基于PDF、Word資料提出50個問題,并把問題做成表格。這也都沒難倒它,真是挺強大的。
話說回來,即使是付費版的GPT-4,它處理上下文時的token數量上限也只是32K。
雖然根據我自己的測試,似乎只能處理大約10萬字。不過,實際上10萬字的處理能力,對于大多數情況來說,也已經足夠了。
2. 讀網頁
我先試了Kimi Chat給的一個示例,就是總結一篇大概3.6萬字的文章,并讓它像個AI專家似得提出三個問題。 Kimi Chat給我找了一篇關于人工智能的文獻,10幾秒分析完,速度挺快。
我分別將虎嗅、36氪、百度、豆瓣等多個網站的鏈接發送給Kimi Chat。它不僅能夠讀取這些鏈接中的內容,還能夠概括出各篇文章主旨,當我需要更深入的細節時,它也能提供。
比如:
我問它,某個文章第一段主要講啥?核心觀點是什么?
它能快速給我總結出來。這樣我就不用自己費勁去翻找了,直接知道文章的要點。特別是我有一堆東西要看的時候,這個功能真的挺省事。
我對Kimi Chat進行了連貫性測試。
先把三篇講差不多東西的文章的鏈接,扔到同一個聊天窗口里,一塊兒發過去,然后問它一些問題。它回答得挺好的,一點兒都不亂。
后來我又換了個招,發三篇完全不同主題的文章,還來自不同網站,結果它照樣能處理得挺順利。
總之,在處理文件和網頁內容方面, Kimi Chat的一個大優點是能上傳多種類型、來自不同網站的內容。 它甚至可以將您的問題和答案整理成表格,方便查看和理解,分析能力很強。
但也有些局限。
比如,它不支持在一個對話框里同時上傳網頁和文件。 而且,盡管官方宣稱它能一次性處理20萬字,實際上我發現它并沒有達到這個標準,也可能是我人工測試的不精準。
說實在,就讀網頁、讀文檔方面,這些功能足夠使用了。
3. 文本搜索
文本搜索,對一個內容創作者,最重要的能力是什么? 答案是準確性、相關性。
舉個例子:
最近各家都在頻繁出Q3財報,財經類作者需要迅速獲取這些財報的詳細信息,來進行分析; 這種情況下,他們可能會用關鍵詞,如“網易2023Q3財報”進行搜索。
搜索出來后,基于財報簡要、主要財務指標、市場分析的評論、以及其他媒體的報道,然后結合自己的觀點提出不同角度。
那么,大家常規怎么操作的呢?
基于某度、某乎、某氪、或者微信搜索進行搜索,這非常麻煩。我把這個問題,交給了Kimi Chat。
它直接給我事實搜索出,2023年11月16日網易發布的第三季財報內容,并且指出該季度增長如何、業績如何;毛利多少、實現毛利潤多少。
…..
為了更深入了解網易。我讓它給出(資產負債表狀況)公司的資產、負債和股東權益的狀態如何?是否顯示出財務健康和穩定性?
它迅速給我找出5篇資料。
但由于分析過程比較復雜,它沒辦法直接給出結論,最后,它建議我關注流動比率、負債占資產比率、凈資產收益率。
我問它你能幫我找到嗎?
它無法直接找到三個問題同樣的內容,但為我提供了關于負債占資產比率的5篇文章。后來,我把5篇鏈接復制下來給它,讓它分析,它也無法給出占資產比率。
也就是說,
第一,這個工具能提供實時搜索,但它的功能有限。
比如,如果您需要了解占資產比率,但這個信息沒有直接提及在內容中,工具就不能自動計算、提供數據。它不能基于財報進行額外的計算。
第二,聯網搜索和文檔(鏈接)分析是分開的。
如果你已經向它發送任何鏈接、文檔,那么,它就無法再幫您搜索網絡上的內容,不過,要是開啟一個新的對話,它就可以再次聯網搜索;
其三,未聯網下,它的知識庫訓練截止到2021年11月,和ChatGPT-4時間相似。
4. 找資料
文本搜索,就像在網上快速找東西,輸入你想知道的關鍵詞,然后它會給你一堆信息; 但找資料不一樣,它更像你已經知道什么,然后去挖掘背后的故事。
這個觀點誰提出的,什么時候提出。不是簡單搜搜看,更像深入地去研究背后的信息。
舉個例子:
我平時寫認知心理學的內容比較多,所以經常得翻翻誰最先提出某個概念,或者找找相關的學術研究之類的。
于是,我針對“焦慮”一詞,提出了幾個問題,讓它幫我找出來。結果挺讓我吃驚的。
它給我抓取了百度知道、頭條百科、以及學術方面的內容,并且對這些內容進行了詳細的解釋。
繼續我的實驗。
我對它引用的資料:[(1917)焦慮(《精神分析引論》第25講)提出新的問題。我想知道里面提到焦慮分為幾個部分,但它告訴我,對這個知識領域不夠了解,無法給我想要的答案。
于是,我嘗試了另一種方法。
我把它提供的鏈接復制下來,開啟了一個新的對話框,并再次提問焦慮分為哪幾個部分。這次它給了我答案,告訴我焦慮可以分為:
- 現實焦慮(Realangst)
- 神經性焦慮(Neurotischer Angst)
- 道德焦慮(與超我相關)
也就是說, 這個工具自己不能從它給你的鏈接里,再挖東西出來。 如果你想知道更多,得自己復制它給的那個鏈接,再發回去給它,這樣它才能根據這個鏈接找出你要的詳細信息,ChatGPT-4至今也無法做到。
最后,我又測試了一下它的自語言處理能力(NLP)。
什么是自語言?
簡單來說,個人在不太正式的情況下,用最自然、最習慣的方式表達的語言,這包括用方言、非常口語化的方式表達出來的想法。
它實際反應一個人的思考模式和內心狀態。
比如:
一個人面對困難時,可能會對自己說,加油,你能行;這種語言往往非常直接、真實,并且表達用詞非常個人化,有口頭禪、自創詞匯。
這種在沒有旁聽者的情況下,用來鼓勵自己的言行,就是一種自語言。
日常我和客戶訪談居多。最近,嘗試了一個新方法:
將我和一位高管的訪談對話轉錄成文字,然后交給了Kimi-chat,看看它能否理解這些內容,并生成一個剔除那些非正式或口語化表達(俗稱“口水話”)的文本。
結果,它的能力還是令我挺吃驚地。 我能完全理解采訪的實質內容,還能生成更加有邏輯、清晰的形式,這對于整理采訪記錄、提煉重點信息來說,非常有幫助。
綜合來看,我總結了它的4個優點:
- 快速享應
- 高可用性
- 不漏信息
- 學習長文本
它用來起挺方便的,不需要代理。而且給它一大堆文字也不用怕丟失,回答快,準確性高,就算你丟給它一個超大文件,也能把里面所有信息炒出來,一個不漏。
講真,國產大模型我也測試了很多,目前能做到這個地步,還算不容易;當然,評價一款軟件,首先看它好不好用,長期堅持使用一款軟件,我更關心它會不會跑路。
二、該公司背景
該公司創始人叫,楊植麟。他是一位90后的AI天才,曾是清華大學的學生,師從IEEE Fellow唐杰。
本科畢業后,他就去了自語言處理(NLP)研究全球排名第一的卡耐基基梅隆大學攻讀博士學位。攻讀期間發表關于Transformer-XL和XLNet的兩篇論文,主要給AI大模型技術提供了突破性基礎。
后來自己創立名叫“月之暗面”(MoonShot AI)公司,發布一款千億參數的大模型moonshot,用來承載Kimi Chat,至今估值20億美金。
這個公司有兩位聯合創始人,分別為周昕宇、吳育昕,他們在大模型的工程、算法開發方面都有豐富的經驗。目前公司的團隊規模超過50人,成員多來自于谷歌、Meta、亞馬遜等全球科技巨頭,是一個國際化的團隊。
我比較好奇,為什么叫月之暗面?
于是,我就去找了找原因。這個名字來源于創始人個人喜歡的一張專輯Pink Floyd的《Dark Side of the Moon》。
意思是,月球的暗面始終背對地球,處在地球人的視線外,象征神秘與未知。
公司想在人工智能領域探索這種未知,就像月球暗面一樣,充滿神秘和挑戰;因此,他將公司民命為月之暗面。
這個軟件為什么內容比較精準、且處理長文本呢?楊植麟認為市場的大模型有三種:
- 金魚型
- 蜜蜂型
- 蝌蚪型
金魚比較健忘,就像滑動手機窗口一樣,模型會基于窗口,自動把之前的內容扔掉,只關注最新輸入的東西,所以它沒法完全懂整篇文章的意思,處理不了跨好幾篇文檔的對比。
好比,我有10萬字訪談記錄,它就不一定能從里面找出來最重要的10個觀點、問題是什么。
蜜蜂型處理方式,像蜜蜂采花那樣,只關注一小塊,不管整體。它會在給的文本里搜尋、增強信息,但只專注于其中一部分。
就好比,假設你給它10份簡歷,它能幫你找出每份簡歷的重點,但就做不到更深入地挖掘每個細節。
蝌蚪型,就像是個還沒長大的小蝌蚪,能力還沒完全長成。為了讓它處理更長的文字,就得減少一些參數,比如只用百億個。
這就像是,想讓一個人走更遠的路,就讓他的背包輕一些,因為書少了,做的事情也就少了。
因此,楊植麟認為,對于‘月之暗面’這個項目來說,成功的第一步是解決‘長文本’處理的挑戰。
例如,要通過分析多篇財務報告、處理多份法律合同、或者匯總多篇文章,才能有效地找到關鍵信息。這種能力對于深入理解、處理大量復雜數據至關重要。
話說回來,長文本能力的提升,不僅讓AI工具在日常工作流中更好用,還能更好地輔助人類進行跨領域、跨學科主題發散思考。這難道不是好事嗎?
嗯,至少從我的角度來說,挺好的,你可以試試。
三、總結
AI的記憶力,越來越好了。
估值20億的kimi-Chat真香,這家年輕的公司已經展現出巨大潛在價值, 它能否像open-AI一樣,成為國內的巨頭,就看如何把握機遇,應對挑戰了。
專欄作家
王智遠,公眾號:王智遠,人人都是產品經理專欄作家。暢銷書《復利思維》作者,互聯網學者,左手科技互聯網,右手個體認知成長。
本文原創發布于人人都是產品經理。未經許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協議
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
昨天剛用了,很不錯