KIMI視覺思考模型到底強不強?公開3輪真實體驗和分析
在人工智能技術的不斷進步中,Kimi的視覺思考模型K1以其獨特的能力吸引了眾多關注。本文將帶您深入了解K1模型的實際體驗,通過三輪真實的測試視頻和細致的分析,我們將探索K1在解決復雜問題、解讀圖表和識別圖片內容等方面的強大功能。
Kimi的視覺思考模型 K1已經發布有幾天了,有很多的測評和贊美。到底強不強,需要自己去體驗一下才行。
今天就體驗和測評一下Kimi的這款新能力。
一、入口
進入KimiPC官網,在首頁 – 搜索框下,有一個快捷入口。
【Kimi k1 視覺思考模型搶先體驗】
二、對話體驗界面
中間是對話區域和3個提示問題,如下;
- 接下來我會發你截圖,幫我解答圖中的題目好嗎?
- 接下來我會發你一張復雜圖表,請你幫我逐步解讀?
- 接下來我會發你食物照片,收到后幫我逐步計算卡路里?
看似默認的預設問題,分別暗示了Kimi的K1思考模型的3個能力層面。
- 解答數學題,很難很難的那種。
- 解讀復雜的圖表,類似于財報,包含了柱狀圖、餅圖、曲線圖、還有表格等各種復雜內容、數字、符號的圖表文檔等。
- 圖片實體內容識別,并解讀實體背后的核心邏輯,展現驚人的圖片識別和分析能力。
三、Kimi+的名片體驗
還有右邊的Kimi+的名片,作為產品經理,也是要好好研究一下的,值得玩味。
Kimi 視覺思考版
每個像素,都值得深入思考。基于 k1 視覺思考模型 | 來自 Kimi
文檔解讀很強大。
支持的文件格式:PDF、Word 文檔(DOC、DOCX)、Excel 表格(XLSX)、PPT(PPT、PPTX)、TXT、CSV、MD。
四、測試素材準備
為了順利測試Kimi的這幾個方面的能力,我準備了3張不同的圖片,如下:
第一張:超高難度奧數題
第二張:電動汽車充電市場展望分析圖
第三張:用AI生成的一盤實物圖片
五、Kimi視覺思考模型解奧數題
體驗過程,我已經把體驗的過程錄制成了視頻,請觀看,可獲得更直觀的感受。
體驗過程中的幾點感受:
優點:
- 預設好的問題,埋好了prompt,上傳并發送相關圖片,即可得到想要的答復,體驗很好。
- 響應速度很快,很好,基本不用等待。
- 輸出的過程非常詳細,這道題很難,我幾乎是看不懂,Kimi思考了完整的詳細的過程,并連續輸出了4分鐘,1共59行推理過程,包含文字、數字、和公式。
如果哪位數學大牛懂這道題,可以詳細看看Kimi的解答過程是否合理。從多個其他大模型做這道題的過程借結果來看,我感覺Kimi的功底還是挺深的。
缺點:
1、不管是PC端還是APP端,都存在前端公式渲染效果的問題,如下圖:
六、Kimi視覺思考模型解讀圖表
體驗過程:
數據錯誤:
ABB:從6.6下降到0.9,下降幅度非常顯著。
結論也稍有問題:
這一部分的下降幅度更為顯著,尤其是ABB,其市銷率從6.6驟降至0.9。這可能表明這些公司在盈利能力和市場預期方面面臨更大的挑戰。
七、Kimi視覺思考模型計算圖中食物卡路里
體驗過程,我已經把體驗的過程錄制成了視頻,請觀看,可獲得更直觀的感受。
Kimi的回答,第一步:
識別圖片中的食物,按照主次、大小的一般邏輯描述圖中的食物。
第二步:按照識別到的食物,逐一計算卡路里。
計算方式:
1、設定食物類型
2、該種食物單位熱量計算
3、估算圖中該種食物的分量
4、計算圖中該種食物的熱量值
第三步:所有食物熱量相加,得出總熱量值
第四步:自我反思,重新評估,反復確認
以上就是體驗的基本情況。
當然還有更多場景沒有覆蓋,有興趣的伙伴也可以自己去試試。
還可以給一些潦草的筆記,讓Kimi識別后進行思考輸出,很有意思。
利用這幾點能力,可以幫解決工作和生活中的一些問題。
本文由人人都是產品經理作者【Echo 產品論】,微信公眾號:【產品經理的邏輯與審美】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自Kimi官網截圖
- 目前還沒評論,等你發揮!