KIMI視覺思考模型到底強不強?公開3輪真實體驗和分析

0 評論 922 瀏覽 0 收藏 8 分鐘

在人工智能技術的不斷進步中,Kimi的視覺思考模型K1以其獨特的能力吸引了眾多關注。本文將帶您深入了解K1模型的實際體驗,通過三輪真實的測試視頻和細致的分析,我們將探索K1在解決復雜問題、解讀圖表和識別圖片內容等方面的強大功能。

Kimi的視覺思考模型 K1已經發布有幾天了,有很多的測評和贊美。到底強不強,需要自己去體驗一下才行。

今天就體驗和測評一下Kimi的這款新能力。

一、入口

進入KimiPC官網,在首頁 – 搜索框下,有一個快捷入口。

【Kimi k1 視覺思考模型搶先體驗】

二、對話體驗界面

中間是對話區域和3個提示問題,如下;

  1. 接下來我會發你截圖,幫我解答圖中的題目好嗎?
  2. 接下來我會發你一張復雜圖表,請你幫我逐步解讀?
  3. 接下來我會發你食物照片,收到后幫我逐步計算卡路里?

看似默認的預設問題,分別暗示了Kimi的K1思考模型的3個能力層面。

  1. 解答數學題,很難很難的那種。
  2. 解讀復雜的圖表,類似于財報,包含了柱狀圖、餅圖、曲線圖、還有表格等各種復雜內容、數字、符號的圖表文檔等。
  3. 圖片實體內容識別,并解讀實體背后的核心邏輯,展現驚人的圖片識別和分析能力。

三、Kimi+的名片體驗

還有右邊的Kimi+的名片,作為產品經理,也是要好好研究一下的,值得玩味。

Kimi 視覺思考版

每個像素,都值得深入思考。基于 k1 視覺思考模型 | 來自 Kimi

文檔解讀很強大。

支持的文件格式:PDF、Word 文檔(DOC、DOCX)、Excel 表格(XLSX)、PPT(PPT、PPTX)、TXT、CSV、MD。

四、測試素材準備

為了順利測試Kimi的這幾個方面的能力,我準備了3張不同的圖片,如下:

第一張:超高難度奧數題

第二張:電動汽車充電市場展望分析圖

第三張:用AI生成的一盤實物圖片

五、Kimi視覺思考模型解奧數題

體驗過程,我已經把體驗的過程錄制成了視頻,請觀看,可獲得更直觀的感受。

體驗過程中的幾點感受:

優點:

  1. 預設好的問題,埋好了prompt,上傳并發送相關圖片,即可得到想要的答復,體驗很好。
  2. 響應速度很快,很好,基本不用等待。
  3. 輸出的過程非常詳細,這道題很難,我幾乎是看不懂,Kimi思考了完整的詳細的過程,并連續輸出了4分鐘,1共59行推理過程,包含文字、數字、和公式。

如果哪位數學大牛懂這道題,可以詳細看看Kimi的解答過程是否合理。從多個其他大模型做這道題的過程借結果來看,我感覺Kimi的功底還是挺深的。

缺點:

1、不管是PC端還是APP端,都存在前端公式渲染效果的問題,如下圖:

六、Kimi視覺思考模型解讀圖表

體驗過程:

數據錯誤:

ABB:從6.6下降到0.9,下降幅度非常顯著。

結論也稍有問題:

這一部分的下降幅度更為顯著,尤其是ABB,其市銷率從6.6驟降至0.9。這可能表明這些公司在盈利能力和市場預期方面面臨更大的挑戰。

七、Kimi視覺思考模型計算圖中食物卡路里

體驗過程,我已經把體驗的過程錄制成了視頻,請觀看,可獲得更直觀的感受。

Kimi的回答,第一步:

識別圖片中的食物,按照主次、大小的一般邏輯描述圖中的食物。

第二步:按照識別到的食物,逐一計算卡路里。

計算方式:

1、設定食物類型

2、該種食物單位熱量計算

3、估算圖中該種食物的分量

4、計算圖中該種食物的熱量值

第三步:所有食物熱量相加,得出總熱量值

第四步:自我反思,重新評估,反復確認

以上就是體驗的基本情況。

當然還有更多場景沒有覆蓋,有興趣的伙伴也可以自己去試試。

還可以給一些潦草的筆記,讓Kimi識別后進行思考輸出,很有意思。

利用這幾點能力,可以幫解決工作和生活中的一些問題。

本文由人人都是產品經理作者【Echo 產品論】,微信公眾號:【產品經理的邏輯與審美】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。

題圖來自Kimi官網截圖

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!