生產力工具大比拼!能打的海螺AI也該出來好好亮相了!
現在市面上的大模型產品有很多,那么,這些產品的表現如何?這篇文章里,作者就基于重度使用的基礎上,對海螺AI這款多模態產品做了能力拆解和橫向評測,一起來看看它的表現如何吧。
最近由于某個智能助手產品經常性的提示“太忙了”,對于我這樣重度依賴AI的用戶就很惱火!于是尋找其他的替代品,別說,真的讓我找到一個很好用的智能伙伴,支持200k超長上下文+萬億參數MOE大模型的產品:海螺AI。
重度使用后,發現真香啊,于是很感興趣,仔細的研究了一番,這篇文章,我們從幾個要點來詳細剖析下這款實力大于名氣的智能伙伴。
- 產品介紹
- 能力剖析
- 雙輪驅動
- 未來期望
Take Away:
- 長文總結、AI搜索、語音對話、知識庫等方面提供全面的智能伙伴解決方案
- MiniMax公司的雙輪驅動策略
- 用戶體驗優化和用戶價值傳遞的重要性
一、產品介紹
智能搜索,文件速讀,語音通話,文案神器,拍照答疑 嗨!我是小海螺,你的AI智能伙伴,幫助你學習工作效率加倍!
以上是海螺AI在應用市場里的介紹,可以看出,這是一個多模態產品,能在這幾個場景提供AI能力:
- AI搜索
- 長文章/文件的摘要總結閱讀
- 實時的語音交流
- 多種文案的撰寫
- 圖片識別/分析
打開App,首頁比較清爽,重點突出了幾大能力,同時也有很多Bot在發現頁面里提供快速使用:
海螺AI首頁相當簡潔,用戶能夠很快的找到所需功能,把各類Bot做了收起,大幅降低了用戶決策成本。
這和其他同類App存在顯著差異,從生產力工具的定位來說,首頁界面海螺更加明晰:
(豆包、文心一言、智譜清言、Kimi)
這幾家對于第一次打開的用戶并不是很友好,沒有明確的幫助用戶確定使用心智。真心建議其他幾家學習一下。
使用后,我發現海螺AI的若干個能力超出預期,下面我們逐個來展開聊聊:
二、能力剖析
第一,長文總結
我們先拿海螺AI和Kimi號稱最強的長文本總結做一個對比,這也是我常用的一個AI能力。
首先,使用一樣的Prompt,這是我多次調整后的基于Kimi整理的文章總結Prompt,理論上Kimi會更加適應:
我希望你總結與閱讀的內容是:https://mp.weixin.qq.com/s/R9-3Drlt1foX3M7Wx-JOYQ
請按照下面的邏輯去分析:
你是一個公眾號文章閱讀助手,用于幫助我總結文章并進行必要的思考,當我給你發送一段內容或一個鏈接時,你總是:
- 用200字簡要闡述文章內容
- 提煉文章多個重要的觀點;同時對于每個觀點,你需要理解作者是用哪些事實與邏輯推演形成這些觀點的,進行簡要總結。
- 提煉文章最關鍵的數據(如有)
- 描述清楚文章的推理邏輯鏈條,并對每一步做批判性分析,看是否存在漏洞。
對應的鏈接文章是Super對于星野App的萬字長文分析,所以我很理解里面的核心觀點,看看兩者的對比:
首先在格式上,右側的Kimi有更清晰的縮進,但也導致了可閱讀區域過窄,在App里閱讀上有一定影響,因為我更希望能夠快速掃描,獲得最關鍵的文章洞察,用于幫助我篩選是否值得花時間仔細閱讀長文,所以盡可能的在更少滑動的內容范圍內能快速完成閱讀。
其次在內容的提煉上,兩者整體差不多,不過海螺AI抓住了一個非常重要的關鍵點:
作者認為,星野的商業收入不是北極星指標,而是通過用戶量和數據來驅動大模型的優化和公司的發展。
這一點Kimi漏掉了,但又是極其重要的一個觀點。
另外,這一段Prompt里面很重要的是,獲得AI對原文的批判性分析,這有助于我快速理解文章是否可能會存在一些結論上的約束條件!再來個截圖對比:
主觀判斷來看,海螺AI抓到了一個比較好的批判點:用戶洞察是否足夠充分?這會幫助我在閱讀文章時,著重關注結論是否有足夠的用戶觀察來獲得。
而Kimi認為原文忽略了兩種產品的用戶體驗差異其實是錯誤的,原文內有明確的對于兩類產品帶給用戶體驗的差異性表達:
這是海螺AI帶給我的驚喜,因為Kimi一直以長文本自豪,但在萬字長文的總結里,海螺AI不光沒有落后,反而有超越!很讓人驚喜!
第二,論文閱讀
最近我也寫了一篇產品經理是否需要刷論文的文章,盡管結論是不需要刷那么多,刷到人焦慮,但適當的進行一些閱讀是有必要的,特別是一些有突破性潛力的論文。
我使用的閱讀論文Prompt如下:
論文解析,我希望你總結與閱讀的論文鏈接:https://arxiv.org/pdf/1706.03762
請按照下面的邏輯去分析:
你是一個AI資深的技術專家,擅長于解讀論文,然后用通俗易懂的語言描述,用于幫助我論文閱讀并進行必要的思考,當我給你發送一段內容或一個鏈接時,你按照下面的步驟逐步執行:
第一步,用200字描述這篇論文的核心亮點
第二步,描述這篇論文在解決什么問題?
第三步,為解決這個問題,還有哪些相關研究?
第四步,論文如何解決這個問題?(實施步驟、操作細節等)
第五步,論文做了哪些實驗?(尤其是消融實驗)
第六步,論文的主要結論。(尤其是具有建設性、非共識觀點)
第七步,有哪些問題值得進一步探索?
對應的論文鏈接是Transformer,那我們繼續來做個對比:
再看看結尾部分:
我們會發現海螺AI和Kimi在總結方面基本相同,都是模型的可解釋性、長序列處理能力、資源消耗等,只不過描述的角度略有不同。打個平手。
文心一言很莫名奇妙的總結了其他論文,害得我又重新回去檢查了一遍,確實是完全一樣的論文地址,并且要求核心亮點200字,也只輸出了不到100字,太偷懶了。
智譜清言在這個case中未能打開對應的論文頁面,嘗試了兩次都是如此。
第三,AI搜索
AI搜索是一個Super認為非常有前途的細分應用,對于用戶來說,很有可能使用后就不愿意再用傳統的搜索引擎了,在這個方向上,海螺AI和Kimi都做了一些優化。
我們直接看效果:
比如我查特斯拉最新的財報,海螺給出了最新的2024年Q1財報,kimi給的是2023年的財報,同時我點開了kimi參考的資料,居然沒有找到一篇最新的財報數據。。。
下一個case:“查一下上海稀宇公司的高管團隊”,這個case稍微有點意思,因為這是MiniMax的公司名稱,全稱是:“上海稀宇科技有限公司”,kimi給出的答案幾乎是不可用的,同時我發現盡管搜索源里面包括了企查查、愛企查等鏈接,手動打開后是可以查到具體高管的信息,不知為何Kimi并沒有在結果上呈現:
我們換一個,月之暗面:
這一個case里,月之暗面的介紹更加清晰一些,海螺AI簡潔清晰,信息也給的很全面。
好,我們再來個第三方公司來看看,智譜:
對比下來,我們會發現,Kimi嘗試提供更豐滿的內容,但問題也很大:結構化要弱,搜集的信息全面性要少,會漏信息。
海螺AI更全面,結構也很清晰,附帶了對應的引用來源,方便用戶追溯,除此之外,也會在答案后面保留三個追問,如果感興趣可以繼續獲得更多信息,對比下來還是海螺AI更好。
對于AI搜索,個人認為有三點非常重要的:快、準、全。
首先是不能搜索了很久還沒給出答案,那用戶都跑了,這一點兩家速度都還不錯。
其次是準確性,或者給出錯誤的信息,這會損害用戶價值,在這一點上,我發現Kimi有些Case里會丟信息,在對于200k長下文為宣傳特色的大模型來說,實屬不該。
最后是全面性,信息整合應該是全面沒有遺漏的,包括可以通過追問來進一步幫助用戶補全信息,海螺AI顯示的三個追問問題做的不錯。
第四,極強的語音對話
ChatBot類產品,很少有實時通話功能,其實我們細想一下,人們從出生下來,最習慣和最直接的溝通方式就是語音對話,在語音對話場景下,信息的交互非常的高效,特別是AI音色擬人度高的情況下,甚至會讓用戶愛上使用AI產品。
眾所周知,MiniMax的語音是國內最強,眾多情感陪伴類產品都是接入它家的語音大模型,我有朋友之前做的產品接入語音后用戶的付費意愿和使用量頓時就上了一個臺階,很強。海螺AI直接把這個功能開放出來,還是挺出乎我意料的!
對,海螺AI在主界面上就有通話鍵,點擊后直接進入實時語音對話界面,同時可以選擇32種不同的聲音(驚呆了,這么多選擇?。?/p>
從產品設計上就能看出和競品的對比,大家可以聽一下聲音對比,我的開場白都是“晚上好啊,今天晚上我很開心跟你聊天?!保?/p>
海螺AI的音色很穩定,柔和,豆包兩段語音中間過渡的比較突兀。
另外海螺AI在對話界面還支持倍速調整,還支持更換音色,這是豆包無法支持的能力。
實際體驗下來,包括音色、語氣、停頓、情緒,很多方面海螺AI接入的語音效果是更加的逼真,這就帶來了更強的沉浸感和體驗感。
更絕的是,還能克隆自己的聲音,整個過程也就1分鐘,但是能實現70%的還原度,效果不錯:
克隆的聲音除了自己用,還可以分享給家人。
咦,那豈不是可以通過創建智能體+聲音克隆,很低成本的實現親人的“復活”了么?
前段時間還有文章去寫AI復活產業鏈的文章,標題類似:《AI“復活”逝者成流水線生意,收費從百元到萬元》,所以,海螺AI免費就可以實現了。。。
第五,拍照識圖
拍照識圖有兩個場景比較確切。
第一個場景是朋友圈圖片配文案,海螺AI默認就有引導用戶使用這一能力,我嘗試了一下,可用:
第二個場景是表格類解析,我上傳了一個自己的公眾號閱讀量表格,發給了5個生產力工具產品,進行數據提取,效果對比如下:
(從左到右,海螺AI、Kimi、文心一言、智譜清言、通義千問)
Kimi提示不支持JPG格式上傳,文心一言說看不懂,智譜清言整體是對的,但最后一行出現了幻覺,通義千問完成了任務,但使用了Markdown格式,閱讀起來很不方便。這個case里還是海螺AI最符合我的需求。
第六,知識庫
知識庫是一個很有潛力的場景,有幾類用戶會有很強的需求:
- 企業知識管理類
- 研究人員&老師&學生
- 專業人士(醫生&律師&咨詢顧問)
- 內容創作者
- 知識工作者
對于海量信息,知識庫結合AI,就可以做到快速檢索,信息組織等等工作。
比如Super自己一直想有一個獨屬于自己的知識庫,把一本書上傳上去,然后可以不斷地通過和AI交流來更好的理解。
經過測試,目前海螺AI、Kimi、智譜清言支持,其中海螺AI和智譜清言可以創建獨立的智能體,Kimi只能單獨上傳文件,然后通過歷史對話找回,或者重新上傳。
我把一本自己讀了4遍的書籍《10x is easier than 2x》中文精修版上傳給了三家,然后提兩個問題,看看對比效果:
第一個問題:書中need和want的區別是什么?
(從左到右:海螺AI、智譜清言、Kimi)
海螺AI會詳細地先解釋Need和Want各自的一些含義,最后再做一個區別總結。智譜清言會做很簡單的總結。Kimi選擇了多個維度來進行對比。
第二個問題:10x的思路對于哪一類人更有效?
海螺AI直接給出了具體的人群畫像,并且解釋為何適合;
智譜清言從原因出發,也是一種合理的解釋方式;
Kimi。。。又開始忙了-,-
小結
這一章節,Super從長文總結、AI搜索、語音對話、拍照識圖、知識庫幾個自己常用的方面,和其他一些競品做了少樣本量的橫向對比,可以發現,海螺AI不僅僅是一個簡單的工具,它通過精準的長文總結、深入的論文解析、高效的AI搜索、自然的語音對話、準確的拍照識圖以及強大的知識庫管理,為用戶提供了一個全面的智能伙伴解決方案:
- 研究人員:快速總結和分析長篇學術論文或研究報告;
- 老師&學生:知識庫管理功能可以協助他們組織和檢索課程材料,提高學習和教學效率;
- 內容創作者:AI搜索快速整合關鍵信息,并生成爆款文章;
- 日常用戶:AI搜索和語音對話功能可以提供生活中的即時幫助;
- 知識工作者:知識庫管理功能可以幫助整理和回顧學習資料
簡單來說:海螺AI很像一個六邊形戰士,每一邊和競品對比,都很能打!
為何這么強呢?我又去研究了一下產品背后的公司和團隊:MiniMax、閆俊杰。
三、大模型技術和C端應用雙輪驅動的MiniMax
4月17日,晚點LatePost發了一篇文章,標題是:《對話 MiniMax 閆俊杰:AGI 不是大殺器,是普通人每天用的產品》
有幾個亮點:
- MiniMax公司估值25億美元,是國內大模型第一梯隊的獨角獸;
- ChatGPT還沒發布,閆俊杰最早提出AGI,領先所有其他大模型獨角獸公司;
- 是AI獨角獸中目前對2c產品投入最早最大的公司,有多個突破100萬日活的應用;
- 國內最早推出MoE大模型,并且是萬億參數。
Super過去寫過多篇情感陪伴類的產品分析文章,其中星野是國內眾多產品模仿的對象,這款App就是MiniMax家的產品,我們看一下這篇文章里值得理解的幾個要點:
《晚點》:MiniMax 是國內第一個說 AI 2C 的公司,為什么?
閆俊杰:…我一直不認為 AGI 會像一個原子彈、一個大殺器,它就是普通人每天會用的一個產品、一個服務——這也是我們最堅持的。
而且 AGI 也不應該是一家公司自己做出來,它要靠這家公司和它的用戶一起做出來。
《晚點》:那你們為什么不干脆只專注做產品?現在有很多開源大模型。
閆俊杰:核心原因在于,對模型的理解基本上等同于對產品的理解。產品越往下做,對模型理解肯定要越深。
另一個客觀原因是成本和響應時間,如果沒有對模型的強掌控力,就很難掌握產品成本的變化,也無法調教對用戶的響應時間。而且做產品你會遇到很多問題,什么問題可以解決?什么不能解決?怎么迭代?這些都需要你對技術的掌握。
《晚點》:技術重要,產品也重要,你們糾結過到底哪個更重要嗎?
閆俊杰:…現階段產品價值的來源,核心還是你的模型性能和算法能力。
這樣的事我們經歷了好幾次,你可以做很多產品 feature,但你會發現,幾乎所有大的提升都來自模型本身的進步。
從以上三個點來看,我們會發現閆俊杰和MiniMax對于大模型能力的堅持追求,在技術突進式進化的過程中,特別是“模型即產品”的產品類型里,產品的飛躍靠的還是底層的大模型能力。
另外一個層面,用戶在“模型即產品”里會共創出很多的user case,幫助公司找到更實用的場景,用數據飛輪驅動模型在場景上面能力的提高,從而邁向AGI:
跑出了情感陪伴類產品目前的天花板:
《晚點》:MiniMax 產品的日活已接近 Character.AI(美國 AI 獨角獸開發的一個可以和各種 AI 角色聊天、互動的應用),使用時長甚至更長。
海螺AI也是MiniMax的排頭兵,通過接入MiniMax最新的萬億參數MoE大模型abab6.5系列,支持200k tokens的上下文長度,來直接響應用戶的需求。
通過上一節的對比分析,我們能看出海螺AI很能打,后面更多等著用戶不斷地創造新的場景和數據,來指引MiniMax在大模型能力層面的迭代。
四、未來期望
沿著雙輪驅動的思路,我們也會發現,海螺AI是一個六邊形戰士,但super認為,這里有幾個產品策略是海螺AI可以進一步優化的::
第一,用戶體驗的優化
首先是作為AI智能伙伴,有沒有可能更深入的基于我的偏好,在整體AI輸出層面來提供更好的服務呢?
1)個性化文本風格
海螺AI可以提供定制化的文本風格選項,允許用戶根據自己的喜好選擇不同的表達方式。例如,用戶可以選擇更喜歡邏輯性強、條理清晰的風格,或者偏好直白、通俗易懂的語言。
2)智能預設Prompt
設計一套智能預設系統,根據用戶的過往互動和選擇,自動生成或調整Prompt,以更好地滿足用戶在長文本摘要、論文關注點等方面的需求。
當前海螺AI在移動端整體的體驗偏簡潔,這些能力可以很快地加上來增加用戶的體驗。
第二,用戶價值的傳遞
作為AI產品經理,我們深知技術術語如“萬億參數的MoE”對于專業人士的意義,但普通用戶可能并不熟悉這些概念。因此,我們需要將技術優勢轉化為用戶能夠直觀感受和理解的價值點。
首先,我們需要簡化和明確產品介紹的語言。
例如,將“智能搜索”改為“即時答案,一問即得”,這樣的表述更加直接和易于理解。對于“語音通話”,我們可以解釋為“語音對話,如同真人”,這樣用戶就能快速把握其核心功能。
接下來,我們可以進一步細分用戶群體,并針對不同群體,提煉出明確的價值點。例如:
- 對于學生和研究人員,強調海螺AI在學術資料搜索和論文閱讀上的能力,可以表述為“學術伙伴,深入洞察,助力研究”。
- 對于職場人士,突出其在提高工作效率和文案創作上的優勢,可以描述為“文案伙伴,創意無限,效率倍增”。
- 對于普通用戶,可以強調其便捷性和易用性,比如“生活伙伴,一問即答,生活無憂”。
此外,我們還可以通過以下方式來加強用戶價值的傳遞:
- 故事講述:使用真實用戶的故事來展示海螺AI如何在不同場景下幫助用戶解決問題。例如,一個學生如何利用海螺AI快速完成論文資料的搜集和整理,或者一個職場人士如何通過海螺AI提高工作效率。
- 社區參與:建立用戶社區,鼓勵用戶分享使用經驗,形成口碑傳播。比如創建一個官方論壇或社交媒體群組,作為用戶交流和討論海螺AI的官方平臺。提供一個場所,讓用戶可以分享經驗、提出建議或互相幫助。以及在創建自己的社交媒體,傳播一些用戶參與的User Case。
通過這些方法,海螺AI不僅能夠更好地傳遞其用戶價值,還能建立起一個活躍的、忠誠的用戶社區,這對于品牌的長期發展至關重要。
包括,現在AI產品同質化很嚴重,怎樣在這種競爭形式中盡可能大地做出差異化,打開更多市場需求和用戶增長空間?
總結
這篇文章是Super在重度使用海螺AI后,沿著生產力工具/智能伙伴定位去對它做的能力拆解和橫向評測。
整體使用下來,發現海螺AI依靠著極強的模型能力,結合不錯的產品設計,在這個市場方向上絕對是Top級的水準。
我們也結合MiniMax這家公司對于AI的理解一并做了解析,會發現他們家確實是非常的低調和努力,成立兩年多以來,創始人只接受了這么一次訪談,之前我請教閆俊杰,他也一直說在閉關,沖刺技術。
努力帶來回報,包括我很熟的AI產品朋友,評估下來都認為abab6.5模型是國內最強的大模型之一,體現在海螺AI上,也就帶來了最優秀的體驗。
很期待海螺AI不斷的進化,帶給我們更多驚喜!
參考
對話 MiniMax 閆俊杰:AGI 不是大殺器,是普通人每天用的產品
專欄作家
Super黃,微信公眾號:Super黃的念想,人人都是產品經理專欄作家。專注于深度產品拆解+商業分析。
本文原創發布于人人都是產品經理。未經許可,禁止轉載
題圖來自Unsplash,基于CC0協議。
該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發揮!