AI瀏覽器插件,到底誰才是打工人的新質生產力(Kimi與豆包完整版體驗報告)

0 評論 2247 瀏覽 6 收藏 16 分鐘

近日,月之暗面官宣上線Kimi瀏覽器插件,官方介紹稱,該插件支持輕量搜索功能,適用于瀏覽網頁術語查詢、報道文章摘要總結、寫作靈感提供、文檔數據查詢等應用場景。插件目前功能較少,但都為大模型常用場景,包括“點文筆”和“總結器”兩項功能。那么kimi與豆包的瀏覽器插件功能上線后到底誰更勝一籌,通過這篇文章作者帶大家一探究竟。

一、插件是什么?

相較于傳統的應用開發流程,插件無需開發一整套完整系統,通過接口就能提供服務,且易于修改和更新。在某種意義上,插件是AI應用創新的最佳載體。

kimi瀏覽器插件的下載地址:https://kimi.moonshot.cn/extension/download

豆包瀏覽器插件的下載地址:https://www.doubao.com/browser-extension/landing?utm_source=web_signed

二、豆包與Kimi的特點與差異化

通過安裝教程知道豆包與Kimi的瀏覽器插件都是crx文件直接拖動至chrom即可安裝成功。

豆包與Kimi自己回答本身的插件功能如下

1. 豆包

  • 逐行翻譯:直接在原文旁查看翻譯,能夠清晰對比。
  • 快速摘要和亮點生成:可以一鍵從網頁、PDF 和圖片中總結并生成亮點。
  • AI 輔助搜索結果:使用豆包進行搜索,并利用偏好的搜索引擎生成搜索摘要。
  • 創意寫作助手:直接撰寫周報日報、朋友圈、小紅書、微博等內容。
  • 側邊欄面板:點擊豆包的浮窗菜單按鈕可打開側邊欄面板,自動根據當前頁面進行對話。
  • 頭像浮窗菜單按鈕:提供常用功能,如翻譯此網頁,可沉浸式翻譯當前網頁內容;總結此網頁,可在側邊欄總結當前網頁內容。
  • AI 劃詞工具欄:不僅集成了 AI 搜索、解釋、翻譯和復制等實用快捷工具,還允許用戶對劃詞工具欄的外觀進行個性化定制,甚至能自定義工具欄技能。用戶可進入設置頁面調整外觀樣式,也可添加新技能,每個技能本質上是一個小 Bot,在提示詞內容中支持變量 selection 表示當前劃詞的文字內容,以便更靈活地定制技能。
  • 豆包搜索摘要卡:在搜索頁面中展示搜索摘要卡,不僅能快速搜索總結,還可向豆包繼續提問,并在聊天中繼續對話,改變以往的搜索體驗。點擊“在聊天中繼續”按鈕后,會直接進入側邊欄面板繼續對話。
  • 智能語法檢查:當在網頁輸入文本出現語法錯誤時,及時提醒并提供修改建議。
  • 語音朗讀:劃詞工具欄的“翻譯”和“總結”功能支持語音朗讀。
  • 在線視頻總結和對話:支持對在線視頻進行總結和對話,例如 B 站的視頻右邊會顯示“總結視頻”的入口,總結完成后可在右側展示“總結內容”和“視頻亮點”,點擊每個亮點內容可自動定位到視頻具體位置,也可點擊總結內容底部的“在聊天中繼續”與視頻進行對話。

2. Kimi

  • 多語言對話能力:能夠流暢地進行中文和英文對話。
  • 長文本處理:支持最多20萬字的輸入和輸出,可以處理長文本寫作、翻譯、代碼編寫等任務。
  • 文件閱讀和解析:能夠閱讀和解析TXT、PDF、Word文檔、PPT幻燈片、Excel電子表格等格式的文件。
  • 網頁內容解析:當用戶發送網頁鏈接時,我會先解析網頁內容,然后結合解析內容回答用戶問題。
  • 搜索能力:結合搜索結果為用戶提供更全面的回答。
  • 角色扮演:根據用戶要求,可以進行角色扮演對話。
  • 代碼輸出:對于代碼相關問題,我會提供完整的可執行代碼。
  • 文檔和文件生成:雖然不能直接創建文件,但可以提供文字回復幫助用戶解決問題。
  • 付費打賞支持:用戶可以通過網頁端付費打賞支持Kimi。
  • Kimi+功能:允許用戶根據特定需求自定義Kimi模型。
  • 網頁和App使用引導:提供Kimi智能助手的網頁和App下載鏈接。
  • 語音輸入輸出支持:最新版Kimi智能助手App支持語音輸入和輸出。

從豆包和kimi的大模型插件回答中,可以看出豆包回答的實際功能還是比較準確的,kimi回答的12個功能中,其中有5條是不符合瀏覽器插件功能的只有通過訪問官網才會有,從語意理解上豆包的回答會更準確一些。

基于插件功能的基礎上我們接下來進行幾個維度的體驗分析

3、基礎功能拆解

對豆包與kimi的瀏覽器插件基礎功能進行拆解

經過基礎的功能拆解后通過對比,豆包的基礎能力要比kimi豐富很多,在插件的展示邏輯上豆包只能通過側邊欄進行輔助工作,kimi可以通過快捷鍵進行全局懸浮,從交互體驗上kimi在處理基礎文本工作上體驗會更友好一些。

豆包大模型瀏覽器插件如下圖,基礎功能上支持圖像生成;AI搜索;翻譯等,這一點要遠比kimi支持的業務場景更多元,在交互體驗與更多功能中,豆包支持劃詞工具欄簡化與技能庫,這是Kimi不具備的,技能庫這一功能可以重點展開講一下,對于小紅書創作的博主與代碼極客來說實在是太爽了,可以無縫銜接通過懸浮窗進行文案修改與代碼糾錯,這兩點在后續的業務場景中會詳細展開來說。

三、適用的業務場景

結合白領工作模擬3類業務大模型推理場景,分析豆包與kimi的推理能力

1. 競品分析

TOB產品經理在日常工作中需要經常對于競品網站的業務邏輯與覆蓋板塊進行邏輯梳理與分析,下面以用友、泛微、攜程商旅三個TOB網站為測試樣本測試Kimi與豆包大模型插件的邏輯推理能力。

kimi與豆包表現:

觀點1:通過3個TOB的高級網站業務框架分析kimi與豆包的推理能力,從token的推理數量與網站邏輯分析上來看kimi 與豆包打平,但是kimi可以用【回車】按鈕直接進行全文總結推理,交互上kimi更勝一籌。

2. 簡歷分析

在文件處理工作中LLM模型應用最為廣泛以簡歷附件處理為背景測試kimi與豆包的大模型插件在瀏覽器中的實用性,當在chrom瀏覽器中打開一份簡歷附件時,kimi與豆包的插件懸浮按鈕是不支持彈出的,需要手動打開插件側邊欄進行輔助工作,但這一功能只有豆包有效,Kimi是無效的。

在瀏覽器側邊欄跟豆包進行交互時,邏輯卻不是耦合的在pdf文件上進行劃詞時,無法激活豆包的劃詞技能庫,只有在側邊欄單獨進行附件傳輸與問答時才有作用。

觀點2:在關聯固定瀏覽器打開的pdf文件時,Kimi還需進行適配激活優化,豆包需要進行耦合邏輯與激活劃詞技能庫優化

3. 文案創作與文章閱讀

當日常我們在閱讀公眾號文章或小紅書博主在進行文案腳本創作時,kimi與豆包的大模型插件可以在瀏覽器中幫助進行大幅提效;

當選取的文字沒有上下文做支撐時,Kimi 需要在文本框輸入文字搜索;而豆包得益于更好的 UI 界面,直接點擊搜索便在側邊欄得到詳盡答案。

當有足夠的上下文支撐時,Kimi 表現亮眼,不僅能給出細致解釋,也能結合上下文進一步幫助用戶理解詞匯和文章。

對于一篇題為“股權融資活動與歐洲價值增長回報”的英文文章,豆包能夠正確總結網站并給予 6 個點的亮點提煉;Kimi 插件也能準確總結文章,并對關鍵段落進行總結提煉亮點,且能夠對數據、重要定義以及關鍵行為進行解釋,其總結更加全面并且深入。

豆包得益于更好的 UI 界面與劃詞技能庫,這一點對于新媒體作者的靈感非常有幫助,以小紅書腳本為例豆包插件可以直接通過劃詞技能庫直接生成小紅書文案。

觀點3:在輔助閱讀時,Kimi插件不僅總結內容,還能對數據、重要定義以及關鍵行為進行解釋,增加總結的深度且全局懸浮的交互效果好大幅提高文章閱讀效率;豆包的UI界面和劃詞技能庫設計對新媒體作者特別有用,內容創作方面的實用性上更勝一籌。

四、當下與未來的生態擴展思考

1. 當下問題優化

1)提升交互體驗

  • 即時反饋:進一步優化Kimi的即時反饋機制,如通過語音或更直觀的界面提示,增強用戶的交互體驗
  • 多模態交互:探索將視覺、觸覺等多模態交互方式融入插件,提升用戶體驗。

2)增強文件處理能力

  • 跨平臺適配:加強Kimi和豆包在不同操作系統和瀏覽器中的文件處理能力,確保其在各種環境下的穩定性和兼容性。
  • 智能預處理:開發智能預處理功能,自動調整文件格式和內容,以適應不同的閱讀和分析需求。

3)深化內容理解與創作輔助

  • 深度學習與自然語言處理:利用深度學習技術提升對數據、定義和行為的理解和解釋能力,使總結更加精準和深入。
  • 創意生成工具:為豆包開發更高級的創意生成工具,幫助新媒體作者在內容創作中實現更多創新和個性化表達。

2. 未來生態擴展

當前豆包與kimi只是開發了適配于瀏覽器的插件進行工作提效,想要獲得的更大的市場份額和利益生態擴展是必然;

但是在當前大模型市場與互聯網行業的軟件生態的存量市場競爭中,市場份額很高的現象級軟件,不論是TOB/TOC領域都已巨頭林立;

豆包背靠母公司字節在抖音,西瓜視頻,今日頭條,激萌等一眾APP產品線的扶持下市場份額不必有太多擔心,在APP工廠下自然會有C端來不斷的補齊研發成本,拉高ROI;

但是對于kimi這種創業團隊來說想要與巨頭已經完成閉環的生態中競爭,進行產業融合的落地是唯一的不二選擇

例如:

  • 教育與研究場景:將大模型插件應用于教育和研究領域,輔助學術研究和知識傳播。
  • 企業解決方案場景:開發面向企業的定制化解決方案,幫助企業在數據分析、市場研究等方面提升效率。
  • 數據安全:加強數據加密和隱私保護措施,確保用戶在使用插件時的數據安全。
  • 合規性:確保插件符合各國的數據保護法規,增強用戶對產品的信任。

但是只卷TOB/TOG領域對于科技產業資本來講市場還是小的,而且抗周期與抗風險性較差,還需要與數10億的C端消費者共享企業利潤才可以達成完美的閉環;

例如最近爆火的蘿卜快跑,科技是服務于人民的;人工智能更多的應用場景值得科技資本進一步的探索。

專欄作家

小于愛學習,公眾號:產品技術加油站,人人都是產品經理專欄作家。左手科技互聯網&右手產業與經濟,長期關注硬科技和產業經濟學。

本文原創發布于人人都是產品經理,未經許可,禁止轉載。

題圖來自Unsplash,基于CC0協議。

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!