深度剖析字節豆包AI

23 評論 18505 瀏覽 146 收藏 50 分鐘

在國內的AI產品中,不少都做了APP以供用戶更方便地使用,豆包就是其中之一。這篇文章,我們嘗試對豆包AI進行深度分析,看看能否通過這款比較典型的產品,了解AI 助手APP這個賽道。

這將會是三白的又一篇萬字以上的深度分析報告,作為一個AI深度愛好者以及從業人員,從去年8月份字節豆包上線至今,我一直都在密切的關注這款產品的每一次更新和動向,并頻繁和字節已經行業內的AI從業的朋友們交流和討論這款產品,最近花了近3天左右的時間,把過去1年的積累的內容重新整理并輸出形成一個完整的報告。

全篇內容共13000字,閱讀時間預計需要半小時,我將按照一個標準的產品分析報告的視角,系統的介紹和分享個人關于字節豆包這款產品的一些觀察、分析、思考,我將從產品、行業、商業、用戶、競品等多個角度綜合分析這款目前字節炙手可熱的AI產品,需要聲明的是,以下全部內容僅代表個人觀點,內容僅供參考,若存在有失偏頗的地方歡迎大家和我溝通討論;

由于內容較多,為了提升大家的閱讀效率,我整理了一個全文腦圖如下,沒有時間細細閱讀的朋友可以快速看腦圖即可:

1.為什么想分析字節豆包這款產品?

一般我挑選分析對象,通常會選擇該賽道比較典型、或者有代表性的產品,也最好希望通過一個產品能夠把這個賽道基本了解清楚,一方面我先不選擇ChatGPT,主要是它是海外的產品,可能很多用戶都體驗不到,而豆包為國內公開使用的產品,且目前在使用規模上據個人了解目前是用戶規模前三的AI產品;另外一方面,豆包對比chatgpt,在產品特性上,除了基本具備Chatgpt的大部分功能之外,還增加了關于智能體agent、Agent開發平臺、AI社交、開發者和創作者生態等多個領域,所以能夠覆蓋的領域,因此分析它的價值可能更高;

2.全文內容的信息獲取來源?

本篇文章全部內容和信息主要基于如下幾個信息來源:

  • 個人基于長期對產品的關注、體驗、思考而形成的個人觀點;
  • 來自和騰訊、字節、百度、阿里等國內大廠的AI從業朋友的討論與交流;
  • 參考市面上公開的深度資訊、專題分析、公開報道、數據平臺等;

3.適合哪些人群?

  • 想要系統的了解AI應用端產品,建立行業認知的朋友;
  • AI產品經理和運營人員;
  • 研究AI和字節產品的金融或者戰略研究人員;

一、產品概述

1.1. 產品基本信息介紹

1.1.1. 豆包是一款什么產品?

豆包是字節跳動在2023年8月份推出的一款AI產品,產品直接對標的競品是ChatGPT、文心一言這一類的產品,屬于字節跳動在chatbot領域推出的重量級產品,此外,字節還在海外上線了一款豆包海外版的產品,產品名稱是cici;

產品在字節跳動公司內的組織架構是在字節去年11月份剛成立的FLOW團隊,根據flow業務負責人朱駿公開信息,目前豆包在國內的月活已經有2600萬,算是目前國內活躍規模最高的AI產品,目前應用內已經累計創建了800萬+智能體;

與ChatGPT和文心一言等ChatAI類的產品不同的是,豆包的產品定位更傾向于成為一個綜合性的AI 智能體(AI Agent)平臺,產品整體的交互形式以智能體的形式呈現,通過一個個智能體(Agent)的方式滿足用戶在不同應用場景的使用需求;通用場景下,用戶可以和“豆包”默認智能體聊天對話,也可以尋找其他垂直應用的智能體對話解決垂直場景的問題;

1.1.2. 豆包的研發背景和發展歷程

官方對于為什么產品叫豆包的說法是,一開始想著是抖音內的AI工具包,或者是抖音內的所有AI應用都包了,所以叫豆包,很多用戶調侃這個名字取的太過于俗氣,但是目前從行業的風氣上看,大廠的AI產品們都傾向于取一些比較實物化、普通而接地氣的名字,而不是一些高大上的名字;

豆包的前身是字節去年內部孵化的產品項目,名稱是Grace,當時Grace還沒有上升到整個公司重視的程度,據了解當時公司內部高層對于AI的態度還處于想搞清楚這是個什么東西的階段,創始人張一鳴也在不停地會話行業內的專家試圖了解大模型到底是怎么回事的階段;

23年8月份的時候豆包開始灰度上線,當時的用戶體量還不是很大,月活可能10萬都不到,并且在8~10月份一直保持著自然增長,根據QM公開的數據統計,豆包的整體活躍在11月份的時候開始了跳躍性的增長,月活已經開始超過1000萬,個人猜測產品從11月份開始對外投放廣告,因此帶來了比較明顯的增長,后來又經過半年左右的時間,5月月活規模達到2600萬規模(參考字節官方公布數據);

1.2. 產品定位

1.2.1. 豆包的產品定位:從產品、公司戰略的角度看產品定位

1)從產品形態的角度看產品定位從產品形態上看,前面也提到,豆包的產品定位是一個綜合性的AI智能體平臺;目前豆包內的智能體包括3種類型:

  1. 豆包默認智能體:這個是用戶默認使用的智能體,用戶首次使用時進入的是豆包默認的智能體,新建對話的時候也是默認調起默認智能體;
  2. PGC智能體:第二部分是豆包官方創建的智能體,目前豆包官方創建了25個官方智能體,包括AI圖片生成、愛聊天的小寧、全能寫作助手等;
  3. UGC智能體:這部分是用戶自己創建的智能體,根據官方公示,截止到24年5月份,豆包應用內目前已經有將近800萬的智能體;

2)從公司戰略的角度看產品定位從公司戰略的角度上看,產品的定位包括如下幾點:

  • 豆包更傾向于打造成為公司的品牌和門面的AI產品,包括從目前的產品規模和增長趨勢,以及公司的大模型名稱從之前的云雀大模型改名為豆包大模型,種種跡象都表明,公司有意將這款產品打磨成為一款明顯標桿產品,甚至成為公司的品牌和門面的AI產品;
  • 豆包也是字節大模型秀肌肉的產品,目前豆包整體一直都免費開放給用戶使用,起成本和消耗也不小,但是個人認為這是一種通過C端占領用戶市場和心智,然后帶動大模型售賣的一種方式,企業級的客戶通過使用和體驗豆包的能力可以感受和對比豆包大模型的能力,如此更加有利于大模型的售賣,所以豆包也是字節大模型體驗和秀肌肉的產品;
  • 豆包是字節AI場景的試驗田,在扶持一個體量較大的AI產品之后,豆包也承擔起了AI應用場景和市場驗證的責任,目前個人感受到的思路是,flow團隊會將一些想要驗證的場景以智能體的方式放到豆包應用內驗證并觀察的增長的數據情況并驗證需求,一旦需求和市場獲得了驗證,便采用獨立APP的方式單獨運作;這樣的案例,目前可以看到有貓箱、coze等產品;

1.3. 產品核心產品能力

目前chatbot類的產品功能基本都大同小異,因此這里也就不面面俱到的產品具體產品的功能,個人主要分享幾點個人認為豆包做的相對還比較不錯的,或者可以算的上產品核心能力的產品功能;

1.3.1.手機端核心產品功能

  • 沉浸態的語音對話的功能:目前從大部分使用用戶的反饋看,豆包的語音對話聊天的功能在自然度、擬人化和流暢度等方面都是相對來說比較不錯的,和文心一言等競品可以形成相對的差異,個人也主要是通過行業內的研究人員們關注到這點,可見目前字節在語音模型、語音合成等方面確實具備比較領先的技術優勢;
  • 自定義智能體:用戶可以通過創建智能體的方式自己捏一個角色或者智能體,并應用于個人使用,或者公開給他人使用,目前APP內創建智能體的方式比較簡單,只提供了prompt、頭像、聲音配置的選項,沒有提供太多個性化的配置能力,這部分個性化的能力目前在智能體開發平臺扣子/coze里面實現;
  • 發現智能體:該模塊主要滿足需要想要尋找垂直應用場景的智能體的需求,目前發現智能體模塊提供了頭像生成、學習、AI繪畫、游戲動漫、角色扮演、影視小說、工作、創作、生活、情感、趣味等十幾類智能體;
  • 文生圖能力:豆包目前支持文生圖的功能,個人體驗了國內多款文生圖的chatbot類產品,目前在生成質量、準確性等方面,豆包的表現還是相對比較不錯的,因此個人認為目前在視覺生成方面,可能字節的能力和表現會相對更好一些;
  • AI生成文本+短視頻推薦組合形成query回復:目前當你涉及一些吃喝玩樂相關的話題的時候,豆包除了生成文字回復,還會推流一個抖音短視頻給用戶,這種方式主要是為了解決模型無法很好的應對實時性和物理世界相關的信息這個問題,配合人工生成的短視頻,可能能夠更好的解答用戶的問題,讓回復質量更高;
  • 本地生活推薦:豆包支持基于用戶的LBS推薦用戶定位附近的商家,給用戶提供本地生活推薦的服務,這塊的功能,個人猜測是接入了抖音本地生活推薦的數據,但是目前該功能還沒有大力做,產品體驗和使用價值相對一般,但是在眾多的AI產品里面,目前只看到了豆包做了這個嘗試,也算是一個值得一提的功能;

1.3.2.電腦端核心產品功能

豆包電腦端目前除了網頁端web版的功能,還推出了PC客戶端的版本,整體產品以瀏覽器的形式存在,基本有點類似于對標360AI瀏覽器,其核心功能包括如下:

  • AI搜索:AI和搜索結合的場景,是AI的一個關鍵應用領域,目前豆包的AI搜索功能,個人認為在搜索結果的時效性、準確性等方面是相對比較不錯的,其AI搜索的能力,個人認為甚至目前做的比文心一言的AI搜索還更好一些;據個人了解,百度搜索目前在AI搜索領域的布局目前還處于觀望和滯后狀態,可能因為AI搜索的成本比較高,并且AI搜索會沖擊傳統搜索廣告的業務,所以目前沒有重點發力;

  • 文檔對話和閱讀總結:文檔對話的產品目前也比較多,包括以kimi為主的產品,大家的體驗表現上其實都差不多,但是個人體驗到的豆包表現優越的點在于模型的OCR能力更好,例如上傳掃描件PDF文檔的時候,豆包可以準確是識別文檔的內容,但是kimi等產品并沒有達到響應的水平;
  • 內容創作:支持細分場景的AI內容創作,從之前通用的AI創作工具,到目前逐步支持場景化創作,總體上比之前更近一步了,但是說實話從目前的創作結果上,還沒有達到專業級的水平,相比市面上垂直應用領域的AI寫作產品還是差了一些;

  • 瀏覽器插件:瀏覽器插件的功能是今年5月份左右剛剛推出的功能,能支持在瀏覽器里面實現基于頁面瀏覽的AI功能,包括劃詞搜索和翻譯、頁面摘要、視頻轉文字等實用功能,目前做的還比較不錯并保持著很高頻率的產品更新;關于插件安裝體驗,可訪問如下文檔 https://bytedance.larkoffice.com/wiki/ZwUjwehjyibYCTksatkcb9iXnKc

  • 電腦插件:整體功能和瀏覽器插件差不多,支持切換到電腦的應用場景;具體使用可搜索下載豆包電腦客戶端,安裝后進入首頁即有相關引導;

1.4. 豆包的關鍵版本迭代記錄

過去一年,基本豆包的每一次產品更新,我都在重點的關注,其中個人認為值得關注的重點包括:

  • 去年11月份的版本更新是豆包產品整體改頭換面的一個版本,實現了幾乎豆包大部分的核心能力;
  • 之后的版本里陸續通過各種動作探索和發展第三方智能體的價值;
  • 2月份和扣子打通,支持扣子創建并發布智能體到豆包;
  • 3月份強化搜索和文件對話能力,應對kimi的市場熱度;
  • 以及Q2重點發展PC客戶端和瀏覽器插件;

具體的版本迭代明細見下:

23年11月迭代版本

  • 推出22個豆包官方智能體:包括英語學習助手、聊天、AI生成漫畫、音樂電臺、智能體創建助手、ai生成圖片、文學伴侶、戀愛大事、旅游規劃師、電影評論家、星座運勢、起名專家、本地推薦、編程助手;
  • 強化AI聯網搜索能力:和今日頭條、抖音搜索數據打通,生成的搜索結果支持溯源并打開跳轉頭條和外部網站的內容,支持查看出處,目標是為了增加生成結果的可靠性問題;這個階段,豆包開始和頭條搜索和抖音搜索密切合作,聯網搜索的能力也主要是基于頭條和抖音搜索,尚未拓展到全網搜索;
  • 增加了關聯問題推薦的功能:基于用戶的問題提供問題推薦的功能,節省用戶輸入問題的時間,提供提問的靈感幫助用戶獲得更多的信息,增加用戶提問的頻率;
  • 支持LBS的本地生活搜索推薦:其中美食推薦還比較準確,但是其他的推薦還不準確,包括酒店、生活服務等;
  • 支持文生圖的產品能力;
  • 首頁改版強化智能體模塊:發現智能體的入口從右上角遷移到底部欄,增加了AI智能體的模塊,進一步的強化了智能體平臺的定位,同時也可以看出對發展智能體生態的重視;
  • 支持抖音短視頻內容推薦:生成文本的同時匹配與之相關的相關匹配度最高的短視頻內容;該能力主要彌補ai生成內容泛化的問題,AIGC+UGC互補結合更好的解決用戶對回復內容滿意度的問題,同時抖音短視頻的內容真實性的感覺更強,進一步解決用戶對生成內容的信任感問題;

24年1月迭代版本

  • 首頁改版進一步強化智能體的露出:智能體置頂到首頁頂部,支持滑動展示;
  • 開始對智能體做進一步的分類:分類整理出不同的分類的智能體,這個階段可見智能體的規模已經初步發展起來;
  • 將搜索框固定到首頁頂部,強化搜索功能,但是后來又將搜搜框下架,主要原因可能因為搜索體驗不佳,或者也可能是針對AI搜索的一次測試;

24年2月迭代版本

  • 虛擬聊天智能體增加聊天背景封面優化聊天氛圍,體驗越來越像星野,且智能體創建支持AI生成頭像以及支持AI生成提示詞;
  • 國內版智能體開發平臺“扣子”上線,和豆包打通,支持發布豆包;
  • 豆包AI拓展字節內部其他產品:包括抖音應用內上線AI搜索功能,今日頭條APP首頁右上角上線豆包AI功能,內嵌頭條;

24年3月迭代版本

  1. 智能體開始灰度支持定制個人的音色功能;
  2. 增加文檔對話分析能力:支持上傳PDF、表格、PPT、word、txt等格式文件,不支持圖片格式,文檔大小限制50個以內,大小限制20M以內;
  3. 接入bing搜索,聯網搜索拓展全網搜索,支持抖音搜索和頭條搜索之外的內容搜索;
  4. 上線豆包PC客戶端和瀏覽器插件;

24年5月迭代版本

  1. PC端推出“問答”能力:整體產品形態對標知乎產品,目前主要通過搜索問答類的內容,通過搜索引擎入口引流;為利用AI問答的能力做的搜索投放獲客的能力;官方將問答內容和生成結果沉淀為問答內容,形成一個問答社區;社區鏈接如下:https://www.doubao.com/traffic/ask
  2. 瀏覽器插件更新:支持b站視頻總結、ARXIV論文閱讀;

24年6月迭代版本

  • 豆包瀏覽器插件更新:支持youtube視頻總結和中英雙字幕,詳細功能參考如下文檔:https://bytedance.larkoffice.com/wiki/ZwUjwehjyibYCTksatkcb9iXnKc

二、產品所屬賽道分析

2.1. 賽道定義與細分

2.1.1. AI的賽道細分

對于目前的AI的賽道,個人總結賽道的整體布局如下,其中今年上半年比較火熱的應用領域,基本聚焦在chatbot、智能體開發平臺、虛擬社交、AI搜索這幾個領域:

2.1.2. 豆包所屬細分賽道:Chatbot賽道

盡管很多人對于豆包的產品定位比較有爭議,稱它長得像ChatGPT,又長得像character.ai,但個人認為,目前的整體產品形式,基本都是源于ChatGPT,所以我更傾向于歸類為chatbot賽道;

2.1.3. 賽道內的主要競爭者和市場競爭情況

既然歸屬于chatbot賽道,因此其主要的競爭對手主要包括ChatGPT、文心一言、騰訊元寶等產品;另外因為豆包和核心功能還包括虛擬社交、AI搜索等場景,所以kimi、character.ai、星野等產品,也可以視為其主要競品;

目前從用戶體量上看,海外活躍規模的體量整體相對更高,ChatGPT毫無爭議為目前全球活躍規模最高的AI應用產品;

對于國內,文心一言目前根據QM和similarweb提供的相關數據,截止今年3月份WEB+APP的整體月活將近3000萬左右,而豆包截止5月對外公開的月活規模是2600萬,其后是kimi月活將近1800萬;

三、核心產品技術分析

3.1.MOE架構模型

豆包的應用內承載力虛擬社交聊天、AI搜索、文檔對話、文生圖、內容創作等多種使用場景,如此之多的功能放在一個產品里面,很難只是通過一個通用的大模型就能支持所有的產品能力,必然需要用到多種模型能力,因此豆包的底層采用的應該是MOE(混合專家模型)架構的模型;

MOE模型簡單講就是在模型中組合了多種類型的模型,在處理實際的任務的時候,動態匹配解決任務需要的模型組合,高效的執行任務;以在豆包內構建一個實時資訊聊天機器人并語音對話為例,整個過程中可能涉及到如下幾個模型:

  • 角色扮演模型:在用戶創建一個虛擬角色的時候,后臺可能會使用角色扮演模型輔助用戶創建一個具體角色的Agent;
  • RAG模型(增強檢索模型):用戶在和角色聊天的時候,因為用戶對話的query要求的是實時的資訊聊天,所以模型在響應的時候,需要基于聯網檢索的結果做生成輸入,所以這個環節可能需要調用RAG模型,完成響應輸出;
  • TTS模型(文本轉語音模型):模型完成文本的輸出之后,需要將文本合成為語音之后以語音的方式輸出給用戶,這個過程需要用到TTS模型;

以上我們通過一個案例理解什么是MOE架構模型以及其工作原理,接下來個人猜測一下豆包的MOE模型中可能混合的哪些專家模型:

  • 基礎大模型:也就是豆包大模型,在解決一些通用場景的內容生成,例如豆包默認智能體的生成輸出的時候,大概率可能直接使用的是基礎大模型;
  • 行業大模型:包括在解決虛擬聊天和角色扮演等應用場景的時候,可能使用的是角色扮演模型;
  • 文生圖模型:涉及圖像生成等場景的時候,必然使用的是圖像生成模型;
  • 語音合成模型、音色定制模型:目前語音聊天的場景,包括提供不同的音色,以及語音聊天的輸出,都是通過語音合成模型和音色定制模型技術實現;
  • RAG模型(增強檢索模型)、知識圖譜:如前舉例,涉及需要聯網檢索,或者調用外部知識庫解答的問題,可能會用到RAG模型和知識圖譜技術;
  • 向量化模型:例如在回答用戶問題時,通過向量化模型,系統可以快速查找到和用戶問題相關的知識并生成準確的回答,向量化模型主要用于將知識庫向量化,方便根據用戶問題匹配到跟用戶最相關的知識,然后生成回答;

四、商業模式分析

4.1.關于豆包當前的商業路徑的思考

當前豆包基本完全免費,并且無限量的提供給用戶使用,在C端基本沒有商業付費的場景,個人認為目前豆包的商業模式更多的是C端免費使用,形成市場規模、品牌效應和用戶教育之后,通過模型端收費,但是鑒于最近這段時間字節大模型大幅度降價之后,可能短期售賣模型也不賺錢,而是通過模型消耗帶來的基礎云服務的售賣,其商業變現的鏈條如下:

豆包C端免費———>企業端購買大模型,帶動云服務售賣———>通過售賣云服務賺錢;

所以,當前的商業路徑,表面上是在做AI產品,實際上可能兜兜轉換最后可能變成了賣傳統的云服務賺錢。

4.2.豆包未來可能通過什么模式實現商業化

參考目前市面上競品的做法以及個人的看法,未來豆包的商業化方式可能包括如下3種方式:

1)個人增值訂閱的模式:個人增值訂閱簡單講就是付費會員,與ChatGPT的plus訂閱,文心一言的會員類似,增值訂閱目前是廣泛的用戶普遍可以接受的一種方式,而增值訂閱的方式,關鍵在于未來通過什么增值功能引導用戶付費,我覺得可能的增值點可能包括:

  • 更強的模型:例如免費用戶使用基礎模型,使用更強的模型需要付費;
  • 付費智能體:例如圖像生成等對成本消耗比較高的智能體智能限量使用,超過一定使用量之后需要付費;
  • 增值功能付費:包括深度檢索功能、音色定制功能、上傳文件大小等;

2)廣告模式:作為互聯網廣告的收入大戶,即使在AI產品,未來也未嘗不可嘗試廣告變現的模式,其中包括檢索生成的索引入口、商家和服務的推薦等,都可能是比較合適的廣告入口,當產品的體量逐步上來之后,廣告的規??赡芤矔容^可觀;

3)應用分成模式:目前豆包應用內的第三方智能體為用戶創建并維護,未來也不排除可以做成付費智能體的可能性,特別是通過coze/扣子創建并發布到豆包的智能體,當第三方智能體支持付費,并且豆包內打通支付路徑之后,作為平臺方也可以向第三方應用抽取分成;

以上三種方式,僅為個人猜測,并且個人認為增值訂閱和廣告模式的概率比較高,應用分發的難度相對會比較大,目前豆包官方暫時也沒有對外公開其商業化的計劃和進展情況;

4.3.豆包未來的付費用戶可能是誰?

個人認為,對于豆包類的chatbot的產品,未來潛在的主要付費群體包括如下幾種:

  • AI愛好者:也就是ChatGPT帶起來的第一批AI的興趣用戶,這批用戶具備非常高的質量,既理性又有消費力,愿意為價值買單,我的身邊有非常多的這樣的群體,他們甚至愿意想盡一切辦法購買訂閱費用比較貴的ChatGPT plus的會員,屬于高價值、付費購買意愿比較強的群體,該部分群體的整體年齡也相對比較高,大部分聚焦在30~40歲的用戶,并且男性用戶居多;
  • 辦公族群體:包括商務辦公、學習教育、營銷創作、商業服務、金融法律等行業和場景的用戶群體,解決的是不同領域的工作場景的需求,大部分用戶更愿意為場景付費,該部分用戶的年齡聚焦在25歲~40歲區間的群體;
  • 中小學生群體:社交和游戲偏好的群體可能也會是主要的付費用戶,虛擬社交目前也是豆包的重要使用場景,個人該領域用戶畫像觀測分析認為,該場景在年輕人群體中的偏好較高,未來年輕一代的用戶可能更加愿意為虛擬社交和娛樂聊天付費;

4.4.用戶的核心付費動機和需求是什么?

  • 為效率提升付費:現在大部分用戶更傾向于希望AI產品是一個提升效率的工具,所以用戶更傾向于為效率付費,包括生產效率、信息獲取效率、學習效率、辦公效率、溝通效率、決策效率等,其中生產效率和信息獲取效率的提升是用戶需求更強的場景;
  • 為精神娛樂和情緒價值付費:AI除了以實用價值為出發點的效率場景之外,還有以虛擬社交等為例的精神娛樂和情緒價值的應用場景,該場景用戶為社交獵奇、情感陪伴、情緒宣泄等付費;

那么,對于效率和娛樂這兩個方向,預計哪個有可能更快看到商業變現?

個人認為娛樂方向的變現價值可能會跑的更快,因為效率場景的變現極大的依賴大模型的能力,要想要做出一個能解決具體的效率場景的產品出來,現在說實話真的太難了,而對于效率群體而言,普通的產品能力如果不能切實的解決他們的問題,用戶斷然是不愿意付費的,所以效率場景短期變現難;而娛樂場景,目前模型的能力基本也足以滿足,用戶的付費也有更多的是沖動付費的場景,因此目前從市場上看,投資人們更多的偏好虛擬社交的產品;

4.5.豆包的成本結構

對于豆包類的AI產品,其核心成本主要包括技術、人力、市場營銷費用這幾部分成本,至于具體的成本規模,尚不得而知;

  • 技術成本:包括模型成本、服務器和帶寬成本;
  • 人力成本:包括研發人員、產品和運營人員的人力成本
  • 市場費用:拉新獲客的市場投放、市場營銷的成本;

五、字節的AI產品布局和豆包的位置

5.1.字節激進的AI應用布局

從去年的6月份開始,字節已經開始密集的布局AI領域的應用,去年8月的時候,字節還只是上線了豆包、小悟空等少數幾個產品,半年多過去,目前字節在國內和國外已經上線了十幾個AI應用,覆蓋了不同的熱門賽道,可謂全面開花,基本在大廠里面,在AI應用層如此激進的,基本也就字節了;

縱觀字節的整個AI布局,可以看到,基本上半年幾個火熱的AI應用領域,字節基本都入局了,包括以豆包為標桿的Chatbot領域、以貓箱為主的虛擬社交領域,以扣子為主的智能臺開發平臺領域,加上集團內其他舊產品和AI的結合,布局版圖非常大,其中對于豆包,從目前字節在產品的增長投入、以及甚至將原來的大模型名稱從云雀大模型改成豆包大模型等一系列動作可以看出,豆包在整個字節的AI應用的地位非常重要;

5.2.如何看待字節的激進和騰訊的冷靜?

一方面,個人認為字節在AI的激進是自上而下的,從字節的發展進展和動作上看,字節的高層非常重視并看到AI帶來的應用端的機會,并且迅速的開啟了當年互聯網時代小步快跑、快速驗證市場需求的節奏,個人認為字節目前的發展思路存在如下幾個特點:

  1. 快速占領應用端市場:先在目前市場空白階段先通過應用端快速占領用戶市場,并順利拋出一個AI領域的超級應用,未來掌握入局AI應用領域的第一張門票;
  2. 應用端積累更多的用戶數據,反哺大模型迭代優化:應用端的數據越多,對于模型的迭代和發展就越有利;

另外一方面,反觀騰訊,過去半年騰訊在AI應用側的進展簡直冷靜到讓人不敢相信,過去的一年里面對外公開AI應用的產品并不多,并且原生AI應用的產品也很少,目前只有騰訊元寶、騰訊元器剛剛推出沒多久;雖然騰訊混元的負責人的觀點認為目前AI應用的滲透整體都很低,所以大家都在同一個起跑線上,但是不可否認的是,目前騰訊在AI應用端的反應相對滯后,個人的觀點認為如下:

  • 大模型才是最核心的,應用端并不著急:雖然騰訊在應用端的發聲比較少,但是根據個人了解,騰訊內部在模型端的投入并不低,騰訊混元集中了公司很多模型研發人員,并且對外招聘的力度也比較大,可見騰訊當前的重點還是先發現大模型的基礎能力;
  • 過早進入應用端,并不會拉開差距,成本和模型能力反而會限制增長規模:對于掌握著互聯網大半流量的騰訊而言,孵化一個超級應用的難度并不大,但是更多的還是應該先看清楚市場之后再出手,否則過早進入,可能形成不了市場占有率優勢,反而還受限成本以及模型能力,導致規模難以快速增長;

字節和騰訊對待AI應用的兩種不同的態度,基本也代表了目前市面上大家對AI的態度和心智,只能說各有立場、沒有優劣,只不過是不同認知下的選擇而已。

六、豆包如何實現用戶增長?

以下內容,為個人觀測觀點,尚未獲得實際數據驗證,個人認為豆包的獲客新增策略主要基于如下4個策略:

  • PLG產品驅動:通過持續拓展和新增更多的產品能力,覆蓋不同的AI賽道,滿足不同場景的使用需求,目前豆包基本兼容了主流的chatbot、虛擬社交、智能體創建、AI搜索、AI創作等多個方向的應用場景;
  • 廣告投放:大廠的產品的快速增長,自然離不開廣告投放,豆包的快速增長也主要依托字節內部的引流投放,包括抖音和頭條官方廣告、穿山甲廣告聯盟、抖音內容創作者投放等;
  • 智能體的裂變分享:用戶在使用智能體的過程中,可以把智能體鏈接分享給其他用戶,給豆包帶來更多流量;
  • 插件化:從最近關注到的情況發現,豆包開始做瀏覽器插件、電腦操作系統輔助插件、以及和今日頭條合作豆包ai助手、甚至傳言目前豆包正在和手機廠商合作手機助手,這些動向表明了未來豆包的增長會通過插件化的方式,對外釋放影響力和帶動增長;

七、用戶畫像分析

7.1.豆包目前的用戶畫像分析

根據某第三方數據平臺觀察分析豆包APP用戶的畫像特征如下:

  1. 男性用戶為主:豆包活躍用戶中,將近70%的用戶為男性用戶,女性用戶僅30%左右,對于該數據現象,個人認為和目前國內整體AI興趣偏好人群的分布有關系,或許對于AI科技類的產品,本身男性用戶天然就是比女性用戶更感興趣;想通的數據平臺,觀察文心一言等其他同類型的產品,也存在男性用戶占比明顯高于女性用戶的特征;
  2. 25歲~40歲職場用戶群體為主:豆包活躍用戶中,年齡在25~40歲之間的用戶占比將近70%,為豆包的主流用戶,參考整個互聯網大盤的數據,該年齡階段的用戶占大盤的占比近30%左右;

7.2.豆包未來的核心用戶群體是哪些?

豆包當前的用戶畫像更多的還是受目前市場用戶的整體情況所影響,個人認為,對于一個綜合性的AI智能體平臺,豆包的核心用戶群體,將逐步拓展如下用戶:

  1. 年輕一代用戶:包括大學生、中小學生群體,目前豆包的整體使用用戶,更多的還是以職場白領群體為主,年輕用戶相對較少,鑒于虛擬社交場景也是豆包的重點發展場景之一,個人認為未來對于社交、游戲等新奇事物比較感興趣的年輕一代群體,將會是該場景的重要用戶群體;
  2. 拓展下沉用戶群體:目前AI和大模型的最新資訊,主要還是在一二線城市為主,未來下沉市場的用戶在AI的使用滲透可能會越來越高;
  3. 女性用戶的占比逐步提升起來:AI目前對于大部分人來說,還是個技術感比較強的東西,相比更加吸引男性用戶,隨著未來Ai的使用門檻和工程化越來越普及,女性用戶的占比會逐步提升起來;

八、核心競品分析

8.1 核心產品能力對比

個人認為,衡量一個ChatBot類的產品,其核心產品能力的對比應該包括如下幾個維度:

  1. 文本生成:這是LLM最基礎的能力,作為一個崇尚技術派的人,個人比較看重的是文本生成在邏輯推理、專業性、場景化等方面的表現,因為通用的生成能力對我而言是沒啥用的,我們需要專才來解決我們的問題,而不是一個什么都會的通才;
  2. 語音聊天:其次是語音聊天的能力,包括語音聊天的流暢度、真實感、交互方式,我們需要的是一個接近真實的聊天AI,而不是一個像天貓精靈那樣的傻瓜機器人;
  3. 聯網搜索:不言而喻,聯網搜索的能力基本是一個chatbot產品非常關鍵的能力之一,也是一個核心競爭的產品能力點,通常對于聯網能力的判斷,個人主要看搜索結果的完整度、全面性、時效性、準確性;
  4. 多模態:多模態的能力主要包括跨模態的輸入和輸出,包括輸入方式上支持的格式類型(文本、語音、圖片、文件、視頻等),以及輸出方式上的格式類型;
  5. 垂直場景解決方案:也就是解決垂直場景的AI應用的解決能力,包括平臺提供的智能體、插件的能力,以及支持用戶定制智能體和插件的能力;

以下為個人對豆包及其核心競品核心能力的對比情況,其對比僅根據個人在過去將近1年的實際使用的感受獲得的結論,僅代表個人觀點,如有不正確的地方歡迎指出,總結起來核心觀點主要如下:

  1. ChatGPT在文本生成的專業度、邏輯性,語音聊天能力體驗,多模態表現方面相比其競品做的都相對比較出色;但是在聯網搜索、插件和GPTs發展方面相對弱一些;
  2. 豆包在語音聊天,聯網搜索方面表現出色,但是在文本生成、多模態方面表現比Chatgpt、文心一言相比遜色一些;
  3. 文心一言在文本生成方面相比豆包更優秀,但是語音聊天、聯網搜索表現略比豆包遜色一些;
  4. 三個產品在垂直場景的解決方案方面均沒有非常出色的表現;

8.2 終端布局對比

整體上,豆包在拓展終端,還有用戶使用入口這個事情上,做的更加激進,包括瀏覽器插件、電腦系統插件的植入,甚至據聞未來還計劃將產品能力拓展到抖音、頭條等產品;

8.3 底層大模型對比

對于模型的對比,站在使用端的角度上看,個人主要從模型基礎參數、模型綜合表現能力、價格這三個維度去做對,根據個人關注了解到的信息和評價,對比GPT4.0、豆包大模型、文心大模型,個人評價如下:

  1. 在基本參數方面,從模型參數規模上看,目前GPT4.0的參數規模預計應該是最高的,其訓練數據規模個人猜測預計應該也是最高的,至于上下文長度,目前大家基本豆包128k水平,至于目前市面上一堆生成百萬、千萬級的上下文,個人并不太理解為何能做到如此大的差異,其中可能有營銷的嫌疑,但是個人比較相信GPT4.0的上下文長度上限更加有代表性;
  2. 對于模型綜合表現方面,盡管目前國內有不少模型都生成達到或者超過GPT4.0的水平,但是從個人實際在應用接入的表現上看,GPT4.0的綜合表現基本遠遠超過國內所有模型;
  3. 價格方面,目前價格最低的模型是豆包大模型,今年5月份的時候其主力模型把輸出的價格下降了將近60倍,低至2元/百萬token,這個對于行業應用的開發者而言真的是一個福音,從個人的角度上看,GPT4o的價格雖然貴,但是能力和定價匹配,豆包大模型的能力和GPT4o能力有差異,但是性價比高,但是文心大模型的價格目前屬實太高,其定價基本對標GPT4o,站在開發者的角度上看,性價比不高;

九、未來的產品發展方向思考

對于未來這款產品將會如何發展,個人認為,未來其發展應該會包含如下5個模塊:

  1. 核心應用場景能力升級和深化:除了底層大模型的同步發展之外,豆包在產品工程化方面個人認為后續會越來越深入,其中對于AI目前在虛擬社交、搜索、內容創作、辦公、教育、生活助手等這些核心的應用場景的發展,后續會提供更多的功能升級和服務;
  2. 智能體生態的發展:豆包將會重點發展第三方智能體生態,其中關鍵的目標是孵化超級智能體,也就是使用量較高,并且能帶來更高的裂變效應和產品知名度的智能體;其次是如何將未來發展起來的智能體對外拓展和賦能,讓智能體的能力得到更多的使用;
  3. 多模態AI場景實現:目前豆包的大部分能力基本都是單模態,未來隨著多模態大模型的發展,相信產品也必將推出更多的多模態使用場景;
  4. 插件化:豆包的插件化主要是將豆包的產品能力拓展到更多的用戶使用場景,把產品能力接入到更多的終端和生態,其中包括PC使用場景的插件化、應用插件化、硬件生態插件化,目前從產品的動作和布局上,可以看到有這樣的傾向;
  5. 商業化:產品的商業化是必然會啟動的,盡管目前產品是一個免費產品,但是目前產品昂貴的模型成本和研發成本,必然會push產品開始探索商業化;

當然,以上內容均為個人基于對行業和產品的理解和經驗的一些想法,并非實錘信息,僅供參考。

OK,至此,關于字節豆包的產品分析到此為止,寫完以上內容之后,三白表示心情十分舒暢,作為一個非常不喜歡積累收藏零散、支離破碎的知識信息的強迫癥患者,每次系統輸出某一個產品的知識體系的時候,就好像把自己亂七八糟的房子重新收拾了一遍一樣干凈和舒服,我挺享受這樣的知識梳理的過程。

作者:三白有話說,公眾號:三白有話說

本文由 @三白有話說 原創發布于人人都是產品經理。未經作者許可,禁止轉載。

題圖來自字節豆包官網

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. “本地生活推薦:豆包支持基于用戶的LBS推薦用戶定位附近的商家,給用戶提供本地生活推薦的服務,這塊的功能,個人猜測是接入了抖音本地生活推薦的數據,但是目前該功能還沒有大力做,產品體驗和使用價值相對一般,但是在眾多的AI產品里面,目前只看到了豆包做了這個嘗試,也算是一個值得一提的功能;”

    抖音本來就和美團在搶本地生活的市場了,現在大家把ai當搜索引擎用,也就是壟斷流量入口,這個思路確實好啊

    來自廣東 回復
    1. 是的是的

      來自中國 回復
  2. 寫的很好呀! 幫我更深度理解產品 行業,感謝分享,高質量內容

    來自北京 回復
    1. 謝謝呀

      來自廣東 回復
  3. 豆包比某些ChatGPT套殼的強

    來自廣東 回復
  4. 寫的非常好,花時間看完后對這塊產品有了大概的了解,也幫助我更好完成實習的工作!祝你保持狀態,越來越好

    來自廣東 回復
    1. 謝謝喲

      來自廣東 回復
  5. 目前豆包AI完全免費,但以后就可能通過增值訂閱、廣告模式或應用分成實現商業化。好耶歸好用,暗中賣價就不得而知了

    來自北京 回復
    1. 收費和變現是一定會的,什么時候而已,AI產品成本那么高不收費或者變現誰頂得住,暗中賣價是什么意思,沒懂!

      來自廣東 回復
  6. 專業的分析, 受益匪淺. 豆包也是我目前主力輔助工具, 豆包的火山翻譯是我目前用過最準確的翻譯軟件. 期待作者的作品~

    來自河北 回復
    1. 點贊

      來自廣東 回復
  7. 謝謝您,我是應屆生正好最近在準備相關面試,這種知識框架的梳理真的是給我的思想提升了一個維度。感謝!

    來自四川 回復
    1. 點贊

      來自廣東 回復
  8. 這是真正產品經理人,很牛??!我感覺您應該是女的,如此細心。希望豆包在繪圖方便能快速追上MJ,我愿意付費。

    來自北京 回復
    1. 謝謝。俺是個漢子,哈哈哈??

      來自廣東 回復
  9. 好文章,感謝

    來自北京 回復
    1. 謝謝哈

      來自廣東 回復
  10. 寫的很細,看完有所得

    來自廣東 回復
    1. 謝謝呀

      來自中國 回復
  11. 很驚訝競品選擇中沒有智譜清言,作為同期發布的競品,智譜清言不僅從模型質量、自定義模型可配置程度、客戶端用戶體驗等層面上都強過豆包,可以說從迭代功能上講豆包簡直就是對智譜清言進行拙劣模仿。居然還率先開始商業化了,果然賣產品靠的不是產品能力,而是推廣能力。

    來自江西 回復
    1. 感謝同行專家的評論,一看就是在行的,基于您的觀點和問題,回復如下:
      1.為什么競品里面沒有智譜清言?
      ①首先智譜清言確實也是競品之一,但是chatbot賽道的競品非常多,除此之外,還有天工、訊飛星火,甚至海外還有很多產品,筆者并沒有選擇一一完整的羅列,站在產品分析的角度,個人不太喜歡面面俱到,更傾向于聚焦重點,所以跟個人寫作的邏輯和風格有關;
      ②個人挑選聚焦重點競品的邏輯,核心是基于活躍規模,根據目前個人觀察到的數據,國內chatbot類產品活躍前三的產品是文心一言、豆包、kimi,智譜清言在用戶規模上甚至還低于天工和訊飛星火,以上數據基于相對可靠的第三方平臺觀測數據;至于按照活躍規模挑選競品的邏輯是否有問題,個人認為沒有問題,即使是騰訊、阿里、字節內部,在選擇同賽道競品的時候,也會優先看規模,其次看產品力;

      2.“迭代功能上講豆包簡直就是對智譜清言進行拙劣模仿”個人認為這句話“拙劣”一詞有些偏頗,不夠客觀
      從整個行業上看,大家都是在抄chatgpt,國內的產品算不上模仿和抄襲,也沒有必要,即使部分功能由于上線先后,存在學習模仿的嫌疑,行業內大家相互學習參考,沒啥問題,算不上拙劣;至于模型、產品之間能力差異,個人認為,現在只有國內和國外的差異,國內的差異不值一提;

      3.“果然賣產品靠的不是產品能力,而是推廣能力”
      個人認為,商業層面的PK,自然是多個維度的,產品是很重要的維度,但是不能否認企業在流量獲客、品牌營銷等方面的重要性,就好像海外的幾個頭部的模型,誰敢說GPT4就是遠遠比他們更好,但是大部分人第一個記住的是GPT4,不排除有奧特曼個人的營銷能力在里面;純粹的產品思維,僅僅只是站在產品角度考慮問題是不夠的,商業世界,要從商業的角度考慮問題;

      最后,個人沒有貶低智譜清言的意思,不可否認它也是一個優秀的產品,只是在我的邏輯之下沒有進入觀測視角;另外對于不同產品的觀點和看法見仁見智,關鍵在于堅守自己的核心邏輯,同時給觀點要帶論據!

      來自廣東 回復
    2. 想和您討論一下這個問題,首先就目前而言我認同您的看法,智譜的模型能力,準確性是優于豆包的。

      但這里有一個現狀,無論智譜還是豆包都沒有達到 100 分,在這樣的情況下,我認為優秀的產品設計是能夠彌補功能的差異的,對用戶側就是更好的解決用戶問題(技術能力,方案涉及是其次)。所以我也相信這個結果也確實是市場,用戶的選擇。

      再 By the way,第一個大模型的 API, 我是多用智譜來使用的,后來也希望于桌面端、瀏覽器端可以繼續使用它(因為認同他的準確性更好),可惜被豆包的功能設計搶走了我這個智譜原始用戶。

      來自香港 回復
    3. 贊成觀點哈,優秀的產品=出色大模型能力?出色產品工程?無處不在的使用場景,非常歡迎多交流哈,期待您給我分享一下使用智譜的體驗,個人微信basketball-boy555

      來自廣東 回復