豆包vs可靈,抖快AI之爭背后的產品路徑
在人工智能技術的浪潮中,短視頻平臺抖音和快手通過各自的AI應用——豆包和可靈,展示了兩種不同的產品發展路徑。本文將深入探討豆包和可靈背后的產品邏輯,分析它們在AI應用領域的競爭與合作,以及這些創新如何塑造著未來人機交互的新形態。
智能涌現的浪濤,還在翻涌。以今年5月為節點,全球科技巨頭在AI領域的成功與部署以更為密集的狀態呈現。
其中一條步履鮮明的主線,是普遍在追求AI落地。硬件端,蘋果在全球開發者大會上發布蘋果智能,宣布將ChatGPT融入Siri,三星宣布Galaxy AI融入手機、平板、穿戴式設備;軟件端,谷歌在Chrome瀏覽器集成Gemini AI助手……
一個公認的現況,AI應用即是國內AI產業當下的弱點環節,又是國內能夠追趕甚至超越的機會所在。
有趣的是,拋開尚處于初級階段的“百模大戰”,僅從AI應用場景出發,抖音與快手這兩大先天占據優勢的短視頻內容平臺,各自大熱的AI應用,又提供了兩種截然不同的落地路徑。
一、豆包,文生圖文基底的AI Agent
AIGC相關的App中,豆包繞不過。據Questmobile數據顯示,截至2024年6月,在國內AIGC App中,豆包、天工、Kimi智能助手、貓箱增長亮眼——其中豆包流量排名第一。
豆包并不嚴格“歸屬”于抖音,更確切來說歸屬于字節跳動。坊間流傳的消息是,這個名字很接地氣的AI產品,最開始的定位是抖音內的AI工具包,或者是抖音內的所有AI應用都包了,所以叫豆包。
在2023年8月上線以來,豆包本身的產品定位和能力也在不斷迭代,直至跳脫出抖音本身的框架,單獨成為一個App。與ChatGPT和文心一言等ChatBot產品形態類似但不同的是,盡管交互形態相似,但豆包的定位更傾向于一個綜合性的AI Agent(AI智能體)平臺。
通用場景下,用戶可以和“豆包”默認智能體聊天對話,也可以尋找其他垂直應用的智能體對話解決垂直場景的問題,其中包含官方與第三方創建的智能體應用。
在不斷迭代之下,其功能也愈發繁復?,F在的豆包,不僅有App更有PC端,應用內的場景也擴展到了虛擬社交聊天、AI搜索、文檔對話、文生圖、內容創作等多種使用場景。而且AI能力的應用也開始擴展到了字節旗下的不同產品。
以抖音為例,一邊是抖音應用內上線AI搜索功能,一邊是用戶在和豆包進行吃喝玩樂等特定類目內容交互時,豆包除了生成文字回復,還會推流一個抖音短視頻來填補AI回復的準確性和及時性。
在今年上半年相對熱門的AI應用中,字節基本都有入局,虛擬社交領域的貓箱,智能臺開發平臺領域的扣子,為主文生視頻的即夢等等。然而,豆包之于字節的定位重要性毋庸置疑,先是持續在增長方面的投入并公布商業化路徑,后是干脆將原來的大模型名稱從云雀大模型改成豆包大模型等一系列動作,都足夠驗證。
集成、聚合、綜合……豆包代表的產品路徑,依舊保持著“超級App”或者說“超級入口”的思路,在市場相對空白階段階段,先通過應用端占領用戶市場,并且在小步快跑中不斷迭代,最終聚合成一個超級應用,來獲取AI應用時代的優先船票。
與此同時,不同場景和不同產品的貫穿,又讓字節生態內的用戶數據進一步被累積,成為自身AI能力增長的數據養料。
二、可靈,視頻世界的AI入口
對AI領域有關注的人們,或許還會記得2月Sora推出時引起的震動。這是堪比ChatGPT式的信標。絲滑的文生視頻體驗,代表著人機交互、內容創意之間的某個隔閡被消磨殆盡,轉向通途。
很多人會以為,中國版“Sora”,會誕生在BAT和所謂“大模型五虎”上。作出這種判斷并不令人意外,技術基底延伸產品應用的鏈路總是更短。但出乎意料的是,真正在用戶層引起爆發式普及的文生視頻產品,卻是快手推出的可靈。
與還處于內測階段的Sora相比,在6月公布的可靈直接對外開放。比較吸引人的點在于,可靈支持生成長達 2 分鐘的 30 幀視頻,分辨率最高1080p,并且可以自由定制寬高比。這樣的產出能力,甚至遠超還Sora和其余競品(包括在可靈公布前一個月字節上線測試的文生視頻應用“即夢”)。
在發布后不久,其又上線了圖片生成視頻功能。視頻生成的效果,也符合其宣稱的大幅度合理運動、物理世界特性模擬、具備概念組合能力和想象力等優勢。這一度成為許多“內容創作者”們吸睛的利器,讓老照片、手繪圖片變成視頻的“獨家秘笈”甚至被許多人做成課程銷售。
快手的AI產品路徑,也值得思考。在可靈之前,快手先后發布了通用大語言模型“快意”、文生圖大模型產品“可圖”,均未有太大火花,反而是更符合自身內容生態的可靈迅速火爆。
而在可靈爆火后,在移動端唯一能使用的渠道依舊只有快手創作工具快影 App。但快手專門打造了Web端,并發布公告稱此前的可圖平臺將在8月關閉,產品功能融入“可靈AI”中。從Web端入口可以看到,快手對可靈的官方定位是新一代AI創意生產力平臺,突破了文生視頻局限,集中在AI內容/創意生成方面,并且還有AI視頻剪輯等功能方面的想象力留白。
這似乎又是一個方向:圍繞自身核心業務場景,提供AI助力來實現揚長避短。而快手本身的內容生態,AI能力的喂養、AI產品的落地、用戶的反饋,形成了一個完整閉環,用第三方平臺、工具的形式,從創作到體驗到生態提升了整體主站App的體驗。
三、Agent和工具集,被動與主動
不難發現,盡管目前交互的形態還屬于一問一答、一入一出的階段,但豆包和可靈之間的差異,已經有了被動與主動的差別。
豆包嘗試的AI Agent作為通往AGI(通用人工)的必經之路,發展方向無疑是能夠獨立思考、調用工具去逐步完成給定目標的獨立助手。終極的發展目標,是用戶只需要給出一個需求,就能根據需求拆解步驟并提供解法。用戶被動享受著AI的主動響應。
可靈AI作為垂類平臺,集成了對應的分類能力。用戶依舊要為進行文字、圖片和素材的輸入,并且進行調試。產品用被動式的交互保持了用戶的部分主動性。
無關優劣,這本就是非常有意思的階段性發展。人機交互關系究竟應該是什么形態,人們需要一個萬能的智能體助手,還是更垂直有效的工具,又是一個事關倫理的新命題。
而可以確認的是,至少在未來的一段時間內,我們不用擔心AI產品的無趣了。
本文由人人都是產品經理作者【甲方財經】,微信公眾號:【甲方財經】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協議。
豆包與可靈分別是抖音與快手推出的AI應用,代表了短視頻平臺在AI領域的不同探索路徑。豆包作為綜合性AI Agent平臺,旨在成為用戶的一站式AI服務入口;而可靈則專注于視頻內容的生成,幫助內容創作者輕松制作高質量視頻。兩者展現了AI技術在短視頻領域的應用多樣性和靈活性,推動了行業的創新發展。
期待AI的更多發展可能,抖音快手這兩個老對手也錯開賽道發展了。
豆包作為字節跳動的綜合性AI Agent平臺,展現了強大的集成與擴展能力,旨在成為AI時代的超級入口;而可靈則依托快手的內容生態,專注于文生視頻領域,實現了快速的市場突破。這兩個APP不僅讓我們看到了AI技術在具體應用中的多樣性和創新性,還引發了關于AI產品路徑選擇和市場競爭策略的深刻思考。所以,我們是否該思考一下這些APP對我們是不是有用???
細分場景的AI小模型,似乎是大模型市場下的一個賽道突破,像是好久之前就有的戀與制作人,就很懂得情感陪伴,而且商業布局也很好
那如果他的目標是殺死所有同行是不是該改名叫豆沙啊