小紅書,給行業上了一課

0 評論 1262 瀏覽 0 收藏 13 分鐘

小紅書的翻譯功能憑借其對網絡熱梗、非標準表達的靈活處理以及強大的風控機制,正在重新定義翻譯工具的用戶體驗。本文深入剖析了小紅書翻譯功能背后的AI技術邏輯,探討了其如何通過大語言模型(LLM)實現“人性化”翻譯,并將AI能力深度融入社交平臺的場景中。

刷到小紅書的翻譯功能了嗎?

沒有,沒關系,告訴你怎么用。三步走:一.去手機應用市場更新最新版小紅書;二.進入設置,找到「關于小紅書」,點擊「檢測更新」;三.更新完成后重啟小紅書,就可以使用了。

然后,在評論區下面,看到純英文、直接點擊翻譯按鈕,就能實現;不僅如此,它還支持 日語、韓語、法語、德語、西班牙語、意大利語等。

我體驗一會兒,發現「翻譯功能」越來越通人性了。

為什么這么說呢?

首先,在一些陌生網友的帖子下,我試著用非標準的英文表達,比如「you see see you,one day day,just know eat」,它竟然翻譯成了「你看看你,一天天就知道吃」。挺有意思。

接著,我又嘗試了幾個網絡流行語。比如:CPDD和on9。它告訴我,CPDD是「處對象」的意思,on9在香港粵語中意味著「傻」。

更讓人驚嘆的是,它不僅能夠處理常規的文字翻譯,還能應對一些特殊格式,比如:Unicode、CSS,甚至是摩斯密碼,兼容性讓人眼前一亮。

雖然不確定翻譯是否百分之百準確,但至少目前看來,結果非?!溉诵曰埂?/p>

我發現,小紅書的翻譯功能之所以能夠做到這一點,是因為它基于大語言模型(LLM)提示詞實現的。

所以,無論是非規范英文、網絡用語、表情符號,還是語氣詞和縮寫,它都能結合現狀給出貼近實際語義的翻譯結果。

不過,目前該功能也還存在一些局限性,對于中英文混合以及英文加表情等內容形式,并沒有發現「翻譯」按鈕;還有,一些特殊語境下,結果還存在不夠準確的情況,但總體來說,夠用、滿足日常需求。

我比較好奇:為什么小紅書翻譯功能這么厲害?

其實市面上有很多成熟的翻譯工具,比如:谷歌翻譯、有道翻譯。它們各有優勢,但小紅書的翻譯功能確實有一些獨特的亮點。

首先,谷歌、有道翻譯在處理常規語言時,表現得非常出色。不管是學術文章、正式商務郵件,它們都能提供非常準確、專業的結果。畢竟,在標準語法和正式文本方面,已經很成熟。

相比之下,小紅書翻譯功能在處理網絡熱梗、非標準表達時表現得非常靈活。比如:

「yyds、絕絕子」這些網絡流行語,或者「you see see you」這種不太規范的英語表達,它能輕松搞定,這是其他產品暫時做不到的。

此外,它似乎有一個緩存機制。

如果某段內容已經被翻譯過,它能瞬間完成翻譯。不過,當我試圖用一些特殊語言或符號進行“攻擊”時,它的風控系統非常嚴密,完全無法突破。

舉個例子:我故意輸入了一段罵人的話,它會提示“翻譯失敗,請檢查輸入內容”。這種對敏感信息的精準識別和攔截,說明它的風控機制非常嚴謹。

還有一點,小紅書的翻譯功能與社交平臺緊密結合,不需要切換到其他應用,這種無縫銜接的體驗,讓我的感受更自然。

當然,其他翻譯工具也有它們的獨特之處,像谷歌翻譯有語音輸入功能,這對于一些不善于打字的用戶來說非常方便;有道翻譯對學習外語的學生來說也非常實用。

所以,不同的工具適合不同的場景,小紅書的翻譯更像一個懂你的朋友。

那么,它到底用了哪家的大模型呢?關于技術細節,在站內直接提問,肯定得不到答案,因為相關回答都被過濾掉。

不過,通過查閱小紅書技術團隊的公開分享,我發現,他們之前開發了自研的RLHF框架,并使用了PPO(近端策略優化)算法,這是一種被廣泛認可的強化學習算法。

此外,小紅書在2023年還自研了大模型基座「小地瓜」,雖然目前尚不清楚翻譯功能是否直接基于小地瓜,但可以推測技術架構與自研模型有緊密關聯。

值得一提的是,它也可能使用了一些外部的API服務。

例如,有第三方插件RedTrans支持小紅書的翻譯功能,但這并不意味著官方翻譯功能完全依賴外部模型,而是可能在某些場景下作為補充。

因此,一個結論是:小紅書的翻譯功能背后既有自研的大模型技術,也可能結合了外部模型服務。

不過,通過一些技巧,比如使用prompt、<s>、<bos>等標簽,還是可以推測出部分系統提示詞(system prompt)的內容,當然,這些是我的主觀判斷。

考慮到如此龐大的語料庫和復雜的模型訓練,小紅書臨時抱佛腳的推出這項能力,確實令人驚嘆。

所以,這是否會讓小紅書在AI賽道中更進一步呢?

答案是肯定的。

昨天還看到一篇文章討論:小紅書是否應該做大模型或AI產品?我認為,它一定會做,但不會獨立去做,而是會將能力深度融入現有產品中。

從過去舉措中,我已經可以看到這種趨勢。

比如,2023年3月,小紅書籌備獨立大模型團隊;同年4月,上線主打中國風AI繪圖的「Trik」;7月,推出了文生圖功能「此刻」。

9月,又開發AI聊天功能「達芬奇」。這些動作都表明,小紅書正在將AI技術逐步嵌入到產品的各個場景中。

這些產品里,我對「達芬奇」印象最深,它雖然挺好玩,但有時候也挺「傻」,在遇到復雜問題或者網絡熱梗,它有點應付不來,回答得不太準,有時候還顯得特別死板,不夠靈活。

但現在翻譯功能,正好補上短板。它不僅能翻譯得又快又準,還能識別敏感信息,連網絡流行語都能搞定,這樣一來,AI能力就更全面了。

除了這些,小紅書還在不斷探索新的AI應用場景,比如,AI搜索產品「點點」,通過多模態技術讓用戶可以拍照提問,獲取更有“畫面感”的回答。

綜上,很明顯看出:

通過翻譯功能和聊天助手提升用戶互動,通過AI繪圖和內容生成豐富用戶創作,小紅書正在構建一個智能、便捷,有趣的社區,AI已經全方位滲透到各個場景中。

圖片

寫到這,我覺得,它潛意識給大模型應用上了一課。

為什么這說呢?

一開始,我看到一些評論,比如:「這AI翻譯太神了,完全不像機器翻譯」,或者「yyds居然都能翻譯出來」,我還以為大家是在開玩笑。

后來,類似評論越來越多,我才意識到,很多人根本不知道大模型已經發展到了什么水平,我們都陷入了信息繭房,關注的視野有限。

像LLM、RAG、MOE等術語,可能已經聽慣了,但實際上,它們很小眾。

有一個博主的評論讓我特別震撼。他說:以后小紅書就是我的翻譯軟件了。下面還有幾百個人回復「天才」。這讓我意識到,AI在普通用戶中的落地應用,還有很大的空間。

因為很多AI產品現在處于一個「中間態」。它們有功能,但沒有真正融入用戶的工作流。就像你面前有一把錘子,但你不知道怎么用。結果,市場的潛力沒有被完全開發出來。

這里我要提到一個概念:技術接受模型(TAM, Technology Acceptance Model),簡稱TAM。

這個模型到底是什么意思呢?

感知有用性,即,用戶認為用了技術能提升工作效率,或者帶來其他好處。比如:一個技術產品能讓工作更快更好,或者讓生活更舒適,大家肯定覺得它有用。

感知易用性,是用戶覺認為技術用起來簡單不費勁。比如,學起來容易不容易,操作起來順不順手,能不能輕松融入到日常生活中。

不過,技術有用不一定就容易用。

有時候,你認為某個技術很厲害,能幫大忙,用起來特別復雜,就會讓人覺得麻煩,這是所謂的使用距離(perceived complexity)。

我第一次使用Adobe Photoshop時,頭發差點掉光;它的功能藏在一層層的菜單里,連裁剪圖片、調整顏色都要經過好多步驟,這種復雜的操作直接把我勸退。

如果用戶覺得一個技術不好用、實際幫助不大,他們會對技術敬而遠之。

雖然用小紅書做翻譯軟件有點低效,直接用Kimi、豆包APP或者網頁版大模型更方便,但很多人就想用小紅書翻譯功能,這說明小紅書的「翻譯」按鈕是一個真正好用的產品設計。

這些用戶可能不知道網頁版大模型能做翻譯,所以,從來沒用過;小紅書有了這個方便的翻譯按鈕后,大家都能輕松使用,這就成了他們的需求。

從今天起,我們得正視大模型落地應用的信息差,技術上微調一下還不夠,直接用AI顛覆產品形態也很難,所以,小紅書的創新,給我們提了三個醒:

一,AI技術不是高高在上的概念。要融入到產品里,讓用戶感覺不到它的存在,又能實實在在地幫助大家;二,易用性很關鍵。產品不能太復雜,得讓它變得簡單、易用、順手。

三,市場潛力巨大。許多用戶尚未意識到AI強大能力,比如翻譯網絡熱?;蛏蓚€性化圖片,這些能力觸手可及,恰巧是打開市場的機會點。

AI應用并非千篇一律的大招,希望做產品的朋友,不只盯著應用本身,多關注用戶的具體需求和體驗。嗯,是「具體的」需求,而非「組合型」需求。

本文由人人都是產品經理作者【王智遠】,微信公眾號:【王智遠】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。

題圖來自Unsplash,基于 CC0 協議。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!