沒了新鮮感之后,社交網絡如何維系用戶長期活躍?
本文主要圍繞“社交網絡如何從小長大,如何維持網絡上用戶的長期活躍”這些話題,從仿真建模的角度,對網絡的增長和節點活躍狀態聯動的建模過程做了一個介紹,并進行了一個階段性的探索。
微信在社交領域無論從覆蓋度、用戶粘性、口碑、創新上都占據了高點。但是社交戰場始終沒有人打算放棄,才有了試圖從短視頻切入社交的抖音、主打實時語音輸入體驗的子彈短信,這些社交領域的挑戰者們依然有機會創造了一個個新的爆點。
建立社交王國不僅僅是打磨一個新的APP,事實上,影響一個社交網絡由小變大乃至保持活躍的內部因素非常之多,每個不起眼的因素都可能對社交網絡中的局部乃至整體帶來潛移默化、甚至突發強烈的作用;更不用提難以捉摸的外部環境影響。
在這篇文章里,本期騰研識者試圖將社交網絡從紛繁復雜的具體場景、細節條件中剝離出來,單單從個體間連接的類型這一角度,對維持整個社交網絡的長期活躍給出了他的回答。雖然脫離了真實世界的研究有些抽象,但作者相信這些抽象模型的背后可能蘊含著人們可以理解的虛擬世界里的運行法則。
正如作者所言:“拋磚引玉,與諸君共勉?!?/p>
文章要點:
- 如何抽象刻畫一個社交網絡?
- 社交網絡怎樣從小到大?
- 網絡上個體狀態的連鎖反應(級聯反應)
- 增長中的網絡伴隨用戶行為狀態的級聯反應,帶來可預見的多樣開局
引言
去日本奈良旅游,不得不提的是“東大寺”。千百年來,東大寺經歷了無數的腥風血雨,曾多次在戰火或天災中遭受重創,卻每每在數百年中又得到重大翻修重整,因而屹立至今,成為既存在于史書中又存在現實中的文化遺產之一,可以讓今人設身處地的一睹千年前古人的勞動和智慧。
值得一提的是,在日本各地建立國分寺和國分尼寺的做法,被認為是效仿中國隋唐時代在各地興建的國立寺院。例如武則天時期著名的大云寺,以為國祈福。而在武則天時期曾經遍布全國的大云寺,因為權力交接、天災人禍,遭受了近乎全面的毀滅……
圖1 日本東大寺
歷史上耗時數十年、數代人參與的大型工程還很多,例如埃及金字塔、中國的萬里長城、鐵路修建、電力鋪設等等。而小到一個家族的興衰,大到一個大型的企業組織、一個城市、一個王朝的變遷,亦蘊含著一些人群匯聚的獨特魅力。
是什么樣的魔力將原本獨立自由的個體匯集起來,形成一個個的小組、團隊直至大型的組織?匯聚而成的團體,又將如何進一步經營壯大,尋求在團隊凝聚力、成員活躍度、協同作戰能力等方面尋求突破?
社團、群體的延續性、可持續性的問題,本身既抽象又開放,在時間和空間的長河中普遍存在,也許根本不存在完美的解答。
在這篇文章里,我們試圖將社交關系構成的網絡結構從紛繁復雜的具體場景、細節條件中剝離出來,單單從個體間連接的類型這一角度,對整個網絡的持久活躍能力給出了一個回答——即便對于同樣的一群個體,具有明確的個體屬性(例如,個體的流行度popularity,可理解為個體成為大V用戶的內因,潛力值)和個體間的相似性(例如興趣愛好、觀點論調、行為習慣,個體信息上的同質程度,如:喜歡同一個話題、同一個東西、同一個人、生活環境類似、地理位置類似等等),并且他們具有一樣的網絡拓撲結構,由于連接類型上的屬性差異,由這群個體形成的社交圈子也可能在維持用戶活躍度上具有截然不同的能力。并且,以個體間的相似度為基礎,適當偏向高流行度個體的網絡增長的方式,可以讓網絡達到極高的持久活躍能力。
(注:在這里,我們假定用戶的吸引力主要來自于兩個方面,一個是用戶本身的流行度,成為大V的潛質;一個是用戶和其他用戶之間的相似度,二者的共同作用,決定了用戶之間連接關系的形成。實際上,流行度也可以不局限在個人的層面,也可以是一個社會熱點問題、一條熱點新聞、一個爆款視頻、一篇10萬+的文章、一個營銷策劃的方案,這些都是個體內在的流行度帶來的顯性的外在結果。)
這一回應距離“正確答案”、“標準答案”可能謬以千里,但不妨作為一塊上好的磚塊拋出,希望可以吸引、甚至激發大片美玉的出現。
問題の抽象
影響一個社交群體活躍程度的內部因素非常之多,每個不起眼的因素都可能對社交網絡中的局部乃至整體帶來潛移默化、甚至突發強烈的作用;更不用提難以捉摸的外部環境影響。于是,本文嘗試將這個問題向某個方面逐漸化簡、抽象。
圖2 運營用戶生命周期的示意圖
拋開外部環境的影響,也拋開具體場景細節的考量,一個長遠運營的社區可能會經歷以下的周期:從吸引不同個體加入進來,到用戶對社區的熟悉、活躍、沉淀,到用戶穩定留存下來,再到用戶對社區逐漸失去興趣,再到用戶淡出社區。
社交網絡用戶活躍的問題可以被抽象提煉成一個純粹由節點(node)和邊(edge)構成的社交關系圖上的問題。進一步的,社交關系中節點與連邊的數目和狀態一直處于一種動態變化中;社交網絡整體活躍程度的問題也轉化成——如何讓網絡中的大量節點維持更長期的活躍?這一問題對復雜網絡的理論研究以及社交群體實際的運營而言,無疑是一件有趣且有意義的事。
問題的進一步思考:
當我們將這個問題抽象化簡之后,那么一連串的問題又雙叒叕來了:
- 人們的社交關系如何抽象刻畫?
- 節點的活躍狀態如何刻畫?
- 連邊的形成、斷開、重連等如何刻畫?
- 這個社交網絡上面各種狀態的變化如何刻畫?
- ……
還有最要命的,如此抽象化了的模型已經跟現實世界半毛錢關系都沒有了,那這個抽象模型的存在還有什么意義呢?在簡化抽象結果上得出來的結論,可能對現實世界而言然并卵。
是的,這么講沒毛病。就像在電子游戲里地球上存在過的某個生命體,對于現實世界里地球上幾十億年的演化而言,好像也沒什么卵用。不過至少,在抽象后虛擬的時空里,這些抽象模型里可能蘊含著這個虛擬世界里的運行法則。而這些虛擬的時空,可以看做高維的現實在某種低維時空下的一個投影。
注:關于社交網絡生成過程的模型抽象,本身非常有趣也很神奇,不過這并不是本文想要探討的重點。有額外興趣的朋友可以移步騰訊研究院之前的發文《社交網絡中的冪律分布:為什么有的人微信好友5000而你只有500?》。那篇文章沒有提供一個完美解答,但可以讓你有更進一步的了解。
先前學界的工作通常在預先生成或給定的網絡結構上考慮個體的持久活躍問題;然而,社交網絡的發展,是網絡在增長的同時伴隨著已加入個體的活躍狀態的級聯反應(cascading effect,可以理解為連鎖反應,連帶作用)。
↓插個圖,靈魂畫手作品↓
(看不懂沒關系,我又用電腦重新畫了一張)
圖3
- (a) 網絡中節點由少變多、連邊也由少變多,可以有微量的邊減少之類的;
- (b) 一個社交群體因為個別節點的不活躍而死寂。
真實的社交網絡具備一些特征,每個特征都可能影響到個體的活躍度。接下來,我們就對網絡增長的過程(多樣的網絡增長模式),節點活躍狀態改變的過程(社交網絡中個體的活躍狀態也具有級聯反應)還有二者的協同(社交網絡的增長+節點活躍狀態的聯動 → 一個網絡結構與節點狀態協同演化的過程),做一個簡單介紹。
多樣的網絡增長模式
社交網絡怎樣由小長大?它們的增長模式是復雜多變的。
例如早期新浪微博的策略是綁大V,邀請各路明星名人加入微博,然后這些名人帶動粉絲加入,這是一種個體流行度優先(popularity-first)的增長模式。還有一些網上的興趣社區,是用戶根據興趣愛好聯系起來,這類網絡的增長模式是個體間相似度優先(similarity-first)。
此外,人人網或稱校內網抓住的是高三畢業大一新生的需求,學生需要跟高中同學保持聯系,同時在大學結交新朋友,還有用戶是想看同年級中的美女帥哥、學霸、社交達人等,這里糅合了同學關系、熟人關系、線下朋友關系等等多重關系的作用;與之類似,微信也是糅合了QQ好友、通訊錄好友等線上好友、線下熟人等等關系的作用。
還有一些不太成功的社交網站,沒有明確的增長方式,可看做是自由生長、放養型的維護方式,也可以理解成一種沒有人為干預的自組織的增長方式。
正如上文中提到的,對于個體間的社交吸引力,雖然我們提煉出了個體的流行度(popularity)、個體間的相似度(similarity)這樣簡單純粹的元素,但是對于其他一些復雜的線下關系、熟人關系、通訊錄關系,在本文中并沒有提煉出一些明確的、可以刻畫的屬性。而且,即便是流行度、相似度在不同的具體場景下,也存在不同性質、不同維度的具體體現。
個體本身的屬性差異,以及個體之間鏈接類型的差異使得即便是相同的網絡結構、相同的一群個體,在不同的網絡增長模式下,依然可能帶來不同的網絡持久性。
社交網絡中個體的活躍狀態,也具有級聯反應
在高壓電網中級聯失效(cascading failure)、連鎖反應是一個常見的事故,當電力系統滿載或者輕微過載時,某個節點的錯誤有可能導致大范圍電力系統的癱瘓,一夜回到解放前。這一現象至今非常普遍,06年歐洲大斷電和12年印度大斷電波及幾百萬、幾億人口的生活。
又如,在生態系統中,食物網的持久性體現在初始物種在受到干擾之后存活下來的比例。一個營養學物種的消亡有可能威脅食物網的平衡;更別提各國政府不約而同聞之色變的物種入侵問題。
類似的,在社交網絡中,維持個體的活躍度是促進整個社區穩定、發展、繁榮的關鍵一步。一些關鍵人物的狀態改變,也可能導致整個社交圈子的性質發生變化,例如:小到一個家庭里某個家人的健康與疾患,大到公司、國家領導人的交接。
這些來自不同領域的高壓電網、食物網、社交網絡,在網絡結構上形成的“連鎖反應”、“級聯效應”,都可以抽象成一個幾何圖形上的結構和狀態變化。在圖論中,k-core 與 k-core 分解的概念就被用來理解網絡結構對級聯反應的作用。
什么是core的概念?一個網絡拓撲結構中,節點的重要性是可以排序、打分的。按照不同的指標、不同的角度,都可以給出一套給節點打分排序的方法。Core的概念認為一些節點在構成該網絡結構時位于更高的“內核之中”,具有更高的core值;越是處于核心的節點,對于網絡結構的穩定、網絡上的傳播等等,可能比其他節點扮演更加重要的角色。
這里需注意的是,節點的“重要性”可以體現在很多層面上。例如:節點的度數可以衡量節點的潛在影響力、可觸達的用戶數量,是最為常用的衡量指標之一。擁有大量粉絲的大V用戶被認為具有更大的影響力和號召力。在營銷學中,使用KOL(關鍵意見領袖Key Opinion Leader)的概念來分析諸如節點度數、core值等等不同指標下,衡量節點對營銷內容的傳播和擴散起到的作用。
當然,節點/連邊的重要性還可以體現在關鍵的節點或者關鍵的邊對于維持網絡局部結構的穩定程度所起的作用等等其他方面上,并不局限于KOL和營銷問題。
這里舉一個實例:如下圖,如果我們稱一個子圖(一個網絡圖的一部分稱為子圖)是3-core或者3-degeneracy,那么圖中每個節點最少具有3個鄰居是屬于3-core 或更高層的core。
圖4? 一個典型的 k-core 分解示意圖
對 k=3,3-core 這一層而言,每個節點至少有 3 個鄰居也屬于 3-core(或者更高層的 core)。K=1,2時也類似。計算core值時,從0-core, 1-core開始,像剝洋蔥一樣,一層一層將網絡剝離成幾個互不重疊的core層。
對3-core的計算過程依賴于先要獲得0-core,1-core,2-core對應的節點,像剝洋蔥一樣,一層一層的撥開。0-core就是孤立的節點。1-core要求節點最少與1個不低于1-core的鄰居相連,由此得到core值為1的節點集合,并將這些節點從原圖中剝離開。
此時,原先度數為2的一些節點,也可能度數降為1了(因為鄰居被剝離出去),這些節點也屬于1-core,并被繼續剝離。直到所有滿足1-core條件的節點都被剝離殆盡,網絡中只剩下高于1-core值的節點群體時,第一層的分解才算完成。由此,進入2-core分解的階段,以此類推。
K-core 可以幫助人們理解圖的稀疏程度、連接密度等[1];此外,core值越高的節點,在純粹的拓撲結構上具有更加重要的連接地位。
K-core是建立在靜態的網絡拓撲結構上的一種結構指標。不過,k-core本身對于網絡上節點動態傳播能力也具有一定的衡量價值。在這里,受到k-core定義的啟發,我們也可以引申出一個活躍鄰居閾值的概念:當節點具有不少于c個活躍鄰居時,節點可以繼續保持活躍。
這里需要說明的是,對每個人來說,這個閾值很可能存在,但不一定是同一個。而且,很可能還跟軟件應用本身的設計,或者非泛泛的鄰居有關。
社交網絡的增長+節點活躍狀態的聯動 →?一個網絡結構與節點狀態協同演化的過程
社交網絡的增長大趨勢,伴隨著個體活躍狀態的級聯,這兩個過程是協同發生的,不是相互孤立的。這一協同過程對網絡持久活躍的影響,還缺乏探討。
不同的社交網站具備不同的增長模式,這些多樣的增長模式到底對網絡中個體的持久活躍意味著什么?這個問題更深一層的是:不同的社交關系,不同的鏈接類型對網絡持久性有什么樣的影響?
考慮到通過獲取各類社交網站長期的真實數據來促成這項研究有較大的實施難度。我們選擇從網絡建模仿真的角度來探討這個問題,對前文提到的社交網絡的增長過程與節點活躍狀態的變化聯動,分別建模并結合起來。這個工作建立在 Papadopoulos 的網絡增長模型和受k-core啟發的節點狀態級聯模型基礎上。
Papadopoulos 的工作提供了一個迄今最為強大的網絡增長模型[2]。先前網絡的增長模型是以節點的流行度為核心,高流行度的節點更容易具備較高的連接度數(更廣的人脈),而高度數的節點有更大概率優先與新加入的節點鏈接。
Papadopoulos 認為,節點之間的相似度也是吸引其他節點與之相連的因素。他們的模型將多種真實世界中的網絡(技術網絡、生物網絡和社交網絡)映射到由節點的流行度和相似度構成的極坐標中,并引入流行度和相似度所在雙曲空間中的雙曲距離作為優先鏈接的評判標準。
這項工作的意義是,這個改進的優先鏈接模型,不但可以復現先前優先鏈接模型實現的節點度數在統計學上的冪律分布(類似于經濟學里的馬太效應,度數高節點度數越來越高,度數低的節點度數很低而且數量眾多);而且,由該模型生成的網絡可以很好的模擬多種真實世界的網絡在雙曲距離上的鏈接概率。
注:讀者如對Papadopoulos模型的深入理解感興趣,可點擊閱讀原文參閱公眾號文章《從社交網絡到量子糾纏:我們如何理解空間?》
不過,Papadopoulos 的工作只考慮了網絡的增長,不涉及節點狀態動態改變的這些問題;此外,在其模型中,節點的流行度與節點加入網絡的時間是綁定的,這與真實世界中多樣的網絡增長模式不符。
我們提出基于節點的流行度優先(popularity-first)、相似度優先(similarity-first)和隨機加入(random)三種社交網絡的增長模式,解綁了節點的流行度和加入時間,同時保留了基于雙曲距離的優先鏈接機制[3]。然后,我們在增長網絡基礎上引入了級聯過程,可以描述網絡增長與節點狀態級聯的協同演化。
這里需說明的是,我們這里提出的隨機增長是空白試驗,完全不考慮節點的相關性,就隨機的加入網絡;這跟真實世界中一些自由增長的網絡還是有點區別的。
圖5
三種不同增長模式下社交網絡演化過程示意。在極坐標系下,每個節點具有兩個屬性,極徑r和極角θ。極徑可看做節點的流行度的大小,極徑越小,流行度越高;而兩個節點的夾角代表它們的相似度。
流行度優先就是節點按照極徑由小到大加入網絡;相似度優先就是按照夾角的大?。ɡ鐝?度開始),由小到大加入網絡;隨機模式則是充分隨意的加入節點。節點是否鏈接由雙曲距離的大小等參數決定,節點再經過自發活躍度之后,由活躍鄰居閾值決定是否繼續活躍。
在考慮節點活躍狀態的變化時??紤]到當新用戶加入網絡時,本身會具有一個自發活躍(spontaneous activity)的時期,這時個體對網絡充滿新鮮感,它的活躍主要依靠自身的好奇心和探索的需求驅動,不受其他用戶的影響。當新鮮感過了之后,如果個體還有一定的活躍鄰居,那個體還可以繼續保持活躍,否則就會變成不活躍。
這個活躍鄰居閾值(active neighbour threshold)可以追溯到上文提到的k-core。如果每個節點要具有3個活躍鄰居才能保持活躍,那最終這些活躍節點構成的圖可以看做是動態網絡下的3-core 退化圖。這里早期“新鮮感自驅動”和后期靠“活躍鄰居維持”的考慮,從廣義上講對應社會心理學家常提到的“探索”與“習慣”。
圖5是仿真模型基于三種網絡增長模式的演化過程示意。節點都具有流行度以及與其他節點的相似度。即便是相同的一批節點,遵從相同的規則來建立鏈接和保持活躍,但是因為加入網絡的順序不同,網絡增長的模式不同,最終網絡中活躍節點的比重也會截然不同。
如圖例中所言,針對五個節點的示意圖,即便是相同的一批節點集合,節點之間基于相同的鏈接規則,節點的活躍狀態也基于相同的規則,唯一改變了節點加入網絡的順序,同樣會造成節點的鏈接類型、生成的網絡結構不同,繼而節點的活躍狀態也呈現出明顯的差異。
請注意,這里僅僅著眼于社交網絡發展壯大的早期,尚沒有觸及其他階段、其他因素的作用。并且,這種網絡結構的差異、節點活躍狀態的差異,并不是一次兩次隨機偶然的事件。當進行大量重復的仿真過程之后,一些明確的現象和規律已呼之欲出……
啟示&展望
這篇科普文,主要圍繞“社交網絡如何從小長大,如何維持網絡上用戶的長期活躍”這些話題,從仿真建模的角度,對網絡的增長和節點活躍狀態聯動的建模過程做了一個介紹,并進行了一個階段性的探索。這一小探索已然表明:節點活躍程度的演化不僅取決于網絡拓撲,而且與節點間的鏈接類型有關;節點間的鏈接類型又蘊含在網絡的增長和節點活躍狀態變化的協同過程之中。
依據這一模型[3],我們發現:即便是對于同樣的一群個體,具有明確的個體流行度和個體間的相似度,由于連接類型的差異,這群個體形成的社交結構也可能具有截然不同的維持用戶活躍的能力;并且,以個體間的相似度為基礎,適當偏向高流行度個體的方式,可以讓網絡達到極高的持久活躍能力。
本文中考慮的節點的流行度、相似度,節點自發活躍等內容是對真實世界的抽象。在涉及具體的社區類產品的運營時,這些內容對運維策略和產品設計也有啟發。因為作者目前對企業運營的具體實踐認知不夠,不敢妄加揣測,這里僅拋出來一些點,希望能給讀者一點啟發,可能業內專業人士能給出更好的解答。
進一步的文獻資料可參閱:
[1] “Degeneracy (graph theory),” Wikipedia. 19-Sep-2018.
[2] F. Papadopoulos, M. Kitsak, M. á. Serrano, M. Bogu?á, and D. Krioukov, “Popularity versus similarity in growing networks,” Nature, vol. 489, no. 7417, pp. 537–540, Sep. 2012.
[3] X. Jin, C. Jin, J. Huang, and Y. Min, “Coupling effect of nodes popularity and similarity on social network persistence,” Sci. Rep., vol. 7, p. 42956, Feb. 2017.
*本文部分圖片來源于網絡,版權歸原作者所有。
作者:金誠,騰訊游戲數據挖掘應用中心研究員,微信公眾號:騰訊研究院(ID:cyberlawrc)
本文由 @金誠 原創發布于人人都是產品經理。未經許可,禁止轉載。
題圖來自 Pexels,基于 CC0 協議
- 目前還沒評論,等你發揮!