如何科學(xué)地調(diào)研小眾人群?

4 評論 13958 瀏覽 108 收藏 12 分鐘

如何讓一些小眾用戶、小眾群體為自己所用呢?怎么去研究這類群體、以及怎么去收集他們的信息呢?

互聯(lián)網(wǎng)時代的“長尾理論”,讓我們重新認識了小眾用戶、小眾產(chǎn)品、亞文化群體的意義和價值。網(wǎng)絡(luò)上的亞文化群體,包括嘻哈文化、二次元、同性戀文化、宅文化、小清新、非主流等等,小眾群體包括小眾作者的粉絲、小眾產(chǎn)品的用戶等;現(xiàn)實生活中,亞文化群體則包括性工作者、吸毒者、流浪藝人等所謂的“隱藏人口”。

如何研究這些群體,收集他們的信息為我所用呢?顯然,概率抽樣、問卷調(diào)查可能是一種流行的做法。

概率抽樣的困境

在研究小眾群體或亞文化群體時,通常會面臨一系列抽樣困境:

  • 第一,這些小眾群體或亞文化群體在總體中所占比例較低,群體的規(guī)模和邊界不太清楚,很難找到合適的抽樣框;
  • 第二,小眾群體,尤其是亞文化群體的成員,常常因種種原因拒絕暴露自己的身份,這就加大了我們獲取有效信息的難度。

舉個例子:

假設(shè)在A社交平臺上,我們的研究對象是同性戀群體,我們想了解這群用戶的情況。假設(shè)A社交平臺有1億用戶,其中有5萬名用戶受同性戀文化影響。我們通過簡單隨機抽樣,抽取一個10萬人的樣本(已經(jīng)是相當大的樣本了),從中可以得到的同性戀亞文化群體樣本也只有50個左右,考慮到亞文化群體較高的拒訪率,實際獲得的樣本可能更少。顯然,概率抽樣的效率極低。

受訪者驅(qū)動抽樣的優(yōu)勢

那么有沒有更好的方法呢?

受訪者驅(qū)動抽樣(Respondent-Driven Sampling,下文簡稱RDS)在很大程度上能解決這種抽樣困境。RDS抽樣承襲自雪球抽樣(snow-ball sampling),先從總體中的少數(shù)成員開始調(diào)查,由已知成員推薦符合要求的新成員,然后樣本像滾雪球一樣越來越大。

雪球抽樣雖然操作簡單,但它是非概率抽樣,并非按照隨機抽樣原則來抽取樣本,失去了大數(shù)定律的存在基礎(chǔ),也就無法確定抽樣誤差,無法準確地說明樣本的統(tǒng)計值在多大程度上適合于總體。

RDS不僅具有類似雪球抽樣的易操作性,同時它又有效解決了抽樣偏誤和抽樣概率未知等問題,可以對總體情況做出相對準確的估計。

RDS抽樣的理論基礎(chǔ)源自社會網(wǎng)絡(luò)分析(social network analysis)中的小世界網(wǎng)絡(luò)(small world)理論。社會網(wǎng)絡(luò)分析是一種分析社會結(jié)構(gòu)的理論和方法,將人與人之間、群體與群體之間的聯(lián)系視為一條條連線,整個社會結(jié)構(gòu)就可以視為由各個點及其連線構(gòu)成的一張大網(wǎng)絡(luò)[i]。小世界網(wǎng)絡(luò)是指,網(wǎng)絡(luò)中大部分的節(jié)點彼此并不相連,但絕大部分節(jié)點之間經(jīng)過少數(shù)幾步就能聯(lián)系在一起。

如何科學(xué)地調(diào)研小眾人群--RDS受訪者驅(qū)動抽樣

小世界網(wǎng)絡(luò)(Small-world)

哈佛大學(xué)心理學(xué)教授斯坦利·米爾格拉姆做過一次連鎖信實驗,證明平均只需要6步就可以聯(lián)系任何兩個互不相識的美國人,這便是著名的“六度分隔理論”;而Facebook2016年公布的官方研究報告(Research At Facebook)則顯示,全球 15.9億用戶中間,僅僅隔著3.57個朋友而已。

如何科學(xué)地調(diào)研小眾人群--RDS受訪者驅(qū)動抽樣

2016年,F(xiàn)acebook上15.9億人中間,僅隔著3.57個朋友而已

弱關(guān)系的力量

提到網(wǎng)絡(luò)分析,就不能不提格蘭諾維特以及那篇令他聲名大噪的論文——《弱關(guān)系的力量》(The strength of weak ties),這篇論文是社會學(xué)史上引用率最高的論文,他本人也憑借其在網(wǎng)絡(luò)分析領(lǐng)域的杰出貢獻,作為一個社會學(xué)家,提名了諾貝爾經(jīng)濟學(xué)獎。

論文的核心觀點是:

與自己頻繁接觸的親朋好友是一種“強關(guān)系”,通過這種關(guān)系獲取到的往往是同質(zhì)性的信息;但社會上更為廣泛的是一種并不深入的人際關(guān)系(即弱關(guān)系),這種弱關(guān)系能夠使個體獲得通過強關(guān)系無法獲取到的信息,從而在工作和事業(yè)上、在信息的擴散上起到?jīng)Q定作用[ii]。

如何科學(xué)地調(diào)研小眾人群--RDS受訪者驅(qū)動抽樣

強關(guān)系與弱關(guān)系

RDS抽樣依據(jù)社會網(wǎng)絡(luò)理論認為,個人總是生活在一定的網(wǎng)絡(luò)之中,一旦我們知道了這些亞文化群體或者小眾群體的社會網(wǎng)絡(luò)構(gòu)成情況,那么我們也就能對總體人口的特征有一個比較清晰的認識。

RDS方法與常規(guī)抽樣方法的最大區(qū)別在于:常規(guī)抽樣方法是先從界定清晰的總體中抽取出一定數(shù)量的有代表性的樣本,然后根據(jù)樣本情況直接估計總體的參數(shù);而在RDS方法中,總體是尚不清晰的,從總體的社會網(wǎng)絡(luò)中抽取樣本,先估計樣本所在社會網(wǎng)絡(luò)的情況,然后再根據(jù)網(wǎng)絡(luò)情況來推斷總體的情況[iii]。

如何科學(xué)地調(diào)研小眾人群--RDS受訪者驅(qū)動抽樣

常規(guī)抽樣方法與RDS方法的差異

 

RDS抽樣的具體操作方法

  • 第一、研究者先任意找到幾個符合調(diào)查要求的目標用戶,這幾個目標用戶是我們的“種子”,研究者對種子進行調(diào)查,并給他們發(fā)放物質(zhì)獎勵作為酬謝,這就是調(diào)查的起始輪次(wave 0)。
  • 第二,研究者給種子發(fā)放一定數(shù)量的調(diào)查券,調(diào)查券上必須標明新受訪者的編號(在推算子群體在總體中所占比例會用到),讓種子把這些調(diào)查券發(fā)給自己認識的、符合調(diào)查要求的目標用戶,并承諾:只要得到調(diào)查券的人接受調(diào)查,不僅接受調(diào)查的人會得到物質(zhì)獎勵,推薦他來的種子也會因為推薦新人而得到額外獎勵。
  • 第三,研究者確認持首輪調(diào)查券來接受調(diào)查的人是否屬于目標用戶,如果符合,就對其進行調(diào)查,調(diào)查后給他們發(fā)放獎勵,同時給招募他們的種子發(fā)放獎勵。這是研究的第一輪次(wave 1)。
  • 第四,研究者給每一個第一輪受訪者發(fā)放同樣數(shù)量的次輪調(diào)查券,并標上新一輪被調(diào)查者的編號。要求他們把調(diào)查券發(fā)給自己認識的目標群體成員,并同樣承諾會同時為持券接受調(diào)查者和招募者發(fā)放獎勵,新的受訪者還會得到招募新人和獲得獎勵的機會。
  • 第五,經(jīng)確認后調(diào)查每個持次輪調(diào)查券來接受調(diào)查的目標用戶,并獎勵受訪者及其招募人,完成第二輪次調(diào)查(wave 2)。
  • 第六,重復(fù)以上步驟,進行下一輪調(diào)查,直到達到研究設(shè)計所確定的樣本總數(shù)為止。

如何科學(xué)地調(diào)研小眾人群--RDS受訪者驅(qū)動抽樣

RDS抽樣的具體操作方法

美國社會學(xué)家赫克索恩證明了RDS抽樣方法是一個一階馬爾科夫過程(first-order Markovprocess)[iv],即樣本在招募被訪者的過程中會實現(xiàn)均衡,并與初始的種子相互獨立。此外,他的研究結(jié)論還證實了,研究者初始選擇的“種子”,并不需要刻意保持隨機性,而且使用RDS方法無需經(jīng)過太多輪次就可使樣本達到均衡。

RDS抽樣在國外已有了豐碩的研究成果,尤其在諸如艾滋病患者、性工作者等亞文化群體中。赫克索恩也曾在互聯(lián)網(wǎng)上使用RDS對在校大學(xué)生抽樣,與常規(guī)概率抽樣進行對比,并得出結(jié)論:RDS的估計值不僅合理,還可以進一步提高精確性。

總而言之,對于用戶研究來說,當我們研究的群體小眾或用戶調(diào)研參與意愿低,那么RDS不失為一種很好的替代概率抽樣的方法!

參考文獻:

1. 劉林平,范長煜,王婭. 被訪者驅(qū)動抽樣在農(nóng)民工調(diào)查中的應(yīng)用:實踐與評估[J]. 社會學(xué)研究,2015,30(02):149-173+244-245.

2. 趙延?xùn)|,Jon Pedersen. 受訪者推動抽樣:研究隱藏人口的方法與實踐[J]. 社會,2007(02):192-205+208.

3. Granovetter M S. The strength of weak ties[M]//Social networks.1977: 347-367.

4. Heckathorn D D. Respondent-driven sampling: a new approach to thestudy of hidden populations[J]. Social problems, 1997, 44(2): 174-199.

[i]趙延?xùn)|,JonPedersen.受訪者推動抽樣:研究隱藏人口的方法與實踐[J].社會,2007(02):192-205+208.

[ii]轉(zhuǎn)自維基百科:馬克·格蘭諾維特

[iii]趙延?xùn)|,JonPedersen.受訪者推動抽樣:研究隱藏人口的方法與實踐[J].社會,2007(02):192-205+208.

[iv]如果某一事件每次發(fā)生狀態(tài)轉(zhuǎn)移時,都只與上一時刻的狀態(tài)有關(guān),而與過去的狀態(tài)無關(guān),則稱此狀態(tài)轉(zhuǎn)移過程為馬爾可夫過程。

 

作者:盛少奇,網(wǎng)易UEDC用戶研究院,社會學(xué)專業(yè)背景,跟進過教育、母嬰、只能硬件等產(chǎn)品,熟悉定量研究,熱愛電影、足球和籃球

微信公眾號:網(wǎng)易UEDC

本文來源于人人都是產(chǎn)品經(jīng)理合作媒體@網(wǎng)易UEDC,作者@盛少奇

題圖來自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 錯別字

    回復(fù)
  2. “智”能硬件產(chǎn)品,錯別字不能忍

    來自上海 回復(fù)
    1. 沖這一個字我認真的看了整篇文章

      回復(fù)
    2. ?? ??

      來自浙江 回復(fù)