線上調研數據處理的四個原則

3 評論 9965 瀏覽 35 收藏 5 分鐘

在進行線上調研的時候,注意以下四個原則,可以幫助你少走彎路,少踩坑。

通過線上調研的方式收集的數據,因其調研方法有別于傳統的面對面調研,所以在進行數據處理分析時需要額外注意一些細節。

原則一:數據完整

在線調研的數據,是通過網頁或手機app收集而來,難免會存在因為瀏覽器插件、安全軟件、不兼容等因素導致的數據丟失情況。因此在調研上線前首先要進行測試,多嘗試幾種瀏覽器進行測試,看能否正常遞交數據;其次,在分析數據時,首先要進行數據完整性檢查,包括是否有漏答、跳題邏輯是否正確,否則你可能會在報告寫到一半時,發現數據有缺失。

原則二:數據干凈

在線調研不可避免會存在亂答題的情況,如果亂答題的人太多,容易影響數據質量,所以在檢查了數據完整性后,需要對數據進行清洗,可以從以下幾個方面進行:

  • 答題時長,一方面可以邀請幾個同事進行試填答,做好計時,另一方面可以計算平均(去掉極端值)答題時間,也可以考慮一個成年人的閱讀字數來計算參考,以上述幾個時間都可以作為標準來進行清洗。另外,答題時間太久了也需要清洗掉。(注意不同邏輯條件下,用戶回答的問題數可能會不一樣,需要考慮此方面)
  • 填空題答題質量,填空題的內容能反映出一個填答者的態度,如果很敷衍、甚至亂答的,可以進行剔除;
  • 題目或選項之間隱藏邏輯,比如:年齡25歲以上,還說自己在讀高中;個人年收入大于家庭年收入;同時選擇了兩個明顯互相矛盾的選項;
  • 選項個數,所有多選題的選項都只選1個,尤其是明顯不是一個答案的選擇題(比如,你知道哪些洗發水品牌);
  • 矩陣題(表格形式)都選同一個選項的;
  • 建議在問卷設計時,設置1-2個可以進行驗證的地雷題,以便篩選出去那些不認真填答的人;(如:前面題目詢問家中擁有的設備,如汽車、ipad。。。,后面題目詢問家中是否有私家車);

原則三:數據代表性

問卷數據一般是通過抽樣調查的方式獲得,因此抽樣方法不一樣,回收回來的數據代表性意義也不一樣;如果是隨機抽樣(受限于各種條件,一般無法做到真正意義上的隨機抽樣),則回收的數據可以認為具有代表性-能代表總體;若采用分層抽樣(如分地區各抽取10萬用戶),這樣的抽樣獲得的數據,由于事先進行了樣本配比,所以其不能代表總體,在結果統計時,需要對不同地區的樣本進行加權(權重可以參考不同地區用戶的實際占比)處理。

原則四:數據處理過程可回溯

在進行數據檢查、清洗的過程中,往往需要進行多步驟操作,難免發生在處理的過程中出錯的情況,因此需要在一些關鍵步驟上進行數據保存,并進行備注,以防止需要回溯的情況;在編寫查錯程序時,也要將程序保存下來,防止出錯,也方便進行反查;

在線調研數據處理時要特別注意上述原則,能讓你的工作更有效率、少走彎路。(什么,你們有DP?那這篇文章你就當看看熱鬧?。?/p>

 

作者:李兆平

來源:http://ued.ctrip.com/?p=5614

題圖來自unsplash,基于CC0協議

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 這篇文章,需要再改進,數據完整其實可以提出一些實際的案例來支撐,剩余的三個觀點也都可以利用實際的案例來支撐。這樣就更有價值了

    來自河南 回復
  2. 寫的什么幾把

    回復
    1. 哈哈哈,這個評論可還行,但是我們還是支持一下作者,畢竟他們愿意寫東西出來

      來自河南 回復