【干貨】從網易產品經理筆試,教你如何做數據估算題

35 評論 82330 瀏覽 738 收藏 8 分鐘

2016年網易產品實習中,有這么一道數據估算題:

估算今年全國通過網絡參加考研培訓的人數?

這類題型主要考察:

  1. 邏輯思維能力:遇到問題能否清晰有條理。
  2. 數據能力:對數據的關注度,是否重視日常的數據。
  3. 細節把握能力:是否注意分析中的細節,結合實際情況去細化

001

要點:

  • 準確的數據越多,估算越有根據,也體現了應聘者對數據的重視。
  • 漏斗模型,注意每個環節的人員流失率。環節考慮的越多,對問題的分析也更加透徹。
  • 用戶分類和畫像。盡量結合用戶的使用場景,對用戶進行分類,這樣數據也更貼合實際情況。
  • 思路比結果重要。最終的數據可能不在一個級別,但是在有多種方案的情況下,通過不同方案的比較大致可以估算出一個量級??疾斓闹攸c是思維。

本題解答思路(供參考):

步驟1:做加法

(本階段不求正確,多多益善)

尋找準確能夠獲得的數據,從不同維度來尋找數據,類似頭腦風暴:

1.?提取關鍵字法:

可以通過去掉其中的一些形容詞,提取關鍵字來聯想

全國+考研:今年全國考研人數

網絡+培訓:今年全國網絡培訓機構數,機構收入數,培訓人數

2.?從人、地點、時間、錢幾個維度來尋找線索。

  • 人:考研的人數,培訓老師的人數
  • 地點:高校數,機構數
  • 錢:在線教育交易額,客單價。

3. 從提供端和需求端兩個維度

提供端考慮:機構數,機構老師數。需求端:課程數,學生數。

002

步驟2:做減法

從步驟1提取自己較為熟悉的數據且和目標數據相關度更明顯的數據。目標事件為考研培訓,直接參與的主體是教師和學生,我們不妨通過教師數目和學生數目來突破。

步驟3:方案分析

本例提取考研學生報名數:170萬,大學教師數150萬

3.1 由培訓教師來計算

考研科目的培訓主要集中在外語,數學,政治等科目。

英語教師、數學教師、政治教師累計占比:

一本院校:

計130所,平均每個學校英語(含小語種)教師60名,數學教師(基礎數學)按50人計,政治教師按40人計。每個老師平均按30個學生計,可以帶學生,考慮到學生實際可能一個人報3門課,平均每人按報1.5門課計。平均每一百個老師有3個做培訓。

得到:130x(60+50+40)x30x3%/1.5=1.17w

二本院校:

750所,平均每個學院英語老師(含小語種)教師35人,政治教師30名,數學教師計30人,每個老師平均按20個學生計(教師影響力認為比一類院校差),可以帶學生,考慮到學生實際可能一個人報3門課,平均每人按報2門課計(認為二本院校學生培訓需求相對較強)。平均每一百個老師有5個做培訓(認為二本院校教師時間相對充裕)。

得到:750x(35+30+20)x20x5%/2=3.18w

方案2合計:1.17w+3.18w=4.35w

3.2 由考研學生來計算

按大學來分:一本院校研學生占總考研人數比50%,由于資源相對較多,集中在線下培訓,其中參加線上考研培訓的比例按1%計,二本院??佳腥藬嫡伎偪佳腥藬当劝?0%計算,參加線上考研培訓占考研人數的比例按3%計算,三本考研人數較少占總考研人數比計10%,參加線上培訓的占考研人數比例計2%。

計算結果:170w x(0.5×0.01+0.40×0.03+0.10×0.02)=3.23w

步驟三 計算過程中的要點

要點1:漏斗模型:

每經過一個環節,數據都會打折,留存的百分比直接相乘得到結果。

方案1漏斗模型:

003

在頂端數據確定的情況下,漏斗本身實際存在的環節越多最終的誤差越大,分析時選擇的環節越多,數據越接近真實數據。最終的結果為漏斗底部數據乘以各個環節的留存百分比。

要點2:通過用戶畫像對用戶進行細分。

根據學生考研院校的不同,分為一類本科和二類本科,根據教師所教的課程不同對教師進行分類。分類原因是因為這些不同的用戶在不同的漏斗環節具有不同的流失率,有利于數據更加準確。本例在答題時間充裕以及對考研情況非常了解的情況下,學生可以繼續細分為不同專業的學生,不同收入水平的學生,對于政治教師可以繼續根據教師的方向分類,例如和考研相關的馬克思主義理論教師從事培訓的比例相對較高,可以和其他方向分開計算。甚至可以根據年齡進行細分,有經驗的較年長的老師可能參加培訓的比例更高等。

步驟四:交叉驗證

本例中兩種計算方案最終數據大致相當,得到了一定的驗證。

總結

004

主要的思路和流程如上圖:以上簡要介紹了產品筆試面試中常遇到的估算題。最終的數據不一定可靠,但是思路是大致一樣的。功夫在平時,我們只有多關注數據,平時有意識對用戶進行細分,才能更好的鍛煉思維。

 

作者:孫輝(微信號huihuishengwei),在校研究生,產品愛好者,創業團隊產品經理

本文由 @孫輝 原創發布于人人都是產品經理。未經許可,禁止轉載。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 你這思路有問題,人家問的是參加網絡培訓

    來自浙江 回復
  2. 170萬是16年考研人數,首先應該是考慮參加培訓的人數占比吧(有一部分是完全自學的,屬于流失),再才是用戶細分,然后考慮線下培訓與網絡培訓各自占比,,,一點個人想法

    來自湖北 回復
  3. 看完題目,我想我是不是要轉行。

    來自湖北 回復
  4. 我有一個問題:3.2中,170萬是學生總人數,(0.5×0.01+0.40×0.03+0.10×0.02)中,0.5、0.4、0.1分別是一本、二本、三本中考研的人數百分比,但是括號中并沒有一本、二本、三本占總考研人數的百分比~

    來自北京 回復
    1. 170萬是16年考研報名人數,你去查一下就知道了

      來自湖北 回復
  5. 補充一下:剛剛的疑問針對3.1方法

    來自江蘇 回復
    1. 我也發現這個沒體現出網絡這個關鍵詞呀,不過作者的思路還是值得借鑒的

      來自北京 回復
  6. 寫的挺好的,有個疑問,你這里是不是沒加入“網絡”這個關鍵詞???不是問通過網絡參加考研培訓的人數嗎?

    來自江蘇 回復
    1. 是的。。。所以感覺有點虛?

      來自北京 回復
    2. 這寫的有問題

      來自浙江 回復
  7. 個人的思路:先得出16年本科畢業人數、考研人數。假設本科畢業人數為76w,考研人數為170w(網上找到的數據)。得出平均100個畢業生有20個考研的比率。通過市場調查隨機20個考研生的網絡培訓比例(可以調查2、3組,建立角色畫像)。假設3組20個研究生的線上培訓平均為65%(用戶畫像進行分類,這里可以對城市不同進行細節分類),那么大概可以估算170w考研學生有大概110w個參加網絡考研培訓。不知是否正確。

    來自廣東 回復
    1. 100個畢業生20個考研的,這咋得出來的?除了應屆考研,還有往屆的(二戰三戰…N戰的)、社會人士考研的。

      來自湖北 回復
  8. 筆試完看見這個,哎,早看到會好很多

    回復
  9. 思路開拓了不少,滿滿干貨!

    來自浙江 回復
  10. 看完題目一臉蒙蔽,后天就要筆試了,有沒有大神可以線上指導

    回復
  11. 類似的題目還有估算一個城市的出租車公交車數量啦,估算全國打某個游戲的用戶總數啦之類的都可以納入到答主的這個解決體系里面來。概括一下答主的思路大概就是細化問題+層層抽樣,從一個部分來估算整體,分了幾層之后做抽樣調查比整體就快捷多了。

    來自江蘇 回復
  12. 思路挺好的,估計實際操作中需要比較準確的用戶調研。 ??

    來自廣東 回復
  13. 費米推理法。作者思路方向絕對是很棒的,不過那些各科目教師參與培訓比率和學生平均報1.5門科目這些數據的獲取確實缺少調研,來自于經驗吧,需要進一步論證,或者換個方向。

    來自河南 回復
  14. 我最后做這個題的時候只有十分鐘,寫了5行左右就沒有時間了,也沒有寫完。我當時是想從宏觀層面,如歷年的研究生報名人數,錄取人數,網絡用戶占比等。但是這樣的數據又沒有辦法查閱,所以如果自己去估計數據的話估計更加離譜。所以樓主的估算方法還是有不錯的價值的

    來自湖北 回復
  15. 查查四年前和五年前的本科錄取人數,得出一個增長率,再查查去年的考研人數,乘以增長率,就得出今年的考研人數了

    來自江蘇 回復
  16. 你這個,隨便一個數據估算錯誤,差距就大了。比如,平均每人按報1.5門課,這個數據確定?平均每一百個老師有5個做培訓,憑什么?這種數據都是在YY啊,沒有任何科學依據。而且,參加培訓的人數,和培訓教師的人數,也沒關系吧!

    來自重慶 回復
    1. 是的,結果很不精確。培訓教師的數目,是來作為量級參考的。

      來自湖北 回復
    2. 問題是幾乎每一個參考系數都是YY的,何來自信量級能正確?

      來自北京 回復
    3. 你們是腦子不好使吧?做校招筆試哪來的精確數據?出這種題考察的根本就不是你能不能精準的算的對,因為根本不可能有人算的對。別人是要考你在計算過程中每一步是不是符合邏輯,有沒有把該剔除的去掉該保留的保留。最后得出的數據根本就不重要。這里一個阿貓一個qingtongli一直糾結數據準確性,是學數學學傻了?

      來自廣西 回復
  17. 這個思路不敢茍同

    來自上海 回復
  18. 你這個整的太復雜了,一上來哪有這么多時間,其實這里面只需要關注2014年,2015年的4個數據就行了。分別是2014、2015年的在大學本科畢業生的總人數,參加考研的人數,錄取人數,參加網絡培訓的總人數(發放一份調研問卷,調研一下已經考上研究生的同學,他們有多少人參加的網絡培訓,得到一個百分比)。通過2104,2015本科畢業生的總人數,參加考研的人數,錄取人數,參加網絡培訓的總人數這四組數據,分別得到四個百分比,得到他們之間的一個關系,然后查閱一下2016年將要畢業的大學本科畢業有多少人,通過2014年,2015年的比較數據就能比較精確的得到2016年大概會有多少同學會參加網絡在線培訓。說說你分析的問題,大學教師的多少和考研人數的多少沒得半毛錢關系,一個班50人也是教,40人也是教。你所說的占比1%,2%的依據是什么,數據可靠嗎?你怎么去統計這部分數據,所以你這里面沒有考慮數據統計的正確性,既然這樣的話,你得到的數據的可靠性就會很差,說白了,一堆很水的數據。所以結論就是好木匠不一定要用尺子,好司機開車的時候不是還要背交通法規。

    來自北京 回復
    1. 謝謝關注。1%是根據個人經驗,是沒有依據。你說的方法挺好的,可是可能沒有往年的網絡在線考研培訓數據。

      來自湖北 回復
    2. 不明白層主說的四個百分比得出他們之間的關系是什么意思。

      ——還有實際上是調研前三年的數據。不僅要算增長率來推算數值。還要考慮增長率變化值。

      來自北京 回復
    3. 層主你這個直接拿到往年參加網絡培訓的總人數就是開啟作弊模式了好嘛。。。這樣的話直接比例就出來了,不符合這道題的初衷了吧。

      來自江蘇 回復
  19. ? ? 最后做這題的時候只有3分鐘了 ??

    來自江蘇 回復
    1. 時間規劃和進度控制也是產品人重要的能力,拿到題目后可以大致估算一下每個題花的時間,控制好節奏。 ??

      來自香港 回復
  20. 完全沒答對,主要是時間根本不夠 ?? ?? ??

    來自江蘇 回復
    1. 沒有標準答案,主要是思路。 ??

      來自香港 回復