從入門(mén)到求職,成為數(shù)據(jù)科學(xué)家的終極指南

2 評(píng)論 2475 瀏覽 15 收藏 14 分鐘

本文作者通過(guò)分享自己的經(jīng)驗(yàn),來(lái)幫助大家了解從事數(shù)據(jù)科學(xué)這個(gè)職業(yè),一起來(lái)看看~

你想成為一名數(shù)據(jù)科學(xué)家?

很棒,說(shuō)明你是很有上進(jìn)心的人,而且對(duì)數(shù)據(jù)科學(xué)充滿(mǎn)熱情,并希望通過(guò)解決復(fù)雜的問(wèn)題為公司帶來(lái)價(jià)值。但是你在數(shù)據(jù)科學(xué)方面毫無(wú)經(jīng)驗(yàn),也不知道如何開(kāi)始。我很懂你,因?yàn)樵?jīng)我也是如此。本文就是特別針對(duì)熱情且有抱負(fù)的數(shù)據(jù)科學(xué)家,解答進(jìn)入該領(lǐng)域最常見(jiàn)的問(wèn)題和挑戰(zhàn)。

我希望通過(guò)分享我自己的經(jīng)驗(yàn),幫助你了解入科從事數(shù)據(jù)科學(xué)的職業(yè),并為你提供一些指南,讓你的學(xué)習(xí)之旅更加愉快。讓我們開(kāi)始吧!

數(shù)據(jù)科學(xué)人才缺口

根據(jù)國(guó)際數(shù)據(jù)公司(IDC)預(yù)測(cè),2020年全球大數(shù)據(jù)和業(yè)務(wù)分析收入將超過(guò)2100億美元。

根據(jù)LinkedIn 與2018年8月發(fā)布的美國(guó)勞動(dòng)力報(bào)告, 2015年美國(guó)的數(shù)據(jù)科學(xué)人才過(guò)剩。三年后,隨著越來(lái)越多公司面臨數(shù)據(jù)科學(xué)技能人才的短缺,這一趨勢(shì)發(fā)生了巨大變化。越來(lái)越多的公司開(kāi)始使用大數(shù)據(jù)得出分析見(jiàn)解和制定決策。

從經(jīng)濟(jì)角度講,這完全取決于供需關(guān)系。

好消息是:形勢(shì)以及發(fā)生了轉(zhuǎn)變。壞消息是:隨著數(shù)據(jù)科學(xué)領(lǐng)域的就業(yè)機(jī)會(huì)不斷增加,但很多有抱負(fù)的數(shù)據(jù)科學(xué)家由于技能不符合市場(chǎng)的需求,而難以找到心儀的工作。

在接下來(lái)的部分中,你將看到該如何提高數(shù)據(jù)科學(xué)技能,從而在大量求職者中脫穎而出,最終收獲夢(mèng)想的工作。

終極指南

1. 需要哪些技能以及如何掌握?

說(shuō)實(shí)話(huà),要掌握數(shù)據(jù)科學(xué)領(lǐng)域所有技能幾乎是不可能的,因?yàn)榉秶珡V了??傆幸恍┘夹g(shù)是數(shù)據(jù)科學(xué)家沒(méi)有掌握的,因?yàn)椴煌臉I(yè)務(wù)需要不同的技能。但有一些核心技能是數(shù)據(jù)科學(xué)家所必須掌握的。

技術(shù)能力,數(shù)學(xué)和統(tǒng)計(jì)學(xué),編程和商業(yè)知識(shí)。盡管無(wú)論使用何種語(yǔ)言,編程能力都是必備的。作為數(shù)據(jù)科學(xué)家,我們應(yīng)該運(yùn)用商業(yè)溝通能力想企業(yè)高層說(shuō)明模型結(jié)果,同時(shí)基于數(shù)學(xué)和統(tǒng)計(jì)學(xué)的支持。

(1)數(shù)學(xué)和統(tǒng)計(jì)學(xué)

關(guān)于數(shù)學(xué)和統(tǒng)計(jì)學(xué),可以查看Randy Lao的相關(guān)文章,當(dāng)中的資源非常豐富。

https://medium.com/@randylaosat

當(dāng)我剛開(kāi)始學(xué)習(xí)數(shù)據(jù)科學(xué)時(shí),我讀了這本書(shū) An Introduction to Statistical Learning?—?with Applications in R(統(tǒng)計(jì)學(xué)習(xí)導(dǎo)論 – 與R中的應(yīng)用)。我強(qiáng)烈推薦這本書(shū)給初學(xué)者,因?yàn)楸緯?shū)側(cè)重于統(tǒng)計(jì)建模和機(jī)器學(xué)習(xí)的基本概念,并提供詳細(xì)而直觀(guān)的解釋。如果你特別喜歡數(shù)學(xué),也許你更喜歡這本書(shū):The Elements of Statistical Learning(統(tǒng)計(jì)學(xué)習(xí)中的元素)。

(2)編程

關(guān)于學(xué)習(xí)編程,特別是對(duì)于沒(méi)有經(jīng)驗(yàn)的初學(xué)者,我建議專(zhuān)注于學(xué)習(xí)一種語(yǔ)言,我個(gè)人更喜歡Python,因?yàn)镻ython更容易學(xué)習(xí)。關(guān)于Python或R哪種語(yǔ)言更好一直都存在爭(zhēng)論,我個(gè)人認(rèn)為重點(diǎn)應(yīng)放在如何幫助企業(yè)解決問(wèn)題,而不是使用哪種語(yǔ)言。

(3)商業(yè)知識(shí)

最后,我要強(qiáng)調(diào)的是對(duì)商業(yè)知識(shí)的理解也是至關(guān)重要的。

(4)軟技能

事實(shí)上,軟技能比硬技能更重要。在LinkedIn詢(xún)問(wèn)了2000名商業(yè)領(lǐng)袖,我們發(fā)現(xiàn)2018年他們最希望員工具備的軟技能包括:領(lǐng)導(dǎo)力、溝通能力、合作能力和時(shí)間管理能力。我認(rèn)為這些軟技能在數(shù)據(jù)科學(xué)家的日常工作中起著至關(guān)重要的作用。

2. 如何選擇合適的訓(xùn)練營(yíng)和在線(xiàn)課程?

隨著人工智能和數(shù)據(jù)科學(xué)的興起,大量課程課程、訓(xùn)練營(yíng)如雨后春筍般涌現(xiàn),都不希望錯(cuò)失良機(jī)。

因此問(wèn)題來(lái)了,該如何選擇適合你的學(xué)習(xí)資源呢?

我的選擇方法如下:

沒(méi)有一門(mén)課程能涵蓋你需要的所有資源。有些課程在某些方面是重疊的,因此不值得花錢(qián)購(gòu)買(mǎi)不同但有重復(fù)性的課程。

首先要知道你需要學(xué)什么。不要因?yàn)榛ㄉ诤臀说臉?biāo)題就盲目選擇課程。通過(guò)查看求職網(wǎng)站上數(shù)據(jù)科學(xué)家的職位描述,你會(huì)發(fā)現(xiàn)一些公司需要的通用技能。然后通過(guò)了解自己缺乏的技能去搜索相應(yīng)課程。

比較不同平臺(tái)提供的優(yōu)質(zhì)課程。類(lèi)比幾個(gè)課程,并且查看其他人的評(píng)論(非常重要!)。另一方面,Coursera、Udemy、Lynda、Codecademy、DataCamp、Dataquest等平臺(tái)也提供許多免費(fèi)課程。

以下是我個(gè)人特別喜歡的一些課程:

  1. Machine Learning ,主講人: Coursera的聯(lián)合創(chuàng)始人吳恩達(dá)
  2. Python for Data Science and Machine Learning Bootcamp,主講人 :Jose Portilla
  3. Deep Learning A-Z?: Hands-On Artificial Neural Networks,主講人: Kirill Eremenko,Hadelin de Ponteves
  4. Python for Data Science Essential Training ,主講人:Lillian Pierson
  5. The Ultimate Hands-On Hadoop?—?Tame your Big Data,主講人:Frank Kane

3. 能否通過(guò)開(kāi)源學(xué)習(xí)成為數(shù)據(jù)科學(xué)家?

我想說(shuō)的是,通過(guò)開(kāi)源學(xué)習(xí)足以讓你開(kāi)始從事數(shù)據(jù)科學(xué),之后可以根據(jù)業(yè)務(wù)需求進(jìn)一步發(fā)展自己的職業(yè)生涯。

4.對(duì)于零基礎(chǔ)的初學(xué)者有什么推薦的書(shū)籍嗎?

沒(méi)有固定的學(xué)習(xí)途徑,條條大路通羅馬。閱讀相關(guān)書(shū)籍是掌握基礎(chǔ)知識(shí)的良好。注意不要試圖去記憶具體的數(shù)學(xué)和算法細(xì)節(jié),因?yàn)楫?dāng)應(yīng)用于實(shí)際問(wèn)題進(jìn)行編程時(shí),你可能會(huì)忘記這些內(nèi)容。你只需了解一定的基礎(chǔ)知識(shí),并繼續(xù)學(xué)習(xí),要?jiǎng)?wù)實(shí)。不要試圖完全了解所有知識(shí),因?yàn)橛袝r(shí)完美主義會(huì)給你的學(xué)習(xí)拖后腿。

關(guān)于Python、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的基礎(chǔ)知識(shí),我推薦以下書(shū)籍:

  1. Learning Python
  2. Python for Data Analysis
  3. An Introduction to Statistical Learning
  4. Machine Learning for Absolute Beginners
  5. Python Machine Learning
  6. Python Data Science Handbook
  7. Introduction to Machine Learning with Python
  8. Deep Learning with Python
  9. Deep Learning with Keras

5. 如何在理解商業(yè)問(wèn)題和提高技術(shù)技能之間取得平衡?

在理解商業(yè)問(wèn)題和制定解決方案之前,我首先去提高自己的技術(shù)技能。

商業(yè)問(wèn)題在于”是什么”和”為什么”。要解決商業(yè)問(wèn)題,首先必須解決問(wèn)題,而技術(shù)技能是注重于”怎么做”。我的建議主要基于個(gè)人經(jīng)驗(yàn)。

6.如何克服開(kāi)啟數(shù)據(jù)科學(xué)家職業(yè)生涯的挑戰(zhàn)?

對(duì)于許多數(shù)據(jù)科學(xué)家來(lái)說(shuō),主要挑戰(zhàn)就是數(shù)據(jù)科學(xué)是信息的海洋。我們可能失去方向,因?yàn)橛刑嗟慕ㄗh和資源,大量的在線(xiàn)課程、研討會(huì)等等,你需要保持專(zhuān)注,知道你擁有什么,你需要什么。

在我的數(shù)據(jù)科學(xué)歷程中,我主要通過(guò)這些方法克服這些挑戰(zhàn):

(1)有效地篩選學(xué)習(xí)資源

在剛開(kāi)始時(shí),我因?yàn)榇罅康馁Y源感到困惑。通過(guò)聽(tīng)數(shù)據(jù)科學(xué)家的播客,閱讀如何開(kāi)啟數(shù)據(jù)科學(xué)領(lǐng)域的文章,嘗試不同在線(xiàn)課程。最終我關(guān)注我在本文中分享的這些優(yōu)質(zhì)資源。

(2)不要放棄

當(dāng)學(xué)習(xí)過(guò)程太過(guò)艱難時(shí),我開(kāi)始懷疑自己,我真的有能力做到嗎?我追求的道理是正確的嗎?最終對(duì)數(shù)據(jù)科學(xué)的熱情和耐心讓我重新開(kāi)始,繼續(xù)不斷努力和前行。

(3)獲得數(shù)據(jù)科學(xué)相關(guān)的工作

由于就業(yè)市場(chǎng)競(jìng)爭(zhēng)激烈,找到心儀的數(shù)據(jù)科學(xué)工作對(duì)我來(lái)說(shuō)并非易事。我提交了大量的簡(jiǎn)歷都毫無(wú)結(jié)果。因此我開(kāi)始改進(jìn)找工作的方法,參加聚會(huì)和研討會(huì),在網(wǎng)上分享我的學(xué)習(xí)經(jīng)歷,在招聘會(huì)上于潛在雇主接觸等等。

7. 如何有效地在簡(jiǎn)歷中加入自己的工作經(jīng)驗(yàn),從而提高被錄用的幾率?

這是一種誤解,你并不能通過(guò)簡(jiǎn)歷中的經(jīng)驗(yàn)就被聘用。事實(shí)上,簡(jiǎn)歷是面試的敲門(mén)磚。

因此,學(xué)習(xí)如何寫(xiě)簡(jiǎn)歷對(duì)于獲得面試機(jī)會(huì)至關(guān)重要。研究表明,招聘人員在確定求職者是否適合該職位時(shí),平均看簡(jiǎn)歷的時(shí)間僅為6秒。

關(guān)于完善簡(jiǎn)歷,我推薦以下網(wǎng)站和文章:

  1. Vault
  2. TopResume
  3. Optimize Guide
  4. A Resume Expert Gives Career Advice
  5. https://www.facebook.com/businessinsider/videos/10153537949019071/
  6. How to Pass the 6-Second Resume Test
  7. https://www.topresume.com/career-advice/how-to-pass-the-6-second-resume-test
  8. How to tailor your Academic CV for Data Science roles
  9. https://www.linkedin.com/pulse/how-tailor-your-academic-cv-data-science-roles-jason-byrne/?trackingId=3ykuEpfW%2BISNc%2Fx9YFbIZQ%3D%3D
  10. What do Hiring Managers Look For in a Data Scientist’s CV?
  11. https://www.linkedin.com/pulse/what-do-hiring-managers-look-data-scientists-cv-ben-dias/
  12. The 14 Things You Need On Your Resume To Land Your Dream Job
  13. https://www.elitedaily.com/money/14-signs-you-have-a-strong-resume/617472

8. 怎樣的作品集能幫助我們找到第一數(shù)據(jù)科學(xué)或機(jī)器學(xué)習(xí)方面的工作?

簡(jiǎn)歷是不夠的,你還需要作品集的支撐。在看了簡(jiǎn)歷之后,招聘人員希望更多地了解你的背景,這時(shí)就需要作品集了。

可以試著在社交媒體平臺(tái)分享自己的學(xué)習(xí)經(jīng)歷,寫(xiě)文章和做播客都是不錯(cuò)的選擇。

更多資源?

學(xué)習(xí)平臺(tái) :Towards Data Science, Quora, DZone, KDnuggets, Analytics Vidhya, DataTau, fast.ai

推薦視頻:Webinars——Data Science Office Hours, Data Science Connect, Humans of Data Science (HoDS)

推薦文章:

  1. A Badass’s Guide to Breaking Into Data
  2. http://www.data-mania.com/blog/guide-to-breaking-into-data/
  3. 10 Must Have Data Science Skills
  4. https://www.kdnuggets.com/2016/05/10-must-have-skills-data-scientist.html?utm_content=buffer7c1a3&utm_medium=social&utm_source=linkedin.com&utm_campaign=buffer
  5. My Data Science & Machine Learning, Beginner’s Learning Path
  6. https://www.linkedin.com/pulse/my-data-science-machine-learning-beginners-path-vin-vashishta/?trackingId=J16vYmqLQEZ5wr4oElpnNA%3D%3D
  7. 24 Ultimate Data Science Projects To Boost Your Knowledge and Skills
  8. https://www.analyticsvidhya.com/blog/2018/05/24-ultimate-data-science-projects-to-boost-your-knowledge-and-skills/

值得關(guān)注的數(shù)據(jù)科學(xué)家

LinkedIn上的數(shù)據(jù)科學(xué)社區(qū)非常棒,以下是我認(rèn)為值得關(guān)注的數(shù)據(jù)科學(xué)家和專(zhuān)業(yè)人士:

  1. Randy Lao
  2. Kyle McKiou
  3. Favio Vázquez
  4. Vin Vashishta
  5. Eric Weber
  6. Sarah Nooravi
  7. Kate Strachnyi
  8. Tarry Singh
  9. Karthikeyan P.T.R.
  10. Megan Silvey
  11. Imaad Mohamed Khan
  12. Andreas Kretz
  13. Andriy Burkov
  14. Carla Gentry
  15. Nic Ryan
  16. Beau Walker

結(jié)語(yǔ)

希望本文能夠解決你的問(wèn)題。每當(dāng)你在數(shù)據(jù)科學(xué)旅程中遇到任何障礙,快要放棄時(shí)請(qǐng)記住,堅(jiān)持是關(guān)鍵。

 

作者:Admond Lee

翻譯:Mika

本文由 @Mika 翻譯發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來(lái)自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 初學(xué)者考CDA證,有用嗎

    來(lái)自江蘇 回復(fù)
    1. 有用的,能考下來(lái)說(shuō)明基礎(chǔ)就已經(jīng)具備了

      來(lái)自北京 回復(fù)