從入門(mén)到求職,成為數(shù)據(jù)科學(xué)家的終極指南
本文作者通過(guò)分享自己的經(jīng)驗(yàn),來(lái)幫助大家了解從事數(shù)據(jù)科學(xué)這個(gè)職業(yè),一起來(lái)看看~
你想成為一名數(shù)據(jù)科學(xué)家?
很棒,說(shuō)明你是很有上進(jìn)心的人,而且對(duì)數(shù)據(jù)科學(xué)充滿(mǎn)熱情,并希望通過(guò)解決復(fù)雜的問(wèn)題為公司帶來(lái)價(jià)值。但是你在數(shù)據(jù)科學(xué)方面毫無(wú)經(jīng)驗(yàn),也不知道如何開(kāi)始。我很懂你,因?yàn)樵?jīng)我也是如此。本文就是特別針對(duì)熱情且有抱負(fù)的數(shù)據(jù)科學(xué)家,解答進(jìn)入該領(lǐng)域最常見(jiàn)的問(wèn)題和挑戰(zhàn)。
我希望通過(guò)分享我自己的經(jīng)驗(yàn),幫助你了解入科從事數(shù)據(jù)科學(xué)的職業(yè),并為你提供一些指南,讓你的學(xué)習(xí)之旅更加愉快。讓我們開(kāi)始吧!
數(shù)據(jù)科學(xué)人才缺口
根據(jù)國(guó)際數(shù)據(jù)公司(IDC)預(yù)測(cè),2020年全球大數(shù)據(jù)和業(yè)務(wù)分析收入將超過(guò)2100億美元。
根據(jù)LinkedIn 與2018年8月發(fā)布的美國(guó)勞動(dòng)力報(bào)告, 2015年美國(guó)的數(shù)據(jù)科學(xué)人才過(guò)剩。三年后,隨著越來(lái)越多公司面臨數(shù)據(jù)科學(xué)技能人才的短缺,這一趨勢(shì)發(fā)生了巨大變化。越來(lái)越多的公司開(kāi)始使用大數(shù)據(jù)得出分析見(jiàn)解和制定決策。
從經(jīng)濟(jì)角度講,這完全取決于供需關(guān)系。
好消息是:形勢(shì)以及發(fā)生了轉(zhuǎn)變。壞消息是:隨著數(shù)據(jù)科學(xué)領(lǐng)域的就業(yè)機(jī)會(huì)不斷增加,但很多有抱負(fù)的數(shù)據(jù)科學(xué)家由于技能不符合市場(chǎng)的需求,而難以找到心儀的工作。
在接下來(lái)的部分中,你將看到該如何提高數(shù)據(jù)科學(xué)技能,從而在大量求職者中脫穎而出,最終收獲夢(mèng)想的工作。
終極指南
1. 需要哪些技能以及如何掌握?
說(shuō)實(shí)話(huà),要掌握數(shù)據(jù)科學(xué)領(lǐng)域所有技能幾乎是不可能的,因?yàn)榉秶珡V了??傆幸恍┘夹g(shù)是數(shù)據(jù)科學(xué)家沒(méi)有掌握的,因?yàn)椴煌臉I(yè)務(wù)需要不同的技能。但有一些核心技能是數(shù)據(jù)科學(xué)家所必須掌握的。
技術(shù)能力,數(shù)學(xué)和統(tǒng)計(jì)學(xué),編程和商業(yè)知識(shí)。盡管無(wú)論使用何種語(yǔ)言,編程能力都是必備的。作為數(shù)據(jù)科學(xué)家,我們應(yīng)該運(yùn)用商業(yè)溝通能力想企業(yè)高層說(shuō)明模型結(jié)果,同時(shí)基于數(shù)學(xué)和統(tǒng)計(jì)學(xué)的支持。
(1)數(shù)學(xué)和統(tǒng)計(jì)學(xué)
關(guān)于數(shù)學(xué)和統(tǒng)計(jì)學(xué),可以查看Randy Lao的相關(guān)文章,當(dāng)中的資源非常豐富。
https://medium.com/@randylaosat
當(dāng)我剛開(kāi)始學(xué)習(xí)數(shù)據(jù)科學(xué)時(shí),我讀了這本書(shū) An Introduction to Statistical Learning?—?with Applications in R(統(tǒng)計(jì)學(xué)習(xí)導(dǎo)論 – 與R中的應(yīng)用)。我強(qiáng)烈推薦這本書(shū)給初學(xué)者,因?yàn)楸緯?shū)側(cè)重于統(tǒng)計(jì)建模和機(jī)器學(xué)習(xí)的基本概念,并提供詳細(xì)而直觀(guān)的解釋。如果你特別喜歡數(shù)學(xué),也許你更喜歡這本書(shū):The Elements of Statistical Learning(統(tǒng)計(jì)學(xué)習(xí)中的元素)。
(2)編程
關(guān)于學(xué)習(xí)編程,特別是對(duì)于沒(méi)有經(jīng)驗(yàn)的初學(xué)者,我建議專(zhuān)注于學(xué)習(xí)一種語(yǔ)言,我個(gè)人更喜歡Python,因?yàn)镻ython更容易學(xué)習(xí)。關(guān)于Python或R哪種語(yǔ)言更好一直都存在爭(zhēng)論,我個(gè)人認(rèn)為重點(diǎn)應(yīng)放在如何幫助企業(yè)解決問(wèn)題,而不是使用哪種語(yǔ)言。
(3)商業(yè)知識(shí)
最后,我要強(qiáng)調(diào)的是對(duì)商業(yè)知識(shí)的理解也是至關(guān)重要的。
(4)軟技能
事實(shí)上,軟技能比硬技能更重要。在LinkedIn詢(xún)問(wèn)了2000名商業(yè)領(lǐng)袖,我們發(fā)現(xiàn)2018年他們最希望員工具備的軟技能包括:領(lǐng)導(dǎo)力、溝通能力、合作能力和時(shí)間管理能力。我認(rèn)為這些軟技能在數(shù)據(jù)科學(xué)家的日常工作中起著至關(guān)重要的作用。
2. 如何選擇合適的訓(xùn)練營(yíng)和在線(xiàn)課程?
隨著人工智能和數(shù)據(jù)科學(xué)的興起,大量課程課程、訓(xùn)練營(yíng)如雨后春筍般涌現(xiàn),都不希望錯(cuò)失良機(jī)。
因此問(wèn)題來(lái)了,該如何選擇適合你的學(xué)習(xí)資源呢?
我的選擇方法如下:
沒(méi)有一門(mén)課程能涵蓋你需要的所有資源。有些課程在某些方面是重疊的,因此不值得花錢(qián)購(gòu)買(mǎi)不同但有重復(fù)性的課程。
首先要知道你需要學(xué)什么。不要因?yàn)榛ㄉ诤臀说臉?biāo)題就盲目選擇課程。通過(guò)查看求職網(wǎng)站上數(shù)據(jù)科學(xué)家的職位描述,你會(huì)發(fā)現(xiàn)一些公司需要的通用技能。然后通過(guò)了解自己缺乏的技能去搜索相應(yīng)課程。
比較不同平臺(tái)提供的優(yōu)質(zhì)課程。類(lèi)比幾個(gè)課程,并且查看其他人的評(píng)論(非常重要!)。另一方面,Coursera、Udemy、Lynda、Codecademy、DataCamp、Dataquest等平臺(tái)也提供許多免費(fèi)課程。
以下是我個(gè)人特別喜歡的一些課程:
- Machine Learning ,主講人: Coursera的聯(lián)合創(chuàng)始人吳恩達(dá)
- Python for Data Science and Machine Learning Bootcamp,主講人 :Jose Portilla
- Deep Learning A-Z?: Hands-On Artificial Neural Networks,主講人: Kirill Eremenko,Hadelin de Ponteves
- Python for Data Science Essential Training ,主講人:Lillian Pierson
- The Ultimate Hands-On Hadoop?—?Tame your Big Data,主講人:Frank Kane
3. 能否通過(guò)開(kāi)源學(xué)習(xí)成為數(shù)據(jù)科學(xué)家?
我想說(shuō)的是,通過(guò)開(kāi)源學(xué)習(xí)足以讓你開(kāi)始從事數(shù)據(jù)科學(xué),之后可以根據(jù)業(yè)務(wù)需求進(jìn)一步發(fā)展自己的職業(yè)生涯。
4.對(duì)于零基礎(chǔ)的初學(xué)者有什么推薦的書(shū)籍嗎?
沒(méi)有固定的學(xué)習(xí)途徑,條條大路通羅馬。閱讀相關(guān)書(shū)籍是掌握基礎(chǔ)知識(shí)的良好。注意不要試圖去記憶具體的數(shù)學(xué)和算法細(xì)節(jié),因?yàn)楫?dāng)應(yīng)用于實(shí)際問(wèn)題進(jìn)行編程時(shí),你可能會(huì)忘記這些內(nèi)容。你只需了解一定的基礎(chǔ)知識(shí),并繼續(xù)學(xué)習(xí),要?jiǎng)?wù)實(shí)。不要試圖完全了解所有知識(shí),因?yàn)橛袝r(shí)完美主義會(huì)給你的學(xué)習(xí)拖后腿。
關(guān)于Python、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的基礎(chǔ)知識(shí),我推薦以下書(shū)籍:
- Learning Python
- Python for Data Analysis
- An Introduction to Statistical Learning
- Machine Learning for Absolute Beginners
- Python Machine Learning
- Python Data Science Handbook
- Introduction to Machine Learning with Python
- Deep Learning with Python
- Deep Learning with Keras
5. 如何在理解商業(yè)問(wèn)題和提高技術(shù)技能之間取得平衡?
在理解商業(yè)問(wèn)題和制定解決方案之前,我首先去提高自己的技術(shù)技能。
商業(yè)問(wèn)題在于”是什么”和”為什么”。要解決商業(yè)問(wèn)題,首先必須解決問(wèn)題,而技術(shù)技能是注重于”怎么做”。我的建議主要基于個(gè)人經(jīng)驗(yàn)。
6.如何克服開(kāi)啟數(shù)據(jù)科學(xué)家職業(yè)生涯的挑戰(zhàn)?
對(duì)于許多數(shù)據(jù)科學(xué)家來(lái)說(shuō),主要挑戰(zhàn)就是數(shù)據(jù)科學(xué)是信息的海洋。我們可能失去方向,因?yàn)橛刑嗟慕ㄗh和資源,大量的在線(xiàn)課程、研討會(huì)等等,你需要保持專(zhuān)注,知道你擁有什么,你需要什么。
在我的數(shù)據(jù)科學(xué)歷程中,我主要通過(guò)這些方法克服這些挑戰(zhàn):
(1)有效地篩選學(xué)習(xí)資源
在剛開(kāi)始時(shí),我因?yàn)榇罅康馁Y源感到困惑。通過(guò)聽(tīng)數(shù)據(jù)科學(xué)家的播客,閱讀如何開(kāi)啟數(shù)據(jù)科學(xué)領(lǐng)域的文章,嘗試不同在線(xiàn)課程。最終我關(guān)注我在本文中分享的這些優(yōu)質(zhì)資源。
(2)不要放棄
當(dāng)學(xué)習(xí)過(guò)程太過(guò)艱難時(shí),我開(kāi)始懷疑自己,我真的有能力做到嗎?我追求的道理是正確的嗎?最終對(duì)數(shù)據(jù)科學(xué)的熱情和耐心讓我重新開(kāi)始,繼續(xù)不斷努力和前行。
(3)獲得數(shù)據(jù)科學(xué)相關(guān)的工作
由于就業(yè)市場(chǎng)競(jìng)爭(zhēng)激烈,找到心儀的數(shù)據(jù)科學(xué)工作對(duì)我來(lái)說(shuō)并非易事。我提交了大量的簡(jiǎn)歷都毫無(wú)結(jié)果。因此我開(kāi)始改進(jìn)找工作的方法,參加聚會(huì)和研討會(huì),在網(wǎng)上分享我的學(xué)習(xí)經(jīng)歷,在招聘會(huì)上于潛在雇主接觸等等。
7. 如何有效地在簡(jiǎn)歷中加入自己的工作經(jīng)驗(yàn),從而提高被錄用的幾率?
這是一種誤解,你并不能通過(guò)簡(jiǎn)歷中的經(jīng)驗(yàn)就被聘用。事實(shí)上,簡(jiǎn)歷是面試的敲門(mén)磚。
因此,學(xué)習(xí)如何寫(xiě)簡(jiǎn)歷對(duì)于獲得面試機(jī)會(huì)至關(guān)重要。研究表明,招聘人員在確定求職者是否適合該職位時(shí),平均看簡(jiǎn)歷的時(shí)間僅為6秒。
關(guān)于完善簡(jiǎn)歷,我推薦以下網(wǎng)站和文章:
- Vault
- TopResume
- Optimize Guide
- A Resume Expert Gives Career Advice
- https://www.facebook.com/businessinsider/videos/10153537949019071/
- How to Pass the 6-Second Resume Test
- https://www.topresume.com/career-advice/how-to-pass-the-6-second-resume-test
- How to tailor your Academic CV for Data Science roles
- https://www.linkedin.com/pulse/how-tailor-your-academic-cv-data-science-roles-jason-byrne/?trackingId=3ykuEpfW%2BISNc%2Fx9YFbIZQ%3D%3D
- What do Hiring Managers Look For in a Data Scientist’s CV?
- https://www.linkedin.com/pulse/what-do-hiring-managers-look-data-scientists-cv-ben-dias/
- The 14 Things You Need On Your Resume To Land Your Dream Job
- https://www.elitedaily.com/money/14-signs-you-have-a-strong-resume/617472
8. 怎樣的作品集能幫助我們找到第一數(shù)據(jù)科學(xué)或機(jī)器學(xué)習(xí)方面的工作?
簡(jiǎn)歷是不夠的,你還需要作品集的支撐。在看了簡(jiǎn)歷之后,招聘人員希望更多地了解你的背景,這時(shí)就需要作品集了。
可以試著在社交媒體平臺(tái)分享自己的學(xué)習(xí)經(jīng)歷,寫(xiě)文章和做播客都是不錯(cuò)的選擇。
更多資源?
學(xué)習(xí)平臺(tái) :Towards Data Science, Quora, DZone, KDnuggets, Analytics Vidhya, DataTau, fast.ai
推薦視頻:Webinars——Data Science Office Hours, Data Science Connect, Humans of Data Science (HoDS)
推薦文章:
- A Badass’s Guide to Breaking Into Data
- http://www.data-mania.com/blog/guide-to-breaking-into-data/
- 10 Must Have Data Science Skills
- https://www.kdnuggets.com/2016/05/10-must-have-skills-data-scientist.html?utm_content=buffer7c1a3&utm_medium=social&utm_source=linkedin.com&utm_campaign=buffer
- My Data Science & Machine Learning, Beginner’s Learning Path
- https://www.linkedin.com/pulse/my-data-science-machine-learning-beginners-path-vin-vashishta/?trackingId=J16vYmqLQEZ5wr4oElpnNA%3D%3D
- 24 Ultimate Data Science Projects To Boost Your Knowledge and Skills
- https://www.analyticsvidhya.com/blog/2018/05/24-ultimate-data-science-projects-to-boost-your-knowledge-and-skills/
值得關(guān)注的數(shù)據(jù)科學(xué)家
LinkedIn上的數(shù)據(jù)科學(xué)社區(qū)非常棒,以下是我認(rèn)為值得關(guān)注的數(shù)據(jù)科學(xué)家和專(zhuān)業(yè)人士:
- Randy Lao
- Kyle McKiou
- Favio Vázquez
- Vin Vashishta
- Eric Weber
- Sarah Nooravi
- Kate Strachnyi
- Tarry Singh
- Karthikeyan P.T.R.
- Megan Silvey
- Imaad Mohamed Khan
- Andreas Kretz
- Andriy Burkov
- Carla Gentry
- Nic Ryan
- Beau Walker
結(jié)語(yǔ)
希望本文能夠解決你的問(wèn)題。每當(dāng)你在數(shù)據(jù)科學(xué)旅程中遇到任何障礙,快要放棄時(shí)請(qǐng)記住,堅(jiān)持是關(guān)鍵。
作者:Admond Lee
翻譯:Mika
本文由 @Mika 翻譯發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自Unsplash,基于CC0協(xié)議
初學(xué)者考CDA證,有用嗎
有用的,能考下來(lái)說(shuō)明基礎(chǔ)就已經(jīng)具備了