De vraag naar bekwame data science beoefenaars in de industrie, de academische wereld, en de overheid groeit snel. Het HarvardX Data Science-programma bereidt u voor met de nodige kennisbasis en nuttige vaardigheden om real-world data-analyse-uitdagingen aan te pakken. Het programma behandelt concepten zoals waarschijnlijkheid, inferentie, regressie en machine learning en helpt u een essentiële vaardigheden te ontwikkelen die R-programmering, data wrangling met dplyr, datavisualisatie met ggplot2, bestandsorganisatie met Unix/Linux, versiebeheer met git en GitHub, en reproduceerbare documentvoorbereiding met RStudio.
In elke cursus gebruiken we motiverende casestudy’s, stellen we specifieke vragen, en leren we door deze te beantwoorden door middel van data-analyse. Case studies omvatten: Trends in de wereldgezondheid en economie, Amerikaanse misdaadcijfers, De financiële crisis van 2007-2008, Verkiezingsvoorspelling, Het bouwen van een honkbalteam (geïnspireerd door Moneyball), en Aanbevelingssystemen voor films.
Door het hele programma heen, zullen we gebruik maken van de R software omgeving. U leert R, statistische concepten, en data-analyse technieken tegelijkertijd. Wij geloven dat je R kennis beter kunt vasthouden wanneer je leert hoe je een specifiek probleem moet oplossen.