Efterspørgslen efter dygtige datavidenskabsfolk i industrien, den akademiske verden og det offentlige er hastigt stigende. HarvardX Data Science-programmet forbereder dig med den nødvendige vidensbase og nyttige færdigheder til at tackle virkelige dataanalyseudfordringer i den virkelige verden. Programmet dækker begreber som sandsynlighed, inferens, regression og maskinlæring og hjælper dig med at udvikle et væsentligt færdighedssæt, der omfatter R-programmering, data wrangling med dplyr, datavisualisering med ggplot2, filorganisering med Unix/Linux, versionsstyring med git og GitHub og reproducerbar dokumentforberedelse med RStudio.
I hvert kursus bruger vi motiverende casestudier, stiller specifikke spørgsmål og lærer ved at besvare disse gennem dataanalyse. Casestudier omfatter bl.a: Tendenser i verdens sundhed og økonomi, amerikanske kriminalitetsrater, finanskrisen i 2007-2008, valgprognoser, opbygning af et baseballhold (inspireret af Moneyball) og filmanbefalingssystemer.
Igennem hele programmet vil vi bruge R-softwaremiljøet. Du vil lære R, statistiske begreber og dataanalyseteknikker på samme tid. Vi mener, at du bedre kan fastholde din viden om R, når du lærer at løse et specifikt problem.