Efterfrågan på skickliga datavetare inom industrin, den akademiska världen och myndigheter ökar snabbt. HarvardX Data Science-programmet förbereder dig med den nödvändiga kunskapsbasen och användbara färdigheter för att ta itu med verkliga dataanalysutmaningar. Programmet täcker begrepp som sannolikhet, inferens, regression och maskininlärning och hjälper dig att utveckla en väsentlig uppsättning färdigheter som inkluderar R-programmering, datavärdighet med dplyr, datavisualisering med ggplot2, filorganisation med Unix/Linux, versionshantering med git och GitHub och reproducerbar dokumentberedning med RStudio.
I varje kurs använder vi motiverande fallstudier, ställer specifika frågor och lär oss genom att besvara dessa genom dataanalys. Fallstudierna omfattar bl.a. följande: Trender inom världshälsa och ekonomi, brottslighet i USA, finanskrisen 2007-2008, valprognoser, bygga ett baseballlag (inspirerat av Moneyball) och filmrekommendationssystem.
Under hela programmet kommer vi att använda oss av programvarumiljön R. Du kommer att lära dig R, statistiska begrepp och tekniker för dataanalys samtidigt. Vi tror att du bättre kan behålla R-kunskaperna när du lär dig att lösa ett specifikt problem.