Cererea de practicieni calificați în știința datelor în industrie, în mediul academic și guvernamental este în creștere rapidă. Programul HarvardX Data Science vă pregătește cu baza de cunoștințe necesară și cu abilități utile pentru a aborda provocările de analiză a datelor din lumea reală. Programul acoperă concepte cum ar fi probabilitatea, inferența, regresia și învățarea automată și vă ajută să dezvoltați un set de abilități esențiale care include programarea R, manipularea datelor cu dplyr, vizualizarea datelor cu ggplot2, organizarea fișierelor cu Unix/Linux, controlul versiunilor cu git și GitHub și pregătirea documentelor reproductibile cu RStudio.
În fiecare curs, folosim studii de caz motivante, punem întrebări specifice și învățăm răspunzând la acestea prin analiza datelor. Studiile de caz includ: Tendințe în sănătatea și economia mondială, Rata criminalității în SUA, Criza financiară din 2007-2008, Previziuni electorale, Construirea unei echipe de baseball (inspirat de Moneyball) și Sisteme de recomandare a filmelor.
Pe parcursul programului, vom folosi mediul software R. Veți învăța simultan R, concepte statistice și tehnici de analiză a datelor. Credem că puteți reține mai bine cunoștințele despre R atunci când învățați cum să rezolvați o problemă specifică.