Koulutettujen datatieteen ammattilaisten kysyntä teollisuudessa, korkeakouluissa ja julkishallinnossa kasvaa nopeasti. HarvardX Data Science -ohjelma valmistaa sinut tarvittavaan tietopohjaan ja hyödyllisiin taitoihin, joiden avulla voit ratkaista reaalimaailman data-analyysihaasteita. Ohjelma kattaa sellaisia käsitteitä kuin todennäköisyys, päättely, regressio ja koneoppiminen, ja auttaa sinua kehittämään keskeisiä taitoja, joihin kuuluvat R-ohjelmointi, datan käsittely dplyr:llä, datan visualisointi ggplot2:lla, tiedostojen organisointi Unix/Linuxilla, versiohallinta git:llä ja GitHub:lla sekä toistettavissa olevien dokumenttien laatiminen RStudio:lla.
Kullakin kurssilla käytämme motivoivia tapausesimerkkejä, esitämme konkreettisia kysymyksiä ja opimme vastaamaan niihin data-analyysin avulla. Tapaustutkimuksia ovat mm: Trendit maailman terveydessä ja taloudessa, USA:n rikollisuusluvut, vuosien 2007-2008 finanssikriisi, vaalien ennustaminen, pesäpallojoukkueen rakentaminen (Moneyballin innoittamana) ja elokuvasuositusjärjestelmät.
Kautta koko kurssin käytämme R-ohjelmistoympäristöä. Opit R:ää, tilastollisia käsitteitä ja data-analyysitekniikoita samanaikaisesti. Uskomme, että R-tiedot säilyvät paremmin, kun opit ratkaisemaan tietyn ongelman.