Poptávka po kvalifikovaných odbornících v oblasti datové vědy v průmyslu, akademické sféře i státní správě rychle roste. Program HarvardX Data Science vás připraví na potřebnou znalostní základnu a užitečné dovednosti pro řešení reálných výzev v oblasti analýzy dat. Program zahrnuje koncepty, jako je pravděpodobnost, inference, regrese a strojové učení, a pomůže vám rozvinout základní soubor dovedností, který zahrnuje programování v jazyce R, práci s daty pomocí nástroje dplyr, vizualizaci dat pomocí nástroje ggplot2, organizaci souborů v systému Unix/Linux, správu verzí pomocí nástrojů git a GitHub a přípravu reprodukovatelných dokumentů pomocí nástroje RStudio.
V každém kurzu používáme motivující případové studie, klademe konkrétní otázky a učíme se jejich zodpovězením prostřednictvím analýzy dat. Mezi případové studie patří např:
V průběhu celého programu budeme používat softwarové prostředí R.
Trendy ve světovém zdravotnictví a ekonomice, Míra kriminality v USA, Finanční krize v letech 2007-2008, Předpovídání voleb, Sestavování baseballového týmu (inspirované Moneyball) a Systémy pro doporučování filmů. Současně se naučíte R, statistické koncepty a techniky analýzy dat. Jsme přesvědčeni, že si znalosti R lépe zapamatujete, když se naučíte řešit konkrétní problém.