Der Bedarf an qualifizierten Data-Science-Fachleuten in Industrie, Wissenschaft und Regierung wächst rasant. Das HarvardX Data Science Programm bereitet Sie mit der notwendigen Wissensbasis und nützlichen Fähigkeiten vor, um reale Datenanalyse-Herausforderungen zu bewältigen. Das Programm deckt Konzepte wie Wahrscheinlichkeit, Inferenz, Regression und maschinelles Lernen ab und hilft Ihnen bei der Entwicklung grundlegender Fähigkeiten, die R-Programmierung, Datenverarbeitung mit dplyr, Datenvisualisierung mit ggplot2, Dateiorganisation mit Unix/Linux, Versionskontrolle mit git und GitHub und reproduzierbare Dokumentenerstellung mit RStudio umfassen.
In jedem Kurs verwenden wir motivierende Fallstudien, stellen spezifische Fragen und lernen, diese durch Datenanalyse zu beantworten. Zu den Fallstudien gehören: Trends in der Weltgesundheit und Wirtschaft, Kriminalitätsraten in den USA, die Finanzkrise 2007-2008, Wahlprognosen, Aufbau eines Baseballteams (inspiriert von Moneyball) und Filmempfehlungssysteme.
Während des gesamten Kurses werden wir die Softwareumgebung R verwenden. Sie werden R, statistische Konzepte und Datenanalysetechniken gleichzeitig erlernen. Wir glauben, dass Sie R-Kenntnisse besser behalten können, wenn Sie lernen, wie Sie ein bestimmtes Problem lösen können.