La demanda de profesionales cualificados en ciencia de datos en la industria, el mundo académico y el gobierno está creciendo rápidamente. El programa de Ciencia de Datos de HarvardX te prepara con la base de conocimientos necesaria y habilidades útiles para abordar los desafíos de análisis de datos del mundo real. El programa cubre conceptos como la probabilidad, la inferencia, la regresión y el aprendizaje automático, y te ayuda a desarrollar un conjunto de habilidades esenciales que incluyen la programación en R, el manejo de datos con dplyr, la visualización de datos con ggplot2, la organización de archivos con Unix/Linux, el control de versiones con git y GitHub, y la preparación de documentos reproducibles con RStudio.
En cada curso, utilizamos estudios de casos motivadores, planteamos preguntas específicas y aprendemos respondiendo a estas mediante el análisis de datos. Los estudios de caso incluyen: Tendencias en la salud y la economía mundial, las tasas de criminalidad en Estados Unidos, la crisis financiera de 2007-2008, la previsión electoral, la construcción de un equipo de béisbol (inspirado en Moneyball) y los sistemas de recomendación de películas.
A lo largo del programa, utilizaremos el entorno de software R. Aprenderás simultáneamente R, conceptos estadísticos y técnicas de análisis de datos. Creemos que se puede retener mejor el conocimiento de R cuando se aprende a resolver un problema específico.