Data Science: 7 cursos para convertirte en científico de datos

Data Science: 7 cursos para convertirte en científico de datos

Como comentábamos en el artículo Data Science: qué es y qué necesito para ser un científico de datos, se necesitan una serie de conocimientos para poder “ejercer” en este campo con unas mínimas garantías.

Voy a hablar a continuación de aquellos cursos que conozco, bien porque me he informado personalmente, o bien por que los he hecho o estoy en ello.

¿De qué recursos disponemos?

Existe un repositorio en Github con infinidad de información sobre esta disciplina, artículos y opiniones sobre Data Science, recursos formativos, blogs, cuentas de Facebook, algoritmos, etc.

En cuanto a formación, actualmente existen numerosos cursos tanto presenciales como a distancia y muchos de ellos están recogidos en el repositorio de Github.  Evidentemente el primer filtro es el precio, a día de hoy un curso de Data Science presencial, en castellano y decente es bastante caro (aunque esto es subjetivo obviamente). Como he dicho voy a hablar de los que conozco.

  • Curso presencial: UTAD. Su precio ronda los 7.000 euros y su duración es de 300 horas. Tenían (y tienen) uno de Big Data y se dieron cuenta que abarcaba demasiado y que tenían que tratar Data Science como una disciplina aparte. Uno de mis socios y yo estuvimos hablando con el director del master un par de horas y la impresión fue muy buena, nos expuso sus dificultades sin tapujos y qué conocimientos deberíamos tener para que no nos resultase frustrante su realización, vamos que no intentó vendernos ninguna moto. El temario es bastante completo y a priori parecen suficientes horas para cubrirlo. Se nos iba de precio, lo que no quiere decir que sea caro.
  •  Curso online: Especialización en Data Science (Coursera). En inglés. Impartido por la universidad John Hopkins (14 ª en el ranking mundial de universidades). Consta de 9 módulos y un proyecto final. Si lo haces del tirón unos 10-12 meses y unos 390 Euros. Es muy completo, cubre la extracción, limpieza, análisis estadístico y presentación de los datos. Se basa en R por lo que más te vale saber programar en R o las horas estimadas semanales multiplícalas por 3 fácilmente ya que el curso es un mucho de “búscate la vida”, lo que tiene su parte mala (como no dispongas de muchas horas libres no lo sacas) y su parte buena (no te queda más remedio que aprender a base de investigar y leer). Si tienes problemas con la programación ni lo intentes.
  • Curso online: Foundations of Data Analysis (edX). En ingles e impartido por UT Austin (79ª en el ranking mundial de universidades).  Es, básicamente, un curso bastante completo de estadística. La duración es de 13 semanas y es gratuito (50 $ si quieres un certificado verificado). El instructor es muy bueno y ameno. Los videos son muy didácticos y con ejemplos reales. Tienes que trabajar algunas horas más de las que estiman necesarias  si quieres certificarte, puesto que hay bastantes ejercicios que puntúan para el mismo y tienes que sacar una puntuación mayor del 70%. Merece la pena.
  • Curso online: Data Analyst Nanodegree (Udacity). En inglés. Un nanodegree es un nuevo tipo de credencial creado por Udacity y construido con la colaboración de distintas empresas, en este caso los colaboradores son mongoDB, Facebook y Zipfian Academi. Está basado en proyectos, 5 que abarcan buena parte del trabajo que tendrá que desarrollar un científico de datos y que se pueden hacer también de manera individual. Su duración es de entre 9-12 meses y su precio de 200 $ mes con una semana de prueba gratuita. Requiere de conocimientos de Python, R y estadística. Muy buena pinta.
  • Curso online: Programming for Everybody (Python) (Coursera). En inglés e impartido por la universidad de Michigan (23ª en el ranking mundial de universidades). Tiene una duración de 10 semanas, es gratuito y tienes la opción de certificado verificado (43 €). El curso perfecto para empezar a programar, en este caso además con el añadido de que se enseña con Python. El instructor, Charles Severance,  es fantástico, didáctico y divertido, poniendo especial énfasis en que queden claros todos los conceptos. Su libro Python for Informatics se puede descargar gratuitamente. Muy recomendable para los que quieren iniciarse en la programación.
  • Curso online: The Analytics Edge (edX). En inglés e impartido por el MIT (1ª en el ranking mundial de universidades). Es gratuito (100 $ si quieres el certificado verificado). Curso muy interesante, lleno de ejemplos desarrollados en distintos campos, desde la sanidad hasta el deporte, pasando por la enología, justicia, aerolíneas, etc. Los ejemplos y ejercicios se desarrollan en R, y aunque no es necesario conocimientos de programación, si no te manejas en R te requerirá un esfuerzo extra para comprender determinados conceptos. Aun así se puede hacer.  De igual modo es recomendable tener conocimientos de estadística y por supuesto de matemáticas elementales. El curso toca prácticamente la totalidad de los palos de la ciencia de datos: análisis estadístico, visualización, clustering, análisis de textos, optimización. Tengo que decir que las horas estimadas de esfuerzo que indican en edX se quedan bastante cortas si pretendes aprovechar el curso, puesto que te hacen “currarte los ejercicios”, pero en fin, es el MIT ¿qué más se puede pedir? Además, a diferencia de otros tiene un examen final con un peso importante en la puntuación del curso. El “instructor” principal tiene un CV. que da miedo, así que saber, sabe el señor :-). De los que he hecho o estoy haciendo, para mí, el mejor.

Pues hasta aquí los recursos formativos de los que puedo hablar, aunque existen muchos más. A medida que vaya finalizando cursos e iniciando otros nuevos iré actualizando la información.

Espero que la información resulte de utilidad para todo aquel que se quiere iniciar en esta disciplina.

Imagen: Stuart Miles / freedigitalphotos.net

Sobre José Manuel Escudero

Químico de formación. Máster en Analítica Web por KSchool. Máster en Finanzas y Marketing por ESIC y EOI. Certificado en Google Analytics (GAIQ). Más de 15 años de experiencia en el mundo de Internet y Tecnologías de Información. Primer premio de la XIX Edición premios IDEA (Gobierno de Aragón) en la categoría de Servicios avanzados para empresas.

4 Comentarios

  1. Gran articulo

    Responder
  2. Excelente articulo. Hay un orden preferencial para realizar los cursos si quisiera hacer los de coursera y los de edX o se puede iniciar con cualquiera?

    Responder
  3. Buenas tardes José, muy buen articulo. Una pregunta, ¿qué te parece el curso de especialización de la UOC “Ciencia de los datos (Data Science)”?

    Responder
  4. Hola, ni sabia de este posta ya que he seguido sin sabe. Los mismos cursos, me faltaría la de john hopkins que más tiempo me llevaría. Que tal lo de Analytics Edge? Sin embargo veo que faltan prácticas con R por ejemplo recomendado es Datacamp, para comenzar no está mal. Hay también que tener en cuenta los datos de base datos de tipo NoSql y Sql , y visualización de datos, que no siempre los cursos indicados tienen. En fin Data science son especiliazaicines diferentes y diferentes ramas, creo que saber todo es importante, especializarse luego en una es lo ideal.

    Responder

Deja un comentario