La ciencia de datos es un campo interdisciplinar que utiliza métodos, algoritmos, procesos y sistemas para extraer conocimiento y conclusiones a partir de todo tipo de datos. A través del aprendizaje automático se combinan elementos de estadística, informática, matemáticas y técnicas de análisis para resolver problemas, hacer predicciones y generar valor a partir de los datos. Se apoya en grandes volúmenes de datos (Big Data) para descubrir patrones, tendencias y relaciones que pueden ser utilizadas para la toma de decisiones. El aprendizaje automático utiliza dos tipos de técnicas: el aprendizaje supervisado, que entrena a un modelo con datos conocidos de entrada y salida para que pueda predecir resultados futuros, y el aprendizaje no supervisado, que encuentra patrones ocultos o estructuras intrínsecas en los datos de entrada. El aprendizaje supervisado utiliza técnicas de clasificación y regresión basadas en modelos predictivos, según la naturaleza de la variable dependiente. Si esta es categórica estamos ante las técnicas predictivas de clasificación y si es cuantitativa estamos antes las técnicas predi