GALAR, MIKEL / TRIGUERO, ISAAC
Prefacio
Parte I: Entender y trabajar con big data
Capítulo 1. Introducción
Capítulo 2. MapReduce
Parte II. Plataformas de big data
Capítulo 3. Hadoop
Capítulo 4. Spark
Capítulo 5. Spark SQL y DataFrames
Parte III: Aprendizaje automático con big data
Capítulo 6. Aprendizaje automático en Spark
Capítulo 7. Diseño de algoritmos de machine learning para big data
Capítulo 8. Implementación de modelos clásicos: k-medias y regresión lineal
Capítulo 9. Ejemplos avanzados: Aprendizaje semi-supervisado, ensembles, y despliegue de modelos de deep learning
Bibliografía
Índice alfabético
El análisis de datos a gran escala es clave para construir modelos de inteligencia artificial. Aprenda, con un enfoque práctico, a diseñar modelos de machine learning a gran escala con Python y Spark.El procesamiento y análisis de datos en inteligencia artificial requiere plataformas distribuidas capaces de gestionar grandes volúmenes de información. Esta guía práctica ofrece los conceptos clave y las habilidades necesarias para abordar tareas de análisis de datos y aprendizaje automático a gran escala. «Con la creciente disponibilidad de conjuntos de datos grandes y complejos, dominar modelos de programación como MapReduce y Spark se ha convertido en una habilidad imprescindible para científicos de datos, ingenieros de datos y especialistas en machine learning. Triguero y Galar aprovechan su amplia experiencia docente en este ámbito para ofrecer una obra rigurosa y accesible que aborda tanto los conceptos técnicos como las habilidades prácticas necesarias para el análisis de datos a gran escala. Alternan explicaciones claras e intuitivas con ejemplos relevantes de ingeniería de datos y pipelines clásicos de machine learning, todo ello acompañado de código bien estructurado y el resultado de su ejecución. Este libro no solo muestra cómo aplicar este conocimiento en la práctica hoy en día, sino que también prepara al lector para aplicarlo con éxito en escenarios futuros».-Arun Kumar, Universidad de California, San Diego.
Mikel Galar se doctoró en Informática por la Universidad Pública de Navarra (UPNA) en 2012. Actualmente es profesor titular del área de Ciencias de la Computación e Inteligencia Artificial en el departamento de Estadística, Informática y Matemáticas de la UPNA. Es también investigador propio del Instituto de Smart Cities (ISC) y director de la Cátedra Tracasa de Ciencias de la Computación e Inteligencia Artificial. Su trabajo de investigación se centra en machine learning y big data, área en la que cuenta con más de 100 publicaciones, 9000 citas y tres publicaciones situadas en el top 1 % de citas en el área de ciencias de la computación, aparece en la lista del 2 % de investigadores más citados elaborada por la Universidad de Standford. Es cofundador de Neuraptic AI y ha sido investigador principal en proyectos que suman más de dos millones de euros de financiación tanto pública como privada. Desde 2011, imparte asignaturas relacionadas con las ciencias de la computación, inteligencia artificial, 'machine learning' y 'big data'. En 2020, recibió un premio a la excelencia docente en la UPNA. Ha dirigido tres tesis doctorales y actualmente supervisa otras cinco. Es autor de dos libros de texto: 'Learning with Imbalanced Datasets' y 'Large-scale Data Analytics with Python and Spark: A Hands-on Guide to Implementing Machine Learning Solutions'.