ANÁLISIS DE DATOS A GRAN ESCALA CON PYTHON Y SPARK

ANÁLISIS DE DATOS A GRAN ESCALA CON PYTHON Y SPARK

GALAR, MIKEL / TRIGUERO, ISAAC

29,95 €
IVA incluido
🚚 LLegada en 24/48h
Editorial:
ANAYA MULTIMEDIA
Año de edición:
2025
Ubicación
⬆️INFORMÁTICA
ISBN:
978-84-415-5155-8
Páginas:
432
Encuadernación:
Rústica
29,95 €
IVA incluido
🚚 LLegada en 24/48h
Añadir a favoritos

Prefacio

Parte I: Entender y trabajar con big data
Capítulo 1. Introducción
Capítulo 2. MapReduce

Parte II. Plataformas de big data
Capítulo 3. Hadoop
Capítulo 4. Spark
Capítulo 5. Spark SQL y DataFrames

Parte III: Aprendizaje automático con big data
Capítulo 6. Aprendizaje automático en Spark
Capítulo 7. Diseño de algoritmos de machine learning para big data
Capítulo 8. Implementación de modelos clásicos: k-medias y regresión lineal
Capítulo 9. Ejemplos avanzados: Aprendizaje semi-supervisado, ensembles, y despliegue de modelos de deep learning

Bibliografía
Índice alfabético

El análisis de datos a gran escala es clave para construir modelos de inteligencia artificial. Aprenda, con un enfoque práctico, a diseñar modelos de machine learning a gran escala con Python y Spark.El procesamiento y análisis de datos en inteligencia artificial requiere plataformas distribuidas capaces de gestionar grandes volúmenes de información. Esta guía práctica ofrece los conceptos clave y las habilidades necesarias para abordar tareas de análisis de datos y aprendizaje automático a gran escala. «Con la creciente disponibilidad de conjuntos de datos grandes y complejos, dominar modelos de programación como MapReduce y Spark se ha convertido en una habilidad imprescindible para científicos de datos, ingenieros de datos y especialistas en machine learning. Triguero y Galar aprovechan su amplia experiencia docente en este ámbito para ofrecer una obra rigurosa y accesible que aborda tanto los conceptos técnicos como las habilidades prácticas necesarias para el análisis de datos a gran escala. Alternan explicaciones claras e intuitivas con ejemplos relevantes de ingeniería de datos y pipelines clásicos de machine learning, todo ello acompañado de código bien estructurado y el resultado de su ejecución. Este libro no solo muestra cómo aplicar este conocimiento en la práctica hoy en día, sino que también prepara al lector para aplicarlo con éxito en escenarios futuros».-Arun Kumar, Universidad de California, San Diego.

Mikel Galar se doctoró en Informática por la Universidad Pública de Navarra (UPNA) en 2012. Actualmente es profesor titular del área de Ciencias de la Computación e Inteligencia Artificial en el departamento de Estadística, Informática y Matemáticas de la UPNA. Es también investigador propio del Instituto de Smart Cities (ISC) y director de la Cátedra Tracasa de Ciencias de la Computación e Inteligencia Artificial. Su trabajo de investigación se centra en machine learning y big data, área en la que cuenta con más de 100 publicaciones, 9000 citas y tres publicaciones situadas en el top 1 % de citas en el área de ciencias de la computación, aparece en la lista del 2 % de investigadores más citados elaborada por la Universidad de Standford. Es cofundador de Neuraptic AI y ha sido investigador principal en proyectos que suman más de dos millones de euros de financiación tanto pública como privada. Desde 2011, imparte asignaturas relacionadas con las ciencias de la computación, inteligencia artificial, 'machine learning' y 'big data'. En 2020, recibió un premio a la excelencia docente en la UPNA. Ha dirigido tres tesis doctorales y actualmente supervisa otras cinco. Es autor de dos libros de texto: 'Learning with Imbalanced Datasets' y 'Large-scale Data Analytics with Python and Spark: A Hands-on Guide to Implementing Machine Learning Solutions'.

Artículos relacionados

  • CONTROL DE GESTIÓN CON EXCEL Y POWER QUERY
    VEGA CABALLERO, CLARA / POMARES MEDRANO, JOSÉ MANUEL
    La gestión adecuada de datos es crucial para la salud financiera de las empresas. Aunque las herramientas de gestión de datos como los programas contables y los ERP son importantes, no son suficientes para satisfacer todas las necesidades internas de la empresa. Es necesario contar con indicadores que midan el desempeño de la empresa y permitan tomar decisiones acertadas en un ...
    ✅ Disponible - Ver Ubicación

    30,95 €

  • STORYTELLING CON DATOS, ANTES Y DESPUÉS
    NUSSBAUMER KNAFLIC, COLE / CISNEROS, MIKE / VELEZ, ALEX
    Transformaciones prácticas. Estrategias comprobadas. Relatos de datos poderosos. De la mano de la autora superventas Cole Nussbaumer Knaflic y de los expertos narradores de datos Mike Cisneros y Alex Velez, Storytelling con datos, antes y después se basa en más de una década de experiencia ayudando a las organizaciones líderes a comunicar sus datos de forma clara y eficaz.A tra...
    📅 En preventa

    41,50 €

  • INTRODUCCIÓN A MICROSOFT FABRIC
    AGUILERA REYNA, DIANA / LÓPEZ CENTENO, NELSON
    Descubre Microsoft Fabric, la nueva plataforma de datos de Microsoft que amplía las capacidades de Power BI y permite implementar procesos de datos modernos de forma sencilla y unificada.El procesamiento y análisis de datos sigue siendo clave en casi cualquier proyecto, y ha cobrado aún más relevancia con los avances de la Inteligencia Artificial Generativa. Esto ha impulsado t...
    🚚 LLegada en 24/48h

    29,95 €

  • CURSO DE LENGUAJE DAX
    BISBÉ YORK, ANA MARÍA
    El tratamiento de datos es una de las actividades más importantes en empresas y organizaciones. Vivimos en la era de los datos. Ante esta necesidad, Microsoft creó los modelos tabulares que se almacenan en bases de datos y se consumen en informes creados con Excel y Power BI a través de un lenguaje de expresiones que se llama DAX.El libro que te presento comienza tratando las c...
    🚚 LLegada en 24/48h

    29,95 €

  • ARQUITECTURA E INGENIERÍA DE DATOS
    CALCAGNO LUCARES, WALTER E.
    Esta obra proporciona una introducción accesible y completa a los conceptos clave, las técnicas y las mejores prácticas en el campo de la arquitectura y la ingeniería de datos, sin la necesidad de conocimientos previos en programación o estadísticas.Aborda secuencialmente una descripción general de los conceptos clave en la arquitectura de datos, incluidas las definiciones esen...
    🚚 Llegada en 2/3 días

    30,95 €

  • TRATAMIENTO BÁSICO DE DATOS Y HOJAS DE CÁLCULO
    MORO VALLINA, MIGUEL / SÁNCHEZ ESTELLA, ÓSCAR
    Dentro de las diversas herramientas ofimáticas que se hallan a nuestra disposición, las hojas de cálculo ocupan un papel especialmente destacado. Se trata de aplicaciones destinadas a manejar datos: contables, económicos, estadísticos?, a partir delos cuales se pueden realizar representaciones gráficas de series de datos o análisis financieros, entre otras cosas. Cualquier docu...
    🚚 LLegada en 24/48h

    18,00 €