MCKINNEY, WES
Agradecimientos
Sobre el autor
Prefacio
Capítulo 1. Preliminares
Capítulo 2. Fundamentos del lenguaje Python, IPython y Jupyter Notebooks
Capítulo 3. Estructuras de datos, funciones y archivos incluidos
Capítulo 4. Fundamentos de NumPy: arrays y computación vectorizada
Capítulo 5. Primeros pasos con pandas
Capítulo 6. Carga de datos, almacenamiento y formatos de archivo
Capítulo 7. Limpieza y preparación de los datos
Capítulo 8. Manipulación de datos: unir, combinar y remodelar
Capítulo 9. Trazado y visualización
Capítulo 10. Agregación de datos y operaciones con grupos
Capítulo 11. Series temporales
Capítulo 12. Introducción a las librerías de modelado de Python
Capítulo 13. Ejemplos de análisis de datos
Anexo A. NumPy avanzado
Anexo B. Más sobre el sistema IPython
Índice alfabético
Obtén el manual definitivo para manipular, procesar, limpiar y restringir conjuntos de datos en Python. Actualizado para Python 3.10 y pandas 1.4.0, esta tercera edición de Python para análisis de datos. Manipulación de datos con pandas, NyumPy y Jupyter está llena de casos prácticos, que permiten averiguar cómo resolver una amplia variedad de problemas de datos de una manera efectiva. Con su ayuda conocerás y aprenderás las versiones más recientes de pandas, NumPy, IPython y Jupyter.
Escrito por Wes McKinney, el creador del proyecto pandas, Python para análisis de datos es una introducción práctica y moderna a las herramientas de ciencia de datos que ofrece Python. Es ideal para analistas no versados en Python y para programadores que deseen ponerse al día en ciencia de datos y computación científica o ciencia computacional. GitHub alberga los archivos de datos empleados en el libro y otro material asociado.
Entre otras cosas, este libro permite:
* Utilizar Jupyter Notebook y el shell de IPython para explorar datos. * Aprender funciones de NumPy básicas y avanzadas. * Iniciarse en el manejo de las herramientas de análisis de datos de la librería pandas. * Emplear herramientas flexibles para limpiar, transformar, combinar y remodelar datos. * Crear visualizaciones informativas con matplotlib. * Aplicar la función GroupBy de pandas para segmentar, desmenuzar y resumir conjuntos de datos. * Analizar y manipular series de datos temporales regulares e irregulares. * Aprender cómo resolver problemas reales de análisis de datos con ejemplos específicos y detallados.
Wes McKinney es desarrollador de software y empresario en Nashville, Tennessee. Tras obtener su título universitario en matemáticas en el Massachussets Institute of Technology (MIT) en 2007, empezó a trabajar en finanzas y economía cuantitativa en la compañía AQR Capital Management en Greenwich, Connecticut. Frustrado por las incómodas herramientas de análisis de datos que existían en ese momento, aprendió Python e inició lo que más tarde se convertiría en el proyecto pandas. Es un miembro activo de la comunidad de datos de Python y un defensor del uso de Python en análisis de datos, finanzas y aplicaciones de computación científica.
Posteriormente, Wes fue cofundador y director ejecutivo de DataPad, cuyas instalaciones tecnológicas y personal fueron adquiridos por Cloudera en 2014. Desde entonces ha estado muy implicado en la tecnología Big data, y se ha unido a los comités de administración de los proyectos Apache Arrow y Apache Parquet en la Apache Software Foundation (ASF). En 2018 fundó Usra Labs, una organización sin ánimo de lucro centrada en el desarrollo de Apache Arrow, en asociación con RStudio y Two Sigma Investments. En 2021 ha creado el startup tecnológico Voltron Data, donde trabaja en la actualidad como director de tecnología.