Introducción al Procesamiento de Datos con Python
Este es el contenido del curso “Introducción al Procesamiento de Datos con Python”, el cual ha sido desarrollado y mantenido por OpenTechSchool.
Bienvenido
Bienvenido a la “Introducción al Procesamiento de Datos con Python”. Este taller te llevará a través de los fundamentos del trabajo con texto y otros tipos de datos usando Python. Aprenderemos cómo leer datos desde archivos hacia estructuras de datos en nuestros programas, a extraer la información que deseamos. Mostraremos nuestros datos en gráficas y charts, y tendremos un vistazo del mundo del Open Data que está disponible en línea. ¡Nunca más querrás seguir usando una hoja de datos de nuevo!
Sólo esperamos que conozcas un poco de Python, no mucho. Si has realizado nuestro taller Introducción a la Programación, estaría perfecto.
- Material principal del Taller
- Resumen de lo esencial de Python - Un resumen rápido de algunas cuestiones esenciales de la Introducción a la Programación.
- Estructura de Datos en Python - Una introducción a las estructuras de datos: listas y diccionarios.
- Introducción a IPython Notebook - ¡Una completamente nueva manera de trabajar con Python!
- Trabajando con archivos de texto - ¿Qué es un archivo de texto? ¿Cómo lo introducimos y sacamos con Python?
- Trabajando con cadenas - Una vez que tenemos el texto en Python, ¿qué podemos hacer con él?
- Creando gráficos - Usando IPython Notebook en conjunto con matplotlib para crear gráficos.
- Archivos CSV - Leyendo datos separados por comas.
Cosas divertidas adicionales
- Enfoques alternativos - Otras formas de almacenar y procesar datos (Pandas, bases de datos SQL.)
- Fuentes de Open Data Datos.
Material de referencia
- [Página principal de IPython NBViewer][nbviewer]
- [Galería de IPython Notebook][gallerry]
- Galería matplotlib
Material para Avanzados
Si estás imaginándote como “subir de nivel” con análisis de datos más avanzados después de dominar éste material, puedes intentar estos:
-
Un serie de tutoriales de Hernán Rojas mostrándonos lo básico de usando la librería de Python “pandas” para el análisis de datos. Puedes hacer click en la lección para verlo directamente en el navegador, o hacer click en el link “(download)” a la derecha de cada página para descargar un archivo ZIP conteniendo archivos de IPython Notebook.
-
Si tienes experiencia en el modelado estadístico entonces este video tutorial de Skipper Seabold en SciPy 2012 (material complementario como archivos de IPython Notebook) es áltamente recomendado.