El semillero de programación para las ciencias sociales es una iniciativa conjunta entre el Observatorio de la Democracia y Congreso Visible para fomentar la discusión, aplicación y enseñanza de metodologías computacionales para el estudio de fenómenos sociales. A lo largo de diez sesiones prácticas y dos de repaso, los participantes del semillero han podido aplicar los conceptos y metodologías aprendidas para responder preguntas de investigación en las diferentes disciplinas de las ciencias sociales. De esta forma, a través de un programa sucinto, se busca presentar un abrebocas de las ilimitadas aplicaciones de estas herramientas.
Teniendo en cuenta la acogida de esta iniciativa en la Universidad de los Andes y nuestro profundo deseo de expandir la conversación más allá de las aulas de clase, el semillero ha decidido abrir sus puertas a todos los interesados en estas nuevas metodologías. Por eso hemos decidido compartir públicamente todo nuestro material de trabajo en el repositorio de código del Observatorio de Democracia.
Así, los interesados podrán acceder, a su propio paso y por medio de 10 sesiones interactivas, a una introducción a la programación y su aplicación en la investigación social. Los módulos son los siguientes:
- Estructuras de datos en Python (Sesión 1): Se introducen las nociones básicas de la programación y las diferentes estructuras en este lenguaje de programación, al igual que sus diferentes aplicaciones.
- Loops, condicionales y funciones (Sesión 2): Se utilizarán los aprendizajes de la primera sesión para programar funciones usando bucles y condicionales.
- Manejo de bases de datos con Pandas (Sesión 3): Se introducirán los temas de manipulación de bases de datos usando datos electorales y la aplicación del método D’Hondt (llamado también cifra repartidora) para determinar la distribución de curules en el senado colombiano.
- Visualización de datos estadísticos (Sesión 4): Se introducen el paquete Matplotlib para la creación de gráficas de barras y de torta, usando nuevamente datos electorales.
- Webscrapping con BeautifulSoup (Sesión 5, Repaso Sesión 11): Se presenta el paquete BeatifulSoup para descargar información de la web tomando como ejemplo las sentencias de la Corte Constitucional con mención al aborto.
- Text mining con Spacy (Sesión 6): Por medio del uso del paquete Spacy, se introduce la minería de texto, la limpieza de corpus, las nociones básicas de la procesamiento natural de lenguaje y la visualización por medio de nubes de palabras.
- Ejercicios de repaso (Sesión 7): Sesión con ejercicios prácticos de los temas cubiertos hasta esta sesión usando datos del COVID-19.
- Visualización de mapas (Sesión 8): Introducción al paquete Geopandas y a la metodología de la cartografía analítica usando los datos electorales del plebiscito para la paz en Colombia (2016).
- Análisis de redes sociales con Networkx (Sesión 9): Introducción al paquete Networkx y la metodología de las redes sociales usando los datos de co-autoría en proyectos de ley en el Congreso de Colombia.
- Extracción de datos de Twitter (Sesión 10, repaso Sesión 12): Introducción al paquete Tweepy y la api de Twitter para analizar las tendencias del día y las diferentes posibilidades de análisis de opinión pública en las redes sociales digitales.
Extendemos la invitación a todos aquellos que deseen aprender a que se unan al semillero y sigan nuestro trabajo en la sección de #Política&Redes del Observatorio de la Democracia.
Repo Público:
https://github.com/Obsdemocracia/Semillero-programacion-20201