Factor Data es una iniciativa del Instituto de Altos Estudios Sociales que impulsa la incorporación de técnicas computacionales de investigación. En noviembre se realizaron dos encuentros y talleres con especialistas en el Campus Miguelete y en el Edificio Volta.
La primera actividad “La ciencia de datos en las ciencias sociales y las ciencias sociales en la ciencia de datos”, fue el viernes 22 de noviembre en el Edificio Volta. El panel contó con la participación del coordinador de Factor Data e investigador del Instituto de Altos Estudios Sociales (IDAES) de la UNSAM, Germán Rosati, que analizó la relación entre machine learning y ciencias sociales.
También participaron Tomás Olega (UBA), que expuso sobre vías de detección de fraude electoral a través de métodos estadísticos; Natsumi Shokida (Economía Femini(s)ta y RLadies), que realizó una presentación sobre el rol que pueden ocupar los datos en el avance de los feminismos; Antonio Vázquez Brust (UTDT-FLACSO), que habló sobre el análisis del código de programación como medio de expresión; y Victoria O’ Donnell (UBA-FLACSO), que analizó el “lado oscuro” de la aplicación de algoritmos y la necesidad de una conjunción entre las ciencias sociales y la ciencia de datos.
Coordinó el panel Diego Kozlowski (FCEyN-UBA). Luego de las exposiciones, se debatió acerca de la relación entre el método científico de las ciencias sociales y las técnicas computacionales y estadísticas, y sobre las limitaciones técnicas, éticas y políticas del uso de algoritmos para la automatización de los procesos de toma de decisiones.
El Taller de Análisis Computacional de Textos Aplicado a las Ciencias Sociales fue el lunes 25. Por la mañana hubo exposiciones de casos de aplicación de text mining (minería de textos) para problemas del campo de las ciencias sociales. Diego Kozlowski (FCEyN-UBA) presentó un análisis sobre estereotipos de género en las revistas Brando y OhLaLá; Carla Pallaviccini (FCEyN-UBA) expuso sobre la identificación de cepas de cannabis analizando relatos de usuarios; Facundo Carrillo (FCEyN-UBA) disertó sobre formas de identificación automática de pacientes con esquizofrenia a partir de análisis del discurso; Sebastián Pinto (FCEyN-UBA) habló sobre metodologías para el seguimiento continuo de la agenda mediática y, por último, Germán Rosati presentó un caso de análisis de letras de tango mediante técnicas de text mining.
Durante la tarde se organizó un taller práctico de text mining a cargo de Diego Kozlowski. El objetivo fue mostrar un pipeline (embudo de ventas) de trabajo completo. Se expusieron algunas técnicas para preprocesar texto y se explicó una de las técnicas para modelar e identificar tópicos en un corpus de forma automática. Por ultimo, se realizó una práctica descargando y analizando twits sobre el golpe de Estado en Bolivia.
Analisis computacional de textos, Antonio Vázquez Brust, Carla Pallaviccini, Ciencia de Datos, Ciencias sociales, destacadaIdaes, Diego Kozlowski, FACTOR DATA, Factor IDAES, Facundo Carrillo, Germán Rosati, minería de datos, minería de textos, Natsumi Shokida, Sebastián Pinto, Tomás Olega, Victoria O'Donnell