Una iniciativa del laboratorio de experimentación sobre las formas de las ciencias sociales Factor IDAES, que propone explorar el uso de técnicas computacionales para el análisis de datos.
“En las ciencias sociales argentinas tenemos una riquísima producción teórica y un muy buen nivel de análisis. El aprovechamiento de las técnicas computacionales, en cambio, es una de nuestras patas flojas”, dice Germán Rosati, investigador del CONICET en el Instituto de Altos Estudios Sociales (IDAES) de la UNSAM e impulsor de la iniciativa Factor Data.
Para Rosati, esa clase de herramientas abre un abanico de posibilidades, ya que no solo facilitan la recabación y el análisis de datos, sino también la concreción de hallazgos inesperados. “Lo bueno de este tipo de estudios es que se pueden encontrar cosas que no se están buscando”, dice el sociólogo, que hoy está al frente de un proyecto de análisis de letras de tango. “En los estudios que analizan textos se tiende a buscar algo bien específico, por ejemplo ‘masculinidades en letras de tango’. No es que eso esté mal pero, cuando hacemos un análisis basado en big data descubrimos, por ejemplo, que la mujer no aparece en el tango como un tema relevante en sí mismo”.
En esa línea, Rosati señala que se da una complementación muy interesante entre un análisis dirigido y otro más “agnóstico o empirista”. “Hay otros trabajos —que no hacemos nosotros— que han buscado estereotipos de género en revistas como El Gráfico o Brando. De ahí salen hallazgos muy interesantes que complementan los estudios de género”, amplía.
Además de este proyecto, que utiliza técnicas de análisis automático de texto para el estudio de letras de canciones de tango y de rock, Factor Data tiene otros cuatro proyectos en marcha: un abordaje de la circulación de contenidos en redes durante las corridas cambiarias enfocado en la red social Twitter; un seguimiento de la polarización del discurso político en redes a partir del estudio de los discursos de actores políticos individuales e institucionales, medios de comunicación y actores de la sociedad civil; una investigación enfocada en temáticas de delito, violencia y punitivismo a partir del estudio de posteos en Twitter y contenidos mediáticos; y un mapeo de tierras a partir de imágenes satelitales para determinar usos del suelo y modelar el avance de la frontera agrícola.
Las técnicas de deep learning, machine learning y ciencias sociales computacionales pueden tener múltiples aplicaciones. Rosati explica que las técnicas empleadas para el análisis del uso de suelos pueden aplicarse, por ejemplo, al estudio de fenómenos de transición de votos y comportamientos electorales. “Son una herramienta muy útil, con todas las ventajas y limitaciones que tiene cualquier herramienta. No son arcanos insondables que solo gente iluminada puede utilizar ni tampoco una solución mágica a todos los problemas. Si no hay una pregunta de investigación clara y bien formulada, las técnicas no van a resolver ese inconveniente”.
Más información, acá.
Big data y ciencias sociales, Ciencias Sociales computacionales, Data Science, Deep Learning, destacadaIdaes, FACTOR DATA, Factor IDAES, IDAES