Métodos y fuentes en la sociología computacionalla exploración de los Big Data bibliográficos y de bibliotecas mediante análisis de redes
- Martinez Uribe, Luis
- Modesto Escobar Mercado Director
Universidad de defensa: Universidad de Salamanca
Fecha de defensa: 20 de julio de 2022
- Estrella Gualda Caballero Presidente/a
- Luis Carlos García Figuerola Secretario/a
- Iñaki Úcar Marqués Vocal
Tipo: Tesis
Resumen
Los orígenes de la sociología computacional, según Cioffi-Revilla (2014), se remontan a la invención de la computadora digital tras la Segunda Guerra Mundial aunque es sin duda la aparición del fenómeno big data lo que realmente ha supuesto un punto de inflexión comparable a los momentos de revolución científica y cambio de paradigma de Khun (1962). Desde hace unos años la sociología se ha relacionado con las nuevas fuentes de datos denominados big data de una manera excepcional, incorporándose en multitud de estudios de diversa índole, combinando las técnicas estadísticas habituales con nuevas metodologías cuantitativas de la ciencia de datos y la inteligencia artificial. Esta nueva subdisciplina de la sociología tiene ante sí retos sustanciales como son el acceso a los nuevos datos que, en la mayoría de las ocasiones pertenecen a empresas privadas, o la formación tecnológica necesaria de los sociólogos computacionales que les permitan almacenar, consultar, limpiar, explorar y analizar grandes conjuntos de datos. El presente trabajo de investigación en formato de tesis por compendio de publicaciones se inscribe en la tarea de aportar a la sociología computacional metodologías y herramientas que faciliten el trabajo con grandes cantidades de información. Para ello esta tesis intenta descubrir y aplicar herramientas y estrategias novedosas con las que enfrentarse a los big data y conseguir de ellos una correcta interpretación. Además, esta tesis tiene por objetivo ilustrar a través de ejemplos cómo los sociólogos pueden disponer y tratar los datos generados y gestionados por las bibliotecas y los archivos. Estas instituciones preservan la memoria que posibilita un análisis de las circunstancias políticas, económicas, culturales y sociales a lo largo de la historia. Para ello, esta tesis se compone de tres artículos: el primer artículo presenta la herramienta netCoin de código abierto para la exploración de estructuras de datos que implementa el análisis de coincidencias y que combina análisis multivariante y de redes. En el segundo artículo se trata con la herramienta netCoin una colección de datos abiertos de 3 millones de registros bibliográficos de la British Library. El tercer artículo analiza la disciplina sociológica en los últimos años, a partir de los 300 millones de publicaciones de los datos de Microsoft Academic Graph, aplicando varias metodologías y estrategias que permiten reducir la dimensionalidad. Los resultados de las investigaciones realizadas ofrecen varias conclusiones. En primer lugar, el análisis de coincidencias aporta un método de detección de patrones aplicable a colecciones de grandes y pequeños datos que ayuda a entenderlos mejor. Por otro lado, la herramienta desarrollada ofrece la utilización de redes interactivas que permiten realizar análisis exploratorios y presentar resultados finales. Además, se han presentado varias técnicas que reducen la dimensionalidad de los datos convirtiéndolos en datos más sencillos de manejar y analizar. Finalmente, los datos bibliográficos y de bibliotecas proporcionan una fuente de calidad y de fácil acceso para los sociólogos computacionales.