Cuando:
1 marzo, 2023 a las 6:00 pm – 7:00 pm
2023-03-01T18:00:00+01:00
2023-03-01T19:00:00+01:00
Donde:
CCHS-CSIC
Calle Albasanz
26 28037 Madrid
Precio:
Gratuito
Nuevos desarrollos en el área del big data histórico: desafíos, métodos y oportunidades de investigación (Conferencia) @ CCHS-CSIC

CICLO: Demography Today 2022/2023
CONFERENCIANTE: Bárbara Revuelta-Eugercios (Investigadora senior de proyectos en los Archivos Nacionales de Dinamarca e investigadora invitada en el Instituto SAXO de la Universidad de Copenhague)

Para comprender de una forma lo más amplia posible los cambios sociales, demográficos y de salud actuales es imprescindible incorporar los cambios lentos que ocurren a través de las generaciones y la transmisión intergeneracional de rasgos biológicos y sociales. Como consecuencia, existe una creciente demanda de datos a gran escala que contengan información a nivel individual sobre el curso de vida y las relaciones familiares, y que se remonten a varias generaciones. Dado el coste de construir estas bases de datos, los investigadores recurren a la explotación de los registros de población históricos existentes, reutilizan las colecciones disponibles o, en algunos casos, construyen bases de datos completamente nuevas aprovechando la experiencia de los últimos treinta años en el campo.

En esta conferencia, se presenta el proyecto Link-Lives, que desarrolla métodos para un nuevo registro de población histórico a nivel nacional en Dinamarca y que cubre el período 1787-1968, integrando conjuntos de datos históricos legibles a través de procesos de reconocimiento de texto. Dado que el actual sistema de registro civil se inició en 1968, la conexión de ambos hará posible la reconstrucción de hasta diez generaciones. Además, se mostrarán los desafíos únicos de combinar conjuntos de datos ya creados y en proceso de diferentes orígenes: proyectos de crowdsourcing en curso, colecciones genealógicas de empresas privadas, experimentos en curso con reconocimiento automático de escritura a mano y bases de datos de investigación existentes, que ascienden rápidamente a cien millones de registros. Se mostrarán los métodos desarrollados para administrar y vincular estos registros históricos a través de métodos replicables, transparentes, históricamente precisos y robustos, basados en una combinación de experiencia en el dominio y métodos de aprendizaje automático. Finalmente, se discutirá la investigación actual que esta nueva base de datos hace posible dentro de las limitaciones del proyecto, así como las nuevas vías de investigación, desde la historia hasta las ciencias sociales y de la salud, que se abrirán en un futuro próximo.