Taller en la UC profundizó conocimientos en manejo de la Encuesta Casen a través de R

14 de junio de 2024


  • La pregunta principal que se respondió en el taller fue cómo poder tratar la no respuesta de forma que se permita visualizar la enorme pérdida de información en las inferencias producto de la no respuesta.

Dummy image

Estudiantes de pregrado y postgrado, junto a especialistas de áreas como la estadística, economía, sociología, administración pública y ciencias políticas, llegaron hasta la Facultad de Matemáticas UC para ser parte del “Taller de Conocimiento y Manejo de la Encuesta CASEN con R”, organizado por el “Núcleo Milenio sobre Movilidad Intergeneracional: del modelamiento a la política” (MOVI), para profundizar en el análisis de la encuesta CASEN, mediante el lenguaje de programación R.

Dictado por el investigador postdoctorante MOVI y Doctor en Estadística de la Facultad de Matemáticas UC, Eduardo Alarcón, el espacio se realizó durante dos jornadas que tuvieron lugar en el campus San Joaquín de la UC, donde cerca de 100 asistentes pudieron ahondar en la metodología que utiliza CASEN para la estimación de las cantidades poblacionales que aparecen en prensa.  

“Una de las fortalezas que tiene CASEN, es que entrega a toda la documentación necesaria para poder entender de dónde vienen todos los resultados que se reportan. En este contexto, es de suma importancia que, como ciudadanos responsables, sepamos cuál es la antesala de estos cálculos, pues con CASEN se toman decisiones importantes a nivel país”, dijo Alarcón.

En vista de ello, el taller buscó proponer una nueva metodología que reporta resultados que dejan de manifiesto la incerteza generada a raíz de la no respuesta por parte de los entrevistados.

“Comprobamos que los resultados que vemos en prensa son producto de un supuesto: la variable en la que quiero hacer inferencias, se comporta de manera homogénea entre quienes tienen las mismas características. Sin embargo, es un supuesto que no se puede verificar (al igual que cualquier supuesto). Adicionalmente, demostramos que, bajo este supuesto, no importa qué porcentaje de valores faltantes hay para hacer inferencias, opacando la enorme incerteza que se produce por la no respuesta”, agregó el investigador.

En ese sentido, la pregunta principal que se respondió en el taller fue cómo poder tratar la no respuesta de forma que se permita visualizar la enorme pérdida de información en las inferencias producto de la no respuesta. “Esta pregunta la contestamos, introduciendo una técnica que se denomina identificación parcial, que permite incluso no incorporar supuestos sobre lo no observado, dejando de manifiesto el posible rango de valores que podría tomar lo que queremos medir y que no se puede observar si no consideramos la no respuesta”, manifestó Eduardo Alarcón.  

En línea con ello, quienes participaron de taller pudieron visualizar los resultados, contrastando lo obtenido a través de la metodología de CASEN con lo arrojado a través de esta técnica de identificación parcial. Una vez entendido esto, se pasó a replicar resultados de prensa a través de R, un software gratuito que es útil para realizar análisis estadísticos. Esta fue la última parte del taller, pues los y las asistentes ya estaban empapados de cómo se obtenían los resultados.

“Para el Núcleo Mileno MOVI, es importante ver el interés de la comunidad en esta materia. Quienes participaron, se mostraron muy entusiasmados por entender más aún sobre este supuesto de homogeneidad, dónde se aplica y por cómo se puede justificar. Además, se vieron muy entusiasmados con la réplica de resultados, pues ya sabían lo que realmente estaban replicando y cómo se hacía”, puntualizó Eduardo Alarcón.

Alojado en la Facultad de Matemáticas UC, el Núcleo Milenio sobre Movilidad Intergeneracional (MOVI), a través de sus distintas líneas de investigación, busca caracterizar la medición y las recomendaciones de políticas públicas sobre movilidad intergeneracional basadas en diferentes enfoques metodológicos.

Todo el material del taller lo puede encontrar aquí.