Seminario de Estudiantes de Doctorado en Estadística

El propósito de estos seminarios es conocer los proyectos de investigación en los que han participado los y las estudiantes del programa de Doctorado en Estadística en la modalidad de ponencia. Se extiende la invitación a participar a toda la comunidad UC.


2023-06-22
16:00 hrshrs.
Inés Varas Caceres. PUC
Linking measurements through a Bayesian nonparametric approach
SALA MULTIUSOS (2do piso), FELIPE VILLANUEVA
Abstract:

We propose a new method for linking measurements of different versions of an instrument in order to obtain comparable scores defined in the context on educational measurement, especifically on equating methods. Considering measurements as ordinal random variables we use its latent representation from a Bayesian nonparametric approach to define customised relations between specific subgroups of the population of interest. We applied the proposal in different contexts broader than educational measurement. 

2023-06-08
16:00 hrshrs.
Bladimir Morales Torrez. PUC
Modelo Skew-t con coeficientes parcialmente variables ST-PVCM
SALA MULTIUSOS (2do piso), FELIPE VILLANUEVA
Abstract:

Los modelos parciales con coeficientes variando (Partially Varying Coefficient Models PVCMs) son una herramienta importante en la modelación de datos ambientales, económicos, financieros, biomédicos y otros, que tienen en su formulación un componente paramétrico y otro no paramétrico además de presentar interacción de las funciones suaves desconocidas con otras covariables modificadoras de efecto, que flexibiliza a los modelos de regresión lineales clásicos, generaliza a los modelos aditivos generalizados (GAMs) y a los modelos con coeficientes variando (VCMs) propuestos por Hastie y Tibshirani (1986, 1993), que tienen usualmente en el componente aleatorio (errores) distribución gaussiana, pero en muchas ocasiones los datos suelen ser más complejos en el sentido de que pueden presentan altos niveles de asimetría y curtosis así como datos atípicos. El objetivo de este trabajo es extender los PVCMs, el cual permita tener en su componente aleatorio errores de distribución asimétrica y colas pesadas t-Student denominada Skew-t presentada por Azzalini y Capitanio 2003, Gupta et al. 2002 y Gupta 2003, incrementando la flexibilidad de este tipo de modelos originando el modelo Skew-t con coeficientes parcialmente variables (Skew-t Partially Varying Coefficient Model ST-PVCM). Específicamente se desarrolló el algoritmo de Esperanza-Maximización (EM) propuesto por Dempster et al. 1977 para la estimación de los parámetros, además de realizar la inferencia para la aproximación de los errores estándar siguiendo la idea de Ferreira y Paula 2016 y se desarrolló el análisis de diagnóstico mediante influencia local a partir de Cook 1986 y Zhu y Lee 2001, así como el leverage generalizado siguiendo a Osorio 2006. Luego para evaluar la eficiencia de la estimación del algoritmo EM se realizó un estudio de simulación con la implementación computacional en el software R. Finalmente se aplicó toda la teoría desarrollada a dos conjuntos de datos del Sistema de Información Nacional de Calidad del Aire (SINCA) de Chile, específicamente a datos de la estación de la comuna de Pudahuel de la Región Metropolitana de Santiago y de la comuna Coronel Norte de la región del Bío Bío mostrando la utilidad del modelo ST-PVCM, teniendo como variable de estudio el material particulado fino respirable PM_2.5, por la importancia que representa en temas de contaminación ambiental y salud de la población.

2023-05-25
16:00 hrshrs.
Eduardo Alarcón Bustamante. PUC
Monotonic selection assumptions for more informative prediction of grade point averages
SALA MULTIUSOS 2 (1er piso), FELIPE VILLANUEVA
Abstract:

The degree to which college admissions test scores predict college grade point average (GPA) is commonly studied under the name of predictive validity, being regression analyses one of the most used tools in this type of studies. A problem that occurs in an admission process is that test scores are observed for all the applicants; however, the GPA of applicants that were not selected cannot be observed. The standard solution to tackle this problem has relied in strong assumptions to identify the exact value of the regression function in presence of  missing data.

In this talk, I present an alternative approach based on the theory of partial identifiability that uses milder assumptions to learn about the regression function. For a data set of university admissions, the results based on a monotonic selection assumption show that the set of plausible values for the regression function is much more informative for predicting the GPA than those obtained under weakly informative assumptions.

2023-05-11
16:00 hrshrs.
Cristian Capetillo Constela. PUC
Algoritmos Tipo Metropolis en Inferencia Bayesiana
SALA MULTIUSOS (2do piso), FELIPE VILLANUEVA
Abstract:

La estadística Bayesiana ha tomado una importancia relevante en los modelos estadísticos actuales. Su capacidad de incorporar nueva información de diversas fuentes y su naturalidad para realizar predicciones suelen ser un punto fuerte de este enfoque. El elemento en el cuál se basa la inferencia Bayesiana es la distribución a posteriori que es proporcional a la función de verosimilitud por la priori. Lamentablemente, el cálculo de esta distribución, o bien, cálculos que la involucren, suelen ser imposibles de resolver analíticamente y es necesario optar por métodos aproximados.

Debido a la complejidad de la posteriori, se han desarrollado técnicas computacionales para poder llevar a cabo la inferencia en el problema asociado. El conjunto de estas técnicas se denomina Computación Bayesiana. Dentro de la computación Bayesiana existe un conjunto de métodos denominados Markov Chain Monte Carlo (MCMC), que se basan en generar una cadena de Markov ergódica cuya distribución estacionaria y límite es justamente la posteriori. Desafortunadamente, el costo computacional puede ser bastante alto si se utiliza un método muy general como el Metropolis-Hastings vía caminata aleatoria. Suele ser común entonces que en base al problema, se utilice un algoritmo específico que haya sido estudiado en problemas relacionados.

Por la razón anterior es que en esta presentación se propone comparar tres algoritmos MCMC en distintos modelos Bayesianos: Random Walk Metropolis-Hastings (RWMH), Metropolis-Adjusted Langevin Algorithm (MALA) y Hamiltonian Monte Carlo (HMC). Éstos dos últimos tienen en común el uso del gradiente de la log-posteriori para la generación de la cadena de Markov.

2023-04-20
16:00 hrshrs.
Francisco Segovia Godoy. PUC
A survival curve estimator with hypothesis testing using Bayesian variable selection
SALA 3, FACULTAD DE MATEMÁTICAS
Abstract:

En el área de sobrevivencia es común buscar el estimar curvas de sobrevivencia para los tiempos de falla y concluir si existe una diferencia significativa entre dos curvas o no. Para esto, existen métodos conocidos tales como el estimador de Kaplan-Meier, test de log-rank o modelos de Cox. Sin embargo, las técnicas mencionadas poseen ciertas restricciones que buscamos superar. En esta presentación mostramos un método que sirve tanto para estimar curvas de sobrevivencia como para identificar predictores relevantes, usando una técnica de aumentación de datos bajo inferencia Bayesiana. La estrategía de selección de predictores está basada en la metodología Spike-and-slab. Se presenta tanto el método como el algoritmo de su Gibbs sampling. Finalmente, ajustamos nuestro modelo a una aplicación para datos reales.

2023-03-30
16:00 hrshrs.
Leonardo Barrios. PUC
Extensión de la distribución inversa power Muth usando composición de power series
SALA 2, FACULTAD DE MATEMÁTICAS
Abstract:

Se introduce una nueva distribución con soporte positivo, la cual permite una mayor flexibilidad para adaptarse a distintos tipos de datos en el área científica. Esta distribución, denominada inversa power Muth power series, es una extensión de la distribución inversa power Muth propuesta por Chesneau y Agiwal (2021), que es una composición entre las distribuciones inversa power Muth y la clase de distribuciones power series (Noak, 1950), destacando por primera vez el uso de la distribución Bell en este contexto. Se presentan las funciones de densidad, de sobrevivencia y de riesgo, así como los momentos de la distribución y la entropía diferencial. Haciendo uso de la representación estocástica del modelo se implementan los estimadores de máxima verosimilitud, a través del el algoritmo EM, y los errores estándar se calculan usando el método Oakes. Se realizan estudios de simulación de Monte Carlo para evaluar el desempeño de los estimadores de máxima verosimilitud en muestras finitas, y se presentan dos ilustraciones a conjuntos de datos reales, donde se compara con varios modelos comúnmente utilizados en la literatura también basados en composición del modelo power series.

2022-12-02
14:00hrs.
Nixon Jerez Lillo. PUC
Modelos Exponenciales de Grafos Aleatorios
SALA 2, FACULTAD DE MATEMÁTICAS
Abstract:

El Modelo Exponencial de Grafos Aleatorios (ERGM) es un modelo utilizado en grafos aleatorios que ha tenido una gran popularidad en el análisis estadístico de redes por permitir describir parsimoniosamente las fuerzas de selección locales que dan forma a la estructura global de una red (Hunter et al. 2008). Sus aplicaciones cruzan transversalmente diversas áreas, tales como las redes biológicas, informáticas, de trabajo, de conocimiento, etc.

 

La exposición tiene como objetivo dar a conocer esta nueva clases de modelos (en el marco de los modelos para variables binarias dependientes), y comprender sus desafíos (como modelo cuya constante normalizadora es intratable). Iniciaremos con una breve revisión bibliográfica sobre la forma en que algunos investigadores propusieron modelar redes para luego presentar el ergm y comprender la hipótesis de dependencia y homogeneidad por sobre el cual están construidos. A continuación, se ahondará en la forma con la que hacer inferencia clásica y bayesiana, cómo simular redes sintéticas a partir de él y una revisión a los métodos de bondad de ajuste que son utilizados.

2022-11-25
14:00hrs.
Hernán Robledo Araya. PUC
Psicometría: Puntuación de percepciones de seguridad en escuelas chilenas
Sala usos multiples 1 FELIPE VILLANUEVA
Abstract:

El Cuestionario de Contexto y Calidad de la Educación mide atributos relacionados a las percepciones del sistema educativo en estudiantes, profesores y apoderados para los cursos de 4° básico, 8° básico, y 2° medio. Estas percepciones son capturadas con cuestionarios autorreportados que miden clima escolar, motivación académica y escolar, entre otros. Teoría de Respuesta al Ítem (IRT) es un enfoque de modelamiento con variables latentes que es utilizado para modelar datos recopilados a través de este cuestionarios. Se presentará una aplicación de estos modelos para proponer cómo calcular un índice válido y confiable que representa las percepciones de seguridad de los miembros del sistema escolar.