Modelos de regresión para datos masivos con errores asimétricos: Una generalización RR y GBLUP

Paulino Pérez Rodríguez

(Colegio de Posgraduados)

Resumen:

Los modelos de regresión lineal múltiple son una herramienta fundamental en el área de estadística. En los modelos clásicos es usual suponer que los errores se distribuyen como variables aleatorias normales con media cero y varianza común, lo cual implica que la variable respuesta tiene también distribución normal. Es usual suponer también que el número de predictores (p) es menor que el número de registros (n). En otras disciplinas, por ejemplo, en genética existen aplicaciones en los que la distribución de la variable respuesta es marcadamente asimétrica debido al proceso de selección y el número de predictores excede por mucho el tamaño de muestra (p>>n) por ejemplo cuando se tienen Polimorfismos de Nucleótidos Simples (SNPs). En este trabajo se propone una extensión del modelo de regresión múltiple y que es útil para predicción cuando p>>n y los errores son asimétricos. El modelo es ajustado empleando el enfoque Bayesiano y una representación estocástica de una variable normal asimétrica, lo cual permite utilizar el muestreador de Gibbs el algoritmo de Metropolis y caminata aleatoria para obtener las distribuciones posteriores para las cantidades de interés. Se presenta también un par de reparametrizaciones del modelo basadas en la descomposición en valores singulares y QR de la matriz de predictores lo que permite reducir considerablemente los tiempos de cómputo. La utilidad del modelo propuesto se ejemplifica con un problema de selección de líneas en el programa de mejoramiento genético de maíz del CIMMyT.

Fecha: Lunes 21 de mayo de 2018.
Lugar: Salón 201-202, Edificio Anexo del IIMAS.
Hora: 13:00 horas.