Una aplicación Bayesiana de mezclas basadas en procesos Dirichlet
Luis Gonzalo León Novelo
La gran mayoría de los modelos Bayesianos utilizados actualmente en las aplicaciones, concretamente en el análisis de datos, son paramétricos. Por una parte, los modelos paramétricos son más fáciles de analizar y cuentan con técnicas más desarrolladas para su análisis. Por otro lado, muchas veces permiten describir de manera simple las características esenciales del problema estudiado y por lo tanto generalmente admiten interpretaciones más directas. No obstante, los modelos paramétricos implican fuertes supuestos sobre el proceso que genera los datos y pueden ser poco robustos ante violaciones a dichos supuestos. Desde un punto de vista Bayesiano, suponer un modelo paramétrico implica la asignacion de probabilidad uno a un subconjunto muy pequeño dentro del conjunto de todos los modelos posibles. Lo anterior puede llevar a inferencias incoherentes si posteriormente la evidencia muestra que el modelo paramétrico no era adecuado.
Una forma de mitigar estos problemas consiste en utilizar modelos no paramétricos. Desde la perspectiva Bayesiana, esto se logra asignando distribuciones iniciales sobre espacios de funciones de densidad (o de distribución). Sin embargo, las herramientas matemáticas requeridas para el análisis de este tipo de modelos, tales como la teoría de los procesos estocásticos, son más complejas. Afortunadamente, desde hace algunos años ha sido posible analizar estos modelos a través de métodos numéricos, debido principalmente a los avances recientes en las técnicas de simulación y específicamente a las técnicas de Monte Carlo vía cadenas de Markov. Entre los modelos Bayesianos no paramétricos propuestos hasta la fecha, las mezclas basadas en procesos Dirichlet son posiblemente los más atractivos ya que son bastantes flexibles pero al mismo tiempo son relativamente sencillos de analizar a través de las técnicas de simulación antes mencionadas.
En este trabajo hemos discutido el desarrollo y
aplicaciones las
mezclas basadas en procesos Dirichlet. Abordado con detalle las
propiedades del Proceso Dirichlet.
También
hemos descrito con cierto detalle el algoritmo utilizado para obtener
las muestras de la distribución predictiva final, que son la
base de nuestro análisis Bayesiano no paramétrico.
Finalmente, consideramos la aplicación de las mezclas basadas en procesos Dirichlet al problema de estimación de densidades, lo cual nos permitió posteriormente plantear y resolver un problema de selección de modelos paramétricos desde un punto de vista Bayesiano no paramétrico.