Muchas aplicaciones estadísticas involucran colecciones de
parámetros que pueden considerarse relacionados entre sí debido
a la estructura del problema. Por ejemplo, en un estudio sobre la efectividad
de un tratamiento renal, si los pacientes del hospital tienen una
probabilidad de supervivencia
entonces parece razonable
suponer que las estimaciones de los parámetros
(las
cuales representan una muestra de hospitales) están relacionadas entre
sí.
Una manera natural de modelar esta situación consiste en usar una
distribución inicial bajo la cual las probabilidades
puedan verse como una muestra de una distribución
poblacional común, que a su vez depende de un hiperparámetro
desconocido
. Una característica importante de este enfoque
es que los datos observados,
, pueden utilizarse para estimar ciertos aspectos de la
distribución poblacional de los parámetros
(funciones
de
) a pesar de que sus valores no son observables.
La Figura 3 muestra la estructura general de un modelo jerárquico
simple.
Esta estructura jerárquica resulta muy útil al analizar modelos con muchos parámetros, como los que se usan, por ejemplo, para analizar datos que provienen de muestreos estratificados. Así, en un estudio para pronosticar la proporción de votantes que favorecerán a un candidato determinado en las próximas elecciones, pueden considerarse factores a nivel nacional, regional, estatal y distrital.
Es importante destacar que en la práctica los modelos no jerárquicos no son apropiados para analizar datos con estructura jerárquica. En general, si el modelo tiene pocos parámetros entonces no puede ajustar adecuadamente conjuntos de datos relativamente grandes. Por el contrario, si el modelo tiene muchos parámetros entonces tenderá a ``sobreajustar'' a los datos, en el sentido de que ajustará bien a los datos observados pero no necesariamente producirá buenas predicciones.
En contraste, los modelos jerárquicos pueden tener suficientes parámetros para ajustar bien los datos evitando el problema de sobreajuste al modelar la estructura de dependencia entre los parámetros a través de la distribución poblacional.