Publicador de contenidos

Desenvolupament de models per a l'anàlisi estadística de l'associació entre polimorfismes genètics i malalties psiquiàtriques

Duración
2009
Coordinador
Juan José Abellán Andrés, CSIC
Financiadores
Generalitat Valenciana
Las herramientas de análisis estadístico más utilizadas habitualmente para estudiar la asociación entre los SNPs y los fenotipos de enfermedades se basan fundamentalmente en regresión logística y en contraste de hipótesis (ver eg [1]), aunque últimamente también se han propuesto nuevas alternativas como la regresión lógica [2,3]. El contraste de hipótesis se aplica de forma individual a cada SNP, y como los SNPs no suelen ser independientes, está sujeta al problema de comparaciones múltiples. Para controlar esta grave limitación estadística, habitualmente se hace una corrección del p-valor global inspirada en la de Bonferroni, reduciendo el valor nominal del nivel de significación estadística de los tests muy por debajo del 5% habitual. En los modelos de regresión logística la variable respuesta consiste en el fenotipo, y las variables explicativas son los SNPs. Cuando el número de variables, i.e. de SNPs, es muy grande, la estimación de los parámetros se hace numéricamente inestable. La regresión lógica es una herramienta alternativa más interesante, pues trata de establecer las posibles asociaciones entre el fenotipo y combinaciones lógicas de los SNPs, incluyendo así interacciones entre los SNPs que de alguna manera tienen en cuenta la naturaleza multivariante del problema. A pesar de la utilidad de estas técnicas con finalidad exploratoria, todas presentan la limitación de no poder incluir las posibles estructuras subyacentes en el mecanismo de generación de los datos que pueden vincular por ejemplo los SNPs o fenotipo. Los SNPs pueden estar agrupados por nada, bloques de haplotius, correlación cromosómica espacial o por su funcionalidad también [4]. También las enfermedades fenotípicas a estudiar pueden estar interrelacionadas mediante algún tipo de estructura que puede ser susceptible de ser tenida en cuenta en el estudio [5].

El uso de otras alternativas metodológicas como los modelos multinivel o jerárquico no se ha explorado hasta ahora. Estos modelos presentan la ventaja de tener una gran flexibilidad pues permiten incorporar distintas fuentes de variación con o sin estructura asociada, y por tanto tener en cuenta de forma más realista las relaciones de dependencia subyacentes en los datos. Nuestro objetivo con este proyecto es explorar la utilidad de estos modelos en el contexto de los estudios de genómica y salud descritos anteriormente. La estadística bayesianos ofrece un marco idóneo para hacer inferencia de este tipo de modelos altamente estructurados, y se ha aplicado ya en un gran variedad de contextos diferentes [6]. El uso del paradigma bayesiano no es nuevo en el ámbito de la genética y la genómica, donde ya se ha utilizado con éxito (ver eg [7-9] como ilustración de aplicaciones novedosas). Para el problema en particular de la asociación entre SNPs y fenotipo, algunos autores han propuesto dentro del marco bayesiano el uso de técnicas de selección de variables en modelos de regresión probit (similares a los de regresión logística, pero con otra función de enlace entre la media y el predictor lineal) para encontrar los SNPs [10]. Nosotros en este proyecto pretendemos investigar el uso de los modelos jerárquicos bayesianos en los estudios de asociación entre SNPs y enfermedades mentales, aunque su aplicación a otros tipos de enfermedades será inmediato.

Nuestro equipo

Investigador principal (IP)

  • Juan Ramón González Ruiz
    Juan Ramón González Ruiz