Publicador de continguts

Desenvolupament de models per a l'anàlisi estadística de l'associació entre polimorfismes genètics i malalties psiquiàtriques

Durada
2009
Coordinador
Juan José Abellán Andrés, CSIC
Finançadors
Generalitat Valenciana
Les eines d'anàlisi estadística més emprades habitualment per a estudiar l'associació entre els SNPs i els fenotipus de malalties es basen fonamentalment en regressió logística i en contrast d'hipòtesi (veure e.g. [1]), tot i que darrerament també s'han proposat noves alternatives com ara la regressió lògica [2,3]. El contrast d'hipòtesi s'aplica de forma individual a cada SNP, i com que els SNPs no solen ser independents, està subjecta al problema de comparacions múltiples. Per a controlar esta greu limitació estadística, habitualmente es fa una correcció del p-valor global inspirada en la de Bonferroni, reduint el valor nominal del nivell de significació estadística dels tests molt per sota del 5% habitual. En els models de regressió logística la variable resposta consisteix en el fenotipus, i les variables explicatives són els SNPs. Quan el nombre de variables, i.e. de SNPs, és molt gran, l'estimació dels paràmetres es fa numèricament inestable. La regressió lògica és una eïna alternativa més interessant, doncs tracta d'establir les possibles associacions entre el fenotipus i combinacions lògiques dels SNPs, incloent així interaccions entre els SNPs que d'alguna manera tenen en compte la natura multivariant del problema. Tot i la utilitat d'aquestes tècniques amb finalitat exploratòria, totes presenten la limitació de no poder incloure les possibles estructures subjacents en el mecanisme de generació de les dades que poden vincular per exemple els SNPs o els fenotipus. Els SNPs poden estar agrupats per gens, blocs d'haplotius, correlació cromosòmica espacial o per la seua funcionalitat també [4]. També les malalties fenotípiques a estudiar poden estar-hi interrelacionades mitjançant algun tipus d'estructura que pot ser susceptible de ser tinguda en compte en l'estudi [5].

L'ús d'altres alternatives metodòlogiques com ara els models multinivell o jeràrquic no s'ha explorat fins ara. Estos models presentan l'avantatge de tindre una gran flexibilitat doncs permeten incorporar distintes fonts de variació amb o sense estructura associada, i per tant tindre en compte de forma més realista les relacions de dependència subjacents en les dades. El nostre objectiu amb este projecte és explorar la utilitat d'estos models en el context dels estudis de genòmica i salut descrits anteriormente. L'estadística baiesiana ofereix un marc idoni per a fer inferència d'aquest tipus de models altament estructurats, i s'ha aplicat ja en un gran varietat de contexts diferents [6]. L'ús del paradigme baiesià no és nou en l'àmbit de la genètica i la genòmica, on ja s'ha fet servir amb èxit (veure e.g. [7-9] com a il.lustració d'aplicacions novedoses). Per al problema en particular de l'associació entre SNPs i fenotipus, alguns autors han proposat dins del marc baiesià l'ús de tècniques de selecció de variables en models de regressió probit (semblants als de regressió logística, però amb una altra funció d'enllaç entre la mitjana i el predictor linial) per tal de trobar els SNPs [10]. Nosaltres en aquest projecte pretenem investigar l'ús dels models jeràrquics baiesians en els estudis d'associació entre SNPs i malalties mentals, tot i que la seva aplicació a altres tipus de malalties será immediat.

Our Team

Investigador principal (IP)

  • Juan Ramón González Ruiz
    Juan Ramón González Ruiz