Exposés de la réunion à La Rochelle les 23 et 24 septembre 2010¶
Compte rendu de la réunion du projet ANR Rules & Tools à La Rochelle, les 23 et 24 septembre 2010
Objectifs¶
Objectifs¶
Le but de ces journées était de partager nos connaissances sur les méthodes et techniques disponibles dans la littérature et utiles au projet. Les participants ont été invités à présenter au choix un article particulièrement significatif, ou une synthèse bibliographique, ou un résultat original, dans l’esprit des taches sur lesquels ils doivent travailler. Il était demandé de faire des présentations suffisamment longues et détaillées pour que chacun puisse s’approprier la connaissance.
Réalisation¶
La rencontre s’est déroulée du jeudi 10h30 (jusqu’à 19h45) au vendredi 17h00 (à partir de 8h30). Vingt deux personnes étaient présentes, 16 ont fait une présentation.
La réunion était dense. Si elle devait être répétée, il conviendrait de limiter les temps de parole à une heure discussion comprise.
Le lieu était pratique (proche de la gare, en centre ville) et la salle de réunion confortable.
Exposés¶
JM Elsen. Synthèse sur le WCGALP¶
- Présentation des exposés de la session « statistical and Genomics tools for mapping QTL and Genes »
- Conclusions : travailler sur la dernière étape de l’analyse d’association ou du LDLA (CST, concordance) ; comprendre Blossoc comme alternative aux méthodes courantes ; approfondir la relation entropie-signal pour le contrôle des erreurs ; explorer les propositions d’approche de l’épistasie ; inviter Alvarez pour comprendre NOIA
S Boitard. Théorie de la coalescence¶
- Description pédagogique de la théorie et de ses applications
B Servin. Logiciels de simulation¶
- Comparaison de différents logiciel existants (ms, cosi, simcoal,genome, fastPHASE-U, Simulpop, QMsim)
- Conclusion : les méthodes de coalescence permettent d’obtenir rapidement des échantillons respectant les équilibres de Wright-Fisher ; elles ne permettent pas d’obtenir simplement des échantillons respectant le DL observé dans les populations réelles ; on a intérêt à découpler les volets génération de populations en DL (les fondateurs de pedigree) et gene dropping dans un pedigree réel ou imaginé
H Gilbert. LDSO¶
- Description du simulateur de Florence Ytournel
- Conclusion : il faut assembler sur le wiki des clés d’entrée vers les logiciels disponibles (adresse de la documentation, des sources et commentaires éventuels) ; l’ergonomie de LDSO doit être améliorée ; il faut prévoir de l’étendre au multicaractère et à l’épistasie
P Schneider. Synthèse sur le calcul des probabilités d’IBD et la classification des haplotypes¶
- Description très complète de l’existant. Analyse d’articles sur : la clustérisations des haplotypes et l’analyse d’association (Li et al., 2006) ; l’inférence de génotypes manquants (Marchini et al., 2007) ; l’inférence de phase et de génotypes manquants à partir de clusterisation (Scheet and Stephens (2006) et Browning and Browning (2007) ) ; la réalisation de régression à partir d‘imputation bayésienne (Servin and Stephens, 2007) ; le calcul de probabilité d’IBD en LA et LD (Meuwissen and Goddard, 2001) ;la clusterisation d’haplotypes basée sur les proba d’IBD et l’analyse de variance pour la cartographie (Druet et al., 2008) ; l’inférence des haplotypes et des génotypes manquants et la clustérisation en LDLA (Druet and Georges, 2010)
- Conclusions : comparer les clusters produits par les différentes méthodes, variant selon l’indice de distance et la méthode de clusterisation ; investir beaucoup plus sur les méthodes basées sur les états cachés avec l’aide de Bertrand
P Croiseau. Haplotype Inference in complex Pedigree (Kirkpatrick, 2009)¶
- Une autre approche pour trouver les haplotypes, en utilisant une méthode de Gibbs sampling bloqué
- Conclusion : évaluer son intérêt dans les structures animales
C Moreno. Utilisation du DL en croisement¶
- Analyse d’articles sur la sélection génomique dans les situations croisées (Prédiction de valeurs génétiques en race pure à partir de populations croisées (Dekkers, 2007;Ibanez et al, 2009; Toosi et al, 2010) ; Prédiction de valeurs génétiques en race pure à partir de plusieurs races pures (Roos et al, 2009; Hayes et al, 2009; Kizilkaya et al, 2010))
- Conclusion : le modèle de BSAM (Ibanez et al, 2009) est attractif ; il faut étudier comment ces méthodes peuvent s’utiliser en détection de QTL ; le modèle de Ledur doit être analysé ; il faut des modèles avec de la dominance
O Demeure. Epistasie génomique ¶
- Présentation du travail de Nicola Bacciu sur la recherche de SNP en interaction avec le reste du génome, résumé dans une GEBV
- Conclusion : il faut objectiver les tests statistiques et étudier leurs propriétés.
F Hospital. Epigenetic Inheritance and the Missing Heritability Problem (Slatkin, 2009)¶
- Présentation de l’article de Slatkin.
- Conclusion : les phénomènes d’épigénétiques doivent ils être modéliser pour améliorer les performances des modèles existants de recherche de QTL
C Delmas. Synthèse sur le contrôle des erreurs¶
- Présentation des travaux en collaboration avec CE Rabier. Tentative de généralisation au cas des interactions
- Conclusion : il faut réfléchir à l’extension à l’analyse d’association. Le point central sera la modélisation des covariances entre statistiques de tests successives sur le génome : loi basée sur le DL, possiblement empirique. Il sera en fait difficile d’intrapoler entre deux points (cela dépend à la fois de la distance et des fréquences). Est il réelement utile de faire de l’interval mapping dans ce cas ?
S Teyssedre. Améliorer la robustesse des analyses d’association¶
- Présentation de “New approaches to population stratification in genome-wide association studies’ (Prices et al, 2010) et d’un travail algébrique sur les propriétés des méthodes usuelles (régression, grammar et qtdt)
- Conclusion : il faut finir l’analyse de la méthode FASTA ; le modèle de Yu et al devra être testé sur données réelles
A Legarra. Parenté génomique¶
- Présentation des différentes approches de la matrice de parenté génomique. Analyse de l’article Common SNPs explain a large proportion of the heritability for human height (Yang et al)
S Fritz. Problèmes pratiques rencontrés dans la manipulation des données de la génomique¶
- Problèmes liés à la mauvaise qualité des cartes génétiques, à la variabilité de l’information entre animaux, à la convergence du LDLA, à l’interprétation du signal chaotique
- Conclusion : les puces changeront, il faut maitriser les techniques d’imputation ; la variabilité d’information entre reproducteurs peut être très importante ; savoir faire du multiQTL en LDLA ; choix des seuils de rejet.
V Ducrocq. Utilisation des méthodes de la sélection génomique pour l'analyse du génome¶
- Exposé très complet des méthodes d’évaluation génomique existantes ; ces méthodes ne sont pas très performantes pour repérer les QTL ; les approches de détections sont très complémentaires et utiles à la sélection génomique
A Ricard. Performance d'un Bayes Cpi pour la détection des QTL¶
- Exposé détaillé d’une méthode qui a été programmée en Fortran par O Filangi et analyse de ses propriétés
- Conclusions : Bayes Cpi marche sans doute bien pour l’évaluation génomique, mais pas pour la détection avec les effectifs étudiés : il ne faut pas tenter d’estimer la proportion de SNP actifs, pi. Le programme fortran marche très bien et des généralisations sont prévues
O.Filangi. Parallélisation¶
- Exposés des méthodes de parallèlisations de calculs disponibles et de leurs premières applications à la détection de QTL
- Conclusion : OpenMP est facile et efficace ; MPI n’est pas très efficace ; GPu demande une forte réécriture des codes ; la démarche de parallèlisation doit êter généraliser à nos algorithme, et aussi peu visible que possible pour les utilsateurs