Evaluating rules¶
jeux de données d'exemples¶
Les jeux de données d'exemples sont mis à disposition sur le NAS dans le volume /prodanr. Les données sont accessibles depuis dga2 et dga8.
Un repertoire par jeu de données est crée :
Bovins laitiers :
Repertoire : /prodanr/bovins_lait
Descriptions des données :
Dans ce fichier,
nous nous intéresserons au chromosome 1 ou il y a un QTL pour le lait
bien détecté en race Montbéliarde.
lait.txt : fichier de performance
id - poids - perf
marqueur1 : fichier carte
n°SNP - nom SNP - chromosome - position
ParGlob46.txt : fichier de paramètre génétique
n° du caractère - nom du caractère - var_r - var_g - h2 - r2
ped : fichier pedigree
id - pere - mere - id_recodifié(pas utile dans ce projet)
phase : fichier de données phasées
id - hap - snp1 snp2 ...
typ1.cvt : fichier de génotypage non phasé et avec données manquantes.
id snp1_1 snp1_2 snp2_1 snp2_2 ...
Si vous souhaitez les fichiers de génotypage avec données manquantes imputées au format typ, je peux vous les fournir.
Cheval
Les données sont également disponible sur /prodanr/cheval/
Dans ce fichier,
nous nous intéresserons au chromosome 3 ou il y a un QTL pour l'ostéochondrose du Jarret
dans ce répertoire, vous trouverez:
perf : fichier de performance
id - indicatrice - poids - perf
carteX : fichier carte
n°SNP - nom SNP - chromosome - position
ParamCar : fichier de paramètre génétique
n° du caractère - nom du caractère - var_r - h2 - r2
ped : fichier pedigree
id - pere - mere
phaseX : fichier de données phasées
id - hap - snp1 snp2 ...
typX : fichier de génotypage non phasé et avec données manquantes
id snp1_1 snp1_2 snp2_1 snp2_2 ...
Bovins viande
En race Blonde d'Aquitaine:
Freq$bta pour tour les chromosomes avec les fréquences des allèles aux marqueurs
marqueur$bta avec la carte pour tous les chromosomes
typ$bta avec les typages bruts
typ$bta.out avec convert et verifBTA de passés
phases$bta avec les phases (id - origine - marq1 - marq2 - marq3....)
perf_mnotend: performance corrigée des effets de milieu pour la note de tendreté (h²=0.19)
perf_tot: toutes les perf dispo
ParamCar: paramètres génétiques des caractères
perf manquantes codés à -9999
le chromosome d'intérêt est le 7 avec 2 QTL (au moins!) de la note de tendreté!¶
Données ovins
Fichiers * typ = sortie veriftyp * phases = sortie Linkphase
Pour les études LDLA, Pascal et Sophie ont reconstitué des phases complètes pour le chromosome 12 avec Dagphase(Beagle) = phases12_completes sur /prodanr/RES/LDLA/ovins
- le fichier perf : anim perf1 ip1 perf2 ip2, Si ip vaut 0 la perf associée n'est pas prise en compte. Les perf sont déjà corrigées pour les effets fixes.
- le fichier carte comprend aussi le nom du marqueur en dernière colonne
- Pour ParamCar, ce sont des valeurs approximatives et non estimées (h**2 et r**2). La variance résiduelle est celle des performances.
Les données comprennent les grand-pères de race pure Black-Belly, les pères F1, les back-cross et les back-cross*back-cross. Les mères Romane ne sont pas typées.
On s'intéresse à OAR12 qui comporte un QTL pour FEC12t et FEC34t.
Resultats¶
Les fichiers de resultats sont dans RES; regardez les README. Pour les analyses de Jean Michel Elsen:
les analyses des données bovines lait
fichiers
de resultats : result_qtlmap_la (analyse de liaison)
result_qtlmap_ld_nodam (modèle LDdecay sans les haplotypes maternels)
result_qtlmap_ld_dam (modèle LDdecay avec les haplotypes maternels)
result_qtlmap_ldla_nodam (modèle LDLA sans les haplotypes maternels)
result_qtlmap_ldla_dam (modèle LDLA avec les haplotypes maternels)
Pour le 4 derniers, voir Legarra & Fernando 2009. Ce sont des haplotypes de 4 SNPs de lrt par position lrt_qtlmap_la etc..... ne considérer que les colonnes 2 (positions) et 3 (lrt)
Porcs¶
Nous nous intéresserons au chromosome 17 où il y a un QTL pour la **longueur de carcasse*** (signal fort avec GenABEL).***
Dans /prodanr/porcTS
- perf : fichier de performance (donnée manquante = 0)
id – moyenne - poids - perf - marqueurXX : fichier carte pour le chromosome XX
n°SNP - nom SNP - chromosome - position - ParamCar : fichier paramètres des composantes de la variance
n° du caractère - nom du caractère - var_r - h2 - r2 - ped : fichier pedigree
id - idpere - idmere – num_avant_recod - phasesXX : fichier des génotypages phasés pour le chromosome XX
id - hap - snp1 - snp2 ... - typXX.out : fichier des génotypages non phasés (donnée manquante = 0 )
id - snp1_1 - snp1_2 - snp2_1 - snp2_2 ...
RESULTATS
Analyses LDLA : /prodanr/RES/LDLA/porcTS/LDLA_porcTS.pdf