Wiki

CR de réunions

Réunion du 8/06/2022:

Présents: Claire, Yannick, Sarah.

Liens utiles:
https://elearning.formation-permanente.inrae.fr/course/view.php?id=196&section=1
https://github.com/nf-core/rnaseq/blob/master/docs/output.md
Exemples
MultiQC v1.9- Exemple: http://genoweb.toulouse.inra.fr/~sigenae/sarah/multiqc_report.html
https://genotoul-bioinfo.pages.mia.inra.fr/use-nextflow-nfcore-course/
https://forgemia.inra.fr/genotoul-bioinfo/use-nextflow-nfcore-course

Autres réunions sur GitLab CATI BIOS4BIOL

https://forgemia.inra.fr/bios4biol/Help4MultiQC/-/tree/main

Exemples de graphiques commentés

General Stats

Il y a effectivement une petite différence de comptage entre samtools flagstat et samtools (raw_total_sequences) mais la différence est effectivement liée au multimapping : tot_seq_counts.png
or 136.5 + 6.5 = 143
M Total seqs (16ieme ligne) = nb de reads brutes pour l'union R1 + R2 = 136.5
M Non-Primary (11ieme ligne) = endroits où les reads mappent à plusieurs endroits (au minimum 2 mappings) = 6.5
M Reads (1ere ligne) = compte les lignes dans le BAM donc ajoute les multimappées aussi.

Chez toi, ces différences sont grandes car tu as beaucoup de multimapping. Voir pourquoi avec la PF de séquençage ?

Pour la différence proper paired, samtools et rseq, j'ai aussi des résultats très différents , du simple ou double.... d'autant que j'ai très peu de multimaps (5)... proper_reads.png

Après, reseq est un vieil outil, utilisé juste pour checker la qualité...

La ligne de commande rseq est:

RNASEQ:RSEQC:RSEQC_BAMSTAT (E_L1_90_LM_M_M+_R1) COMPLETED 0 4m 59s 100.5% 1 MB
    bam_stat.py \
        -i E_L1_90_LM_M_M+_R1.markdup.sorted.bam \
         \
        > E_L1_90_LM_M_M+_R1.bam_stat.txt

    bam_stat.py --version | sed -e "s/bam_stat.py //g" > rseqc.version.txt

RSeQC v2.3.7
bam_stat.py: Now counts ‘Proper-paired reads map to different chrom’

http://rseqc.sourceforge.net/#bam-stat-py --> Il compte les paires donc dans l'exemple ci-dessous: 41 millions de records mais 21 M de paired donc 50% environ... Donc peut-être que multiQC calcule un % mais sur les mauvais chiffres.... Faudrait comprendre par qui (multiQC ?) est calculé le pourcentage ?

bam_stats.png

Utiliser Rseq pour vérifier foward/reverse:

Lancer un pipeline sur 2-3 échantillons avec l'indication "unstranded" puis analyser le multiQC report généré par Nextflow nf-core rnaseq version 3.
En effet, RSeQC infer_experiment nous indique le pourcentage de lectures qui mappent en antisense et en sense. Si les librairies sont séquencées à partir de la polyA, l'antisense est le sens 3'-5' donc reverse et le sense est 5'-3' donc forward.

sens_antisens.png

Autre indication toujours à partir du report multiQC, avec l'outil qualimap.

qualimap.png

RSeQC

2012 - Assez peu utilisé - Contrôle qualité.

FastQC (raw)

-> Cf e-learning FPN INRAE

Sample correlation

sample_correlation : corresponds à une heatmap sous R. Pour mettre en évidence les échantillons outlayers ainsi que la ressemblance des échantillons dans leur expression.

Exemple: s4 est un outlayer

example_sample_correlation_s4outlayer.png

stringtieFPKM

Quantification des gènes du modèle Ensembl.

preseq

Recherche des lectures brutes redondantes en marquant les lectures identiques. Cette comparaison des lectures aboutit à un tableau avec, en première colonne, le nombre de lectures testées et les 3 autres colonnes sont les
lectures distinctes. Une lecture est comparée par rapport aux autres pour voir si elle est nouvelle ou pas. Cette analyse de la redondance de l'information permet de savoir s'il est nécessaire de continuer à séquencer ou pas.

markDuplicates

Marquage des lectures identiques dans le BAM.

dupradar

Recherche les duplicats PCR dans les données afin de déterminer si le lot et l'expression sont biaisés par la duplication des lectures hors du séquençage.

dupradar_example.png

Mini-projets des masters II BioInfo à compiler

Voir les pièces jointes ci-dessous. Sujets proposés en 2022 et 2023 à l'ensemble des étudiants du master II BioInfo de l'UPS.

bam_stats.png (37,274 ko) Sarah Maman, 15/07/2021 15:27

tot_seq_counts.png (9,442 ko) Sarah Maman, 15/07/2021 15:27

proper_reads.png (24,983 ko) Sarah Maman, 15/07/2021 15:27

example_sample_correlation_s4outlayer.png (46,301 ko) Sarah Maman, 15/07/2021 15:52

dupradar_example.png (119,693 ko) Sarah Maman, 15/07/2021 15:52

qualimap.png (65,491 ko) Sarah Maman, 01/03/2022 10:13

sens_antisens.png (49,909 ko) Sarah Maman, 01/03/2022 10:13

Sandra_Dailhau_TP_Nextflow.pdf - Mini projet NEXTFLOW 2022 (824,349 ko) Sarah Maman, 08/11/2023 10:51

Projet_Oceane_HACQUIN.pdf - Mini projet NEXTFLOW 2022 (1,064 Mo) Sarah Maman, 08/11/2023 10:51

JASON_Kory Nextflow.pdf - Mini projet NEXTFLOW 2022 (709,619 ko) Sarah Maman, 08/11/2023 10:51

magdalena.szczuka.pdf - Mini projet NEXTFLOW 2022 (304,625 ko) Sarah Maman, 08/11/2023 10:52

DM_Galaxy_Gatepe_C_KODJOVI.pdf - Mini projet NEXTFLOW 2022 (653,101 ko) Sarah Maman, 08/11/2023 10:52

annabelle.bru.pdf - Mini projet NEXTFLOW 2022 (2,074 Mo) Sarah Maman, 08/11/2023 10:52

note nextflow nassim duprat.pdf - Mini projet NEXTFLOW 2022 (416,799 ko) Sarah Maman, 08/11/2023 10:52

RACOUPEAU_Martin.pdf - Mini projet NEXTFLOW 2022 (525,066 ko) Sarah Maman, 08/11/2023 10:52

Nextflow_Denne_Tiphaine.pdf - Mini projet NEXTFLOW 2022 (368,279 ko) Sarah Maman, 08/11/2023 10:52

Rapport nextflow Coraline SIPRA.pdf - Mini projet NEXTFLOW 2022 (1,264 Mo) Sarah Maman, 08/11/2023 10:52

Projet_SebastienCabanac.pdf - Mini projet NEXTFLOW 2022 (962,465 ko) Sarah Maman, 08/11/2023 10:52

Rapport_Nextflow_Fijalkow_Ilan.pdf - Mini projet NEXTFLOW 2022 (1,258 Mo) Sarah Maman, 08/11/2023 10:52

Projet_Nextflow_Naomi_SCHICKELE.pdf - Mini projet NEXTFLOW 2022 (3,487 Mo) Sarah Maman, 08/11/2023 10:52

Compte_Rendu_Nextflow_JH.pdf - Mini projet NEXTFLOW 2023 (1,703 Mo) Sarah Maman, 08/11/2023 10:54

moussa_Mini_Rapport_nextflow.pdf - Mini projet NEXTFLOW 2023 (670,459 ko) Sarah Maman, 08/11/2023 10:54

Youcef_Ben_Mohammed.pdf - Mini projet NEXTFLOW 2023 (1,819 Mo) Sarah Maman, 08/11/2023 10:54

Catherine.pdf - Mini projet NEXTFLOW 2023 (1,295 Mo) Sarah Maman, 08/11/2023 10:54

claire_Rapport_nextflow.pdf - Mini projet NEXTFLOW 2023 (965,065 ko) Sarah Maman, 08/11/2023 10:54

etienne_RapportEL.pdf - Mini projet NEXTFLOW 2023 (236,647 ko) Sarah Maman, 08/11/2023 10:54

Projet_Nextflow_Margaux_Dore.pdf - Mini projet NEXTFLOW 2023 (490,396 ko) Sarah Maman, 08/11/2023 10:54

CAMPOS_Julie_rapport_NEXTFLOW_M2-BBS.pdf - Mini projet NEXTFLOW 2023 (6,736 Mo) Sarah Maman, 08/11/2023 10:54

Rapport_Nextflow_Han_PHAN.pdf - Mini projet NEXTFLOW 2023 (16,479 Mo) Sarah Maman, 08/11/2023 10:54