Wiki

CR de réunions

Réunion du 8/06/2022:

Présents: Claire, Yannick, Sarah.

Liens utiles:
https://elearning.formation-permanente.inrae.fr/course/view.php?id=196&section=1
https://github.com/nf-core/rnaseq/blob/master/docs/output.md
Exemples
MultiQC v1.9- Exemple: http://genoweb.toulouse.inra.fr/~sigenae/sarah/multiqc_report.html
https://genotoul-bioinfo.pages.mia.inra.fr/use-nextflow-nfcore-course/
https://forgemia.inra.fr/genotoul-bioinfo/use-nextflow-nfcore-course

Autres réunions sur GitLab CATI BIOS4BIOL

https://forgemia.inra.fr/bios4biol/Help4MultiQC/-/tree/main

Exemples de graphiques commentés

General Stats

Il y a effectivement une petite différence de comptage entre samtools flagstat et samtools (raw_total_sequences) mais la différence est effectivement liée au multimapping : tot_seq_counts.png
or 136.5 + 6.5 = 143
M Total seqs (16ieme ligne) = nb de reads brutes pour l'union R1 + R2 = 136.5
M Non-Primary (11ieme ligne) = endroits où les reads mappent à plusieurs endroits (au minimum 2 mappings) = 6.5
M Reads (1ere ligne) = compte les lignes dans le BAM donc ajoute les multimappées aussi.

Chez toi, ces différences sont grandes car tu as beaucoup de multimapping. Voir pourquoi avec la PF de séquençage ?

Pour la différence proper paired, samtools et rseq, j'ai aussi des résultats très différents , du simple ou double.... d'autant que j'ai très peu de multimaps (5)... proper_reads.png

Après, reseq est un vieil outil, utilisé juste pour checker la qualité...

La ligne de commande rseq est:

RNASEQ:RSEQC:RSEQC_BAMSTAT (E_L1_90_LM_M_M+_R1) COMPLETED 0 4m 59s 100.5% 1 MB
    bam_stat.py \
        -i E_L1_90_LM_M_M+_R1.markdup.sorted.bam \
         \
        > E_L1_90_LM_M_M+_R1.bam_stat.txt

    bam_stat.py --version | sed -e "s/bam_stat.py //g" > rseqc.version.txt

RSeQC v2.3.7
bam_stat.py: Now counts ‘Proper-paired reads map to different chrom’

http://rseqc.sourceforge.net/#bam-stat-py --> Il compte les paires donc dans l'exemple ci-dessous: 41 millions de records mais 21 M de paired donc 50% environ... Donc peut-être que multiQC calcule un % mais sur les mauvais chiffres.... Faudrait comprendre par qui (multiQC ?) est calculé le pourcentage ?

bam_stats.png

Utiliser Rseq pour vérifier foward/reverse:

Lancer un pipeline sur 2-3 échantillons avec l'indication "unstranded" puis analyser le multiQC report généré par Nextflow nf-core rnaseq version 3.
En effet, RSeQC infer_experiment nous indique le pourcentage de lectures qui mappent en antisense et en sense. Si les librairies sont séquencées à partir de la polyA, l'antisense est le sens 3'-5' donc reverse et le sense est 5'-3' donc forward.

sens_antisens.png

Autre indication toujours à partir du report multiQC, avec l'outil qualimap.

qualimap.png

RSeQC

2012 - Assez peu utilisé - Contrôle qualité.

FastQC (raw)

-> Cf e-learning FPN INRAE

Sample correlation

sample_correlation : corresponds à une heatmap sous R. Pour mettre en évidence les échantillons outlayers ainsi que la ressemblance des échantillons dans leur expression.

Exemple: s4 est un outlayer

example_sample_correlation_s4outlayer.png

stringtieFPKM

Quantification des gènes du modèle Ensembl.

preseq

Recherche des lectures brutes redondantes en marquant les lectures identiques. Cette comparaison des lectures aboutit à un tableau avec, en première colonne, le nombre de lectures testées et les 3 autres colonnes sont les
lectures distinctes. Une lecture est comparée par rapport aux autres pour voir si elle est nouvelle ou pas. Cette analyse de la redondance de l'information permet de savoir s'il est nécessaire de continuer à séquencer ou pas.

markDuplicates

Marquage des lectures identiques dans le BAM.

dupradar

Recherche les duplicats PCR dans les données afin de déterminer si le lot et l'expression sont biaisés par la duplication des lectures hors du séquençage.

dupradar_example.png

Mini-projets des masters II BioInfo à compiler

Voir les pièces jointes ci-dessous. Sujets proposés en 2022 et 2023 à l'ensemble des étudiants du master II BioInfo de l'UPS.

bam_stats.png (37.3 KB) Sarah Maman, 07/15/2021 03:27 PM

tot_seq_counts.png (9.44 KB) Sarah Maman, 07/15/2021 03:27 PM

proper_reads.png (25 KB) Sarah Maman, 07/15/2021 03:27 PM

example_sample_correlation_s4outlayer.png (46.3 KB) Sarah Maman, 07/15/2021 03:52 PM

dupradar_example.png (120 KB) Sarah Maman, 07/15/2021 03:52 PM

qualimap.png (65.5 KB) Sarah Maman, 03/01/2022 10:13 AM

sens_antisens.png (49.9 KB) Sarah Maman, 03/01/2022 10:13 AM

Sandra_Dailhau_TP_Nextflow.pdf - Mini projet NEXTFLOW 2022 (824 KB) Sarah Maman, 11/08/2023 10:51 AM

Projet_Oceane_HACQUIN.pdf - Mini projet NEXTFLOW 2022 (1.06 MB) Sarah Maman, 11/08/2023 10:51 AM

JASON_Kory Nextflow.pdf - Mini projet NEXTFLOW 2022 (710 KB) Sarah Maman, 11/08/2023 10:51 AM

magdalena.szczuka.pdf - Mini projet NEXTFLOW 2022 (305 KB) Sarah Maman, 11/08/2023 10:52 AM

DM_Galaxy_Gatepe_C_KODJOVI.pdf - Mini projet NEXTFLOW 2022 (653 KB) Sarah Maman, 11/08/2023 10:52 AM

annabelle.bru.pdf - Mini projet NEXTFLOW 2022 (2.07 MB) Sarah Maman, 11/08/2023 10:52 AM

note nextflow nassim duprat.pdf - Mini projet NEXTFLOW 2022 (417 KB) Sarah Maman, 11/08/2023 10:52 AM

RACOUPEAU_Martin.pdf - Mini projet NEXTFLOW 2022 (525 KB) Sarah Maman, 11/08/2023 10:52 AM

Nextflow_Denne_Tiphaine.pdf - Mini projet NEXTFLOW 2022 (368 KB) Sarah Maman, 11/08/2023 10:52 AM

Rapport nextflow Coraline SIPRA.pdf - Mini projet NEXTFLOW 2022 (1.26 MB) Sarah Maman, 11/08/2023 10:52 AM

Projet_SebastienCabanac.pdf - Mini projet NEXTFLOW 2022 (962 KB) Sarah Maman, 11/08/2023 10:52 AM

Rapport_Nextflow_Fijalkow_Ilan.pdf - Mini projet NEXTFLOW 2022 (1.26 MB) Sarah Maman, 11/08/2023 10:52 AM

Projet_Nextflow_Naomi_SCHICKELE.pdf - Mini projet NEXTFLOW 2022 (3.49 MB) Sarah Maman, 11/08/2023 10:52 AM

Compte_Rendu_Nextflow_JH.pdf - Mini projet NEXTFLOW 2023 (1.7 MB) Sarah Maman, 11/08/2023 10:54 AM

moussa_Mini_Rapport_nextflow.pdf - Mini projet NEXTFLOW 2023 (670 KB) Sarah Maman, 11/08/2023 10:54 AM

Youcef_Ben_Mohammed.pdf - Mini projet NEXTFLOW 2023 (1.82 MB) Sarah Maman, 11/08/2023 10:54 AM

Catherine.pdf - Mini projet NEXTFLOW 2023 (1.29 MB) Sarah Maman, 11/08/2023 10:54 AM

claire_Rapport_nextflow.pdf - Mini projet NEXTFLOW 2023 (965 KB) Sarah Maman, 11/08/2023 10:54 AM

etienne_RapportEL.pdf - Mini projet NEXTFLOW 2023 (237 KB) Sarah Maman, 11/08/2023 10:54 AM

Projet_Nextflow_Margaux_Dore.pdf - Mini projet NEXTFLOW 2023 (490 KB) Sarah Maman, 11/08/2023 10:54 AM

CAMPOS_Julie_rapport_NEXTFLOW_M2-BBS.pdf - Mini projet NEXTFLOW 2023 (6.74 MB) Sarah Maman, 11/08/2023 10:54 AM

Rapport_Nextflow_Han_PHAN.pdf - Mini projet NEXTFLOW 2023 (16.5 MB) Sarah Maman, 11/08/2023 10:54 AM