Coucouuu,
Alors, tu as bien raison pour la couverture ! C’est la proportion du génome ou de la séquence cible qu’on a réussi à lire au moins une fois.
👉 Si on compare à une phrase :
Si tu as lu toute la phrase, tu as une bonne couverture. Si tu as oublié des mots, il te manque de la couverture.
Par exemple, si tu veux séquencer un gène de 1000 bases. Si ton séquençage te donne des fragments couvrant 950 bases, ta couverture est de 95 %.
Maintenant, pour la profondeur, je vais essayer de te donner un exemple pour que ce soit plus clair pour toi
Imagine que ton génome, c’est une phrase :
« CHAT NOIR »
Et que ton séquenceur lit cette phrase en petits morceaux (appelés reads).
Par exemple :
Read 1 : CHA
Read 2 : HAT
Read 3 : AT N
Read 4 : T NO
Read 5 : NOIR
Read 6 : OIR
Si on aligne ces petits morceaux, on voit que certaines lettres sont lues plusieurs fois :
Lettre Nombre de fois lue
C 1
H 2
A 3
T 3
N 2
O 3
I 2
R 2
👉 Ici, la profondeur moyenne du séquençage est d’environ 2 à 3×.
Chaque position a été lue en moyenne 2 à 3 fois.
En résumé, la profondeur c'est le nombre de fois où chacune des bases d’intérêt a été lue sur des reads différents.
Pour le nombre de gènes, j'avoue que les infos sont un peu flous... En présentiel, la prof a dit 25 000 gènes mais j'ai essayé de me renseigner et je crois que les données scientifiques actuelles sont les suivantes :
- 20 000 à 21 000 gènes codant pour des protéines chez l’humain.
- si on compte tous les gènes non codants (ARNr, ARNt, ARNs régulateurs…), on peut arriver à 25 000 voire 30 000 éléments génétiques fonctionnels.
En tout cas, no stress, en génétique : les profs ne vous piègeront jamais là dessus !
J'espère que tu as tout bien compris, sinon n'hésite pas et j'espère bien te serrer la main à l'EB (hésite pas à venir me voir directement parce que je ne pourrais pas deviner qui tu es à moins de faire une annonce au micro

)
Bon courage pour les révisions
