Question:
Biais de 5 'et 3' dans les données Rna-seq
stack_learner
2018-02-18 16:36:18 UTC
view on stackexchange narkive permalink

Je travaille avec des échantillons rna-seq. Je vois un biais 5 'et également un biais 3' dans le tracé de contenu de séquence par base. À partir de ce lien, je vois que le biais au début des séquences semble être le résultat d'une sélection biaisée de fragments de la bibliothèque. Et cela n'affectera aucune analyse en aval. Mais dans tous mes échantillons, je vois aussi des biais à la fin des séquences. Quel peut être le problème? Les échantillons sont séquencés par brin avec un protocole de sélection poly-A.

Dans le profil de couverture Transcript, je vois un biais de 5'-3 'pour tous mes échantillons est: 0.9

- tracé de séquence de base pour l'un des échantillons: pour tous les échantillons, je vois que le biais de 5 'et 3'.

Quand j'ai regardé le contenu de l'adaptateur, voici ce que je vois:

Aucun échantillon trouvé avec une contamination d'adaptateur> 0,1%

enter image description here

Deux réponses:
Devon Ryan
2018-02-18 20:34:53 UTC
view on stackexchange narkive permalink

Je pense qu'il y a eu un problème de séquençage lors de la dernière base, où certains réactifs étaient à court de séquenceur. Cela ne posera pas de réel problème, les aligneurs RNAseq comme STAR ne feront que couper doucement la dernière base ou les deux dernières si elles ne correspondent pas.

Il est courant de voir un peu de biais vers le 5 'ou 3 'se termine par RNAseq, principalement en raison du fait que la sélection poly-A a été effectuée ou qu'il y a eu un peu de dégradation. La principale chose à garantir est que le biais est similaire entre les échantillons / groupes. Si tel est le cas, vous n'avez pas à craindre que vos analyses en aval soient affectées par une sorte de biais par groupe.

J'utilise hisat2 et oui, je vois que le biais est similaire dans tous les échantillons. Merci d'avoir répondu.
Ah, pour hisat2, vous pourriez obtenir de meilleurs résultats si vous coupez les 1-2 dernières bases. C'est parce que hisat2 fait des alignements globaux (c'est-à-dire qu'il ne fait pas de soft-clipping). Ou du moins c'était le cas la dernière fois que j'ai vérifié.
Cool. Je vais considérer cela et couper quelques bases à l'extrémité 3 '. A-t-il également besoin d'une coupe à l'extrémité 5 '?
Non, la fin de 5 'devrait être ok.
Je pensais que hisat2 avait une option `--local`, mais quand je lance` hisat2 -h | grep local`, je reçois seulement `--ma match bonus (0 pour --end-to-end, 2 pour --local)`. Pas de `--local` proprement dit. L'aide n'a pas l'air cohérente.
@bli Les joies de la documentation des packages bioinformatiques ...
ewels
2020-05-20 14:22:49 UTC
view on stackexchange narkive permalink

Je sais que c'est un ancien article, mais si ce tracé provient de après le découpage, je suggérerais une explication différente: certains outils de découpage suppriment les séquences poly-A des lectures. Si tel est le cas, toute lecture se terminant par A l'aura supprimée, ce qui conduit à un contenu de base de 0% A dans la position de base finale (et à un code% A dans les deux dernières bases).

Cela ne devrait avoir aucun effet sur les alignements ou l'analyse.



Ce Q&R a été automatiquement traduit de la langue anglaise.Le contenu original est disponible sur stackexchange, que nous remercions pour la licence cc by-sa 3.0 sous laquelle il est distribué.
Loading...