Toutes les plates-formes de séquençage à lecture longue sont basées sur le séquençage à une seule molécule, ce qui entraîne des taux d'erreur par base plus élevés. Pour cette raison, une étape de polissage a été ajoutée aux pipelines d'assemblage du génome - mappage des lectures brutes vers l'assemblage et correction des détails de l'assemblage.
J'ai un ensemble de données PacBio RSII décent d'un génome individuel d'espèces non modèles fortement hétérozygotes . L'assemblage s'est bien passé, mais quand j'ai essayé de peaufiner l'assemblage en utilisant quiver, il n'a pas pu converger sur quelques itérations et je parie que c'est à cause d'une trop grande divergence des haplotypes.
Existe-t-il un autre moyen de polir un génome avec de telles propriétés? Par exemple, existe-t-il un moyen de séparer les longues lectures par haplotype, afin que je puisse polir en utilisant un seul haplotype?