Nous avons généré un génome (diploïde, chordata, hautement hétérozgue) en utilisant PacBio et nous voulions voir s'il contenait des duplications spécifiques à la lignée (paralogues, essentiellement). Le génome n'est pas encore dans Ensembl.
Les seules données dont nous disposons pour le moment sont:
- génome
- annotation de transcription
- RNAseq
Nous avons trouvé quelques méthodes dans des articles:
- utilisez Blast
- détectez les duplications segmentaires dans des génomes complets avec SDDdetector
- détection de duplications segmentaires putatives récentes ou d'organismes homozygotes diploïdes basés sur les données NGS DuplicationDetector
- (je viens de trouver ceci, mais cela devrait fonctionner ) mappe les lectures à l'assemblage & analyse la profondeur de lecture pour détecter les portions dupliquées
Je prendrai volontiers conseil.