Question:
Évaluer des groupes d'individus en utilisant leurs données de séquence
Laaas
2018-03-11 16:41:39 UTC
view on stackexchange narkive permalink

Pour un ensemble de données de plusieurs centaines d'individus, j'ai appliqué un clustering hiérarchique pour générer des clusters basés sur un trait fonctionnel qui les distingue.

Ma tâche est maintenant d'évaluer si ces clusters peuvent être pris en charge par le données de séquence nucléotidique du gène correspondant, c'est-à-dire y a-t-il plus de similitude génétique dans chaque cluster qu'entre les clusters.

Pour une première approche, j'ai créé un alignement de séquences multiples pour chaque cluster et calculé le% de sites identiques valeur. Il y a plus de sites identiques dans chaque cluster que dans un alignement de toutes les séquences.

Connaissez-vous de bons outils (de préférence python) qui peuvent effectuer une évaluation plus sophistiquée des clusters existants en fonction des données de séquence? d'autres méthodes de notation avec lesquelles je peux évaluer la similarité de séquence au sein des clusters (encore une fois de préférence python)?

Un répondre:
Ümit Akköse
2018-07-14 00:46:01 UTC
view on stackexchange narkive permalink

Vous pouvez calculer les fréquences d'allèles pour chaque cluster, vous devez vérifier davantage s'ils appartiennent à une population similaire, mais si la taille de votre ensemble de données est plutôt petite, cela peut ne pas fonctionner pour vous.

https : //www.ncbi.nlm.nih.gov/pmc/articles/PMC3813878/, voici un article sur la différenciation des populations en fonction des données de séquençage.



Ce Q&R a été automatiquement traduit de la langue anglaise.Le contenu original est disponible sur stackexchange, que nous remercions pour la licence cc by-sa 3.0 sous laquelle il est distribué.
Loading...