Question:
Entrez or Ensembl gene IDs?
einonm
2017-06-07 10:25:27 UTC
view on stackexchange narkive permalink

J'utilise plusieurs ensembles de données qui sont encodés à l'aide d'identifiants Entrez ou Ensembl pour spécifier des gènes, et je dois décider sur lesquels normaliser.

Y a-t-il des raisons majeures d'utiliser l'un par rapport à l'autre ?

Quels outils et tableaux de conversion sont les meilleurs à utiliser pour cela?

Il peut être utile de préciser davantage votre cas d'utilisation particulier. Je n'ai pas de réponse à votre question, mais il est possible que les avantages et les inconvénients des deux bases de données diffèrent selon ce que vous essayez de faire.
Il y a une discussion sur Biostar dans le même sujet. https://www.biostars.org/p/16505/
Salut einonm, merci pour votre question et bienvenue sur Bioinformatics Stack Exchange. La bioinformatique est un vaste domaine avec une vaste gamme d'outils et de bases de données, dont beaucoup ont presque le même objectif mais sont conçus pour s'attaquer à un problème particulier. Comme @roblanf l'a souligné, il serait utile que vous puissiez ajouter un peu plus d'histoire / contexte à votre question afin que la communauté puisse mieux comprendre le problème. Une question plus précise signifie que les chances d'une bonne réponse pertinente sont augmentées.
Il ne s'agit pas seulement de savoir quels ID utiliser, mais également de quels modèles de gènes utiliser. Même si un gène Ensembl a une référence croisée avec un gène Entrez, c'est uniquement parce que le pipeline de xréf Ensembl a décidé qu'ils sont _ assez similaires_.
Un répondre:
bli
2017-06-07 13:08:25 UTC
view on stackexchange narkive permalink

Je pense qu'il n'y a pas de réponse générale à votre question.

Le type d'identifiant que vous utiliserez dépend de la manière dont il sera pratique pour votre traitement en aval. Cela dépend de l’autre source d’informations dont vous disposez, du travail de conversion que vous devrez effectuer pour faire correspondre vos données à ces informations si vous utilisez l’une ou l’autre.

Je pense que le choix peut émerger par essais et erreurs, car vous vous rendez compte qu'un choix donné n'est en fait pas pratique dans votre cas d'utilisation particulier. Essayez de mettre en place des procédures de conversion faciles à utiliser que vous pouvez facilement insérer dans certaines étapes de votre flux de travail, afin de pouvoir facilement passer d'un choix à l'autre.

Concernant les outils pour effectuer la conversion, voir la question suivante et ses réponses: Conversion de noms de gènes d'un format de base de données publique à un autre



Ce Q&R a été automatiquement traduit de la langue anglaise.Le contenu original est disponible sur stackexchange, que nous remercions pour la licence cc by-sa 3.0 sous laquelle il est distribué.
Loading...