Question:
Existe-t-il une API RESTful publique pour Gnomad?
Pasted
2017-06-28 17:54:00 UTC
view on stackexchange narkive permalink

Je trouve actuellement l'API RESTful de Harvard pour ExAC extrêmement utile et j'espérais qu'une ressource similaire est disponible pour Gnomad?

Quelqu'un le sait-il d'une API d'accès public pour Gnomad ou éventuellement des plans d'intégration de Gnomad dans l'API Harvard?

Juste pour ajouter un commentaire, l'annotation Cellbase inclut désormais les données Gnomad (Exomes et Genomes) et est accessible via l'API RESTful - http://bioinfo.hpc.cam.ac.uk/cellbase/webservices
Quatre réponses:
Pierre
2017-06-28 18:04:59 UTC
view on stackexchange narkive permalink

Pour autant que je sache, non, mais les fichiers vcf.gz sont derrière un serveur http qui prend en charge Byte-Range , vous pouvez donc utiliser tabix ou toute API associée :

  $ tabix "https://storage.googleapis.com/gnomad-public/release-170228/vcf/exomes/gnomad.exomes.r2.0.1.sites.vcf.gz" "22: 17265182-17265182"
22 17265182. AT 762.04 PASS AC = 1; AF = 4,78057e-06; AN = 209180; BaseQRankSum = -4,59400e + 00; ClippingRankSum = 2,18000e + 00; DP = 4906893; FS = 1,00270e + 01; ConsanguinitéCoeff = 4,40000e-03 ; MQ = 3.15200e + 01; MQRankSum = 1.40000e + 00; QD = 1.31400e + 01; ReadPosRankSum = 2.23000e-01; SOR = 9.90000e-02; VQSLOD = -5.12800e + 00; VQSR_culprit = MQ; GQ_HIST_ALT = 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1; DP_HIST_ALT = 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0; AB_HIST_ALT = 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0; GQ_HIST_ALL = 1591 | 589 | 120 | 301 | 650 | 589 | 1854 | 2745 | 1815 | 4297 | 5061 | 2921 | 10164 | 1008 | 6489 | 1560 | 7017 | 457 | 6143 | 52950; DP_HIST_ALL = 2249 | 1418 | 6081 | 11707 | 16538 | 9514 | 28624 | 23829 | 7391 | 853 | 95 | 19 | 1 | 0 | 0 | 1 | 0 | 1 | 0 | 0; AB_HIST_ALL = 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0; AC_AFR = 0; AC_AMR = 0; AC_ASJ = 0; AC_EAS = 0; AC_FIN = 1; AC_NFE = 0; AC_OTH = 0; AC_SAS = 0; AC_Male = 1; AC_Female = 0; AN_AFR = 11994; AN_AMR = 31324; AN_ASJ = 7806; AN_EAS = 13112; AN_FIN = 20076; AN_NFE = 94516; AN_OTH = 4656; AN_SAS = 25696; AN_Male = 114366; AN_Female = 94814; AF_AFR = 0,00000e + 00; AF_AMR = 0,00000e + 00; AF_ASJ = 0,00000e + 00 ; AF_EAS = 0,00000e + 00; A F_FIN = 4,98107e-05; AF_NFE = 0,00000e + 00; AF_OTH = 0,00000e + 00; AF_SAS = 0,00000e + 00; AF_Male = 8,74386e-06; AF_Female = 0,00000e + 00; GC_AFR = 5997,0,0; GC_AMR = 15662,0,0; GC_ASJ = 3903,0,0; GC_EAS = 6556,0,0; GC_FIN = 10037,1,0; GC_NFE = 47258,0,0; GC_OTH = 2328,0,0; GC_SAS = 12848,0,0; GC_Male = 57182,1,0; GC_Female = 47407,0,0; AC_raw = 1; AN_raw = 216642; AF_raw = 4.61591e-06; GC_raw = 108320,1,0; GC = 104589,1 , 0; Hom_AFR = 0; Hom_AMR = 0; Hom_ASJ = 0; Hom_EAS = 0; Hom_FIN = 0; Hom_NFE = 0; Hom_OTH = 0; Hom_SAS = 0; Hom_Male = 0; Hom_Female = 0; Hom_raw = 0; Hom = 0 ; POPMAX = FIN; AC_POPMAX = 1; AN_POPMAX = 20076; AF_POPMAX = 4.98107e-05; DP_MEDIAN = 58; DREF_MEDIAN = 5.01187e-84; GQ_MEDIAN = 99; AB_MEDIAN = 6.03448e-01; AS_RF_Filter = 9.18451eFiltre = PASS; CSQ = T | missense_variant | MODERATE | XKR3 | ENSG00000172967 | Transcription | ENST00000331428 | protein_coding | 4/4 || ENST00000331428.5: c.707T>A | ENSP00000331704.5: p.Phe2 707.5: p. Y | tTc / tAc || 1 || -1 || SNV | 1 | HGNC | 28778 | OUI ||| CCDS42975.1 | ENSP00000331704 | Q5GH77 || UPI000013EFAE || délétère (0) | bénin (0,055) | hmmpanther: PTHR14297&hmmpanther: PTHR14297: SF7&Pfam_domain: PF09815 ||||||||||||||||||||||||||||||| |||||||||| 1 |||| SNV | 1 |||||||||||||||||||||||||||||||| ||||||||||||, T | regulier_region_variant | MODIFIER ||| RegulatoryFeature | ENSR00001729562 | CTCF_binding_site |||||||||||| 1 |||| SNV | 1 |||| |||||||||||||||||||||||||||||||||||||||

UPDATE : 2019: le serveur actuel de gnomad ne prend pas en charge les requêtes Byte-Range.

Depuis le 15 janvier 2020, cellbase (bioinfo.hpc.cam.ac.uk/cellbase/webservices) le fait. Voir le commentaire de Pasted sur la question. Les demandes de plage d'octets sont prises en charge et les résultats proviennent de GnomAD, ExAC et d'autres ensembles de données. Une ressource assez impressionnante en fait, même si les requêtes de plage d'octets étaient prises en charge par GnomAD ou UCSC.
Jesse
2019-08-02 00:03:22 UTC
view on stackexchange narkive permalink

Le nouveau site gnomAD (en août 2019) dit non, pas encore d'API:

Comment interroger un lot de variantes? Avez-vous une API?

Nous n'avons actuellement pas de moyen de soumettre des requêtes par lots sur le navigateur, mais nous travaillons activement au développement d'une API pour ExAC / gnomAD. Si vous souhaitez en savoir plus sur GraphQL, que nous utiliserons pour travailler avec l'API, vous trouverez un aperçu sur https://graphql.org. Vous pouvez également obtenir des informations sur toutes les variantes à partir des VCF et des tableaux de grêle disponibles sur notre page de téléchargement.

Mais, l'interface Web elle-même envoie déjà des requêtes POST à ​​ https: // gnomad .broadinstitute.org / api pour envoyer et recevoir du JSON / GraphQL. Ainsi, vous pouvez effectuer ces mêmes requêtes par programme dès maintenant, même s'il ne s'agit pas officiellement d'une API publique.

Voici un exemple en Python pour obtenir des informations de base sur les variantes d'un particulier gène. De cette façon, vous obtenez des objets Python imbriqués simples avec lesquels travailler:

  {'conséquence': 'intron_variant', 'pos': 6928442, 'rsid': 'rs782435448', 'variant_id': ' 12-6928442-C-A '}, {' conséquence ':' splice_region_variant ',' pos ': 6928462,' rsid ': Aucun,' variant_id ': '12 -6928462-C-A'}, {'conséquence' : 'splice_acceptor_variant', 'pos': 6928464, 'rsid': 'rs782577109', 'variant_id': '12 -6928464-G-A '}, {' conséquence ':' missense_variant ',' pos ': 6928466,' rsid ':' rs782208003 ',' variant_id ': '12 -6928466-C-T'},  

(J'ai trouvé utile d'emprunter cette route car alors les métadonnées complètes visibles dans le L'interface Web de gnomAD est alors disponible, y compris les détails par variante comme le nombre d'allèles par population. Je n'ai pas trouvé cette information dans les autres API décrites ici.

user1690
2017-10-27 02:48:13 UTC
view on stackexchange narkive permalink

Vous pouvez parcourir les variantes de gnomAD avec ClinGen Allele Registry (il existe des spécifications API disponibles).

John t_eckerd
2020-01-13 00:14:08 UTC
view on stackexchange narkive permalink

J'ai rencontré le même problème récemment, j'ai trouvé ces liens et ces scripts python:

gnomAD GraphQL api https://gnomad.broadinstitute.org/api Cela fonctionne très bien mais cela est une sorte de langage de requête différent. Veuillez consulter la documentation ici: https://graphql.org/learn/queries/

gnomAD Python Api https://github.com/furkanmtorun/gnomad_python_api



Ce Q&R a été automatiquement traduit de la langue anglaise.Le contenu original est disponible sur stackexchange, que nous remercions pour la licence cc by-sa 3.0 sous laquelle il est distribué.
Loading...