Question:
Pourquoi le génome du coronavirus du SRAS-Cov2 se termine-t-il par aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa (33 a)?
Rebecca J. Stones
2020-01-25 06:55:20 UTC
view on stackexchange narkive permalink

Le génome du coronavirus SARS-Cov2 a été publié et est maintenant disponible sur Genbank. En regardant cela ...

  1 attaaaggtt tataccttcc caggtaacaa accaaccaac tttcgatctc ttgtagatct 61 gttctctaaa cgaactttaa aatctgtgtg gctgtcactc ggctgcatgc ttagtgcact 121 cacgcagtat aattaataac taattactgt cgttgacagg acacgagtaa ctcgtctatc ... 29761 acagtgaaca atgctaggga gagctgccta tatggaagag ccctaatgtg taaaattaat29821 tttagtagtg ctatccccat gtgattttaa tagcttctta ggagaatgac aaaaaaaaaaa29881 aaaaaaaaaa aaaaaaaaa aaa  

Wuhan seafood market pneumonia virus isolat Wuhan-Hu-1, génome complet

Geeze, c'est beaucoup de a nucléotides --- je ne pense pas que ce soit juste au hasard. Je suppose que c'est soit un artefact du processus de séquençage, soit il y a une raison biologique sous-jacente.

Question : Pourquoi le génome du coronavirus SRAS-Cov2 se termine-t-il par 33 a?

Pas un biologiste, mais il semble terriblement similaire au mécanisme d'un traîneau NOP, juste un mécanisme naturel de la nature. https://en.wikipedia.org/wiki/NOP_slide
29821 - 29881 (aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa)
@PedroA pas inconnu, https://en.uncyclopedia.co/wiki/AAAAAAAAA!
Je pense que c'est parce que quand le scientifique a entendu parler du virus il / elle est allé "aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa".
La question est EXACTEMENT de savoir comment de grands projets de bioinformatique virale sont lancés, impliquant de nombreuses approches différentes. Ce qui est recherché, c'est une observation génétique anormale et évaluer une corrélation avec les phénotypes virologiques. Dans ce cas, je ne me lancerais pas dans ce projet, mais quelqu'un d'autre pourrait être en désaccord. Par exemple, il y a longtemps, nous avons repéré une région non traduite donnée d'un virus donné (pas Cov) était impliquée dans l'atténuation (anomalies de la souche vaccinale). Aujourd'hui, le concept est un vaccin conçu dans des essais de stade III qui semble bon. Quand les bioinformaticiens disent des choses, d'autres virologues écoutent
Le scientifique [doit être mort en le séquençant] (https://sites.google.com/site/lucidenglish74/castle-of-aaargh--monty-python-and-the-holy-grail)?
@NONONO, l'analogie avec le traîneau NOP aurait du sens au début du gène mais c'est la fin
"Au secours, je suis piégé dans un laboratoire de séquençage de gènes!"
Il est mort du virus et se sentit sur le bouton
Quatre réponses:
#1
+143
Cody Gray
2020-01-25 17:49:00 UTC
view on stackexchange narkive permalink

Bonne observation! La queue poly (A) 3 'est en fait une caractéristique très courante des virus à ARN à brin positif, y compris les coronavirus et les picornavirus.

Pour les coronavirus en particulier, nous savons que la queue poly (A) est nécessaire pour réplication, fonctionnant en conjonction avec la région non traduite 3 '(UTR) en tant que signal agissant en cis pour la synthèse du brin négatif et l'attachement au ribosome pendant la traduction. Les mutants dépourvus de la queue poly (A) sont gravement compromis dans la réplication. Rapport de Jeannie Spagnolo et Brenda Hogue:

La queue poly (A) 3 ′ joue un rôle important, mais encore indéfini, dans la réplication du génome du coronavirus. Pour examiner plus en détail la nécessité de la queue du coronavirus poly (A), nous avons créé des ARN interférents défectueux (DI) mutants poly (A) tronqués et observé les effets sur la réplication. Coronavirus bovin (BCV) et hépatite de souris Coronavirus A59 (MHV-A59) Les ARN DI avec des queues de 5 ou 10 résidus A ont été répliqués, bien qu'à une cinétique retardée par rapport aux ARN DI avec des longueurs de queue de type sauvage (résidus >50 A). Un ARN BCV DI dépourvu de queue poly (A) n'a pas pu se répliquer; cependant, un MHV DI dépourvu de queue s'est répliqué après de multiples passages viraux. L'extension / réparation de queue poly (A) était concomitante avec une réplication robuste des mutants de queue. La liaison de la protéine de liaison du facteur hôte poly (A) (PABP) semble être en corrélation avec la capacité des ARN DI à être répliqués. Les mutants de queue poly (A) qui ont été compromis pour la réplication, ou qui ont été incapables de se répliquer du tout ont présenté moins d'interaction PABP in vitro. Les données soutiennent l'importance de la queue poly (A) dans la réplication du coronavirus et définissent davantage les exigences minimales pour la propagation du génome viral.

Spagnolo J.F., Hogue B.G. (2001) Exigence de la queue Poly (A) dans la réplication du génome du coronavirus. Dans: Lavi E., Weiss S.R., Hingley S.T. (éds) The Nidoviruses. Advances in Experimental Medicine and Biology, vol 494. Springer, Boston, MA

Yu-Hui Peng et al. rapportent également que la longueur de la queue poly (A) est régulée pendant l'infection:

Semblable à l'ARNm eucaryote, le Le génome du coronavirus à brin positif d'environ 30 kilobases est coiffé en 5 'et polyadénylé en 3'. Il a été démontré que la longueur de la queue poly (A) coronavirale n'est pas statique mais régulée pendant l'infection; cependant, on en sait peu sur les facteurs impliqués dans la polyadénylation coronavirale et sa régulation. Ici, nous montrons que lors de l'infection, le niveau d'allongement de la queue du coronavirus poly (A) dépend de la longueur initiale lors de l'infection et que la longueur minimale pour initier l'allongement peut être comprise entre 5 et 9 nucléotides. Par analyse de mutagenèse, il a été constaté que (i) l'hexamère AGUAAA et la queue poly (A) sont deux éléments importants responsables de la synthèse de la queue poly (A) du coronavirus et peuvent fonctionner de concert pour accomplir la polyadénylation et (ii) la fonction de l'hexamère AGUAAA dans la polyadénylation coronavirale dépend de la position. Sur la base de ces résultats, nous proposons un processus pour la façon dont la queue poly (A) coronavirale est synthétisée et subit des variations. Nos résultats fournissent la première preuve génétique permettant de mieux comprendre la polyadénylation coronavirale.

Peng YH, Lin CH, Lin CN, Lo CY, Tsai TL, Wu HY (2016) Caractérisation du rôle de l'hexamère AGUAAA et Poly (A) Tail dans la polyadénylation du coronavirus. PLoS ONE 11 (10): e0165077

Ceci s'appuie sur des travaux antérieurs de Hung-Yi Wu et al , qui ont montré que le coronaviral 3 ' La queue poly (A) a une longueur d'environ 65 nucléotides à la fois dans les ARN génomiques et sgm au pic de la synthèse de l'ARN viral, et a également observé que la longueur précise variait tout au long de l'infection. Plus intéressant encore, ils rapportent:

Les analyses fonctionnelles de la longueur de queue poly (A) sur des espèces d'ARN viral spécifiques, en outre, ont révélé que la traduction, in vivo, des ARN avec la queue poly (A) plus longue était améliorée par rapport à ceux avec le poly (A) plus court. Bien que les mécanismes par lesquels les longueurs de queue varient soient inconnus, les résultats expérimentaux suggèrent ensemble que la longueur des queues poly (A) et poly (U) est régulée. Une fonction potentielle de la longueur de queue de poly (A) régulée pourrait être que pour le génome du coronavirus, un poly (A) plus long favorise la traduction. La régulation de la traduction des coronavirus par la longueur de la queue poly (A) ressemble à celle pendant le développement embryonnaire, ce qui suggère qu'il peut y avoir des parallèles mécanistes.

Wu HY, Ke TY, Liao WY, Chang NY. Régulation de la longueur de la queue poly (A) coronavirale pendant l'infection. PLoS One. 2013; 8 (7): e70548. Publié le 29 juillet 2013. doi: 10.1371 / journal.pone.0070548

Il convient également de souligner que les queues poly (A) à l'extrémité 3 'de l'ARN ne sont pas caractéristique inhabituelle des virus. L'ARNm eucaryote contient presque toujours des queues poly (A), qui sont ajoutées post-transcriptionnellement dans un processus connu sous le nom de polyadénylation. Il ne devrait donc pas être surprenant que les virus à ARN à brin positif aient également des queues poly (A). Dans l'ARNm eucaryote, le motif de séquence central pour identifier une région de polyadénylation est AAUAAA, identifié dans les années 1970, avec des recherches plus récentes confirmant son ubiquité. Proudfoot 2011 est un bel article de synthèse sur les signaux poly (A) dans l'ARNm eucaryote.

Il convient peut-être de noter que la queue poly (A) dans les ARNm eucaryotes sert de région de liaison pour la protéine de liaison Poly (A) qui aide à extraire l'ARNm du noyau.
L'utilisateur NONONO a mentionné dans les commentaires un `NOP sled`, une astuce utilisée dans les virus informatiques, utilisé pour augmenter la probabilité qu'un morceau de code (injecté au hasard dans l'hôte) soit réellement exécuté. Dans ce contexte, c'est toujours un point de départ. Est-il possible que cette queue d'As, telle que décrite ici, ne soit en fait pas une «queue» (fin de données, dernier morceau traduit, etc.), mais plutôt une «tête»? Une «tête» qui est «attrapée» ou «détectée» par quelque chose, puis c'est là que le processus commence et se poursuit avec la lecture / le traitement / la réplication, ou échoue si la chaîne A est trop courte et que le processus «perd son emprise» dessus?
Sachant que ces entités partagent toutes une queue poly (A) 3 'similaire et que cela aide à la réplication, est-il possible de lier essentiellement l'extrémité avec une molécule synthétique, ou cela interférerait-il avec le fonctionnement normal de l'hôte?
Que signifie l'apostrophe en «3»? Est-ce que c'est "Trois pieds", "Trois premiers"?
@JPhi1618 [3-prime] (https://en.wikipedia.org/wiki/Directionality_ (moléculaire_biology) # 3% E2% 80% B2-end)
Les gènes @HouseCat sont traduits en ARN, qui ont une queue polyA 3 '. Cela empêcherait la synthèse des protéines dans vos cellules, et vous ne le voulez pas. La ricine est un poison qui bloque la synthèse des protéines, bien qu'elle le fasse par un mécanisme différent
#2
+30
Michael
2020-01-26 01:33:51 UTC
view on stackexchange narkive permalink

Cette question est assez générale, je vais donc essayer de la rattacher à la bioinformatique.

Contexte L'arbre du coronavirus actuel se trouve ici, montrant qu'il est étroitement lié au coronavirus de chauve-souris et en particulier au SRAS.

Question La question bioinformatique pour le coronavirus actuel est de savoir pourquoi ce virus semble être capable d'infecter l'homme et de le transmettre à l'homme.

Taille du génome Premièrement, vous avez dit que 30kb était grand ... c'est une taille standard pour un génome de coronavirus, même si c'est inhabituel dans la mesure où la famille des Coronaviridae est le plus grand génome pour un virus à ARN simple brin, par exemple les flavivirus font 10kb . Ainsi, tous les coronavirus mesurent tous environ 30 Ko. Certains coronavirus n'infectent pas les humains (aucun symptôme), certains provoquent des symptômes très légers, d'autres sont le MERS et le SRAS avec des taux de mortalité de 40 à 60% et 10%, respectivement. Donc, la taille du génome a peu d'intérêt bioinformatique à mon avis.

Polyadénylation La polyadénylation et le coiffage (méthylation 5 ') permettent à l'ARN d'être trafiqué et transcrit par les ribosomes et le mécanisme est largement utilisé par les virus. La méthylation empêcherait également la réponse immunitaire innée du déchiquetage de l'ARNv. Koonin et Moss (2010), ont interprété un mécanisme de plafonnement donné comme étant commun aux Mononegavirales - un ordre viral comprenant la rougeole, les oreillons et le virus Ebolavirus. C'est une grande déclaration, mais peu importe le poly-A et le plafonnement, ils imitent simplement l'ARNm de l'hôte que de nombreux virus utilisent. Le poly-A et le plafonnement en soi ne sont pas vraiment intéressants.

Évolution et SRAS Un examen plus détaillé de l'évolution du 2019-nCov et de son épidémiologie en rapport au SRAS peut être trouvé ici

Conclusion La question de la bioinformatique est la taille du génome bizarre - non, sa norme pour un coronavirus, est le poly-A bizarre - non son générique parmi de nombreux virus comme c'est le cas. La longueur du poly-A est-elle excessive (33 As), cela semble étrange mais un généciste / bioinformaticien humain doit répondre à cela ... est-il (potentiellement) lié à son épidémiologie / symptômes cliniques?

Je ne pense pas que 33 poly-As soient liés à quoi que ce soit d'intéressant sur le plan bioinformatique. En effet, il variera probablement considérablement entre les génomes (pas simplement les souches épidémiques et non épidémiques). Je ne connais pas le mécanisme de la poly-adénylation, mais je pense que le glissement est une mutation probable entraînant de grandes variations entre les génomes individuels, en particulier pour le poly-A - qui est connu pour le glissement.

Donc, en fin de compte, le poly-As pourrait-il être lié à la capacité du nouveau coronavirus à infecter / transmettre et pourrions-nous donc explorer cela de manière bioinformatique? Je pense personnellement que les mutations de glissement empêcheraient l'émergence d'une lignée clonale, c'est-à-dire que la taille du poly-As n'est pas stable entre les génomes, mais cela supposerait un mécanisme donné de polyadénylation. Donc, en tant que question de bioinformatique, je ne la poursuivrais pas, car je ne pense pas qu'il y ait une justification biologique suffisante. Je suis d'accord que des trucs bizarres devraient être remis en question et que cette partie du génome saute ... mais je doute que cela puisse aller n'importe où.

Slippage La définition d'une mutation de glissement est ici, mais en gros cela signifie que ce génome a 33 poly-As, cependant un autre isolat de la même épidémie pourrait dire avoir 30 poly-As (juste un exemple), un autre pourrait avoir 25 poly-As et ainsi de suite.

Juste mes 2 cents

Quelqu'un peut-il me donner quelques conseils pour comprendre cet arbre de relations? Il ressemble au virus actuel séparé d'un virus de chauve-souris. Et que le même virus ancestral est également ancestral à un certain nombre d'autres virus chez les humains et les chauves-souris. Est-ce exact?
@puppetsock c'est une question distincte et la règle de BioSE est une question par message, sinon elle sera modérée. Si vous postez la question, je vous fournirai une réponse détaillée, avec des détails supplémentaires sur le récepteur partagé du SRAS
#3
+19
Zoë Sparks
2020-01-27 15:37:05 UTC
view on stackexchange narkive permalink

Certaines des autres réponses ici semblent assez bonnes; en même temps, je pense que la réponse fondamentale à la question du PO est peut-être un peu difficile à démêler, alors j'aimerais essayer de l'exprimer plus clairement. Il convient de noter qu'une réponse vraiment complète à cette question semble aller au-delà de la recherche actuelle, mais toute sorte de «Pourquoi? est inévitablement une question difficile, voire impossible, à laquelle répondre pleinement en biologie. Nous avons cependant quelques idées à ce sujet.

L'ARNm est utilisé comme modèle pour la synthèse des protéines dans une cellule. Un seul ARNm est utilisé à plusieurs reprises, mais est finalement «épuisé» et démonté. Chez les eucaryotes, les queues poly (A) se trouvent presque toujours sur les ARNm produits dans le noyau. La queue poly (A) est finalement raccourcie pendant le processus de transcription, et ce raccourcissement contribue à la dégradation de l'ARNm. (Voir ici pour plus d'informations.)

Les coronavirus ont également une queue poly (A), similaire à l'ARNm des eucaryotes. Les fonctions mécaniques précises de cette queue poly (A) et les moyens de sa synthèse font l'objet de recherches en cours, mais la recherche a montré que sa présence augmente considérablement le degré de réplication de l'ARN du coronavirus par la cellule hôte. Des recherches ont également montré que des queues plus longues augmentent la réplication par rapport à des queues plus courtes. Il est fort probable que la présence de la queue aide à recruter le mécanisme de synthèse des protéines de la cellule et permet à l'ARN de durer plus longtemps dans la cellule hôte, tout comme il le fait dans l'ARNm de la cellule.

Fait intéressant, le modèle dans lequel la longueur de la queue du coronavirus poly (A) est régulée pendant l'infection, dans laquelle elle commence plus courte, s'allonge, puis devient beaucoup plus courte, ressemble à la régulation de la longueur de la queue poly (A) de l'ARNm pendant l'embryogenèse eucaryote, suggérant des parallèles (voir l'article dans le lien «queues plus longues» pour en savoir plus). Une longueur de queue plus longue en poly (A) est étroitement liée à une plus grande efficacité de traduction dans ce contexte.

Il y a eu des spéculations dans les commentaires quant à savoir si la queue du Coronavirus poly (A) ressemble ou non à un traîneau NOP en programmation informatique. Je pense que la ressemblance est surtout fortuite. Les traîneaux NOP sont utilisés dans les exploits car un processeur, rencontrant un NOP, passe à l'instruction suivante sans effectuer aucune autre action. Une longue chaîne de NOP, si elle est entrée par le processeur à n'importe quel moment en son sein, le mènera aux instructions «en bas», après les NOP. Ceci est avantageux à utiliser si vous ne pouvez pas faire en sorte que le processeur aille exactement où vous le souhaitez mais que vous savez qu'il se retrouvera quelque part à proximité, car cela augmente vos chances que votre charge utile soit exécutée.

C'est inhabituel pour voir un long traîneau NOP en code légitime, au point que les personnes qui les écrivent doivent généralement déguiser leur fonction afin d'éviter une détection automatique. (voir page 183 ici) En revanche, une queue poly (A) est presque universellement trouvée sur l'ARNm des eucaryotes nucléaires (et sur certains ARNm de presque tous les organismes à une certaine capacité, même les mitochondries). De plus, les fonctions de la queue poly (A) sont suffisamment complexes pour qu'elle fasse toujours l'objet de recherches en cours des décennies après sa découverte initiale, alors qu'un traîneau NOP fait une chose très mécanique. Étant donné que l'environnement à l'intérieur d'une cellule est si différent de l'environnement d'un processeur interagissant avec la mémoire, je pense qu'il est difficile de faire des comparaisons suffisamment granulaires pour traiter un ensemble spécifique d'instructions machine, du moins dans ce type de contexte. le processeur est un type de machine très simple par rapport à une cellule.

Salut Zoe, vous avez déclaré "le modèle dans lequel la longueur de queue du Coronavirus poly (A) est régulée pendant l'infection, dans lequel il commence plus court, s'allonge, puis devient beaucoup plus court .." L'analogie que vous avez utilisée était le développement de la drosophile de l'œuf à la maturation de l'ovocyte. Idée intéressante. Pourriez-vous citer la variation du poly-A pour le coronavirus s'il vous plaît? Le contexte n'est pas clair s'il s'agit d'un cycle de vie au sein d'une cellule, d'une infection (patient) ou entre patients (transmission). Je soupçonne qu'il s'agit d'une observation in vitro et représente l'infection d'une lignée cellulaire établie.
C'est dans [cet article] (https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3726627/). Plus précisément: «Dans cette étude, nous rapportons que la longueur de la queue poly (A) terminale 3 'coronavirale dans l'ARN viral total, le sgmRNA7 et l'ARN DI est relativement courte (~ 26-45 nt) dans les cellules infectées à 0-2 hpi, augmente jusqu'à la longueur maximale (~ 65 nt) à ~ 6-10 hpi, et diminue progressivement la taille (~ 30-45 nt) après ~ 10 h d'infection. " Ils font également l'analogie avec le développement de l'embryon dans leur résumé. Vous avez raison sur le contexte - c'est in vitro en utilisant des cellules d'adénocarcinome humain confluentes (HRT-18).
Merci à sa série chronologique in vitro sur ~ 5 jours, où la queue poly-A atteint un pic de taille assez tôt dans la série chronologique, bien que la désintégration de la taille poly-A par la suite ne soit pas une excellente analyse de leur transfert nordique et ne serait ont été mieux analysés par un data scientist. Le message clé est clair que la longueur de queue poly-A est dynamique pour Cov pour le modèle in vitro et donc peut-être au cours d'une seule infection chez un patient.
@ZoëSparks, je suis intéressé par vos commentaires concernant [ce commentaire] (https://bioinformatics.stackexchange.com/questions/11227/why-does-the-wuhan-coronavirus-genome-end-in-aaaaaaaaaaaaaaaaaaaaaaabaaaaaaaaaaaaaaaaabaaaaaaaaaaaaaaaaaaabaaaaaaaaaaaaaaaaaaba4354aaaaaaaaaaaabaaaaaaaaaaaaaaaaba4354aaaaaaaaaaaba # comment15245_11229), spécifiquement 'Est-il possible que cette queue d'As, telle que décrite ici, ne soit en fait pas une "queue" (fin de données, dernier morceau traduit, etc.), mais une "tête" à la place?'. Interprétons «tête» comme «plus tôt, en termes de causalité», puisque la biologie moléculaire n'a pas de «haut» ou de «bas».
@daveloyall Eh bien, dans ce cas, il y a un haut et un bas dans le sens où la traduction commence et s'arrête sur l'ARNm; il commence au-delà du capuchon 5 'et se termine avant la queue poly (A), d'où les termes (voir [ce diagramme] (https://www.ncbi.nlm.nih.gov/books/NBK6413/figure/A19517/? report = objectonly) pour une belle illustration). En ce qui concerne la queue "attrapée ou détectée" pour commencer la synthèse, cela fait partie de ce qui provoque la prise d'ARNm, mais pas le seul facteur - le capuchon joue également un rôle important, par exemple (voir [ici] (https://www.ncbi.nlm.nih.gov/books/NBK6413/#_A19518_) pour en savoir plus).
@daveloyall En remarque, la queue poly (A) ne favorise le recrutement que chez les eucaryotes; chez les procaryotes, ainsi que les organites eucaryotes comme les mitochondries et les chloroplastes, la présence d'une queue poly (A) favorise la dégradation de l'ARNm (voir [ici] (https://www.ncbi.nlm.nih.gov/books/NBK6253/ # _A18929_) par exemple).
#4
+13
merv
2020-01-25 08:09:16 UTC
view on stackexchange narkive permalink

Ce n'est pas un expert, mais certaines recherches sur les virus eucaryotes à ARN à brin positif semblent montrer que la polyadénylation n'est pas rare. Par exemple, Steil, et al., 2010 .



Ce Q&R a été automatiquement traduit de la langue anglaise.Le contenu original est disponible sur stackexchange, que nous remercions pour la licence cc by-sa 4.0 sous laquelle il est distribué.
Loading...