Question:
conception de complexe d'expression génique différentielle sans répliques
novicebioinforesearcher
2017-07-25 22:23:52 UTC
view on stackexchange narkive permalink

Nous avons une conception expérimentale comme indiqué ci-dessous

où nous avons administré des médicaments à 0 min pour chaque génotype de souris et les avons retirés à des intervalles donnés ci-dessous. Les modèles de souris wt et ko ont été administrés uniquement avec le véhicule qui serait notre contrôle négatif.

Le protocole échoué rnaseq (total rna) truseq aimerait voir les différences entre chaque point de temps par rapport au véhicule, étoile utilisée aligner pour s'aligner sur mm9, htseq pour le nombre de gènes.

  type d'échantillon tempsWT Véhicule 30 minKO Véhicule 30 minWT Médicament 30minKO Médicament 30minWT Médicament 1 heureKO Drogue 1 heureWT Médicament 2 heuresKO Drug 2hourWT Drogue 3 heuresKO Drug 3hour  

Nous n'avons pas de répliques et ne pouvons donc utiliser aucun des outils statistiques d'expression différentielle (posé cette question chez bioconductor où le Dr Love lui-même a répondu lien vers la question posée) où il a suggéré un modèle linéaire.

nous nous demandions si quelqu'un pourrait nous aider avec une telle conception (articles / analyses précédemment effectuées) ce que nous aimerions voir est une comparaison / différences (significatives) entre ces groupes (véh vs 30min, véh vs 1 heure, beh vs 2 heures, véh vs 3 heures)

Quelle est votre conception, exactement? Que sommes-nous censés comprendre de ce tableau vague? Quels sont les horaires? À quelle heure vous avez administré le médicament? La durée pendant laquelle le médicament a dû agir avant d'administrer un antagoniste? Le temps que vous avez passé à l'observer? Comment cela est-il lié à la bioinformatique? Veuillez [modifier] votre question et expliquer ce que vous faites et ce que vous attendez d'une bonne réponse.
Il est peu probable que vous trouviez des articles faisant cela, car il serait difficile d'en faire accepter un s'il était largement basé sur une telle expérience. Je me demande pourquoi vous avez dépensé du temps / des ressources sur cette expérience alors que vous deviez savoir que cela allait être un problème majeur.
@DevonRyan nous avons expérimenté (résultats de laboratoire humide à l'appui) ceci, réalisé qu'il sera difficile d'aller de l'avant avec rna seq seulement après l'avoir posté sur le forum deseq (bioconductor), nous ne sommes pas sûrs si c'est une impasse ou nous pouvons au moins voir quelques différences de base en utilisant des statistiques très basiques
@terdon merci pour vos commentaires J'ai édité la question, s'il vous plaît laissez-moi savoir si des informations supplémentaires sont nécessaires
Vous avez donc administré le médicament, puis tué les souris après le temps spécifié. Alors quoi? Avez-vous effectué RNA Seq? De quoi? Transcriptome entier? Qu'essayez-vous de montrer? Quelles données avez-vous? Essayez-vous vraiment de tirer des conclusions basées sur un seul individu dans chaque condition?
Deux réponses:
benn
2017-07-26 12:38:17 UTC
view on stackexchange narkive permalink

Bien qu'il ne soit pas recommandé de ne pas utiliser de répliques, dans le manuel edgeR, ils donnent quelques conseils sur la façon de continuer sans conception de répliques. Consultez la page 21 du guide de l'utilisateur. Vous pouvez par exemple estimer une valeur BCV. Bien sûr, c'est toujours une astuce et pas des statistiques solides.

Ian Sudbery
2017-07-26 16:42:12 UTC
view on stackexchange narkive permalink

Mike Love a raison. Si la réponse que vous recherchez est linéaire en termes de changement par minute, l'approche la plus productive est probablement d'ajuster un modèle linéaire. Vous pourriez en tirer quelque chose, car la différence entre des points temporels successifs représente plusieurs mesures du taux de changement au fil du temps. Le plus gros problème est que les points temporels ne sont pas indépendants. Vous auriez besoin d'ajuster un modèle qui a estimé ce taux à la fois pour WT et KO, puis tester la différence de taux.

Je vois trois façons d'avancer, dans tous les cas, vous voulez tester le dernier terme du modèle ~ temps + génotype + temps: génotype

  1. Idéalement, vous aimeriez ajuster un modèle linéaire binomial négatif aux nombres de lectures. Mais cela va être difficile car vous n'avez pas de répliques à partir desquelles évaluer la dispersion. Ainsi, vous pouvez générer des comptages de lectures à l'aide de votre pipeline de comptage de lectures préféré (STAR ​​+ featureCounts / Salmon / Kallisto) et adopter l'approche dans le guide edgeR noté par b.nota, puis utiliser edgeR pour tester le modèle ajusté .

  2. Vous pouvez utiliser quelque chose comme salmon ou kallisto pour estimer les TPM en supposant que les TPM de log sont normalement distribués et les modéliser avec lm dans R, en utilisant quelque chose comme balai pour modéliser chaque gène séparément. Un tutoriel de David Robinson, l'auteur de balai sur ce genre de chose peut être trouvé ici

  3. Vous pouvez utilisez les bootstraps Salmon ou Kallisto pour estimer la variation technique (mais pas biologique) et je suppose que vous pourriez utiliser Sleuth pour adapter le modèle.

Dans tous les cas, ces résultats doivent être traités avec scepticisme et principalement considérés comme générateurs d'hypothèses. Vous pourriez trouver des gènes que vous souhaitez revenir en arrière et confirmer et vous pourriez voir des modèles intéressants si vous regardez certains enrichissements, etc. que vous pouvez ensuite concevoir des expériences pour tester.

merci pour l'information est-il un tutoriel pour les méthodes lm et balai que vous avez mentionnées m'aiderait à mieux le comprendre, car R est quelque chose que je viens de commencer à utiliser l'apprécier.
J'ai ajouté un lien vers un tutoriel sur le balai.
c'est vraiment une ressource géniale merci beaucoup !! (Je ne l'aurais pas trouvé), et tenez tout le monde au courant. J'espère que je pourrai reprendre l'utilisation de R et résoudre le problème dans quelques jours.


Ce Q&R a été automatiquement traduit de la langue anglaise.Le contenu original est disponible sur stackexchange, que nous remercions pour la licence cc by-sa 3.0 sous laquelle il est distribué.
Loading...