Question:
ellipses de confiance pour le tracé MDS dans edgeR?
Deffiz
2017-06-05 21:51:28 UTC
view on stackexchange narkive permalink

Est-il possible de dessiner par exemple 95% d'ellipses de confiance autour des échantillons du même groupe sur les résultats de la fonction plotMDS sous edgeR? Si oui, comment?

À quoi correspond la confiance de 95%? MDS ne donne pas directement d'intervalles de confiance.
Cela dépend du fait que vous ayez ou non une vision fréquentiste ou bayésienne des intervalles de confiance. Je m'attendrais (d'après une interprétation bayésienne) à ce que les ellipses de confiance sur un tracé 2D contiennent 95% des points attendus dans un groupe d'échantillons donné.
@gringer Hmm. Pour une configuration expérimentale typique dans NGS, un groupe d'échantillons contient <10 points. Souvent <5. Il y a donc * beaucoup * d'incertitude sur le placement des ellipses en fonction de cela. ;-)
Je suis d'accord avec ce qu'a dit @KonradRudolph. Si votre groupe a moins <10 ou <5, dans ce cas, le critère de l'ellipse pourrait même ne pas être vrai ou je n'y croirais pas. Tout d'abord, MDSplot peut ne pas être également nécessaire pour faire l'ellipse à 95%. Ce lien explique assez bien son utilisation. Je pense juste que parfois, nous faisons beaucoup de surestimation ou de sur-calcul de certaines mesures statistiques qui, pour le premier choix, pourraient ne pas être nécessaires. Voulez-vous même faire ça? https://stats.stackexchange.com/questions/217374/real-meaning-of-confidence-ellipse.
La question suppose que la position sur un graphique MDS est un paramètre de population pour une population à partir de laquelle chacun des échantillons du groupe est tiré. Il suppose que chaque échantillon est une estimation ponctuelle de la population de ce groupe. Selon cette interprétation, une ellipse de confiance est une chose valide. Cependant, je ne suis pas sûr que la position sur un graphique MDS puisse être qualifiée de paramètre de population en raison de la nature de la façon dont un graphique MDS est construit (en particulier, la position de chaque échantillon n'est pas indépendante de la position des autres). Mais peut-être existe-t-il un paramètre approprié?
Un répondre:
Ian Sudbery
2017-06-06 16:28:46 UTC
view on stackexchange narkive permalink

Je peux voir qu'il y aurait un processus en trois étapes pour faire cela:

  1. Fusionner les décomptes de tous les échantillons du groupe, puis rééchantillonner les pseudo-répliques à partir de cela. Si x est une matrice avec des échantillons dans le groupe étant des colonnes et des gènes des lignes

      s <- sample (row.names (x), n = mean (colSums (x)), probs = rowSums (x) / sum (rowSums (x)) stab <- table (s) s <- as.vector (stab) names (s) <- names (stab)  

    Faites cela des milliers de fois.

  2. Vous voudrez alors les projeter sur votre espace de tracé MDS - je ne sais pas trop comment vous pourriez faire cela sans perturber l'espace lui-même.

  3. Calculez le paramètre d'une ellipise qui contiendrait 95% de ces points. Encore une fois, je ne sais pas trop comment faire cela, mais Je pense que la voiture pacakge pourrait être un bon endroit pour commencer à chercher.



Ce Q&R a été automatiquement traduit de la langue anglaise.Le contenu original est disponible sur stackexchange, que nous remercions pour la licence cc by-sa 3.0 sous laquelle il est distribué.
Loading...