J'essaie de comprendre comment l'analyse GSVA fonctionne dans les coulisses et je me demandais s'il y avait un moyen de comprendre plus intuitivement l'ensemble du processus.
Donc, au début, selon papier il commence par évaluer si un gène i est fortement ou faiblement exprimé dans l'échantillon j dans le contexte de la distribution de la population de l'échantillon. Ils utilisent ces estimations par noyau des fonctions de densité cumulées pour transformer les valeurs initiales afin de ne pas être affecté par les intensités problématiques.
Après cette "transformation" et une normalisation suivante, GSVA calcule les scores d'enrichissement en utilisant le Kolmogorov-Smirnov (KS) comme aléatoire statistique de marche .
Comme je le sais, Kolmogorov-Smirnov vérifie les différences dans les distributions. Quelles distributions vérifie-t-il? Le jeu de gènes est contre tous les autres gènes? Et quel est le rôle de la marche aléatoire?
Existe-t-il donc un moyen intuitif de comprendre ce type de Kolmogorov-Smirnov (KS) comme une statistique de marche aléatoire? Comment ça marche réellement? Laquelle est nulle et quelle est l'hypothèse alternative dans ce cas?