Je suis nouveau dans la science des données. J'ai un ensemble de données sur l'expression de gènes unicellulaires à partir de plusieurs types de cellules dans C. Elegans . L'ensemble de données provient de l'article Profilage transcriptionnel unicellulaire complet d'un organisme multicellulaire
Ma question principale est: Quelles approches dois-je utiliser pour filtrer les mauvaises cellules dans ce cas où nous avons plusieurs types de cellules dans l'ensemble de données?
Jusqu'à présent, j'ai essayé de filtrer les gènes qui ont un contenu en gènes mitochondriaux trop élevé en suivant le flux de travail Bioconductor «simpleSingleCell».
Cependant, le tutoriel indique spécifiquement que la méthode de filtrage basée sur les gènes mitochondriaux ne fonctionnera probablement pas lorsque l'ensemble de données a plusieurs types de cellules:
Analyse de tout les types de cellules ensemble gonfleraient inutilement le MAD et compromettraient au mieux l'élimination des cellules de mauvaise qualité; ou conduire à la perte totale d'un type de cellule, au pire.
Toute suggestion serait grandement appréciée.