Wetenschap
- Invoer:eencellige RNA-seq-gegevens (telmatrix)
- Kwaliteitscontrole (QC):Verwijder cellen en genen van lage kwaliteit
- Gegevensnormalisatie:normaliseer de gegevens om technische vooroordelen te corrigeren
2. Clustering
- Voer clustering uit op de genormaliseerde gegevens om celclusters te identificeren
- Er kunnen verschillende clustermethoden worden gebruikt (bijv. k-means, hiërarchische clustering, Leuven)
3. Markergenidentificatie
- Voor elk cluster:
- Bereken de gemiddelde expressie van elk gen in de cellen in het cluster
- Vergelijk de gemiddelde expressie van genen in het cluster met die in andere clusters
- Identificeer genen die in het cluster sterk tot expressie komen in vergelijking met andere clusters
4. Validatie van markergenen
- Er kunnen aanvullende criteria worden toegepast om markergenen te selecteren:
- Vouwverandering:Denk aan genen met een hoge vouwverandering tussen het cluster en andere clusters
- Statistische significantie:gebruik statistische tests (bijv. t-test, Wilcoxon-test) om de significantie van expressieverschillen te beoordelen
- Specificiteit:Zorg ervoor dat markergenen selectief tot expressie worden gebracht in het betreffende cluster
5. Interpretatie en visualisatie
- Analyseer de functies en routes die verband houden met de geïdentificeerde markergenen
- Genereer heatmaps, vulkaanplots of andere visualisaties om de markergenen en hun expressiepatronen te presenteren
6. Validatie in onafhankelijke datasets (optioneel)
- Om het vertrouwen te vergroten, valideert u de geïdentificeerde markergenen in een onafhankelijke dataset, indien beschikbaar.
Wetenschap © https://nl.scienceaq.com