Wetenschap
Een scatterplot is een belangrijk diagnostisch hulpmiddel in het arsenaal van een statisticus, verkregen door twee variabelen tegen elkaar uit te zetten. Hiermee kan de statisticus de variabelen bekijken en een werkhypothese vormen over hun relatie. Om deze reden wordt het meestal getekend voordat een regressieanalyse wordt uitgevoerd. De statisticus test vervolgens de hypothese met behulp van een regressieanalyse en bepaalt het teken en de precieze omvang van de relatie. Bovendien helpt een spreidingsplot uitschieters identificeren - waarden die abnormaal ver verwijderd zijn van de meeste gegevens in het monster. Het elimineren van uitbijters helpt het regressiemodel te verbeteren.
Controleer op een negatieve relatie tussen de twee variabelen in de spreidingsplot. Als lage waarden van de eerste variabele overeenkomen met hoge waarden van de tweede variabele, is er een negatieve correlatie. In dit geval heeft een lijn die door de gegevenspunten wordt getrokken een negatieve helling.
Bekijk de spreidingsplot voor een positieve relatie tussen de variabelen. Als lage waarden van de eerste variabele in de scatterplot overeenkomen met lage waarden van de tweede, en de hoge waarden van de eerste overeenkomen met de hoge waarden van de tweede, hebben de variabelen een positieve correlatie. In dit geval heeft een lijn die door de gegevenspunten wordt getrokken een positieve helling.
Inspecteer de spreidingsplot op geen verband tussen de variabelen. Als de gegevenspunten in de spreidingsplot willekeurig worden verdeeld zonder duidelijke relatie tussen de twee, hebben ze ofwel geen correlatie of een kleine, statistisch niet-significante correlatie. In dit geval is een lijn getrokken door de gegevenspunten horizontaal met een helling gelijk aan nul.
Pas een lijn door de gegevenspunten en onderzoek de vorm om de aard van de relatie tussen de twee variabelen te meten. Een rechte lijn wordt geïnterpreteerd als een lineaire relatie, een gebogen vorm suggereert een kwadratische relatie en een lijn die relatief vlak ligt voordat plotseling omhoog of omlaag wordt geschoten, wordt geïnterpreteerd als een exponentiële relatie.
Bestudeer de spreidingsplot voor uitbijters , waarden die abnormaal ver van het cluster met datapunten liggen. Uitbijters vervormen de relatie tussen de variabelen. Elimineer ze, maar alleen als hun afwezigheid de analyse van de relatie tussen de twee variabelen niet beïnvloedt.
Wetenschap © https://nl.scienceaq.com