science >> Wetenschap >  >> Wiskunde

Hoe de vergelijking van een scatterplot te vinden

Een scatterplot is een grafiek die de relatie tussen twee sets gegevens aangeeft. Soms is het handig om de gegevens in een scatterplot te gebruiken om een ​​wiskundige relatie tussen twee variabelen te verkrijgen. De vergelijking van een spreidingsplot kan met de hand worden verkregen, op een van de twee belangrijkste manieren: een grafische techniek of een techniek die lineaire regressie wordt genoemd.

Een spreidingsplot maken

Grafiekpapier gebruiken om te maken een scatterplot. Teken de x- en y-assen, zorg ervoor dat ze elkaar snijden en de oorsprong labelen. Zorg ervoor dat de x- en y-assen ook de juiste titels hebben. Plaats vervolgens elk gegevenspunt binnen de grafiek. Alle trends tussen de geplotte gegevenssets moeten nu duidelijk zijn.

Best passend regel

Nadat een spreidingsplot is gemaakt, ervan uitgaande dat er een lineaire correlatie bestaat tussen twee gegevenssets, kunnen we een grafische methode om de vergelijking te verkrijgen. Neem een ​​liniaal en teken een lijn zo dicht mogelijk bij alle punten. Probeer ervoor te zorgen dat er net zoveel punten boven de lijn zijn als er onder de lijn zijn. Nadat de lijn is getekend, gebruikt u standaardmethoden om de vergelijking van de rechte lijn te vinden.

Vergelijking van de rechte lijn

Zodra een lijn van de beste passing op een spreidingsgrafiek is geplaatst, is het eenvoudig om de vergelijking te vinden. De algemene vergelijking van een rechte lijn is:

y = mx + c

Waar m de helling (helling) van de lijn is en c het y-snijpunt is. Om het verloop te verkrijgen, zoek je twee punten op de lijn. Laten we omwille van dit voorbeeld aannemen dat de twee punten (1,3) en (0,1) zijn. Het verloop kan worden berekend door het verschil in de y-coördinaten te nemen en te delen door het verschil in de x-coördinaten:

m = (3 - 1) /(1 - 0) = 2/1 = 2

Het verloop in dit geval is gelijk aan 2. Tot dusverre is de vergelijking van de rechte lijn

y = 2x + c

De waarde voor c kan worden verkregen door de waarden in te ruilen voor een bekend punt. Volgend op het voorbeeld is een van de bekende punten (1,3). Steek dit in de vergelijking en herschik voor c:

3 = (2 * 1) + c

c = 3 - 2 = 1

De laatste vergelijking in dit geval is:

y = 2x + 1

Lineaire regressie

Lineaire regressie is een wiskundige methode die kan worden gebruikt om de lineaire vergelijking van een scatterplot te verkrijgen. Begin met het plaatsen van uw gegevens in een tabel. Laten we voor dit voorbeeld aannemen dat we de volgende gegevens hebben:

(4.1, 2.2) (6.5, 4.5) (12.6, 10.4)

Bereken de som van de x-waarden:

x_sum = 4.1 + 6.5 + 12.6 = 23.2

Bereken vervolgens de som van de y-waarden:

y_sum = 2.2 + 4.4 + 10.4 = 17

Tel nu de producten van elk datapunt samen:

xy_sum = (4.1 * 2.2) + (6.5 * 4.4) + (12.6 * 10.4) = 168.66

Bereken vervolgens de som van de x-waarden in het kwadraat en de y-waarden in het kwadraat:

x_square_sum = (4.1 ^ 2) + (6.5 ^ 2) + (12.6 ^ 2) = 217.82

y_square_sum = (2.2 ^ 2) + (4.5 ^ 2) + (10.4 ^ 2) = 133.25

Tenslotte telt u het aantal gegevenspunten dat u hebt. In dit geval hebben we drie gegevenspunten (N = 3). De gradiënt voor de best passende regel kan worden verkregen via:

m = (N * xy_sum) - (x_sum * y_sum) /(N * x_square_sum) - (x_sum * x_sum) = (3 * 168.66) - (23.2 * 17) /(3 * 217.82) - (23.2 * 23.2) = 0.968

Het snijpunt voor de best passende regel is te vinden op:

c = (x_square_sum * y_sum) - (x_sum * xy_sum) /(N * x_square_sum) - (x_sum * x_sum)

\\ = (217.82 17) - (23.2
168.66) /(3 * 217.82) - (23.2 * 23.2) \\ = -1.82

De laatste vergelijking is daarom:

y = 0.968x - 1.82