Wetenschap
Een spreidingsplot is een grafiek die de relatie tussen twee gegevenssets laat zien. Soms is het handig om de gegevens in een spreidingsplot te gebruiken om een wiskundige relatie tussen twee variabelen te verkrijgen. De vergelijking van een spreidingsplot kan met de hand worden verkregen op twee manieren: een grafische techniek of een techniek die lineaire regressie wordt genoemd.
Een spreidingsplot maken
Gebruik grafiekpapier om een spreidingsplot te maken . Teken de x- en y-assen, zorg ervoor dat ze elkaar kruisen en label de oorsprong. Zorg ervoor dat de x- en y-assen ook de juiste titels hebben. Teken vervolgens elk gegevenspunt in de grafiek. Alle trends tussen de geplotte gegevenssets moeten nu duidelijk zijn.
Line of Best Fit
Zodra een spreidingsplot is gemaakt, ervan uitgaande dat er een lineaire correlatie is tussen twee gegevenssets, kunnen we een grafische methode gebruiken om de vergelijking te verkrijgen. Neem een liniaal en trek een lijn zo dicht mogelijk bij alle punten. Probeer ervoor te zorgen dat er net zoveel punten boven de lijn zijn als er onder de lijn zijn. Nadat de lijn is getekend, gebruikt u standaardmethoden om de vergelijking van de rechte lijn te vinden. Vergelijking van de rechte lijn
Zodra een best passende lijn op een spreidingsgrafiek is geplaatst, is het eenvoudig om de vergelijking. De algemene vergelijking van een rechte lijn is:
y \u003d mx + c
Waar m de helling (gradiënt) van de lijn is en c het y-snijpunt is. Zoek twee punten op de lijn om het verloop te verkrijgen. Laten we voor dit voorbeeld aannemen dat de twee punten (1,3) en (0,1) zijn. De gradiënt kan worden berekend door het verschil in de y-coördinaten te nemen en te delen door het verschil in de x-coördinaten:
m \u003d (3 - 1) /(1 - 0) \u003d 2/1 \u003d 2
De gradiënt is in dit geval gelijk aan 2. Tot nu toe is de vergelijking van de rechte lijn
y \u003d 2x + c
De waarde voor c kan worden verkregen door de waarden te vervangen door een bekend punt. Volgens het voorbeeld is een van de bekende punten (1,3). Steek dit in de vergelijking en herschik voor c:
3 \u003d (2 * 1) + c
c \u003d 3 - 2 \u003d 1
De laatste vergelijking in dit geval is:
y \u003d 2x + 1
Lineaire regressie
Lineaire regressie is een wiskundige methode die kan worden gebruikt om de lineaire vergelijking van een spreidingsplot te verkrijgen. Begin met het plaatsen van uw gegevens in een tabel. Laten we voor dit voorbeeld aannemen dat we de volgende gegevens hebben:
(4.1, 2.2) (6.5, 4.5) (12.6, 10.4)
Bereken de som van de x-waarden:
x_sum \u003d 4.1 + 6.5 + 12.6 \u003d 23.2
Bereken vervolgens de som van de y-waarden:
y_sum \u003d 2.2 + 4.4 + 10.4 \u003d 17
Som nu de producten van elke gegevenspuntset:
xy_sum \u003d (4.1 * 2.2) + (6.5 * 4.4) + (12.6 * 10.4) \u003d 168.66
Bereken vervolgens de som van de x-waarden in het kwadraat en de y-waarden in het kwadraat:
x_square_sum \u003d (4.1 ^ 2) + (6.5 ^ 2) + (12.6 ^ 2) \u003d 217.82
y_square_sum \u003d (2.2 ^ 2) + (4.5 ^ 2) + (10.4 ^ 2) \u003d 133.25
Tot slot tel je het aantal datapunten dat je hebt. In dit geval hebben we drie gegevenspunten (N \u003d 3). Het verloop voor de best passende lijn kan worden verkregen van:
m \u003d (N * xy_sum) - (x_sum * y_sum) /(N * x_square_sum) - (x_sum * x_sum) \u003d (3 * 168.66) - (23.2 * 17) /(3 * 217.82) - (23.2 * 23.2) \u003d 0.968
Het onderscheppen voor de best passende lijn kan worden verkregen bij:
c \u003d (x_square_sum * y_sum) - (x_sum * xy_sum) /(N * x_square_sum) - (x_sum * x_sum)
\\ \u003d (217.82 17) - (23.2 De uiteindelijke vergelijking is daarom: y \u003d 0.968x - 1.82
168.66) /(3 * 217.82) - (23.2 * 23.2) \\ \u003d -1.82
Wetenschap © https://nl.scienceaq.com