Wetenschap
Meerdere regressie wordt gebruikt om de relatie tussen verschillende onafhankelijke variabelen en een afhankelijke variabele te onderzoeken. Hoewel u met meerdere regressiemodellen de relatieve invloeden van deze onafhankelijke of voorspellende variabelen op de afhankelijke of criteriumvariabele kunt analyseren, kunnen deze vaak complexe gegevenssets tot valse conclusies leiden als ze niet juist worden geanalyseerd. < h2> Voorbeelden van Multiple Regression
Een makelaar in onroerend goed kan meerdere regressies gebruiken om de waarde van huizen te analyseren. Ze zou bijvoorbeeld als onafhankelijke variabelen de grootte van de huizen, hun leeftijd, het aantal slaapkamers, de gemiddelde huizenprijs in de buurt en de nabijheid van scholen kunnen gebruiken. Als ze deze in een meervoudig regressiemodel plotten, kon ze deze factoren gebruiken om hun relatie met de prijzen van de huizen als de criteriumvariabele te zien.
Een ander voorbeeld van het gebruik van een meervoudig regressiemodel kan iemand zijn in het bepalen van menselijke hulpbronnen. het salaris van managementposities - de criteriumvariabele. De voorspellende variabelen kunnen de anciënniteit van elke manager zijn, het gemiddelde aantal gewerkte uren, het aantal beheerde personen en het afdelingsbudget van de manager.
Voordelen van multiple-regressie
Er zijn twee belangrijke voordelen voor analyseren van gegevens met behulp van een meervoudig regressiemodel. De eerste is de mogelijkheid om de relatieve invloed van een of meer voorspellingsvariabelen op de criteriumwaarde te bepalen. De makelaar kon vaststellen dat de grootte van de woningen en het aantal slaapkamers een sterke correlatie hebben met de prijs van een woning, terwijl de nabijheid van scholen helemaal geen correlatie heeft, of zelfs een negatieve correlatie als het in de eerste plaats een pensioen is. community.
Het tweede voordeel is de mogelijkheid om uitschieters of anomalieën te identificeren. Tijdens het beoordelen van de gegevens met betrekking tot managementsalarissen, kon de personeelsmanager bijvoorbeeld vaststellen dat het aantal gewerkte uren, de afdelingsomvang en het budget een sterke correlatie hadden met salarissen, terwijl senioriteit dat niet was. Als alternatief kan het zijn dat alle opgesomde voorspellende waarden gecorreleerd zijn aan elk van de onderzochte salarissen, behalve voor één manager die te veel werd betaald in vergelijking met de andere.
Nadelen van multiple-regressie
Elk nadeel van het gebruik van een meervoudig regressiemodel komt meestal neer op de gegevens die worden gebruikt. Twee voorbeelden hiervan zijn het gebruik van onvolledige gegevens en ten onrechte concluderen dat een correlatie een oorzaak is.
Stel dat de makelaar bijvoorbeeld bij het beoordelen van de prijs van een huis naar slechts 10 huizen keek, waarvan er zeven werden gekocht door jonge ouders. In dit geval kan de relatie tussen de nabijheid van scholen haar doen geloven dat dit van invloed was op de verkoopprijs voor alle woningen die in de gemeenschap werden verkocht. Dit illustreert de valkuilen van onvolledige gegevens. Als ze een groter exemplaar had gebruikt, had ze kunnen vaststellen dat van de 100 verkochte huizen slechts tien procent van de huiswaarden verband hield met de nabijheid van een school. Als ze de leeftijden van de kopers als voorspellende waarde had gebruikt, had ze kunnen vaststellen dat jongere kopers bereid waren meer te betalen voor huizen in de gemeenschap dan oudere kopers.
Stel dat er sprake was van managementsalarissen in het geval van managementsalarissen. één uitbijter die een kleiner budget had, minder anciënniteit had en minder personeel had om te beheren, maar meer verdiende dan wie dan ook. De HR-manager kan de gegevens bekijken en concluderen dat deze persoon te veel betaald krijgt. Deze conclusie zou echter onjuist zijn als hij er geen rekening mee zou houden dat deze manager de leiding had over de website van het bedrijf en een zeer begeerde vaardighedenset had in netwerkbeveiliging.
Wetenschap © https://nl.scienceaq.com