Wetenschap
Meerdere regressie wordt gebruikt om de relatie tussen verschillende onafhankelijke variabelen en een afhankelijke variabele te onderzoeken. Hoewel u met meerdere regressiemodellen de relatieve invloeden van deze onafhankelijke of voorspellende variabelen op de afhankelijke of criteriumvariabele kunt analyseren, kunnen deze vaak complexe gegevenssets leiden tot valse conclusies als ze niet goed worden geanalyseerd.
Voorbeelden of Multiple Regression
Een makelaar kan multiple regression gebruiken om de waarde van huizen te analyseren. Ze zou bijvoorbeeld als onafhankelijke variabelen de grootte van de huizen, hun leeftijd, het aantal slaapkamers, de gemiddelde huizenprijs in de buurt en de nabijheid van scholen kunnen gebruiken. Als ze deze in een meervoudig regressiemodel plant, kan ze deze factoren vervolgens gebruiken om hun relatie met de prijzen van de huizen als de criteriumvariabele te zien.
Een ander voorbeeld van het gebruik van een meervoudig regressiemodel kan zijn dat iemand in human resources bepaalt het salaris van managementposities - de criteriumvariabele. De voorspellende variabelen kunnen de anciënniteit van elke manager zijn, het gemiddelde aantal gewerkte uren, het aantal mensen dat wordt beheerd en het afdelingsbudget van de manager.
Voordelen van meervoudige regressie
Er zijn twee belangrijke voordelen aan het analyseren van gegevens met behulp van een meervoudig regressiemodel. De eerste is de mogelijkheid om de relatieve invloed van een of meer voorspellende variabelen op de criteriumwaarde te bepalen. De makelaar zou kunnen vinden dat de grootte van de huizen en het aantal slaapkamers een sterke correlatie hebben met de prijs van een huis, terwijl de nabijheid van scholen helemaal geen correlatie heeft, of zelfs een negatieve correlatie als het voornamelijk een pensioen is community.
Het tweede voordeel is het vermogen om uitbijters of afwijkingen te identificeren. Bij het beoordelen van de gegevens met betrekking tot managementsalarissen, kon de HR-manager bijvoorbeeld vaststellen dat het aantal gewerkte uren, de afdelingsgrootte en het budget allemaal een sterke correlatie hadden met salarissen, terwijl anciënniteit dat niet deed. Als alternatief kan het zijn dat alle vermelde voorspellende waarden gecorreleerd waren met elk van de onderzochte salarissen, behalve één manager die te veel werd betaald in vergelijking met de andere.
Nadelen van meervoudige regressie
Enig nadeel van het gebruik van een meervoudig regressiemodel komt meestal neer op de gegevens die worden gebruikt. Twee voorbeelden hiervan zijn het gebruik van onvolledige gegevens en ten onrechte concluderen dat een correlatie een oorzaak is.
Stel bijvoorbeeld bij het beoordelen van de prijs van woningen dat de makelaar slechts 10 woningen heeft bekeken, waarvan er zeven zijn gekocht door jonge ouders. In dit geval kan de relatie tussen de nabijheid van scholen haar doen geloven dat dit een effect heeft op de verkoopprijs voor alle huizen die in de gemeenschap worden verkocht. Dit illustreert de valkuilen van onvolledige gegevens. Als ze een grotere steekproef had gebruikt, had ze kunnen vaststellen dat van de 100 verkochte huizen slechts tien procent van de huiswaarden verband hield met de nabijheid van een school. Als ze de leeftijd van de kopers als voorspellende waarde had gebruikt, had ze kunnen vaststellen dat jongere kopers bereid waren meer te betalen voor huizen in de gemeenschap dan oudere kopers.
Stel dat er in het voorbeeld van managementsalarissen één uitbijter die een kleiner budget had, minder anciënniteit en met minder personeel om te beheren, maar meer verdiende dan wie dan ook. De HR-manager zou de gegevens kunnen bekijken en kunnen concluderen dat deze persoon te veel wordt betaald. Deze conclusie zou echter onjuist zijn als hij geen rekening zou houden met het feit dat deze manager de leiding had over de website van het bedrijf en een zeer felbegeerde vaardigheden in netwerkbeveiliging had.
Wetenschap © https://nl.scienceaq.com