science >> Wetenschap >  >> Elektronica

Door AI gecreëerde stambomen bevestigen 18e en 19e-eeuwse klassenverdelingen in Finland

Een klein deel van een stamboom die 13 generaties beslaat en is afgeleid door het algoritme. De kleuren geven de sociaal-economische status van het individu weer. Krediet:Eric Malmi

Een genealoog zou 100 mensjaren nodig hebben om alle ouders in kaart te brengen en te vinden voor vijf miljoen mensen – met een snelheid van één persoon per minuut. Het AncestryAI-algoritme kan hetzelfde werk in een uur doen met 50 parallelle computers en met een slagingspercentage van 65 procent. Het algoritme kan ook de mate van onzekerheid voor elke verbinding meten, zodat onbetrouwbare resultaten kunnen worden genegeerd. Genealogen en demografen kunnen het algoritme gebruiken om licht te werpen op maatschappelijke verandering en geschiedenis.

'Het algoritme vervangt niet het werk van genealogen; het is gewoon een hulpmiddel om hen te helpen bij hun werk. Het genealogische algoritme kan verbanden suggereren die waarschijnlijk correct zijn, maar op zichzelf is het niet zo nauwkeurig als een zorgvuldige genealoog. Het algoritme kan ook zoeken naar ouders uit landelijke gegevens, terwijl een genealoog zijn zoektocht misschien moet beperken tot slechts één parochie, ' legt Eric Malmi uit, promovendus aan de Aalto University die momenteel voor Google in Zürich werkt.

Met behulp van AncestryAI, gelanceerd in 2017, genealogen zijn er inderdaad in geslaagd nieuwe voorouders te vinden, zoals familiebanden tussen met individuen van wie sommigen zijn verhuisd naar verschillende regio's in Finland. Momenteel, AncestryAI wordt gebruikt om de genealogische relaties af te leiden van mensen die zijn omgekomen in de Finse burgeroorlog in 1918 om te geven, bijvoorbeeld, een nauwkeurigere schatting van het aantal oorlogswezen.

De klassenindeling in Finland bleef 150 jaar onveranderd

Het genealogische algoritme helpt bij het onderzoeken van enorme hoeveelheden gegevens om sociale veranderingen over lange perioden te analyseren in plaats van alleen in bepaalde en smalle tijdsbestekken. Malmi's werk heeft bevestigd, bijvoorbeeld, die klassenindeling in Finland bleef tussen 1735 en 1885 vrijwel onveranderd.

'We hebben het effect van de sociaal-economische status op de keuze van de echtgenoot bestudeerd en ontdekten dat ze duidelijk met elkaar verbonden zijn. Tegen onze verwachting in, echter, de sterkte van de verbinding nam in de loop van de tijd niet af, maar bleef liever hetzelfde, ' legt Malmi uit.

De sociaaleconomische status werd afgeleid op basis van het beroep van de vader van een echtgenoot. Boerenknechten en andere landloze boeren vertegenwoordigden de laagste klasse, en de rest werd vervolgens verdeeld in pachters, boeren, middenklasse en hogere klasse.

AncestryAI maakt gebruik van statistische deductie- en machine learning-procedures die zijn ontwikkeld voor genealogisch gebruik. Het basisalgoritme probeert de moeder en vader voor elk individu afzonderlijk af te leiden op basis van hun naam, plaats en geboortedatum. Een aanvullend algoritme verbetert vervolgens de nauwkeurigheid van het basisalgoritme door rekening te houden met andere factoren, zoals dat mensen meestal kinderen hebben met dezelfde echtgenoot.

AncestryAI maakt gebruik van gegevens in de HisKi-database die wordt onderhouden door de Genealogical Society of Finland. De gegevens bevatten in totaal 5 miljoen geboorten en 3,3 miljoen sterfgevallen in de periode 1648-1918. Het algoritme heeft in totaal 7,3 miljoen verbanden gelegd tussen kinderen en hun ouders.