Wetenschap
Onderzoekers die een onbekende persoon proberen te identificeren, kunnen maanden bezig zijn met het doorzoeken van enorme stambomen. Krediet:Cory Hall
Bijna 37 jaar lang stond ze bekend als Buckskin Girl - een jong, anoniem moordslachtoffer dat buiten Dayton, Ohio werd gevonden, terwijl ze een poncho van hertenhuid droeg. Toen, in april 2018, maakte de politie bekend dat het mysterie van haar identiteit was opgelost. Haar naam was Marcia L. King en ze was geïdentificeerd door een fragment van haar DNA te koppelen aan een van haar neven.
Het was een van de eerste spraakmakende zaken waarin deze onderzoeksmethode was gebruikt om een niet-opgeëist lichaam te identificeren. Twee weken nadat King's naam bekend was gemaakt, kondigde de politie in Californië aan dat ze soortgelijke technieken hadden gebruikt om de Golden State Killer op te sporen. Plots werd de combinatie van genetische bemonstering, genealogisch onderzoek en ouderwetse gumshoeing geprezen als een revolutionaire doorbraak die honderden cold cases zou kraken.
Sindsdien heeft forensische genetische genealogie meer dan 400 gevallen in de VS opgehelderd. Toch is dit speurwerk complex en tijdrovend. Hoewel King na slechts een paar uur speuren werd geïdentificeerd, duurt het in de meeste gevallen veel langer. Gemiddeld duurt het meer dan een jaar voordat ze succesvol zijn opgelost. Velen blijven onvoltooid:wetshandhavingsinstanties hebben mogelijk geen geld meer voordat een persoon kan worden geïdentificeerd en onderzoekers kunnen het opgeven als ze te veel doodlopende wegen raken.
Een meer systematische aanpak zou helpen, zegt Lawrence Wein, hoogleraar operaties, informatie en technologie aan de Stanford Graduate School of Business. Met Mine Su Ertürk, Ph.D., heeft hij een methode onthuld om cold cases met meer snelheid en succes op te lossen. In een nieuw artikel in het Journal of Forensic Sciences , presenteren ze de eerste gedetailleerde wiskundige analyse van het forensische genetische genealogieproces en schetsen ze een manier voor onderzoekers om zoekopdrachten naar onbekende slachtoffers of criminele verdachten te optimaliseren.
Om hun zoekmethode te ontwikkelen, werkten Wein en Ertürk samen met het DNA Doe Project, een non-profitorganisatie in Californië die meer dan 65 gevallen van niet-geïdentificeerde stoffelijke resten heeft opgelost, waaronder de King-zaak. Het leverde de onderzoekers gegevens op van 17 zaken, waaronder 8 die op dat moment onopgelost waren. "Dat is vergelijkbaar met het historische gemiddelde van zaken die ze hebben opgelost", zegt Wein. "Er is dus geen reden om te vermoeden dat deze gevallen veel moeilijker of veel gemakkelijker zijn dan willekeurig geselecteerde gevallen."
Met behulp van die gegevens uit de echte wereld hebben Wein en Ertürk gekeken naar hoe forensische genetische genealogische zoekopdrachten vaak worden uitgevoerd en hebben vervolgens hun methode getest, die erop gericht is de kans op het vinden van een oplossing in de kortst mogelijke tijd te maximaliseren. "Het blijkt veel sneller te zijn", zegt Wein over de nieuwe aanpak - bijna 10 keer sneller. "Als ze maar een klein aantal zaken oplossen met de huidige methode, en we kunnen ze 10 keer sneller laten oplossen, dan kunnen ze veel meer zaken oplossen."
Een bos van stambomen
Een typisch genetisch genealogisch onderzoek begint met een DNA-monster van een 'doelwit', zoals een niet-geïdentificeerd lichaam of een verdachte van moord. Het wordt geüpload naar een DNA-database zoals GEDmatch of FamilyTreeDNA, die een lijst met "matches" genereert:mensen die delen van het genoom van het doelwit delen. Een zoekopdracht kan honderden van deze overeenkomsten opleveren, meestal verre neven waarvan de gedeelde voorouders mogelijk meer dan een eeuw geleden zijn overleden. De gevallen die Wein en Ertürk analyseerden, hadden tussen de 200 en 5.000 overeenkomsten.
Dat is nog maar het begin:een lijn trekken van deze verre verwanten naar het doelwit vereist het bouwen van een stamboom die zoveel mogelijk familieleden omvat. Ook hier is de omvang van het probleem ontmoedigend. "Dit zijn enorme bomen", zegt Wein. "Het is echt moeilijk om iets groter dan een paar dozijn mensen visueel in te delen." Naarmate de boom groter wordt, neemt de kans om het doelwit te identificeren toe, maar de zoekduur neemt ook toe.
Vervolgens moeten de relevante personen in de boom worden geïdentificeerd. Dit vereist het doorzoeken van openbare registers, genealogische sites en sociale media - tijdrovend werk dat intuïtie en vaardigheid combineert. "Het is een hele kunst", zegt Wein. "Met behulp van huwelijks- en overlijdensakten en geboorteakten en Facebook en allerlei verschillende gegevens proberen te achterhalen wie mensen zijn en wie hun voorouders en nakomelingen zijn."
Het is niet meteen duidelijk welke overeenkomsten het beste pad naar het doel zullen bieden. De strategieën van onderzoekers om deze aanwijzingen te volgen, zijn meestal gedecentraliseerd, zegt Wein. "Je hebt een team van mensen dat dit doet en ze zullen elk beslissen om een match te onderzoeken, en dan gaan ze er zelf op uit om te proberen een stamboom terug in de tijd op te bouwen van elke match. Ze denken niet na holistisch over het grote geheel."
Door een stap terug te doen en het hele probleem te beoordelen, bieden Wein en Ertürk een routekaart voor genetische genealogen die op zoek zijn naar de meest efficiënte weg naar een niet-geïdentificeerd doelwit. "Kortom, we vertellen ze:"Gezien waar je nu bent in de zoektocht, dit is wat je nu moet doen", zegt Wein.
Vergelijkingen en misdaden oplossen
Het uitleggen van het verschil tussen de nieuwe zoekmethode en de standaard of "benchmark"-methode is ingewikkeld, maar Wein komt hier op neer:"De benchmarkmethode zoekt naar gemeenschappelijke voorouders tussen verschillende overeenkomsten. Wat je echt wilt vinden, is de meest recente gemeenschappelijke voorouder tussen een match en het onbekende doelwit, en dat is een iets ander probleem." De meest recente gemeenschappelijke voorouder van neef en nicht is bijvoorbeeld een grootouder; achterneven delen een overgrootouder, enzovoort.
Na het identificeren van een lijst met mogelijke meest recente gemeenschappelijke voorouders, vult de methode van Wein en Ertürk de stamboom "agressief" in met hun nakomelingen, zelfs als er maar een kleine kans is dat de voorouder van het doelwit op de lijst staat.
Deze sprong wordt bereikt door waarschijnlijkheidstheorie te gebruiken om de voortgang van de zoekopdracht te volgen. "We doen dit door de gereconstrueerde stamboom te beschrijven als een verzameling kansen die representeren hoe waarschijnlijk het is dat elke persoon in onze stamboom een correcte voorouder van het doelwit is", legt Ertürk uit. "Dan kun je, als je naar deze kansen kijkt, zien welke delen van de boom je meer moet onderzoeken."
Deze aanpak blijkt zelfs bij kleinere stambomen effectief te zijn, wat snellere oplostijden betekent. Na honderden gesimuleerde zoekopdrachten te hebben uitgevoerd, concluderen Wein en Ertürk dat hun methode ongeveer 94% van de tijd een zaak met een stamboom van 7.500 personen kan oplossen. Het slagingspercentage van de standaardmethode ligt in die gevallen rond de 4%.
Wein hoopt dat deze bevindingen het DNA Doe Project en andere onderzoekers zullen helpen hun aanpak te verfijnen en meer zaken op te lossen. Hij merkt op dat zijn analyse geen rekening houdt met enkele van de "trucs" die genetische onderzoekers gebruiken om hun zoekopdrachten te verfijnen, zoals het focussen op familieleden die op een bepaalde locatie woonden. "Ons algoritme is op geen enkele manier bedoeld om genealogen te vervangen", zegt hij. "Maar als ze echt vast zitten, zullen ze ideeën krijgen die misschien niet voor de hand liggend zijn."
Wein en Ertürk hebben eerder wiskunde toegepast om onderzoeksuitdagingen aan te pakken. Vorig jaar schreef Ertürk samen met Stanford GSB-professor Kuang Xu een paper samen waarin een methode van genetisch zoeken wordt geschetst die een evenwicht biedt tussen efficiëntie en privacykwesties. Wein heeft onderzoek gedaan naar betere manieren om vingerafdrukken te scannen, aanrandingskits te verwerken en kogels op te sporen.
Hij ziet forensische genetische genealogie als een ander hulpmiddel voor het oplossen van misdaden dat kan worden verbeterd, zodat het zijn belofte waar kan maken. "Het is een interessant vakgebied dat waarschijnlijkheid en statistiek combineert met optimalisatie en soms speltheorie", zegt hij. "Zo bleef ik, vanuit wiskundig oogpunt, aangetrokken tot deze problemen." + Verder verkennen
Wetenschap © https://nl.scienceaq.com