science >> Wetenschap >  >> anders

Van zoveel mensen is de DNA-sequentie bepaald dat ze de privacy van andere mensen in gevaar hebben gebracht

Krediet:CC0 Publiek Domein

Ieders DNA-sequentie is uniek. Maar voor degenen die hun genetische privacy willen behouden, het is misschien niet uniek genoeg.

Een nieuwe studie stelt dat meer dan de helft van de Amerikanen bij naam kan worden geïdentificeerd als je alleen maar hoeft te beginnen met een monster van hun DNA en een paar basisfeiten. zoals waar ze wonen en hoe oud ze kunnen zijn.

Het zou niet eenvoudig zijn, en het zou niet goedkoop zijn. Maar het feit dat het haalbaar is geworden, zal ons allemaal dwingen om de betekenis van privacy in het DNA-tijdperk te heroverwegen. aldus deskundigen.

Er is weinig tijd te verliezen. De onderzoekers achter de nieuwe studie zeggen dat zodra 3 miljoen Amerikanen hun genomen hebben geüpload naar openbare genealogische websites, bijna iedereen in de VS zou alleen geïdentificeerd kunnen worden door hun DNA en slechts een paar extra aanwijzingen.

Meer dan 1 miljoen Amerikanen hebben hun genetische informatie al gepubliceerd, en tientallen anderen doen dat elke dag.

"Mensen hebben zich afgevraagd hoe lang het zal duren voordat je DNA kunt gebruiken om zo ongeveer iedereen op te sporen, " zei Ruth Dickover, directeur van het forensisch wetenschappelijk programma aan de Universiteit van Californië, Davis die niet betrokken was bij het onderzoek. "De auteurs zeggen dat het niet zo lang gaat duren."

Deze nieuwe realiteit vertegenwoordigt de convergentie van twee al lang bestaande trends.

Een daarvan is de opkomst van direct-to-consumer genetische tests. Bedrijven zoals Ancestry.com en 23andMe kunnen het DNA van iedereen sequencen voor ongeveer $ 100. Het enige dat u hoeft te doen, is een speekselmonster geven en dit op de post doen.

Het andere essentiële element is de verspreiding van openbaar doorzoekbare genealogische databases zoals GEDmatch. Iedereen kan een volledig genoom uploaden naar deze sites en krachtige computers zullen er doorheen knarsen, op zoek naar stukken overeenkomende DNA-sequenties die kunnen worden gebruikt om een ​​stamboom op te bouwen.

Om de groeiende kracht van deze sites te testen, onderzoekers onder leiding van computerwetenschapper Yaniv Erlich aan de Columbia University gingen op zoek of ze de naam van een persoon konden vinden - en dus, zijn identiteit - als het enige wat ze hoefden te doen een stukje van zijn DNA was en een kleine hoeveelheid biografische informatie.

Ze begonnen met een volledige DNA-sequentie van een persoon wiens genetische informatie anoniem werd gepubliceerd als onderdeel van een niet-gerelateerd wetenschappelijk onderzoek. (Ze hadden deze vrouw daadwerkelijk geïdentificeerd in een eerdere studie, maar voor de doeleinden van dit werk, ze deden alsof ze niet wisten wie ze was.)

Erlich en zijn medewerkers uploadden haar genetische code naar GEDmatch en voerden een zoekopdracht uit om te zien of ze relaties op de site had. Ze vonden er twee:een in North Dakota en een in Wyoming.

De onderzoekers konden zien dat ze allemaal verwant waren omdat ze een aantal single-nucleotide polymorfismen deelden, of SNP's. Dit zijn enkele letters op specifieke plekken tussen de ongeveer 3 miljard A's, Cs, Ts en Gs die het menselijk genoom vormen.

Hoe meer SNP's mensen delen, hoe nauwer verwant ze zijn.

Door het DNA van alle drie de familieleden te vergelijken, Het team van Erlich kon een gemeenschappelijk voorouderlijk paar vinden dat de overgrootouders van de vrouw uit Utah waren.

Volgende, de onderzoekers doorzochten genealogische websites en andere bronnen voor extra afstammelingen van dat lang geleden paar. Ze vonden 10 kinderen en honderden kleinkinderen en achterkleinkinderen.

Toen begonnen ze hun enorme lijst met afstammelingen te ruimen. Ze elimineerden alle mannen uit de steekproef, dan degenen die niet in leven waren toen het DNA van de vrouw uit Utah werd gesequenced. De auteurs wisten ook dat hun onderwerp getrouwd was en hoeveel kinderen ze had, wat hen hielp hun doel te bereiken.

Na een lange dag hard werken, de onderzoekers konden de eigenaar van het DNA-monster correct noemen.

De auteurs zeiden dat hetzelfde proces zou werken voor ongeveer 60 procent van de Amerikanen van Europese afkomst, wie zijn de mensen die het meest geneigd zijn om genealogische websites te gebruiken, zei Erlich. Hoewel de kans op succes kleiner zou zijn voor mensen met een andere achtergrond, nog steeds zou worden verwacht dat het voor meer dan de helft van alle Amerikanen zou werken, ze zeiden.

Om tot deze conclusie te komen, de onderzoekers analyseerden een andere database bestaande uit 1,28 miljoen anonieme individuen waarvan de DNA-sequentie door MyHeritage werd bepaald, een DNA-test- en familiegeschiedenisbedrijf waar Erlich de chief science officer is.

Als u iemands achterneef kunt vinden in een genealogische database, dan zou je de persoon moeten kunnen identificeren met een redelijke hoeveelheid speurwerk, zei Erlich. Dus het team controleerde hoeveel familieleden in de volgorde van een derde neef of dichterbij ze voor elk individu in hun dataset konden vinden.

Ze vonden er genoeg:60 procent van de 1,28 miljoen mensen werd gematcht met een familielid dat minstens zo hecht was als een derde neef, en 15 procent had een familielid dat minstens zo hecht was als een achterneef.

De bevindingen werden donderdag gepubliceerd in het tijdschrift Wetenschap .

Tot dusver, De 72-jarige Joseph James DeAngelo is de beroemdste persoon die op deze manier wordt geïdentificeerd. Je kent hem misschien beter als de vermoedelijke Golden State Killer, beschuldigd van 13 moorden en 13 tellingen van poging tot ontvoering.

Toen wetshandhavers in april een openbaar toegankelijke DNA-database gebruikten om DeAngelo te pakken te krijgen, het was pas de tweede keer in de geschiedenis van het oplossen van misdaad dat de strategie met succes werd geïmplementeerd.

Vanaf dat moment, op dezelfde manier zijn ten minste 13 extra vermoedelijke criminelen geïdentificeerd.

"De oplossing van de Golden State Killer-zaak opende deze methode als een mogelijkheid en andere misdaadlaboratoria profiteren ervan, "Zei Dickover. "Er is duidelijk een trend begonnen."

Ook particulieren profiteren van de technologie. Geadopteerden hebben biologische ouders en broers en zussen gevonden, en anderen hebben verre neven gevonden die een nieuw licht kunnen werpen op de oorsprong en het erfgoed van een familie.

Maar naarmate meer van ons DNA uploaden naar openbaar doorzoekbare databases, de implicaties kunnen griezelig zijn.

"Toen de politie de Golden State Killer ving, dat was een zeer goede dag voor de mensheid, "Zei Erlich. "Het probleem is dat dezelfde strategie kan worden misbruikt."

Denk aan buitenlandse regeringen die deze techniek gebruiken om Amerikaanse burgers op te sporen, hij zei. Of demonstranten en activisten die op deze manier worden achtervolgd.

Erlich en zijn co-auteurs stelden een mitigatiestrategie voor die het moeilijker zou maken om een ​​onbekende DNA-sequentie naar een genealogische database te uploaden en naar een match te zoeken.

Ze stellen voor dat direct-to-consumer DNA-testbedrijven een speciale code plaatsen op de onbewerkte gegevensbestanden die ze naar hun klanten sturen. Genealogische sites zouden dan kunnen overeenkomen dat mensen alleen DNA-sequenties mogen uploaden als ze een geldige code hebben. Dit zou ervoor zorgen dat mensen zoekopdrachten konden uitvoeren die alleen betrekking hadden op hun eigen DNA.

Een systeem als dit zou wetshandhavers er niet van weerhouden om genealogische databases te gebruiken om verdachten te zoeken, zei Erlich.

Het uiteindelijke doel is om mensen in staat te stellen hun DNA te gebruiken om meer te weten te komen over hun eigen familie zonder hun privacy op te offeren, zei Erlich.

Alleen dit jaar, zijn geadopteerde neef vond een biologische zus die halverwege de wereld woont, hij zei.

"Daarom hebben we deze techniek, " hij zei.

© 2018 Los Angeles Times
Gedistribueerd door Tribune Content Agency, LLC.