science >> Wetenschap >  >> Elektronica

Hoe big data ouder wordend onderzoek en onderwijs vormgeven

Krediet:CC0 Publiek Domein

Het tijdperk van big data is aangebroken:de wereld heeft de afgelopen twee jaar meer data gecreëerd dan in de hele voorgeschiedenis van de mensheid. Onderzoekers van de USC Leonard Davis School of Gerontology ontleden schatkamers aan informatie - uit bronnen zo divers als hersenscans en het menselijk genoom - om baanbrekend onderzoek te voeden naar het verbeteren van hoe we ouder worden, en om het gerontologie-onderwijs opnieuw vorm te geven, zodat toekomstige wetenschappers impact kunnen maken in een veranderend veld.

Gerontologie is klaar om de nieuwste tools aan te pakken, deels omdat het veld altijd grote datasets heeft gebruikt, zegt Mireille Jacobson, een micro-econoom en universitair hoofddocent gerontologie aan de USC Leonard Davis School. Bijvoorbeeld, haar werk was gebaseerd op grote populatiedatasets - en in zekere zin dat is niet veranderd, ze zegt. "Het is vooral dat er steeds meer data beschikbaar is."

Jacobson werkt met gegevens van Medicare en andere openbaar beschikbare databases om te begrijpen hoe ziektekostenverzekeringen het welzijn van ouderen beïnvloeden. Bijvoorbeeld, een analyse van Medicare-gegevens wees uit dat het ontvangen van Medicare-uitkeringen kan helpen de financiële stress bij 65-plussers te verminderen. Ze doet ook onderzoek naar zorgverleners en hoe zij zorgbeslissingen nemen als reactie op verschillende externe factoren, inclusief nieuwe screeningaanbevelingen en medicijntekorten.

"De inspanning om alles te digitaliseren en elektronisch beschikbaar te maken is nieuw, " zij voegt toe.

Jacobson maakt deel uit van een groep gerontologieonderzoekers aan de USC Leonard Davis School die in enorme hoeveelheden gegevens duiken om veroudering en de levensduur beter te begrijpen. Hun werk heeft belangrijke implicaties voor het opleiden van studenten en voor het creëren van betere datasets, die onderzoekers kunnen helpen om individuele risicofactoren beter te begrijpen, de rol van genen in ziekte te identificeren en preciezere interventies te ontwikkelen.

Over disciplines heen bewegen

bij Arpawong, wetenschappelijk universitair docent gerontologie en directeur van de Gerontology Bioinformatics Core, probeert verschillende informatie samen te brengen om beter te begrijpen hoe genetische en omgevingscomponenten op elkaar inwerken om te resulteren in verschillende gezondheidsresultaten bij oudere volwassenen. Haar huidige werk integreert het gebruik van zowel genoombrede als tweeling- en familiemodelleringsbenaderingen van grote datasets die honderdduizenden individuen vertegenwoordigen gedurende vele decennia, zoals de U.S. Health and Retirement Study en de Project Talent Aging Study, die beide tientallen jaren van follow-up omvatten met tienduizenden deelnemers.

Arpawong zegt dat het bestuderen van veroudering uniek is op het gebied van gezondheidsonderzoek, omdat er zoveel gebeurt in het vroege leven dat het traject van een persoon later beïnvloedt.

"Ik volg een ontwikkelingsbenadering gedurende het hele leven om de effecten van eerdere levensomstandigheden op de gezondheid in het latere leven te bestuderen, inclusief genetica, gedrag en contextuele factoren zoals sociaal-economische status en tegenspoed in het gezin, " ze zegt, "en dit vereist het samenstellen van veel datastukken."

Werken aan projecten zoals het maken van een index van kwetsbaarheid, het ontwikkelen van een genoombrede scan voor depressieve symptomen bij oudere volwassenen, berekenen hoe genetische en omgevingsfactoren bijdragen aan verouderingsgerelateerde cognitieve veranderingen en het beoordelen van de stabiliteit van MRI-markers voor dementie vereist veel vaardigheden op verschillende gebieden - en samenwerking. Er is een extra laag complexiteit wanneer onderzoekers bevindingen uit dierstudies van genetische markers moeten vertalen naar mensen.

"De focus van mijn werk met de Bioinformatics Core is de vertaling, of samenwerken met mensen aan de vertaling, van hun bevindingen uit modelsystemen zoals muizen in gegevens over menselijke populaties, ' zegt Arpawong.

Het is een beetje een circulair proces:vaak, de onderzoekers gebruiken gegevens van mensen om te kijken naar de impact van de bevindingen uit de diermodelsystemen. Zodra ze wat dingen in menselijke gegevens vinden, ze cirkelen terug en voeren die experimenten uit in de diermodellen om te zien of er causale mechanismen zijn. Deze gegevensgestuurde verkenning opent veel nieuwe manieren om veroudering, omdat het niet mogelijk is om dit soort translationele en integratieve gerontologiestudies alleen bij mensen te doen, gezien onze lange levensduur en enorm verschillende leefomgevingen.

"[Deze vertaling] is een groter deel geworden van het werk hier in de gerontologie dat fascinerend is en helpt om het tempo van onderzoeksresultaten te versnellen in disciplines die traditioneel onafhankelijker functioneerden, ' zegt Arpawong.

Het werk is van nature collaboratief geworden, waarbij veel verschillende onderzoekers met verschillende achtergronden betrokken zijn.

"Er is veel cross-over op verschillende afdelingen en er zijn meerdere voordelen van het werken met mensen van het Dornsife College, Keck School of Medicine en het Information Sciences Institute, waaronder van psychologie tot computationele biologie, " legt Arpawong uit. "Het is echt een verward web over het hele USC. Het wijst alleen maar op het hele transdisciplinaire karakter van dit werk. Je moet met veel mensen praten en met veel mensen werken om ervoor te zorgen dat je op de goede weg bent."

Arpawong gebruikte onlangs diverse datasets om het verband te vinden tussen genetica en verbaal geheugen. Ze ontdekte dat een genetische marker van de ziekte van Alzheimer niet de enige was - er is een tweede gen dat specifiek een rol speelt bij effecten op verouderingsgerelateerd geheugenvermogen.

Big data heeft ook de manier veranderd waarop mensen samenwerken, zegt Eileen Crimmins, USC Universiteitshoogleraar en AARP Hoogleraar Gerontologie. Geen enkele onderzoeker kan alle onderdelen van een project kennen, ze legt uit.

"Er zijn veel meer grote multidisciplinaire groepen waar iedereen één specialisatie heeft en niemand die allemaal weet, "zegt ze. "Dus er zijn veel meer mensen die vertrouwen hebben dat ze het weten en dat ze het goed kunnen doen."

Al die gegevens vereisen nieuwere oplossingen voor huisvesting en overdracht, vooral bij het werken met verschillende onderzoekers over de hele wereld.

"De schaal is veel groter in waar we mee te maken hebben en [in] de frequentie en de noodzaak om deze dingen over te dragen, het handhaven van gegevensbeveiliging, en dan over de tools te beschikken om dit te doen, ", zegt Arpawong. "Veel van de gegevensanalyse die we moeten doen, vereist codering in verschillende programmeertalen waar sommige van de meer gebruikelijke statistische software niet de capaciteit voor hebben, en het huisvesten van de gegevens op manieren die verder gaan dan de eigen harde schijf."

Ook het onderwijs moet aansluiten bij de nieuwste ontwikkelingen in big data science, vereisen dat studenten vaardig zijn in coderen, data gedreven en in staat om nieuwe vragen te stellen over de wetenschap van veroudering. Big data heeft het spel voor afgestudeerde studenten veranderd, zegt Crimmins, die de Multidisciplinaire Research Training in Gerontology Program aan de USC Leonard Davis School leidt. Het programma helpt predoctorale en postdoctorale studenten vertrouwd te raken met de studie van veroudering in meerdere disciplines.

"Er is veel meer multidisciplinaire activiteit omdat de vragen echt zijn verplaatst, ' legt Crimmins uit.

De studenten van vandaag verwerven voortdurend nieuwe vaardigheden en kennis, van de pathologie van luchtvervuiling tot genetica, naast hun fundamentele studies in gerontologie. Veel van wat mensen doen, is leren tijdens het werk om vaardigheden te verwerven die niet in de klas worden onderwezen, voegt Arpawong toe.

Voor studenten die het veld betreden, het begrijpen van statistiek en een goed begrip van rekenen is cruciaal. In haar klas, Jacobson presenteert enkele "rare gegevens", bijvoorbeeld waarom het gemiddelde van een dataset veel hoger kan zijn dan de mediaan.

"Als je denkt aan het gemiddelde inkomen in de VS in plaats van het mediaan, dat zou ons iets kunnen vertellen over Amerikanen in het algemeen, "zegt ze. "In zekere zin, de big data die beschikbaar is, zou ons moeten dwingen om terug te gaan naar de basis en de fundamenten te zien."

Codeercompetentie vormt ook de kern van de tools die nieuwe onderzoekers in het veld gebruiken - en soms vereist dat codering in meerdere talen.

Aanpassen voor de toekomst

De beschikbaarheid en soorten data zullen in de toekomst alleen maar toenemen, en onderzoekers bedenken hoe ze hun onderzoek kunnen aanpassen om ruimte te maken voor nieuwe informatie. Crimmins is mede-onderzoeker van de Health and Retirement Study, die al zo'n 30 jaar aan de gang is. Het onderzoek wordt om de twee jaar uitgevoerd, half persoonlijk en half aan de telefoon. Sinds 2006, de onderzoekers hebben biomarkers verzameld van mensen die ze persoonlijk bezoeken - statistieken zoals gewicht en lengte, bloeddruk en een bloedmonster.

Die statistieken zullen de onderzoekers in staat stellen grotere associaties te maken in de bestaande gegevens - en ze doen ook de andere gegevens in de analyse in het niet vallen. "Twee miljoen markers voor elke persoon, en we hebben 20, 000 mensen in de studie, ", zegt Crimmins. "Het vereist echt computergebruik met hoge capaciteit."

Met behulp van gegevens uit de Health and Retirement Study, Crimmins heeft een aantal verrassende bevindingen gedaan. Een daarvan is dat mensen na hun 65e feitelijk meer jaren van goede hersengezondheid hebben dan in het verleden het geval was. Een andere studie van de gegevens wees uit dat onderwijs mensen een voorsprong geeft in hun latere jaren, hen te helpen dementie op afstand te houden en hun herinneringen intact te houden. Het verzamelen van biomarkers van studiedeelnemers stelde ook USC Leonard Davis-alumna Morgan Levine '08 in staat, doctoraat '15 en Crimmins om een ​​veelbelovende methode te ontwikkelen om biologische, in tegenstelling tot chronologisch, leeftijd. Hun werk resulteerde in bevindingen die aantonen dat Amerikanen langzamer ouder worden dan twee decennia geleden.

USC heeft zich ontpopt als een dataproducerende universiteit. Er wordt hard gewerkt aan het stimuleren van het gebruik van data door deze beschikbaar te stellen en in een bruikbaar formaat, zegt Criminus. Het maakt een groot deel uit van wat ze doet:dienstbaar zijn aan het grotere veld.

"Het is een beetje te verwachten in ons vakgebied voor degenen onder ons die gegevensproducenten zijn, dat is een groot goed hier bij USC omdat we veel van de internationale datasets produceren, " ze zegt.

Big data doorbreekt traditionele grenzen tussen velden, zegt Arpawong. De sterkste resultaten zullen waarschijnlijk komen van een mengelmoes van verschillende gegevenstypen, bijvoorbeeld medische facturering en beeldvorming, of genomics en milieugegevens.

"Je moet het in stukjes opsplitsen. Je hebt mensen nodig die weten hoe ze de gegevens moeten manipuleren om te krijgen wat je wilt - en het is heel genuanceerd voor elk stuk, "zegt ze. "Je kunt op elke manier resultaten krijgen, hoe je iets ook kunt coderen, maar klopt het? En een groot probleem voor bio-informatica is ervoor te zorgen dat mensen worden getraind in dit soort gegevensbronnen om ervoor te zorgen dat ze doen wat ze willen doen."

USC Leonard Davis School Decaan Pinchas Cohen is het ermee eens dat in de moderne onderzoeksomgeving van vandaag, het gebruik van gegevens uit verschillende bronnen is net zo belangrijk als het begrijpen van cellulaire functies. In zijn eigen laboratorium hij leidt big data-gedreven studies om voorheen onbekende mitochondriale genen te identificeren, werken om hun functies te begrijpen en of ze doelen kunnen zijn voor behandelingen voor de ziekte van Alzheimer, diabetes en andere ziekten.

"In plaats van een one-size-fits-all mentaliteit, het tijdperk van big data stelt ons in staat om een ​​21e-eeuwse benadering te hebben om ziekterisico's aan te pakken en gezond ouder worden te bevorderen met een diep begrip van de risicofactoren van een individu, ', zegt Cohen. 'Wetenschap gaat niet langer over in een microscoop kijken in het eigen lab; het gaat erom naar buiten te kijken naar gegevens van miljoenen mensen over de hele wereld."