science >> Wetenschap >  >> anders

Big data krijgt een nieuwe vorm dankzij 100 jaar oude ideeën over geometrie

Krediet:Elesey/Shutterstock

Je hersenen bestaan ​​uit miljarden neuronen die verbonden zijn door triljoenen synapsen. En hoe ze zijn gerangschikt, geeft aanleiding tot de functionaliteit van de hersenen en tot je persoonlijkheid. Daarom produceerden wetenschappers in Zwitserland onlangs de allereerste digitale 3D-hersencelatlas, een volledige mapping van de hersenen van een muis. Hoewel dit een kolossale prestatie is, de grote uitdaging ligt nu in het leren ontcijferen van de atlas. En het is een enorme.

De wetenschap zit vol met dit soort problemen:hoe zet je grote hoeveelheden informatie om in bruikbare inzichten. Voor vele jaren, onderzoekers vertrouwden op wiskunde en statistiek om gegevens te verkennen. De explosie van grote datasets gecreëerd door digitale opslag, het internet, en goedkope sensoren heeft geleid tot de ontwikkeling van nieuwe technieken die speciaal zijn ontworpen om met deze "big data" om te gaan.

En nu is er een nieuwe benadering in opkomst, gebaseerd op eeuwenoude ideeën, die superieure tools produceert om bepaalde soorten big data te begrijpen. Met behulp van de hersenen van de muis als voorbeeld, zijn fysieke vorm bepaalt zijn functionaliteit. Maar een nauwkeurige beschrijving van deze vorm, die we nu hebben, onthult niet automatisch alles over hoe de hersenen werken.

Achter de fysieke vorm ligt een meer abstracte vorm die wordt gevormd door de onderlinge verbindingen in de hersenen. Door aspecten van deze vorm vast te leggen door technieken uit de studie van wat bekend staat als 'topologie' toe te passen, kan een dieper begrip van het functioneren van de hersenen worden onthuld. Ditzelfde leidende principe van het gebruik van topologische technieken op big data heeft ook toepassingen in de ontwikkeling van geneesmiddelen en andere baanbrekende inspanningen.

Topologie

Topologie is een tak van moderne meetkunde met wortels die teruggaan tot een fundamentele observatie door de Zwitserse wiskundige Leonhard Euler (1707-1783) over veelvlakken, 3D-vormen met platte vlakken, rechte randen en scherpe hoeken of "hoekpunten". in 1750, Euler ontdekte dat voor elk convex (met alle vlakken naar buiten wijzend) veelvlak, het aantal hoekpunten minus het aantal randen plus het aantal vlakken is altijd gelijk aan twee.

Je kunt dezelfde formule toepassen op andere vormen om wat bekend staat als hun Euler-kenmerk te krijgen. Dit aantal verandert niet, hoe de vorm ook wordt gebogen of vervormd. En topologie is de studie van dit soort constante eigenschappen van vormen.

Topologie maakte in de 20e eeuw een snelle ontwikkeling door als een prominent onderwerp in de zuivere wiskunde. De onderzoekers die het onderwerp hebben gemaakt, hadden geen echte toepassingen in hun hoofd, ze waren gewoon geïnteresseerd in wat wiskundig waar was over vormen onder bepaalde omstandigheden.

Maar sommige van deze ideeën uit de topologie die al meer dan 100 jaar bestaan, vinden nu belangrijke toepassingen in datawetenschap. Omdat topologie zich richt op constante eigenschappen, zijn technieken maken het ongevoelig voor verschillende gegevensonnauwkeurigheden of "ruis". Dit maakt het ideaal voor het ontcijferen van de ware betekenis achter de verzamelde gegevens.

Een knoestig probleem. Krediet:VIKTORIIA NOVOKHATSKA/Shutterstock

U bent waarschijnlijk bekend met een veelvoorkomend topologisch fenomeen. Draden die 's ochtends netjes in je tas zijn geplaatst (je oortelefoons of een adapter) hebben de neiging om tegen de middag een vreselijke puinhoop te produceren. Een draad is een heel eenvoudige vorm. Of het geknoopt is of niet, is een topologische vraag, en de neiging om tot een topologische nachtmerrie in je tas te komen, wordt nu heel goed begrepen.

Miljoenen jaren geleden, evolutie werd geconfronteerd met een soortgelijk probleem. DNA in cellen is een molecuul dat bestaat uit twee opgerolde ketens. Elke ketting is een zeer lange draad, opgebouwd uit een reeks kleine moleculen die nucleobasen worden genoemd. Als een cel zich deelt, deze draden wikkelen zich af, repliceren en dan weer oprollen. Maar net als draden in een zak, de strengen DNA kunnen verstrengeld raken, die voorkomt dat de cel zich deelt en ervoor zorgt dat deze sterft.

Speciale enzymen in de cel, topoisomerases genaamd, hebben tot taak een dergelijke catastrofe te voorkomen. En het opzettelijk verstoren van de topo-isomerases van bacteriën voorkomt dat ze zich verspreiden en stopt zo een infectie. Dit betekent dat een beter begrip van hoe topoisomerasen de verstrengeling van DNA voorkomen, ons zou kunnen helpen bij het ontwerpen van nieuwe antibiotica. En aangezien verstrengeling een puur topologisch kenmerk is, topologische technieken kunnen ons daarbij helpen.

Drug ontwikkeling

Topologie kan ook worden gebruikt om de creatie van nieuwe geneesmiddelen te verbeteren. Farmaceutische geneesmiddelen zijn chemicaliën die zijn ontworpen om op een bepaalde manier in wisselwerking te treden met bepaalde cellen in het lichaam. specifiek, cellen hebben receptoren waardoor moleculen van een bepaalde vorm zich eraan kunnen hechten, het gedrag van de cellen veranderen. Dus door medicijnen te produceren met deze gevormde moleculen, kunnen ze zich richten op de juiste cellen en deze beïnvloeden.

Zoals het blijkt, het vervaardigen van een molecuul om een ​​bepaalde vorm te krijgen is een vrij eenvoudig proces. Maar de gemakkelijkste manier om het medicijn bij de doelcellen te krijgen, is ze via de bloedbaan te sturen, en voor dat, het medicijn moet in water oplosbaar zijn. Nadat een medicijn met de juiste vorm is geproduceerd, de vraag van een miljoen pond is:lost het op in water? Helaas, dit is een heel moeilijke vraag om te beantwoorden, alleen al door de chemische structuur van het molecuul te kennen. Veel projecten voor het ontdekken van geneesmiddelen mislukken vanwege oplosbaarheidsproblemen.

Hier komt topologie om de hoek kijken. "Molecuulruimte" verwijst naar een manier van denken over een hele verzameling moleculen als een soort wiskundige entiteit die geometrisch kan worden bestudeerd. Het hebben van een kaart van deze ruimte zou een geweldig hulpmiddel zijn om nieuwe medicijnen te produceren, vooral als de kaart oriëntatiepunten bevatte die een hogere kans op oplosbaarheid aangeven.

In het recente werk, onderzoekers gebruikten topologische data-analysetools als een eerste stap om zo'n kaart te produceren. Analyseren van enorme hoeveelheden gegevens die molecuuleigenschappen koppelen aan oplosbaarheid in water, de nieuwe aanpak leidde tot de ontdekking van nieuwe, voorheen onvermoed, indicatoren van oplosbaarheid. Dit verbeterde vermogen om in water oplosbare geneesmiddelen te produceren, kan de tijd die nodig is om een ​​nieuwe behandeling te creëren aanzienlijk verkorten, en om het hele proces goedkoper te maken.

In steeds meer domeinen van de wetenschap, onderzoekers merken dat ze meer gegevens hebben dan ze effectief kunnen begrijpen. De reactie van moderne wiskundigen om de wiskundige uitdagingen van big data aan te gaan is nog steeds aan het ontvouwen - en topologie, een theorie die alleen gebonden is aan de verbeelding van haar beoefenaars, zal ongetwijfeld helpen om de toekomst vorm te geven.

Dit artikel is opnieuw gepubliceerd vanuit The Conversation onder een Creative Commons-licentie. Lees het originele artikel.