Wetenschap
Veld van sorghum, een belangrijk gewas dat wordt gebruikt als voedsel en bij de productie van biobrandstoffen. Krediet:Pixabay
Hoe kan kunstmatige intelligentie (AI) de landbouw beïnvloeden, de voedingsindustrie, en het gebied van bio-engineering? Dan Jacobson, een onderzoeks- en ontwikkelingsmedewerker in de Biosciences Division van het Oak Ridge National Laboratory (ORNL) van het Amerikaanse Department of Energy (DOE), heeft een paar ideeën.
De afgelopen 5 jaar, Jacobson en zijn team hebben planten bestudeerd om de genetische variabelen en patronen te begrijpen waardoor ze zich kunnen aanpassen aan veranderende omgevingen en klimaten. Als computationeel bioloog Jacobson gebruikt enkele van 's werelds krachtigste supercomputers voor zijn werk, waaronder de onlangs ontmantelde Cray XK7 Titan en 's werelds krachtigste en slimste supercomputer voor open wetenschap, de IBM AC922 Summit-supercomputer, beide gevestigd in de Oak Ridge Leadership Computing Facility (OLCF), een DOE Office of Science User Facility bij ORNL.
Vorig jaar, Jacobson en zijn team wonnen een Association for Computing Machinery Gordon Bell Prize na het gebruik van een speciale computertechniek die bekend staat als 'gemengde precisie' op Summit om de eerste groep te worden die exascale-snelheid bereikte - ongeveer een triljoen berekeningen per seconde.
Het team van Jacobson werkt momenteel aan tal van projecten die een geïntegreerde roadmap vormen voor de toekomst van AI in plantenveredeling en bio-energie. Het werk van het team was te zien in Trends in biotechnologie in oktober.
In deze vraag en antwoord Jacobson vertelt over het werk van zijn team aan een algoritme voor genomische selectie, zijn visie op de toekomst van milieugenomica, en de ruimte waar simulatie AI ontmoet.
Waar heeft uw team het afgelopen jaar aan gewerkt?
Jacobson:We hebben aan een aantal dingen gewerkt. Onlangs, we hebben nieuwe manieren ontwikkeld om te doen wat 'genomische selectie' wordt genoemd, " of het ontwerpen van een organisme voor fokdoeleinden. We hebben een nieuw genomisch selectie-algoritme ontwikkeld dat wordt aangedreven door opkomende methoden voor machinaal leren die gezamenlijk "verklaarbare AI" worden genoemd, ", een veld dat de AI-methoden voor black box-classificatie verbetert door te proberen te begrijpen hoe deze algoritmen beslissingen nemen.
Dit algoritme helpt ons te bepalen welke variaties in een genoom we moeten combineren om planten te produceren die zich kunnen aanpassen aan hun omgeving. Dit informeert fokkerij inspanningen, inspanningen voor het bewerken van genen, of combinaties daarvan, afhankelijk van wat voor soort bio-engineeringstrategie u wilt volgen.
Vorig jaar verdiende je een Gordon Bell-prijs nadat je de exaschaalbarrière had doorbroken met een code waarmee je combinatorische interacties tussen organismen en hun omgeving kunt bestuderen. Hoe past dit algoritme in dat onderzoek?
Jacobson:We gebruiken nog steeds het model dat we vorig jaar gebruikten, maar nu, we hebben dit AI-gestuurde genomische selectie-algoritme geïntroduceerd in onze Combinatorial Metrics [CoMet]-code en we geven het elke dag van het jaar omgevingsinformatie, zodat we genoombrede associatiestudies kunnen doen in de hele klimaattijd.
Aanvullend, we hebben onze inspanningen op wereldschaal uitgebreid met wat we 'klimatypes' noemen:de klimaat- en milieu-informatie waaraan planten zich aanpassen. Met de hulp van Peter Thornton van ORNL en de expertise van zijn groep op het gebied van biogeografie en klimaat, we bouwden modellen van elke vierkante kilometer land op de planeet en codeerden 50 jaar milieu- en klimaatgegevens in deze modellen, variërend van de bodem, omhoog door lichtspectrale kwaliteit, en alles daartussenin.
Om alle relaties tussen verschillende omgevingen te begrijpen, we vergeleken deze omgevingen met elkaar op Summit met behulp van een nieuw algoritme genaamd Duo dat we aan onze CoMet-codebasis hebben toegevoegd. Voor zover we weten, dit is de grootste wetenschappelijke berekening ooit gedaan.
Dat klinkt als een behoorlijk forse prestatie. Wat voor soort informatie kunnen deze vergelijkingen u geven?
Jacobson:Deze vergelijkingen kunnen ons helpen precies te bepalen waar we ons op bepaalde omgevingen kunnen richten en welke genmutaties en allelen we moeten opnemen om deze planten te helpen zich aan te passen aan verschillende omgevingen. We kunnen naar een omgeving kijken en zeggen:"Voor deze omgeving dit is wat we in het genoom van deze plant nodig hebben om het zo goed mogelijk te laten gedijen."
Is dit de toekomst van milieugenomica?
Jacobson:De geïntegreerde visie die we zien is de verbinding van alle "-omics" lagen, uit genomics (genexpressie), proteomics (eiwitexpressie), en metabolomics (expressie van metabolieten) tot en met fenotypes - waarneembare eigenschappen; dus, van genoom tot fenomen en alles daartussenin.
Ideaal, we willen graag een combinatie van genotypegegevens met klimaat- en milieugegevens in een geïntegreerd model, van enkele nucleotiden - de moleculaire structuren waaruit DNA bestaat - tot milieu en klimaat op planetaire schaal. Dergelijke uitgebreide geïntegreerde modellen zijn nu mogelijk omdat we de spectrale lichtschaal van elk punt op de planeet hebben berekend - dat is een astrofysisch fenotype dat afkomstig is van onze dichtstbijzijnde ster, de zon.
Eerst, we moeten kijken naar de combinatorische interacties in dergelijke modellen om te zien hoe ze leiden tot de opkomende eigenschappen die we in fabrieken proberen te optimaliseren voor toekomstige productiviteit en duurzaamheid. Vervolgens, we kunnen dat in verband brengen met hoe planten zich historisch hebben aangepast aan omgevingen om nieuwe ideale genotypen voor bio-energie of voedselproductie te ontwerpen die zijn geoptimaliseerd om te gedijen in specifieke omgevingen.
Is dit iets dat in de toekomst nodig zal zijn in de landbouw?
Jacobson:Terwijl de wereld verandert, er is een toenemende druk om "marginale grond, " dat is land dat momenteel vaak niet wordt gebruikt voor landbouw of niet efficiënt wordt gebruikt voor landbouw. Dus, als we genotypen ontwerpen die gedijen in deze marginale omgevingen, kunnen we naast onze energieproductie ook onze voedselproductie verhogen. Dit is een technologie voor tweeërlei gebruik.
We maken ons ook grote zorgen over overbemesting van het land, omdat dit kan leiden tot afspoeling met grote ecologische gevolgen. Als we planten kunnen optimaliseren om de voedingsstoffen te gebruiken die er zijn met weinig extra bemesting, dat is ook een groot voordeel voor duurzaamheid. Dus, we proberen dit echt holistisch te bekijken en zoveel mogelijk van deze aanpassingen in het model te bouwen, zodat we de effecten in bepaalde omgevingen kennen.
Waar werk je nu aan?
Jacobson:De volgende stap is om naar de historische gegevens en al deze relaties te kijken en vervolgens naar voren te projecteren, zodat we daadwerkelijk genotypen kunnen ontwerpen die niet alleen zullen gedijen in de huidige milieuzones, maar ook in de toekomst zullen blijven bloeien als het wereldwijde netwerk verandert. Het vermogen om vooruit te projecteren, zowel voor eenjarige gewassen als voor meerjarige gewassen, is echt belangrijk.
Wat zijn enkele resterende uitdagingen?
Jacobson:Alles wat we doen is zwaar tillen, maar we bekijken hoe we deze nieuwe aanpak op Summit en het toekomstige exaschaalsysteem van de OLCF kunnen ontwerpen, Grens, zodat we al deze relaties echt kunnen begrijpen. Ook, nu we deze gegevens op al deze "-omics" lagen hebben, we moeten deze combinaties van lagen - polytopen genaamd - duizenden of tienduizenden of honderdduizenden keren uitvoeren. De volgende reeks algoritmen die we aan het bouwen zijn, is om alle mogelijke relaties en associaties binnen en tussen alle polytopen te vinden. Dat is de volgende grens.
Zal uw werk überhaupt kruisen met traditionele klimaatsimulatiemodellen?
Jacobson:Dit is een data- en AI-gestuurde weergave van klimaatinformatie, wat anders is dan een simulatiebenadering. Overuren, het zal interessant zijn om te zien waar ze elkaar kruisen, en er kunnen dingen zijn die we hier leren die zeer informatief zijn voor klimaatmodellen en vice versa. We weten ook dat dit soort verklaarbare AI-technologie veel kan helpen bij simulatiestudies. Ideaal, we zouden verklaarbare AI-gestuurde modellen kunnen ontwikkelen die simulatiemodellen kunnen helpen met een aantal van hun knelpunten. Als we de patronen die simulatiemodellen gebruiken kunnen leren en sommige van hun knelpunten kunnen vervangen door een geleerd resultaat, dan kunnen die modellen creatievere dingen doen. Dat is echt waar we in de toekomst een deel van deze ruimte kunnen zien kruisen.
Wetenschap © https://nl.scienceaq.com