Science >> Wetenschap >  >> Chemie

GPT-3 transformeert chemisch onderzoek

Credit:CC0 Publiek Domein

Kunstmatige intelligentie groeit uit tot een cruciaal hulpmiddel in chemisch onderzoek en biedt nieuwe methoden om complexe uitdagingen aan te pakken waarmee traditionele benaderingen worstelen. Een subtype van kunstmatige intelligentie dat steeds vaker in de chemie wordt gebruikt, is machinaal leren, waarbij algoritmen en statistische modellen worden gebruikt om beslissingen te nemen op basis van gegevens en taken uit te voeren waarvoor het niet expliciet is geprogrammeerd.



Om betrouwbare voorspellingen te kunnen doen, vereist machinaal leren echter ook grote hoeveelheden gegevens, die bij chemisch onderzoek niet altijd beschikbaar zijn. Kleine chemische datasets bieden eenvoudigweg niet genoeg informatie waarop deze algoritmen kunnen trainen, wat hun effectiviteit beperkt.

Wetenschappers, in het team van Berend Smit van EPFL, hebben een oplossing gevonden in grote taalmodellen zoals GPT-3. Deze modellen zijn vooraf getraind in enorme hoeveelheden teksten en staan ​​bekend om hun brede mogelijkheden voor het begrijpen en genereren van mensachtige teksten. GPT-3 vormt de basis van de populairdere kunstmatige intelligentie ChatGPT.

De studie, gepubliceerd in Nature Machine Intelligence , onthult een nieuwe aanpak die chemische analyses met behulp van kunstmatige intelligentie aanzienlijk vereenvoudigt. In tegenstelling tot wat aanvankelijk sceptisch was, stelt de methode niet rechtstreeks chemische vragen over GPT-3.

"GPT-3 heeft het grootste deel van de chemische literatuur nog niet gezien, dus als we ChatGPT een chemische vraag stellen, zijn de antwoorden doorgaans beperkt tot wat je op Wikipedia kunt vinden", zegt Kevin Jablonka, de hoofdonderzoeker van het onderzoek.

"In plaats daarvan verfijnen we GPT-3 met een kleine dataset omgezet in vragen en antwoorden, waardoor een nieuw model ontstaat dat in staat is nauwkeurige chemische inzichten te verschaffen."

Dit proces houdt in dat GPT-3 een samengestelde lijst met vragen en antwoorden krijgt. “Voor legeringen met een hoge entropie is het bijvoorbeeld belangrijk om te weten of een legering in één fase voorkomt of meerdere fasen kent”, zegt Smit. "De samengestelde lijst met vragen en antwoorden is van het type:Q='Is de (naam van de legering met hoge entropie) eenfasig?' A='Ja/Nee.'"

Hij vervolgt:‘In de literatuur hebben we veel legeringen gevonden waarvan het antwoord bekend is, en deze gegevens hebben we gebruikt om GPT-3 te verfijnen. Wat we terugkrijgen is een verfijnd AI-model dat is getraind om alleen deze vraag te beantwoorden. met ja of nee."

In tests heeft het model, getraind met relatief weinig vragen en antwoorden, meer dan 95% van de zeer uiteenlopende chemische problemen correct beantwoord, waarbij het vaak de nauwkeurigheid van de modernste machine-learning-modellen overtreft. "Het punt is dat dit net zo eenvoudig is als het zoeken naar literatuur, wat voor veel chemische problemen werkt", zegt Smit.

Een van de meest opvallende aspecten van dit onderzoek is de eenvoud en snelheid ervan. Traditionele machine learning-modellen hebben maanden nodig om zich te ontwikkelen en vereisen uitgebreide kennis. De door Jablonka ontwikkelde aanpak duurt daarentegen vijf minuten en vereist nul kennis.

De implicaties van het onderzoek zijn diepgaand. Het introduceert een methode die net zo eenvoudig is als het uitvoeren van een literatuuronderzoek, toepasbaar op verschillende chemische problemen. Het vermogen om vragen te formuleren als:"Is de opbrengst van een [chemische] gemaakt met dit (recept) hoog?" en nauwkeurige antwoorden krijgen, kan een revolutie teweegbrengen in de manier waarop chemisch onderzoek wordt gepland en uitgevoerd.

In het artikel zeggen de auteurs:"Naast een literatuuronderzoek zou het bevragen van een fundamenteel model (bijvoorbeeld GPT-3,4) een routinematige manier kunnen worden om een ​​project op te starten door gebruik te maken van de collectieve kennis die in deze fundamentele modellen is gecodeerd." Of, zoals Smit het bondig verwoordt:"Dit gaat de manier veranderen waarop we scheikunde bedrijven."

Meer informatie: Kevin Maik Jablonka, Is GPT alles wat je nodig hebt voor ontdekking met weinig data in de chemie?, Nature Machine Intelligence (2024). DOI:10.1038/s42256-023-00788-1

Journaalinformatie: Natuurmachine-intelligentie

Aangeboden door Ecole Polytechnique Federale de Lausanne