science >> Wetenschap >  >> Biologie

Naamloze soorten bacteriën een naam geven in het tijdperk van big data

Schematische workflow voor het maken en toewijzen van willekeurige Latinate-namen. Strings opgebouwd uit Latijnse letters werden geselecteerd en samengesteld om ongewenste componenten en betekenisvolle woorden uit te sluiten. Deze werden gecombineerd met Latijnse achtervoegsels of woorden om namen te creëren, die vervolgens werden gebruikt om plaatsaanduidingstaxa in GTDB-bestanden te benoemen en om op tekst gebaseerde protologen te creëren. Credit:International Journal of Systematic and Evolutionary Microbiology (2022). DOI:10.1099/ijsem.0.005482

In een recent gepubliceerd artikel in het International Journal of Systematic and Evolutionary Microbiology , hebben onderzoekers in het VK en Oostenrijk meer dan 65.000 verschillende soorten microben genoemd. De studie, geleid door professor Mark Pallen van het Quadram Institute in Norwich, is gebaseerd op een lange traditie van het creëren van goedgevormde maar willekeurige Latijnse namen voor nieuwe soorten, maar past deze benadering toe op een schaal die ongekend is in de geschiedenis van de taxonomie.

Prof. Pallen stelt dat de microbiologie het slachtoffer is van zijn eigen succes, met tienduizenden nieuwe soorten die de afgelopen jaren zijn ontdekt, maar de meeste blijven naamloos. Bacteriën hebben in het verleden beschrijvende namen gekregen of zijn vernoemd naar mensen of plaatsen. Deze aanpak levert momenteel ongeveer duizend nieuwe soortnamen per jaar op. Met een achterstand van>50.000 goed geclassificeerde maar niet nader genoemde soorten, zou het bij dit tempo van vooruitgang echter minstens een halve eeuw duren om al deze niet nader genoemde bacteriën te noemen - tegen die tijd zouden wetenschappers het probleem krijgen om de miljoenen meer soorten te noemen ondertussen ontdekt.

Pallen en collega's hebben een efficiënte, high-throughput, big data-aanpak aangenomen, waarbij een computerprogramma is gebruikt om tienduizenden onderscheidende maar gebruiksvriendelijke namen te genereren die niet lijken op bestaande woorden. Om te voldoen aan de eis dat namen voor bacteriën in het Latijn moeten zijn, combineerde het team willekeurige reeksen letters uit het Latijnse alfabet met grammaticaal goed gevormde vrouwelijke achtervoegsels. Het resultaat is een reeks namen die herinneren aan de vertrouwdheid en gravitas van het Latijn, ook al missen ze een betekenisvolle stamboom. Voorbeelden zijn Dupisella tifacia voor een bacterie uit de schapendarm, Hopelia gocarosa voor een bacterie die in Zweeds grondwater leeft of Saxicetta apufaria uit een Russisch zoutmeer.

Hoewel dit misschien radicaal lijkt, heeft het vormen van namen op willekeurige wijze een lange traditie, die teruggaat tot de eerste code van taxonomische nomenclatuur in 1869 en zelfs terug tot de vader van de taxonomie, de Zweedse natuuronderzoeker Linnaeus. Wat hier anders is, is het verbazingwekkende gevoel voor schaal, met een catalogus van namen die meer dan tienduizend pagina's beslaat in wat de grootste naamgeving van soorten ooit in één publicatie vertegenwoordigt.

Omdat ze zijn toegepast op soorten die door DNA-sequencing zijn ontdekt maar nog niet in het laboratorium zijn gekweekt, blijven de nieuwe namen voorlopig eerder permanent. Aangezien de code van de nomenclatuur erop staat dat bacteriologen streven naar stabiliteit in namen en er geen concurrerende benaderingen voor naamgeving op schaal zijn, lijkt het waarschijnlijk dat de overgrote meerderheid van de nieuwe namen nog jaren of zelfs eeuwen zullen worden gebruikt.

Tot slot zegt Pallen:"Ik was lid van de werkgroep die ons Griekse letters gaf voor COVID-varianten, die snel werden overgenomen door de wetenschappelijke gemeenschap. Ik hoop dat de hier voorgestelde namen ook snel worden overgenomen en op grote schaal worden gebruikt. Dit is gewoon de eerste stap. Het tijdperk van microbiële ontdekking is nog lang niet voorbij, maar het zal gemakkelijk zijn om toekomstige namen massaal te creëren met behulp van de principes die we hier hebben vastgesteld." + Verder verkennen

Een geautomatiseerd systeem voor het genereren van een miljoen nieuwe namen voor bacteriën