science >> Wetenschap >  >> Natuur

Hoe machine learning regelgevers kan helpen

Voorbeeld faciliteiten voor varkens (links) en pluimvee (rechts), met de originele afbeelding (boven) en een heatmap van de manier waarop de algoritmische modellen de afbeelding hebben verwerkt (onder). De rode gebieden geven aan waar het model de waarschijnlijkheid van faciliteitslocaties heeft gedetecteerd. Credit:National Agriculture Imagery Program / U.S. Department of Agriculture

Het lokaliseren van potentieel vervuilende veehouderijen is al lang een probleem voor milieuregelgevers. Nutsvoorzieningen, Stanford-wetenschappers laten zien hoe een kaartleesalgoritme regelgevers kan helpen om faciliteiten efficiënter dan ooit tevoren te identificeren.

Rechtsprofessor Daniel Ho, samen met Ph.D. student Cassandra Handan-Nader, hebben een manier bedacht voor machinaal leren - een computer leren patronen in gegevens te identificeren en analyseren - om industriële dieractiviteiten efficiënt te lokaliseren en regelgevers te helpen bij het bepalen van het milieurisico van elke faciliteit. De bevindingen van de onderzoekers worden op 8 april gepubliceerd in Natuur Duurzaamheid .

"Ons werk laat zien hoe een overheidsinstantie gebruik kan maken van snelle vooruitgang in computervisie om schoon water efficiënter te beschermen, " zei Ho, de William Benjamin Scott en Luna M. Scott hoogleraar rechten, en een senior fellow bij het Stanford Institute for Economic Policy Research.

Een basisprobleem, met complexe gevolgen

Volgens de Environmental Protection Agency (EPA), de landbouw levert de grootste bijdrage van verontreinigende stoffen aan de watervoorziening van het land, met aanzienlijke vervuiling waarvan wordt aangenomen dat deze afkomstig is van grootschalige, geconcentreerde diervoeders, ook wel CAFO's genoemd.

Maar de inspanningen op het gebied van milieumonitoring zijn gedwarsboomd door een fundamenteel probleem:regelgevers hebben geen systematische manier om te bepalen waar CAFO's zich bevinden, zei Ho. Het Amerikaanse Government Accountability Office meldt dat geen enkele federale instantie betrouwbare informatie heeft over het aantal, omvang en locatie van grootschalige landbouwactiviteiten.

Hoewel de Clean Water Act wel enige federale vergunning vereist, het is alleen van toepassing op operaties die daadwerkelijk verontreinigende stoffen in de waterwegen van de VS lozen - niet op faciliteiten die mogelijk verontreiniging zouden kunnen veroorzaken - opzettelijk of niet, zei Ho.

Zonder definitieve lijst om naar te kijken, inspanningen om potentieel vervuilende faciliteiten te monitoren zijn moeilijk en, in sommige gevallen, onmogelijk.

"Dit informatietekort verstikt de handhaving van de milieuwetten van de Verenigde Staten, ' zei Ho.

Sommige milieu- en publieke belangengroepen hebben geprobeerd om faciliteiten zelf te identificeren door het terrein handmatig te scannen of door luchtfoto's te bekijken, maar ze vonden het een ongelooflijk tijdrovende taak. Het kostte een milieugroep meer dan drie jaar om beelden van slechts één staat te bekijken. Het monitoren van inspanningen als deze kan nooit worden geschaald of in realtime worden uitgevoerd, zei Ho.

Big data gebruiken om de gaten op te vullen

Ho en Handan-Nader, toen een research fellow aan de Stanford Law School en nu bezig met een doctoraat in de politieke wetenschappen, richtten hun aandacht op een soort kunstmatige intelligentie die deep learning wordt genoemd. Een subset van machine learning, deep learning-algoritmen hebben een revolutie teweeggebracht in het vermogen om complexe objecten in afbeeldingen te detecteren.

Met de hulp van verschillende open source-tools en een team van studenten in economie en informatica om te helpen bij data-analyse, Ho en Handan-Nader waren in staat om een ​​bestaand beeldherkenningsmodel te hertrainen om grootschalige dierenfaciliteiten te herkennen door gebruik te maken van informatie verzameld door twee non-profitorganisaties en openbaar beschikbare satellietbeelden van het National Agricultural Imagery Program (NAIP) van de USDA. De onderzoekers concentreerden zich op het identificeren van pluimveefaciliteiten in North Carolina, omdat de meeste geen vergunningen nodig hebben, zei Ho.

Het model, al bedreven in het scannen van afbeeldingen op basis van een enorm corpus aan digitale afbeeldingen, werd omgeschoold om soortgelijke aanwijzingen op te pikken die de milieuorganisaties handmatig hadden gecontroleerd. Bijvoorbeeld, varkenshouderijen waren te herkennen aan compacte rechthoekige stallen met grote drijfmestkelders, en pluimvee door lange rechthoekige schuren en droge mestopslag. Door in te spelen op deze prominente kenmerken, het model was ook in staat om schattingen van de omvang van de faciliteiten te geven.

De onderzoekers ontdekten dat hun algoritme 15 procent meer pluimveebedrijven kon identificeren dan wat oorspronkelijk werd gevonden door handmatige inspanningen. En omdat hun aanpak zou kunnen schalen over jaren van NAIP-beelden, hun algoritme was in staat om de groei in de buurt van een recent gebouwde voerfabriek nauwkeurig te schatten.

"Het model detecteerde 93 procent van alle CAFO's van pluimvee in het gebied, en was 97 procent nauwkeurig in het bepalen welke verschenen nadat de voermolen was geopend, ' schrijven Handan-Nader en Ho in de krant.

complementair, Interdisciplinaire aanpak

Ho en Handan-Nader hopen dat machine learning een aanvulling kan zijn op de menselijke monitoringinspanningen van milieuagentschappen en belangengroepen.

"Nu kunnen allerlei soorten onderzoekers met programmeervaardigheden deze open-sourcetools gebruiken voor nieuwe toepassingen, " zei Handan-Nader, een co-auteur op het papier. "Je kunt op de schouders van reuzen gaan staan ​​en uitbreiden wat experts in dit soort machine learning-technieken hebben gedaan."

Het gebruik van machine learning voor routinetaken kan mensen de vrijheid geven om complexere taken uit te voeren, zoals het bepalen van de mogelijke gevaren voor het milieu van een faciliteit, zei Handan-Nader. De onderzoekers schatten dat hun algoritme 95 procent van de bestaande grootschalige faciliteiten zou kunnen vastleggen met minder dan 10 procent van de middelen die nodig zijn voor een handmatige telling.

Ho en Handan-Nader hopen dat, eventueel, vooruitgang in luchtfoto's zal een computermodel in staat stellen om daadwerkelijke lozing in waterwegen te detecteren.

"Meer en meer, complexe sociale problemen kunnen niet worden opgelost vanuit een beperkte discipline alleen, en het vermogen om innovatie over de campussen heen te stimuleren, kan helpen bij het aanpakken van kernproblemen op het gebied van wetgeving en openbaar beleid, ' zei Ho.