science >> Wetenschap >  >> Natuur

Stanford-studenten zetten machine learning in om omgevingsmonitoring te ondersteunen

Bijschrift:Satellietbeelden van rivierafvoeren naar de Atlantische Oceaan in de nasleep van orkaan Florence tonen water dat verkleurd is door puin en verontreinigende stoffen. Krediet:NASA

Terwijl orkaan Florence zich een weg baant door North Carolina, het bracht wat beleefd zou kunnen worden genoemd een uitwerpselenstorm vrij. Enorme mestpoelen van varkensboerderijen spoelden een stoofpot van gevaarlijke bacteriën en zware metalen naar nabijgelegen waterwegen.

Efficiënter toezicht had enkele van de ergste effecten kunnen voorkomen, maar zelfs in de beste tijden, staats- en federale milieuregelgevers zijn overbelast en ondergefinancierd. Hulp is nabij, echter, in de vorm van machine learning - computers trainen om automatisch patronen in gegevens te detecteren - volgens Stanford-onderzoekers.

hun studie, gepubliceerd in Natuur Duurzaamheid , constateert dat machine learning-technieken twee tot zeven keer zoveel overtredingen kunnen opvangen als de huidige benaderingen, en suggereert verregaande toepassingen voor publieke investeringen.

"Zeker in een tijdperk van dalende budgetten, het identificeren van kosteneffectieve manieren om de volksgezondheid en het milieu te beschermen is van cruciaal belang, " zei studie co-auteur Elinor Benami, een afgestudeerde student in het Emmett Interdisciplinair programma voor milieu en hulpbronnen (E-IPER) in Stanford's School of Earth, Energie &Milieuwetenschappen.

Bronnen optimaliseren

Net zoals de IRS niet elke belastingbetaler kan controleren, de meeste overheidsinstanties moeten voortdurend beslissingen nemen over de toewijzing van middelen. Methoden voor machinaal leren kunnen dat proces helpen optimaliseren door te voorspellen waar fondsen het meeste voordeel kunnen opleveren. De onderzoekers richtten zich op de Schoonwaterwet, waaronder het Amerikaanse Environmental Protection Agency en de deelstaatregeringen verantwoordelijk zijn voor het reguleren van meer dan 300, 000 faciliteiten, maar kunnen in een bepaald jaar minder dan 10 procent daarvan inspecteren.

Met behulp van gegevens van eerdere inspecties, de onderzoekers gebruikten een reeks modellen om de kans te voorspellen dat een inspectie niet zou slagen, op basis van faciliteitskenmerken, zoals locatie, industrie en inspectiegeschiedenis. Vervolgens, ze lieten hun modellen op alle faciliteiten draaien, waaronder die welke nog gekeurd moesten worden.

Deze techniek genereerde een risicoscore voor elke faciliteit, om aan te geven hoe groot de kans was dat de inspectie niet zou slagen. De groep creëerde vervolgens vier inspectiescenario's die verschillende institutionele beperkingen weerspiegelen:variërende inspectiebudgetten en inspectiefrequenties, bijvoorbeeld - en gebruikte de score om inspecties te prioriteren en overtredingen te voorspellen.

In het scenario met de minste beperkingen - onwaarschijnlijk in de echte wereld - voorspelden de onderzoekers dat ze tot zeven keer het aantal schendingen zouden inhalen in vergelijking met de status-quo. Toen ze rekening hielden met meer beperkingen, het aantal geconstateerde overtredingen was nog steeds het dubbele van de status quo.

Grenzen van algoritmen

Ondanks zijn potentieel, machine learning heeft gebreken om voor te waken, waarschuwen de onderzoekers. "Algoritmen zijn onvolmaakt, ze kunnen soms vooringenomenheid bestendigen en ze kunnen worden bespeeld, " zei hoofdauteur Miyuki Hino, ook een afgestudeerde student in E-IPER.

Bijvoorbeeld, agenten, zulke varkenshouderijen, kunnen hun gerapporteerde gegevens manipuleren om de kans op het ontvangen van uitkeringen of het vermijden van boetes te beïnvloeden. Anderen kunnen hun gedrag veranderen - ontspannende normen wanneer het pakkans laag is - als ze weten hoe groot de kans is dat ze door het algoritme worden geselecteerd. institutioneel, politieke en financiële beperkingen kunnen het vermogen van machine learning om bestaande praktijken te verbeteren, beperken. De aanpak zou de bezorgdheid over milieurechtvaardigheid kunnen verergeren als het toezicht systematisch wordt weggeleid van faciliteiten in gebieden met lage inkomens of minderheden. Ook, de machine learning-benadering houdt geen rekening met mogelijke veranderingen in de tijd, zoals in prioriteiten van het overheidsbeleid en technologieën voor verontreinigingsbeheersing.

De onderzoekers stellen oplossingen voor een aantal van deze uitdagingen voor. Door willekeurig enkele faciliteiten te selecteren, ongeacht hun risicoscores, en af ​​en toe het model opnieuw trainen om actuele risicofactoren weer te geven, zou kunnen helpen om faciliteiten met een laag risico scherp te houden op het gebied van naleving. Bezorgdheid over milieurechtvaardigheid zou kunnen worden ingebouwd in praktijken voor het richten van inspecties. Het onderzoeken van de waarde en afwegingen van het gebruik van zelfgerapporteerde gegevens kan helpen om zorgen over strategisch gedrag en manipulatie door faciliteiten te beheersen.

De onderzoekers suggereren dat toekomstig werk aanvullende complexiteiten zou kunnen onderzoeken bij het integreren van een machine learning-aanpak in de bredere handhavingsinspanningen van de EPA, zoals het opnemen van specifieke handhavingsprioriteiten of het identificeren van technische, financiële en personele beperkingen. In aanvulling, deze methoden zouden kunnen worden toegepast in andere contexten binnen de VS en daarbuiten waar regelgevers efficiënt gebruik willen maken van beperkte middelen.

"Dit model is een startpunt dat kan worden uitgebreid met meer details over de kosten en baten van verschillende inspecties, overtredingen en handhavingsreacties, "zei co-auteur en mede-E-IPER-afgestudeerde student Nina Brooks.