science >> Wetenschap >  >> anders

Algoritmen zoeken kiezersfraude

Krediet:CC0 Publiek Domein

Zorgen over kiezersfraude zijn de afgelopen jaren toegenomen, vooral nadat federale functionarissen meldden dat Russische hackers probeerden toegang te krijgen tot kiezersgegevens bij de presidentsverkiezingen van 2016. Er zijn administratieve stemfouten gemeld, te; bijvoorbeeld, een controle door staatsfunctionarissen onthulde dat 84, 000 kiezersrecords werden per ongeluk gedupliceerd door het California Department of Motor Vehicles (DMV) bij de voorverkiezingen van juni 2018.

Michael lvarez, hoogleraar politieke wetenschappen aan Caltech, en zijn team helpen met de situatie door nieuwe algoritmen te ontwikkelen voor het bijhouden van kiezersgegevens. Ze werken samen met Neal Kelley, kiezersregister van Orange County, en, van april 2018 tot mei 2019, evalueerde meer dan 1,5 miljoen stemgegevens in Orange County. De eerste resultaten van het project, gerapporteerd in het journaal Amerikaans politiek onderzoek , laten zien dat dit soort technologie kan worden gebruikt om de integriteit van een verkiezing te beoordelen. In dit geval, echter, er zijn geen gevallen van fraude of significante administratieve fouten geconstateerd.

"Manipulaties van kiezersgegevens kunnen grote schade aanrichten aan een verkiezing, " zegt Allvarez, die ook werkt aan het grotere Caltech/MIT Voting Technology Project, gevormd in de nasleep van de controversiële presidentsverkiezingen van 2000. "Je zou mensen kunnen laten stemmen die niet op de lijst staan, of de adressen van mensen kunnen in de databases worden gewijzigd, zodat kiezers hun instructies niet per post krijgen. Er zijn veel scenario's, sommige frauduleus en sommige administratief, die de kwaliteit en integriteit van verkiezingen negatief kunnen beïnvloeden."

De algoritmen van het team zijn ontworpen om dagelijks snapshots te maken van stemgegevens. Zelfs zonder enige fraude of fouten, stemgegevens veranderen voortdurend door het toevoegen en verwijderen van kiezers, adreswijzigingen en andere administratieve processen. Alvarez en zijn team, onder leiding van Caltech-afgestudeerde student Seo-young Silvia Kim, ontwikkelde één algoritme om de dynamische veranderingen die plaatsvinden in stemregistraties te meten en een tweede algoritme om te zoeken naar statistische anomalieën in dat dynamische proces.

"We willen ervoor zorgen dat de veranderingen die we zien worden verwacht en niet ongewenst, " zegt Kim, een promovendus sociale wetenschappen met een focus op politicologie, die tijdens het werken aan dit project zelf computerprogrammeervaardigheden leerde. "Zijn er duidelijke rode vlaggen?"

"Orange County is een geweldig laboratorium voor deze studie, " zegt Alvarez. "Neal Kelley is zeer toegewijd aan dit proces, en we hebben een sterke samenwerking opgebouwd met Orange County."

Een derde algoritme dat door het team is ontwikkeld, scant op duplicaten van stemgegevens. Duplicaten zijn een normaal verschijnsel in kiezersdatabases die ontstaan, bijvoorbeeld, wanneer kiezers zich op meerdere plaatsen verplaatsen of registreren, maar ze kunnen ook wijzen op een misdrijf of fouten.

"Monitoring op duplicaten is een indicator van de gezondheid van een kiezersdatabase, " zegt Spencer Schneider, een tweedejaarsstudent van Caltech die aan het project werkte als student Summer Undergraduate Research Fellow (SURF) en die de tweede auteur van het artikel is.

Het team zegt dat een doel van het project is om wat ze leren met het publiek te delen, zodat anderen de stemgegevens kunnen volgen en politicologen toegang hebben tot de gegevens voor hun onderzoek. Daartoe, het team heeft hun resultaten en computercodes online geplaatst. Ze zijn ook een soortgelijk project begonnen met Los Angeles County; in Oregon, ze houden de stemmen in de gaten die per post binnenkomen.

"Administratieve fouten en het potentieel voor shenanigans doemen op bij de Amerikaanse verkiezingen, en we moeten mogelijke corruptie van kiezerslijsten tijdig afweren, " zegt Alvarez. "Onze visie is om alle staten dagelijks kiezersgegevens te laten uploaden en algoritmen te laten controleren op hun integriteit."