Sunday, February 17, 2013

Het 'touch screen effect' bij de gemeenteraadsverkiezingen in Vlaanderen

(My apologies for this Dutch post. Soon I'll write an English one on the same subject, but then from a Data Science point of View.)

De gemeenteraadsverkiezingen van oktober jongstleden blijven de gemoederen beroeren. Deze week waren er minstens drie berichten in de actualiteit die te maken hadden met de nasleep van de jongste gemeenteraadsverkiezingen. Er is de kwestie Ninove (zie De Morgen: Geen nieuwe verkiezing in Ninove na "inside joke"), de onwettelijke samenstelling van een aantal Vlaamse OCMW raadsleden (zie De Morgen: "Partijen op lokaal vlak te weinig ondersteund door hoofdkwartieren") en, tenslotte, is er de (vermeende) dubbele voordracht van schepenen in Zaventem (zie De Morgen: Gemeentebestuur Zaventem verzekert continuïteit werking). Het lijkt er dus een beetje op dat Vlaanderen het niet zo gemakkelijk heeft om de verkiezingen te verteren. Maar de problemen dateren niet van nu. Sommigen zullen zich nog herinneren dat de dag van de verkiezingen ook niet vlekkeloos waren verlopen. Er waren wachtrijen en technische mankementen (zie Gazet Van Antwerpen: Heel wat problemen met stemcomputers in de regio) en de problemen met de Touch Screens van de stem computers (Zie Het Laatste Nieuws: Slecht afgestelde stemcomputers leveren extra stemmen op).
Toch is het fair om te zeggen dat Vlaanderen z'n best heeft gedaan om de zaak in goede banen te leiden. De website vlaanderenkiest.be, bijvoorbeeld, opgezet door het Agentschap voor Binnenlands Bestuur, probeert in ieder geval om zoveel mogelijk duidelijkheid te scheppen rond de voorbereiding en de afhandeling van de verkiezingen. Verder waren er infobrochures, en er waren filmpjes over hoe je elektronisch moet stemmen te bekijken op YouTube en op de Vlaamse televisiezenders. Bovendien had het Vlaamse Ministerie van Binnenlandse Zaken het gereputeerde Price Waterhouse Coopers (PwC) ingehuurd om de nieuwe stemcomputers te testen. Er werden zelfs een aantal hackers losgelaten op het systeem om de veiligheid ervan uit te proberen (Zie De Redactie:Bourgeois laat hackers los op stemcomputers).
Eén van de zaken die me persoonlijk sterk heeft verbaasd is de mildheid waarmee men gereageerd heeft op het zogenaamde 'touch screen effect'. Er waren nochtans enkele opvallende uitslagen. Zo meldde De Redactie (Verkozen dankzij de nieuwe stemcomputers?) dat:
In Antwerpen-stad kreeg de vrij onbekende Nick De Wilde, 14e op de Vlaams Belanglijst, maar liefst 2.077 voorkeurstemmen, meer dan voorzitter Bruno Valkeniers (19e plaats, 1.221 voorkeurstemmen) of lijstduwer Gerolf Annemans (1.563 voorkeurstemmen). Meteen goed voor een plaatsje in de gemeenteraad.
en
Bij Vlaams Belang en PVDA+ waren de nummers 14 de gelukkigen (zo kreeg bij PVDA+ Lieve Peeters 740 voorkeurstemmen, de kandidaten boven en onder haar 355 en 319), bij de N-VA en Groen waren dat de nummers 10. N-VA'er Rob Van de Velde kreeg met 4.081 gekleurde bolletjes achter zijn naam, de op drie na meeste voorkeurstemmen van de N-VA-lijst.
De oorzaak van dit alles waren, volgens enkele kranten, de Touch Screens van de stemcomputers. Het Nieuwsblad (zie Stemcomputer verkiest kandidaten per ongeluk) schreef dat:
Zelfs de Belangtop kende niet meteen Nick De Wilde die in Antwerpen met 2.077 stemmen voorzitter Valkeniers het nakijken gaf en verkozen raakte in de gemeenteraad. De Wilde voerde niet eens campagne. ‘Boosdoeners’ zijn de nieuwe stemcomputers waarover bevoegd minister Geert Bourgeois (N-VA) gisteren in het Vlaams parlement lovend sprak. De touchscreens blijken te gevoelig te zijn. Kiezers die te hard (of per ongeluk twee keer) drukten op het stemveld voor een partij gaven automatisch een kandidaat een voorkeurstem. Wie die gelukkige was, hing af van de plaats van dat veld op het computerscherm. Bij Vlaams Belang en bij PvdA+ ging het voordeel naar de nummer 14. Bij de N-VA en Groen ontving de nummer 10 een onverwachte bonus. Rob Van de Velde (N-VA) haalde met 4.081 voorkeurstemmen haast de top tien. Met 1.043 stemmen werd Dirk Avonts (Groen) tweede opvolger.
Toch werd vrij snel het probleem geminimaliseerd. In hetzelfde artikel werd geschreven dat:
Jacques Mahieu, die als voorzitter van de Antwerpse rechtbank de Antwerpse kiesverrichtingen superviseerde, bevestigt het verhaal. ‘Inderdaad, twee getuigen hebben me dat verteld. Juridisch is er geen probleem, het gaat eigenlijk om een fout gebruik van de computer. Tussen de lijsten maakt het geen verschil, binnen de lijsten natuurlijk wel. Kiezers moeten wat aandachtiger zijn. Ze krijgen bovendien de kans om een eventuele foute stem te corrigeren.’
Ook Geert Bourgeois, de bevoegde Minister, zag, in eerste instantie, geen grote problemen. Het Laatste Nieuws (Zie Slecht afgestelde stemcomputers leveren extra stemmen op) schreef dat:
Geert Bourgeois gelooft niet dat mensen door te lang drukken op de stemcomputer ongewild op bepaalde kandidaten gestemd hebben. Zijn agentschap en het bedrijf dat de computers leverde "hebben dat vandaag nog eens uitgeprobeerd", benadrukte hij op Radio 1. "Wat wel kan is dat de kiezer de vinger op het scherm houdt en gemakshalve de eerste de beste persoon aanvinkt. Er zijn telkens twee aparte handelingen nodig", onderstreept Bourgeois. "Mijn agentschap en het bedrijf dat de computers leverde spreekt tegen dat dit kon gebeuren door te lang te drukken." Ook bij de 85.000 tests door PriceWaterhouseCoopers is het probleem "nooit gesignaleerd". Bovendien voorziet het systeem in verschillende controles, argumenteert de N-VA-minister voorts. "Zo kan je niet alleen je print nalezen, maar je ziet het ook op het scherm, waar je je stem nog eens moet bevestigen. Ik ga ervan uit dat mensen die stemmen, dat ook bewust doen."
Later, toen bekend werd dat PwC het probleem met de Touch Screens wel had ontdekt, maar niet gemeld had bij de overheid (Zie Het Nieuwsblad: Geert Bourgeois en de stemcomputers : ‘Ik sta voor schut’), veranderde Geert Bourgeois van toon en kondigde aan te onderzoeken welke maatregelen hij kon nemen tegen PwC.


Een statistisch onderzoek naar het "Touch Screen Effect".

Vanuit statistisch standpunt kun je je natuurlijk de vraag stellen of er nu werkelijk sprake is van een "Touch Screen effect" of niet. Om dit na te gaan trachtte ik uitzonderlijke verkiezingsresultaten (outliers of uitbijters) te identificeren door de residuelen van een multilevel model gefit op de verkiezingsuitslagen te bestuderen, en deze te relateren aan de posities van de kandidaten en hun lijst op de computerschermen. Hieronder probeer ik het onderzoek zo eenvoudig mogelijk uit te leggen. Wie interesse heeft voor de statistische details verwijs ik naar de paper zelf: The 'Touch Screen Effect' in the Belgian municipal elections of 2012.
Ten eerste een recapitulatie van het probleem. Bij het elektronisch stemmen moet men op een eerste scherm een partij (of lijst) kiezen, om vervolgens, op een tweede scherm, een kandidaat te kiezen.

In het voorbeeld hierboven heeft iemand voor PVDA+ gekozen (zie het blauwe vierkantje op de linkse figuur). In de figuur rechts is de overeenkomstige plaats bij het kandidaten scherm eveneens met een blauw vierkantje aangeduid. Bij deze studie concentreerde ik me op de plaats exact in het midden van het vierkantje, i.e. de plaats waar ook de naam van de partij of lijst staat. Gemakshalve noem ik de positie van de kandidaat die net onder zijn of haar lijstnaam staat, een hotspot. Als er sprake is van een "Touch Screen Effect" is de verwachting dat er er meer stemmen op de hotspots te vinden zijn dan men normaal zou verwachten.
Wat men normaal zou verwachten is niet zo evident te bepalen, immers, het aantal stemmen dat een kandidaat krijgt is een functie van heel wat variabelen. Als men alleen al naar de positie kijkt dan weten we uit ervaring en uit ander onderzoek dat de eerste plaatsen (de zogenaamde lijsttrekkers) en de laatste plaatsen (de zogenaamde lijstduwers) over het algemeen meer stemmen genereren. Met een beetje goede wil kan men het verband tussen de positie op de lijst en het aandeel in de stemmen zien als een U-curve (eerst hoog, dan lager, en vervolgens terug hoger). In de paper wordt een regressie-model gebruikt om zo goed mogelijk het verband tussen de positie op de lijst en (het natuurlijk logaritme van) het aandeel van de stemmen van een kandidaat (relatief ten opzichte van het aantal stemmen voor de lijst) te benaderen. Om het curvilineair verband goed te vatten wordt in het regressiemodel een derdegraadsvergelijking gebruikt. In de paper wordt dieper ingegaan waarom een multilevel model hier de voorkeur geniet. De figuur hieronder kan je voor een selectie van 9 partijen-en-gemeenten combinaties, voor jezelf uitmaken in welke mate het model de gegevens goed samenvat of juist niet. De rode lijnen zijn de normale regressies en de groene lijnen komen van de multilevel modellen die uiteindelijk werden gebruikt voor de verdere analyse.

Noot: Voor een beter leesbare versie van deze grafiek, zie de oorspronkelijke paper
Nu kunnen we de mate waarin het stemmenaandeel van een kandidaat meer of minder afwijkt van wat we verachten op basis van de regressie zien als een maat van het hebben van meer of minder stemmen dan men zou verwachten op basis van de positie op de lijst. Vervolgens werd naar de gestandaardiseerde residuelen gekeken om, voor elke kandidaat, na te gaan of er sprake is van een outlier (uitbijter) of niet. Tenslotte werd, voor elke kandidaat, nagegaan of ze op een hotspot zaten of niet.
De figuur hieronder geeft de resultaten weer voor de belangrijkste lijsten van de stad Antwerpen. Ik kies hier voor Antwerpen omdat daar het "Touch Screen" effect (waarschijnlijk) het grootst is. Straks wordt er verder ingegaan op de andere steden en gemeenten. Omwille van de leesbaarheid zijn de eerste vier posities niet weergegeven (zie de oorspronkelijke paper voor een argumentatie waarom. In de paper vind je ook dezelfde figuur waarin de posities 1 tot en met 4 wel zijn opgenomen). De zwarte punten geven de werkelijke stemaandelen weer per positie. De groene lijn is de regressie lijn van het multilevel model. Outliers (uitbijters) zijn in her rood gekleurd. De hotspots worden weergegeven door een paar van blauwe verticale lijnen.

Noot: Voor een beter leesbare versie van deze grafiek, zie de oorspronkelijke paper
In de bovenstaande grafiek zien we dat in Antwerpen bij PVDA+, Groen, Stadslijst, Rood! en Vlaams Belang er een outlier is die ook een hotspot is. Alleen bij Open Vld is dat niet het geval. Er zijn wel een aantal partijen waar meer dan één hotspot is, waarvan er slechts één ook effectief een outlier is. Tenslotte zien we ook outliers die niet op een hotspot zitten. Dat laatste mag alvast niet verbazen want er zijn, buiten de positie op de lijst, nog heel wat andere elementen die het relatieve stemaandeel bepalen. Het goede resultaat kan te wijten zijn aan een uitzonderlijke campagne, het kan gaan om BV's, of mensen die een zichtbaar mandaat bekleden enzovoort. Kortom, we moeten nog nagaan of hetgeen we observeren niet aan het toeval te wijten kan zijn. Een eenvoudige manier omdat te doen is om conditionele kansen te beschouwen. In Antwerpen is de kans dat een hotspot een uitzonderlijk hoog stemaandeel heeft ongeveer 55%. De kans op een outlier bij een normale (niet-hotspot) positie is ongeveer 7%. De verhouding van beide kansen is 7,5. Dit wil zeggen dat de kans op een opvallend hoog stemaandeel op een hotspot 7,5 keer groter is op een hotspot dan op een gewone plaats. In andere steden is dat heel wat minder spectaculair, maar daar moet wel bij worden vermeld dat de methode die ik gebruikt heb een conservatieve inschatting oplevert omdat:
  • het gebruik van residuelen om outliers te bepalen niet goed werkt bij kleinere gemeenten wegens het kleiner wordend aantal observaties
  • er op een vrij zwart-wit manier gekeken worden naar uitzonderlijke stemmenaandelen (met name, outlier of niet), terwijl er ook sprake zou kunnen zijn van een (stijgend) effect zonder dat dit noodzakelijk tot een effectieve outlier aanleiding geeft (een voorbeeld hiervan is positie 14 voor PVDA+).
  • ik hier de hotspot heb beperkt tot die positie die in het midden staat, terwijl aangrenzende posities ook een extra stemmenwinst zou kunnen opleveren (mogelijke voorbeelden hiervan in Antwerpen zijn: PVDA+, Rood!, N-VA en Vlaams Belang.)
  • ik de coordinaten van de hotspots heb moeten inschatten en mogelijk fouten heb gemaakt
  • er veel outliers zijn bij de eerste twee en de laatste twee posities, terwijl die posities net minder relevant zijn voor de "Touch Screen" problematiek
Aan dat laatste kan verholpen worden door bij de conditionele kansenbenadering de eerste twee en laatste twee posities uit te sluiten.

Resultaten:
Een conservatieve inschatting van de kansverhouding voor alle Vlaamse gemeenten waar elektronisch werd gestemd samen (Brussel uitgesloten) is 1,10. Nog steeds een effect, maar een eerder klein effect. Wanneer we de eerste twee en laatste twee, outlier-rijke posities, niet mee opnemen in de analyse, dan wordt die verhouding 1,44. Dat wil dus zeggen dat de kans op een uitzonderlijk stemaandeel op een hotspot een tiende tot tot een goede 40% hoger is op een hotspot dan bij een gewone positie. Als we alleen de centrumsteden waar electronisch gestemd werd bekijken dan is de conservatieve inschatting van die kansverhouding bijna 2, en de minder conservatieve inschatting meer dan 4,5. Ik herhaal hier nogmaals de interpretatie: De kans om, in een Vlaamse centrumstad (Gent uitgesloten), een uitzonderlijk stemaandeel te realiseren is op een hotspot bijna tweemaal zo groot als op een normale positie. De minder conservatieve inschatting geeft aanleiding tot een kansverhouding van meer dan 4,5.
Als we naar individuele partijen kijken dan zien we dat sommige partijen meer te lijden hebben gehad van het "Touch Screen Effect" dan anderen. Het valt bijvoorbeeld op dat Vlaams Belang, vooral in de centrumsteden, te maken heeft gehad met een sterk "Touch Screen Effect". Zo is de kans dat een hotspot op een Vlaams Belang lijst in een centrumstad (Gent uitgesloten) een uitzonderlijk stemaandeel oplevert niet minder dan 40%. Dat is 10 keer zoveel als op een normale positie voor die partij. Als men de minder conservatieve inschatting gebruikt stijgt die kansvehouding zelfs tot meer dan 80. De hele problematiek wordt aanschouwelijk in de Heatmap hieronder. De kolommen zijn de 12 centrumsteden waar elektronisch werd gestemd (Gent stemde met papier en potlood). De rijen zijn de posities van de kandidaten. Aangezien het aantal kandidaten op de Vlaams Belang lijst verschillend is van stad tot stad is de grafiek gekarteld. De donkere kleuren (rood en oranje) geven die posities aan die weinig of niet afwijken van wat we verwachten voor die positie (voor de statistici: de kleuring van de heatmap hangt af van de gekwadrateerde residuelen van het eerder besproken multilevel model). De lichte kleuren (tinten van geel en wit) geven sterk afwijkende stemaandelen weer. We zien meteen (op de eerste rij en de laatste kolommen) dat het model niet zo goed in staat is om de stemaandelen van de lijsttrekker en de lijstduwer te modelleren. Voor de studie van het "Touch Screen Effect" kan dat gelukkig niet zo veel kwaad. Hier zijn we vooral geïnteresseerd in het relevante gedeelte, zeg maar tussen de tweede en de voorlaatste positie. Zoals je kan zien is dat gedeelte over het algemeen netjes rood of donker oranje. Er zijn af en toe outliers die een uitzonderlijk hoog (of laag) aandeel in het totaal aantal stemmen van hun lijst hebben gehaald. In de kolom van Antwerpen, bijvoorbeeld, zie je dat de posities 4, 14, 19 en 20 eerder naar het licht oranje en zelfs geel neigen. Het gaat hier dus om een minder binaire (zwart-wit) manier om naar uitzonderlijke stemaandelen te kijken. De hotspots voor Vlaams Belang zijn aangeduid met een blauw rechthoekje. Onmiddellijk zie je dat in de meerderheid van de Vlaamse centrumsteden de hotspots ook een fellere (gele) kleur krijgen, wat een aanduiding is van een (sterk) afwijkend stemaandeel. Het lijken vooral steden te zijn waar de positie van de lijstnaam op het lijstenscherm gedeeld werd over twee kolommen van kandidaten (vandaar ook twee hotspots per stad in Genk, Aalst en Roeselare) dat de partij gespaard is gebleven van het "Touch Screen Effect".

Noot: Voor een beter leesbare versie van deze grafiek, zie de oorspronkelijke paper

Conclusies:
Ik durf op basis van deze vaststellingen te concluderen dat de problemen met de Touch Screens een duidelijk effect hebben gehad op de resultaten van de voorkeurstemmen bij de voorbije gemeenteraadsverkiezingen. Wel is het zo dat je, mijns inziens, op statistische gronden, niet kan nagaan of een bepaalde kandidaat eigenlijk teveel stemmen heeft ontvangen en eventueel ten onrechte verkozen is geweest. Ik vind het daarom niet verkeerd dat de Raad voor Verkiezingsbetwistingen, geen rekening heeft gehouden met het Touch Screen probleem toen het de verkiezingsuitslagen moest goedkeuren. Als je echter alle kandidaten samen beschouwt, dan kan je wel besluiten dat het heel onwaarschijnlijk is dat de goede resultaten van de kandidaten op de hotspots, louter aan het toeval te wijten is.

No comments:

Post a Comment