51 Sprints
11 juni 2016 - 31 juli 2017
Hoe werkt de Equaliser?
We hebben de vijf concepten waar 51 Sprints om draait statistisch geanalyseerd: sekse, lichaam, ras, natie en klasse, en we hebben geprobeerd te kwantificeren hoe ze als factoren van invloed zouden kunnen zijn op de eindtijd van de renners.
In de equaliser kun je met behulp van de knoppen de prestaties van de renners aanpassen door de invloed van bovenstaande factoren aan of uit te zetten. Bijvoorbeeld: statistisch gezien wordt de eindtijd van een sprinter beïnvloed door het geslacht van de renner. Vrouwen lopen in verhouding minder snel dan de gemiddelde eindtijd van alle sprinters, en mannen lopen iets sneller. Met de equaliser tel je de bij de de mannen 0.431 bij hun eindtijd op, en trek je 0.529 seconden af van de eindtijd van vrouwen. Daarmee wordt het statistische verschil tussen mannen en vrouwen vereffend.
Dit experiment heeft enkele beperkingen en ambiguïteiten die meteen in het oog springen: de gekozen concepten zijn nogal omstreden en vaak politiek geladen. Ze zijn moeilijk te definiëren en hun betekenis verandert ook nog eens door de tijd heen. Verder zijn enkele andere belangrijke factoren niet in de weging meegenomen en de beschikbare data bij sommige factoren is schaars. Met inachtneming van deze beperkingen, is er gewerkt volgens strenge standaarden voor statistische analyse.
We geloven dat onze analyse interessante inzichten geeft, juist omdat er gewerkt wordt met politiek problematische simplificaties die een rol spelen in de publieke perceptie. Hoewel onze analyse geen uitspraken kan doen over de absolute invloed van deze factoren, toont hij duidelijk relatieve ongelijkheden tussen groepen atleten aan, die niet kunnen worden ontkend.
Hoe zijn we te werk gegaan?
In eerste instantie hebben we verkend wat voor soort data mogelijk kwantificeerbare indicatoren (zogenaamde proxy-variabelen) zou kunnen leveren voor onze moeilijk te omlijnen categorieën. Dit leidde tot een verzameling van ongeveer 35 variabelen. Na controle op de compleetheid van beschikbare data, op mogelijke statistische methoden en dubbele controle van de gegevens hadden we nog 20 variabelen over waarover we voor bijna alle sprint finalisten in de Olympische Spelen sinds 1896 gegevens hadden.
Sekse
Atleten werden gecategoriseerd als mannelijk, vrouwelijk of intersex. Omdat er maar één bevestigde intersex deelneemster is geweest (Stella Walsh, goud in Los Angeles 1932) konden we deze categorie niet statistisch onderbouwen. Verder ontsnapte de complexiteit van huidige en eerdere gender concepten aan onze kwantificaties.
Ras
Het concept ras stelt voor dilemma's. Het is een politiek en sociaal beladen concept en een zeer gelaagde issue. Voor sommigen is het een kwestie van identiteit, voor anderen is het vooral een sociale categorie. Weer anderen vinden dat het concept zoveel mogelijk genegeerd moet worden. Hoewel de notie zich nauwelijks laat afbakenen, kunnen we hem ook niet ontkennen.
Het is een vooraanstaande factor in de politiek en in de beeldvorming van sport en lijkt bovendien een rol te spelen in de resultaten van sprinters. Met dit in het achterhoofd hebben we geprobeerd de notie ras radicaal te versimpelen tot een verschil in drie typen huidskleur: blank, geel of zwart. Beperking tot die drie visuele opties in een verder complex spectrum van raciale identiteit, geeft de mogelijkheid enkele tendensen in de verhoudingen te laten zien.
Lichaamstype
Deze factor omvat ondermeer de volgende variabelen: standaard of niet-standaard lichaam, (waarbij de laatste categorie uitgesplitst is naar blind, en onderbeen-amputatie) lengte, gewicht, leeftijd ten tijde van de sprint en dopinggebruik indien ooit geconstateerd tijdens de carrière van de sporter in kwestie.
Natie
Deze factor is opgebouwd uit de volgende variabelen: nationaliteit, bruto nationaal product, continent, bevolkingsaantal ten tijde van de sprint, regeringstype (democratisch, socialistisch, autoritair), (historische) en de aanwezigheid van een staat gesponsord dopingsprogramma.
Klasse
Deze factor bestaat uit de volgende variabelen: beroep, universitaire opleiding (ja / nee), sportbeurs (privaat, publiek of geen sportbeurs) geprivilegieerde opvoeding, gesponsord of niet.
De eerste algemene conclusies
Toen de datatabel compleet was, konden we identificeren welke variabelen het meest tot uitdrukking kwamen in de eindtijden van de atleten. Daarvoor gebruikten we de statistische methode van meervoudige lineaire regressie (MLR). MLR heeft voldoende mogelijkheden voor dit gedachtenexperiment: het kan relatieve verschillen goed in beeld brengen, maar geeft in dit geval_ geen_ verklaring van oorzaken.
Door de analyse werd het duidelijk dat het jaar waarin de respectievelijke Olympische sprintfinale zich afspeelde de grootste factor is in de variatie in eindtijden. Renners zijn gemiddeld ongeveer een seconde snellen geworden in de afgelopen 100+ jaren.
Omdat we vooral geïnteresseerd waren in het verhaal van de individuele atleet in de specifieke context van de vijf factoren, (met inachtneming van de nodige statistische beperkingen) hebben we chronologie als factor echter buiten beschouwing gelaten. Dat wil zeggen: we accepteren zonder statistische correctie het feit dat latere renners sneller zijn dan eerdere.
In een compleet model werden alle variabelen verwerkt met de eindtijden van de sprinters als de afhankelijke factor. Dit model is gebruikt om per renner, per variabele te berekenen hoeveel invloed (in seconden winst of verlies) een factor heeft op de eindtijd.
Disclaimer
De dataverzameling en de statistische analyse die hier zijn gebruikt zijn toegesneden op een het geloofwaardig verrichten van een gedachtenexperiment. De verschillen die zo tot uitdrukking komen, doen geen uitspraak over de oorzaken van deze verschillen. Het zijn niet meer maar ook niet minder dan relatieve verschillen die binnen de dataset door analyse zichtbaar gemaakt kunnen worden. We hebben onze uiterste best gedaan om de meest zorgvuldige analyse toe te passen op de data. Mocht U daarover vragen hebben, neem dan contact op met Random Studio, of als u specifieke vragen over de analyse heeft, met Mikhail S. Spektor en Dr. Gilles Dutilh van de Universiteit van Basel.
Verder nodigen we U graag uit zelf de data verder te analyseren. De tabel kan hier worden gedownload. Vele interessante verhalen zijn nog verborgen in de tabel, en we hopen dat er daar nog meer van zullen worden ontdekt en gedeeld.