De schaatssport onder de loep

October 25, 2016

Share this article:

In de GAXEX verscheen een artikel dat de eerlijkheid van de schaatssport in twijfel trok. Dit keer zoomt dezelfde auteur verder in op een van de daar genoemde problemen: de startprocedure. Is het beter om de startprocedure te automatiseren in plaats van dit door een persoon te laten doen?
Het vorige artikel kwam in eerste instantie tot stand door een gepubliceerd artikel van onder meer oud-schaatser Beorn Nijenhuis. Aan tafel bij Matthijs van Nieuwkerk in de Wereld Draait Door vertelde hij dat uit dit onderzoek zou zijn gebleken dat het interval tussen het roepen van ‘ready’ door de starter en het daadwerkelijke startschot een enorme impact op de eindtijden zou hebben. Hoe korter dit interval, des te sneller de tijd, aldus Nijenhuis. In het artikel uit GAXEX 1 werden echter vraagtekens geplaatst bij de juistheid van het onderzoek. Zo kon de onafhankelijkheid van de data in twijfel worden getrokken. Er werd aangenomen dat Jan Smeekens op dag één een andere Jan Smeekens is dan op dag twee. Dit in combinatie met het feit dat Nijenhuis en co een normale lineaire regressie loslaten op variabelen die niet onafhankelijk zijn, doet de betrouwbaarheid van het onderzoek geen goed.
In dit artikel wordt een andere manier toegepast om data van startintervallen en eindtijden met elkaar in verband te brengen en het is gebaseerd op een onderzoek dat is uitgevoerd naar aanleiding van het vak Sports Economics aan de Rijksuniversiteit Groningen (zie blok). Het feit dat een schaatswedstrijd van 500 meter over twee heats wordt verreden, speelt daarin een belangrijke rol.
 

Eerste verschillen

We nemen aan dat de eindtijd die een schaatser rijdt afhangt van een aantal factoren. De specifieke eigenschappen die een schaatser eigen zijn, \alpha_i, is een van deze factoren. De andere factoren, zoals luchtdruk en eigenschappen van de baan, vormen de vector x_{it}. Het is acceptabel om aan te nemen dat de specifieke eigenschappen van een schaatser en de overige omstandigheden hetzelfde zijn over de twee heats waarover een 500 meter wordt verreden. Deze twee heats worden namelijk of op dezelfde dag of over twee dagen verreden. Het ready-go interval voor schaatser i in heat t is \delta_{it} en het effect daarvan wordt uitgedrukt tot \beta. Dit alles samenvoegend komen we tot de volgende vergelijking voor de eindtijd y_{it} van schaatser i in heat t waar u_{it} de foutmarge weergeeft:
y_{it} = \alpha_{i} + \beta \delta_{it} + \boldsymbol{x_{it}^{'}} \boldsymbol{\gamma} + u_{it} \label{pooledols}
Omdat de 500 meter over twee heats wordt verreden, biedt dit de uitstekende mogelijkheid om gebruik te maken van het model dat gebruikmaakt van eerste verschillen. Aangezien de specifieke eigenschappen en de overige omstandigheden gelijk zijn over de twee heats, is het mogelijk om het effect van het ready-go interval  goed te schatten. Als we onderschriften toevoegen voor heat één en heat twee krijgen we de volgende vergelijkingen voor de eindtijden van deze heats.
y_{it_1} = \alpha_{i} + \beta \delta_{it_1} + \boldsymbol{x_{it_1}^{'}} \boldsymbol{\gamma} + u_{it_1} \label{modt1}
y_{it_2} = \alpha_{i} + \beta \delta_{it_2} + \boldsymbol{x_{it_2}^{'}} \boldsymbol{\gamma} + u_{it_2} \label{modt2}
Omdat we aannemen dat de overige omstandigheden gelijk zijn, krijgen we dat x_{it_1} gelijk is aan x_{it_2}. Als we de twee bovenstaande vergelijkingen van elkaar aftrekken, krijgen we het volgende:
\Delta y_{it} = \beta \Delta \delta_{it} + (u_{it_1} - u_{it_2})
Door deze manier van modelleren wordt er rekening gehouden met de individuele kwaliteiten van een schaatser en de overige omstandigheden, die kunnen fluctueren. Dit is iets waar in het eerdere stadium niet voor werd gecorrigeerd, toen het effect van het ready-go interval werd geschat.
 

Wat levert het op?

De data van de Olympische Spelen van 2010 in Vancouver worden aangevuld met data van een World Cup wedstrijd in Obihiro in 2014 en van de Wereldkampioenschappen Afstanden in Heerenveen in 2015. Bij mannen wordt het effect van een langer ready-go interval geschat op 0,170 seconden en het is 0,193 seconden wanneer valse starts worden uitgesloten. Er wordt verondersteld dat valse starts invloed hebben op de eindtijden doordat schaatsers minder risico nemen bij de start. Bij vrouwen worden de effecten geschat op respectievelijk 0,246 seconden en 0,219 seconden. Als we dit vergelijken met de uitkomsten van Nijenhuis en co, zijn deze resultaten toch aanmerkelijk anders dan de door hen geschatte 0,299 seconden voor mannen en 0,672 seconden voor vrouwen. Ondanks dat het effect van het ready-go interval aanzienlijk kleiner wordt geschat, lijkt een verschil van bijna twee tienden van een seconde voor mannen en een dikke twee tienden van een seconde voor vrouwen toch een grote rol te spelen in een afstand die vaak wordt beslist op tienden, dan wel honderdsten van seconden. Hierbij wordt er echter nog geen rekening mee gehouden dat dit effect optreedt als het ready-go interval een hele seconde langer duurt. In werkelijkheid zal blijken dat een dergelijk verschil alleen in de uiterste gevallen kan optreden. De tijd tussen het aannemen van de startposities door de schaatsers en het startschot dient één tot anderhalve seconde te duren volgens de reglementen van de ISU (International Skating Union). Het ready-go interval bedraagt dus de tijd die het kost voor beide schaatsers om in te zakken en de tijd totdat de schaatsers daarna worden weggeschoten. Als we de intervallen van de verschillende starters van de wedstrijden die hier worden geanalyseerd bekijken, zie figuur 1, zien we dat het verschil per starter nooit meer dan een halve seconde bedraagt.
startintervalperstarter-page-001

Figuur 1

Het uiteindelijke effect van het ready-go interval is dus veel kleiner dan de getallen die aanvankelijk werden aangehaald. Toch zou dit, zoals het er nu naar uit ziet, de Olympische wedstrijd over 500 meter bij de mannen in Sotsji zomaar kunnen hebben beslist. Het verschil tussen Jan Smeekens en Michel Mulder bedroeg daar immers slechts een honderdste van een seconde. Maar er zijn meer dingen die opvallen als we de data beter bekijken. In figuur 2 worden de intervaltijden afgezet tegen het nummer van het corresponderende paar. Schaatswedstrijden worden immers in paren verreden. Wat opvalt is dat hoe meer paren van start zijn gegaan,  des te korter de intervallen lijken te worden. Met name voor starter Hans Terstappen lijkt het erop alsof zijn intervallen veranderen naarmate een wedstrijd vordert. Als we de eindtijden vergelijken met het paar waarin deze gereden worden, zoals te zien is in figuur 3, zien we dat snellere schaatsers later in de wedstrijd pas in actie komen. Dit komt doordat de startvolgorde wordt bepaald aan de hand van ofwel het Wereldbekerklassement of de uitslag van de eerdere heat van de 500 meter. Gegeven dit feit en het feit dat intervallen later in de wedstrijd kleiner worden, is het natuurlijk logisch dat er een positief verband gevonden wordt tussen eindtijden en een langer ready-go interval. Dit gegeven zou het verband zelfs kunnen ontkrachten.
1-1-page-001

Figuur 2

1-2-page-001

Figuur 3

Al met al kunnen we op basis van deze data concluderen dat de uitkomsten van het onderzoek van Nijenhuis het effect van het ready-go interval te groot schatten. Doordat ze bepaalde factoren niet juist hebben opgenomen in hun model, wordt het effect bij mannen, valse starts niet uitgesloten, 1,75 maal zo groot geschat. Bij vrouwen is het nog groter: hier wordt het effect 2,75 keer groter geschat. Bovendien is ons het patroon bij de starters zichtbaar geworden. Hoe later in de wedstrijd, dus hoe hoger de paarnummers, des te korter wordt het ready-go interval. Gegeven dat in het algemeen snelle schaatsers laat in de wedstrijd in actie komen, zorgt dit uiteraard voor een positief effect tussen een langer ready-go interval en een hogere eindtijd.


 

Het onderzoek

Zoals al eerder in het artikel genoemd, werd het onderzoek uitgevoerd naar aanleiding van het vak Sports Economics aan de Rijksuniversiteit Groningen. Het is uitgevoerd door Dennis Kant, Kiki Boonen en Jorrit Visser.


 

500 meter Sotsji

Op de Olympische Winterspelen in 2014 te Sotsji vormde de Nederlandse driekleur het volledige podium van de 500 meter voor de mannen. Michel Mulder won goud, Jan Smeekens pakte het zilver en Richard Mulder legde beslag op het brons. Het verschil tussen de nummer één en twee bedroeg slechts een honderdste van een seconde, over twee afstanden. Nijenhuis noemde het onderzoeken van het ready-go interval te pijnlijk om te onderzoeken gezien het minieme verschil.


Dit artikel is geschreven door Jorrit Visser.

Read more

The Myth of Form in Football

The Myth of Form in Football

Have you ever won five games in a row and felt like you could win ten more? Or maybe you lost 5 five and you just kept losing after that? Most people that have played sports will recognize this. Being “in form” seems to have a large impact on whether we will win the...

Winning in Martial Arts: A Data-Driven Strategy

Winning in Martial Arts: A Data-Driven Strategy

As a martial arts practitioner and fan, I have recently become more interested in the applications of data science to the fields of martial arts. As you may know, during a fight, data is collected in the form of video and observations. This data is used to determine...

The Ewing Theory

The Ewing Theory

What happens if your team’s best player goes down with an injury, leaves for another team or retires? Your team should be less successful, right? Well, as it turns out, this is not necessarily always true. Sometimes, a team can inexplicably flourish without their...