01.05.2018

Abschlussarbeit: Biathlon

Der Sportwissenschaftler Thomas Maier befasste sich im Rahmen des CAS Datenanalyse mit der Vorhersagbarkeit der Trefferquote im Biathlon. Wie zuverlässig ein Athlet ins Schwarze trifft, hängt demnach weder von der Rundenzahl noch von der Schiesszeit ab.

Seit fünf Jahren arbeite ich an der Eidgenössischen Hochschule für Sport Magglingen (EHSM) als wissenschaftlicher Mitarbeiter im Ressort Leistungssport. Unter anderem bin ich verantwortlich für die wissenschaftliche Betreuung des Biathlon-Nationalkaders. Um mein berufliches Profil zu erweitern, entschied ich mich 2017 für den Weiterbildungsstudiengang in Data Science. Dabei absolvierte ich im vergangenen Semester den CAS Datenanalyse. Der Kurs war für mich äusserst lehrreich, die Dozierenden sehr engagiert und die Inhalte hoch relevant. Ich war allerdings froh, bereits einiges an Vorwissen mitgebracht zu haben. Das Themenfeld ist sehr komplex und ambitioniert für einen CAS.

Das Hauptthema dieses CAS, das maschinelle Lernen, interessiert mich schon länger. Denn im Sport wird der Umgang mit grossen Datenmengen immer wichtiger. Ich finde es faszinierend, wie moderne Analysemethoden Muster und Zusammenhänge in riesigen Datensätzen offenlegen können. Im Biathlon werden vor allem die Schiessleistungen unter Athletinnen, Athleten sowie ihren Trainern häufig diskutiert. Als Sportwissenschaftler interessiert mich, wie vorhersehbar die Schiessergebnisse sind. Welchen Einfluss spielt dabei das eigentliche Können eines Athleten? Wie stark beeinflussen zufällige Schwankungen der Trefferquote das Schiessergebnis?

In meiner Semesterarbeit ging ich diesen Fragen nach. Mein Arbeitskollege Severin Trösch und mein Chef Jon Peter Wehrlin dienten mir unter anderem als Co-Autoren. Ich schätze deren Know-how in der klassischen Statistik und beim Ausarbeiten von wissenschaftlichen Arbeiten. Zudem holte ich mir bei Daniel Meister Unterstützung, einem Freund, der im Bereich Datenanalyse tätig ist. Mit ihm besprach ich meinen Analyse-Code und profitierte dabei von seiner langjährigen Erfahrung. Externes Feedback finde ich äusserst wertvoll. Es ist meist ehrlicher und objektiver, als der eigene Blick auf die Arbeit.

Meine Datenbasis bestand aus öffentlich zugänglichen Schiessresultaten von Weltcup-Veranstaltungen und lag mir teilweise nur als PDF vor. Die Daten dieser Dokumente automatisiert zu extrahieren, entpuppte sich als ziemlich mühsam. Für korrekte Vorhersagemodelle musste zudem die zeitliche Reihenfolge der Schiessresultate beachtet werden: Ich durfte die Modelle nur mit vorher zurückgehaltenen, zukünftigen Resultaten testen, um eine realistische Einschätzung der Vorhersagekraft zu erhalten.

Meine Vermutung war, dass sich die Vorhersage einzelner Schüsse als sehr schwierig herausstellen würde. Die Analyse bestätigte dies: Die einzige relevante Information für die Vorhersage des Schiessergebnisses war die Langzeit- Trefferquote einer Athletin oder eines Athleten (jeweils fürs Liegend- und Stehendschiessen). Alle anderen Variablen wie beispielsweise die Rundenzahl, Schiesszeiten oder kurzfristige Trefferquoten scheinen keine grosse Rolle zu spielen.

Die Resultate legen somit nahe, dass kurzfristige Schiesserfolge im Rahmen von ein bis zwei Wettkämpfen in der Praxis überinterpretiert werden. Sie können als zufällig erachtet werden und besitzen damit auch kaum Vorhersagekraft. Um die Schiessleistung der Athletinnen und Athleten zuverlässig beurteilen und Vorhersagen für zukünftige Wettkämpfe machen zu können, muss man die Trefferquote von mindestens 200 Schüssen analysieren.

Ich habe zusätzlich die Daten der Schweizer Mannschaft genauer analysiert, um individuelle Rückmeldungen geben zu können. Ich stehe zudem in regelmässigem Kontakt mit den Kadertrainern. Wir konnten die Ergebnisse bereits zusammen diskutieren und über die Implikationen sprechen. Gerade im Bereich der Wettkampf- und Kaderselektion sind diese Ergebnisse relevant, zeigen sie doch deutlich, dass man bei der Auswahl die kurzfristigen Schiessleistungen nicht überinterpretieren darf.

Potenzial für die Verwendung solcher Vorhersagen sehe ich auch bei Sportübertragungen im Fernsehen. Bereits heute werden einige Informationen wie die Anzahl der verbleibenden Patronen im Magazin angezeigt. So könnte zum Beispiel live im TV die Wahrscheinlichkeit eingeblendet werden, dass der nächste Schuss eines Athleten ein Treffer wird. Zumindest Daten-Nerds wie ich fänden das sicher spannend.

Im vergangenen Semester wurde der CAS in Datenanalyse zum ersten Mal durchgeführt. Innerhalb des Moduls lernen die Studierenden die wichtigsten Technologien aus den Bereichen Machine Learning, Deep Learning und Recommender Systems kennen und erfahren, wie sie den Einsatz dieser Technologien für unterschiedliche Anwendungen beurteilen können. Ausserdem werden ihnen entsprechende Werkzeuge zur Lösung konkreter Probleme vermittelt. Gelehrt und betreut wird der CAS von den beiden Dozierenden Dr. Joachim Steinwendner und Dr. Beat Tödtli des Forschungsinstituts Laboratory for Web Science (LWS) der FFHS. Das LWS forscht aktiv auf den Feldern Data Science und Learning Analytics. Ergebnisse aus beiden Forschungsfeldern fliessen durch Projekte in die Industrie ein.

Thomas Maier verfasste seine Semesterarbeit zum Thema «Predicting biathlon shooting performance using machine learning» im CAS Datenanalyse im Rahmen seines DAS Data Science. Die wissenschaftliche Fachzeitschrift «Journal of Sports Sciences» veröffentlichte die Arbeit in ihrer diesjährigen Aprilausgabe.