Datenjournalismus im Fussball
Dein Name ist Marko? Dann ab in die bosnische Premijer Liga! Dort heissen nämlich die meisten Spieler so 9). Das und noch mehr Fakten gibts in diesem Digezz-Beitrag.
Um mein Können im Bereich des Datenjournalismus zu verbessern, nahm ich mir vor, die bosnische Liga mittels Scraping, Schlaufen, Sortieren und anderen Pandas-Methoden genauer zu untersuchen.
Dabei entstanden diese zwei Codes:
Google Colab – Code für einen Verein (um das Scraping der Spieler zu testen)
Google Colab – Code für die Schlaufe (Scraping an alle Vereine anwenden) und Methoden zur genaueren Analyse —> für das Ausführen* dieses Codes brauchts noch dieses CSV-File**
Die gewonnenen Informationen habe ich schliesslich in Grafiken verpackt:
*ganz einfach über Laufzeit –> Alle ausführen
**kann man links beim Ordner-Symbol hochladen
Puh, das war ein hartes Stück Arbeit.
01 | Idee
Nachdem ich im Major in die Welt des Datenjournalismus eingeführt wurde, wollte ich die gelernten Methoden unbedingt erweitert anwenden können. Und noch mehr Spass macht es, wenn man es in einem Interessensgebiet einsetzt. So entstand die Idee, mittels datenjournalistischen Methoden, die höchste bosnische Fussball-Liga zu analysieren – scheint random, aber ich bin Bosnierin und Anhängerin von Željezničar Sarajevo. Also machte ich mich ran ans Coden.
02 | Der Code
Dafür verwendete ich Google Colab. Ich erstellte zwei Codes, den einen, um es am Beispiel von Zrinsjski Mostar zu testen, wie ich die Spieler eines Vereins von «transfermarkt.ch» mit Namen und dazugehörigen Marktwert scrapen kann. Startpunkt meines Projektes war demnach die Seite der Premijer Liga: https://www.transfermarkt.ch/premijer-liga/startseite/wettbewerb/BOS1
Ich musste viel googlen und nachforschen, wie gewisse Sachen funktionieren. Damit ich später immer noch weiss, was ich in welchem Schritt gemacht habe, kommentierte den Code ausführlich.
03 | Grafiken
Damit ich meine «gewonnenen» Informationen noch visuell ansehnlicher verarbeiten kann statt als Code, habe ich noch zwei Grafiken in Photoshop erstellt.
04 | Learnings
Schwierigster Teil des Codes und Knackpunkt des Ganzen: Transfermarkt. Die Seite macht es einem nicht leicht, zu scrapen. Ich bin unglaublich froh, dass ich es dennoch hingekriegt habe. Zu meinem Glück hatten im HTML der Seite alle Spieler dieselbe div-class. Sonst wäre es um einiges komplizierter geworden.
Ebenfalls für einen erhöhten Herzschlag sorgte mein selbsternanntes «Herzstück» des Codes. Dort musste ich alle kleinen Schnipsel zusammenführen, sodass eine Schlaufe für sämtliche Spieler der aufgelisteten Clubs durchgeführt wird.
X-tausend Errors später hat schliesslich alles funktioniert, sehr befriedigend :-). Ausserdem wusste ich anfangs nicht, dass man für gewisse Seiten eine «Sperre» umgehen muss, was mich am Anfang sehr viele Nerven gekostet hat.
Fünf Semester IM und ich wurde nie so richtig warm mit Codes – doch Datenjournalismus hat mich wirklich gepackt. Liegt vielleicht an meinem Beruf als Sportjournalistin und die Begeisterung am Herausfinden von Sachen. Umso mehr machte es natürlich Spass mit meinem Herzensthema: Fussball.