Οι "παραδοσιακοί" παράγοντες του αθλητισμού επιμένουν ότι τα παιχνίδια δεν παίζονται σε υπολογιστές και spreadsheets. Όμως το σύνδρομο στέρησης που βιώνουμε για τα σπορ, μας ώθησε στην δουλειά του Πολωνού μαθηματικού Stanislaw Ulam, που θεωρείται ο εφευρέτης των Monte Carlo simulations. Αυτές οι προσομοιώσεις έχουν χρησιμοποιηθεί στη μοντελοποίηση πολύ πιο πολύπλοκων συστημάτων, οπότε πιστεύω μπορούν να αντέξουν και το μπάσκετ.
Οι νικητές των προσομειώσεων
Οι προσομοιώσεις Monte Carlo ουσιαστικά προσομοιώνουν κάθε μικρό κομμάτι ενός πολύπλοκου συστήματος, για τα οποία είναι δυνατόν να δημιουργήσουμε ένα σχετικά ακριβές μοντέλο και στο τέλος (μετά από πολλαπλές προσομοιώσεις) δίνουν μια πιθανοτική περιγραφή για το σύστημα. Στην περίπτωση ενός πρωταθλήματος, τα "μικρά κομμάτια" είναι τα συγκεκριμένα παιχνίδια και το σύστημα είναι όλο το πρωτάθλημα. H κατάσταση κάθε ενός από αυτά τα παιχνίδια μπορεί να περιγραφεί από μοντέλα σαν αυτά από τα στοιχηματικά γραφεία.
Έχουμε χρησιμοποιήσει ένα μοντέλο παλινδρόμισης, που είναι η βάση για πολλά από τα μοντέλα που χρησιμοποιούνται στις στοιχηματικές εταιρίες. Συνδυάζοντας τα παραπάνω έχουμε φτιάξει έναν προσομοιωτή για το Ελληνικό πρωτάθλημα και για την Euroleague. Κάθε φορά που νοιώθετε αθλητική στέρηση, ανοίξτε τον υπολογιστή και βρείτε τον νέο πρωταθλητή!
Οι προσομοιώσεις που μπορεί κάποιος να κάνει με τις εφαρμογές που έχουμε συνδέσει παραπάνω είναι μία κάθε φορά. 'Ομως κάποιος μπορεί να επαναλάβει αυτές τις προσομοιώσεις χιλιάδες φορές και να δει πόσες φορές πήρε το πρωτάθλημα η Χ ομάδα και έτσι να βγάλει πιθανότητες για διάφορε γεγονότα. Για παράδειγμα, τρέξαμε τις προσομοιώσεις για την Euroleague 10000 φορές και παρακάτω (δεύτερη στήλη) είναι πόσες φορές πήρε κάθε ομάδα κέρδισε τον τίτλο.
Πόσο ανταγωνιστική είναι η Ευρωλίγκα και ποιο σύστημα είναι "καλύτερο";
Μια επιλογή που έχουν σκεφτεί διάφορες λίγκες και κάποιες (π.χ. BCL) υλοποιούν για να «σώσουν» αυτή τη χρονιά, είναι να οργανώσουν final-8. Αυτό δίνει μια διαφορετική μορφή στο πρωτάθλημα και τη δυνατότητα για περισσότερες «εκπλήξεις». Προσομοιώσαμε αυτό το σενάριο και οι πιθανότητες τίτλου είναι στην τελευταία στήλη παραπάνω. Ένας τρόπος να ποσοτικοποιήσουμε το πόσο «δίκαιο» (ή αμφίρροπο) είναι το πρωτάθλημα (π.χ., ένα πρωτάθλημα αμφίρροπο 100% θα είχαν όλες οι ομάδες τις ίδιες πιθανότητες να κερδίσουν – τουλάχιστον στην αρχή του πρωταθλήματος φυσικά) είναι ο δείκτης gini, που έχει χρησιμοποιηθεί για την ποσοτικοποίηση ανισότητας εισοδημάτων κτλ. Ο δείκτης παίρνει τιμές από 0 εώς 1 και όσο πιο αμφίρροπο είναι το πρωτάθλημα τόσο πιο χαμηλός είναι. Από ό,τι βλέπουμε ο δείκτης έχει μειωθεί με το final-8. Η αλήθεια είναι ότι δεν είναι μεγάλη η μείωση, καθώς ήδη υπάρχει final-4 στην euroleague που ήδη κάνει τη λίγκα πιο αμφίρροπη σε αυτό το σημείο. Οπότε στην πράξη μόνο ένας γύρος πάει από σειρά σε knock-out παιχνίδι.
Αν κάνουμε την ίδια άσκηση για το Ελληνικό πρωτάθλημα, θα δούμε μεγαλύτερες διαφορές. Παρακάτω φαίνεται πόσες φορές πήρε κάθε ομάδα το πρωτάθλημα (και πόσες φορές έπεσε κατηγορία κάθε ομάδα)!
Νομίζω είναι προφανές ότι δεν υπάρχει και μεγάλο ενδιαφέρον για τον πρωταθλητή (μεγαλύτερο ενδιαφέρον/αβεβαιότητα έχει η παραμονή στην κατηγορία...). Αλλάζοντας τις σειρές σε knock-out παιχνίδια μπορούμε να κάνουμε το πρωτάθλημα (λίγο) πιο αβέβαιο (εντάξει δεν είναι και πολλά τα περιθώρια, αλλά άμα σκεφτεί κανείς ότι αυτό γίνεται με τα ίδια ακριβώς ρόστερς είναι εντυπωσιακό). Αν αντί για σειρές play offs, έχουμε final-8 μετά από την κατάταξη των playoffs οι πιθανότητες για την κατάκτηση του πρωταθλήματος είναι οι εξής:
Προς το μέλλον
Αυτές είναι από τις πιο βασικές προσομοιώσεις που μπορεί να κάνει κάποιος, αλλά η επιστήμη της στατιστικής και της τεχνητής νοημοσύνης προχωρά και θα είναι σύντομα δυνατόν να δημιουργήσουμε πραγματικές προσομοιώσεις παιχνιδιών (όχι απλά αποτελεσμάτων όπως η εφαρμογή μας). Για όσους έχουν ακούσει τα deepfakes, η ίδια τεχνολογία μπορεί να χρησιμοποιηθεί και εδώ.
Εν συντομία, η βάση αυτής της τεχνολογίας είναι ένας συγκεκριμένος τύπος νευρωνικού δικτύου (Generative Adverserial Networks), το οποίο προσπαθεί να μάθει να δημιουργεί συνθετικά δεδομένα, που έχουν τις ίδιες στατιστικές ιδιότητες με αυτά που το τροφοδοτούμε. Για να παράδειγμα, χρησιμοποίησα ένα τέτοιο δίκτυο για να δημιουργήσω "ψεύτικα" shotcharts που είναι δυσδιάκριτα από αληθινά shot charts.
#DeepFake #shotcharts Can you tell which one is fake and which one is real (if any)? These are team/game shotcharts (from 2013 and 2014 #NBA seasons). The fake was generated by a #GAN - code and post on GANs coming soon (hopefully). Poll below pic.twitter.com/mzE7658rBy
— Kostas Pelechrinis (@kpelechrinis) August 12, 2019
Τώρα το συγκεκριμένο παράδειγμα θα μπορούσε να είχε γίνει και με πιο απλές στατιστικές τεχνικές, αλλά η διαφορά ήταν ότι το μοντέλο δεν τροφοδοτήθηκε με τις συντεταγμένες των σουτ, αλλά με τις φωτογραφίες! Ερευνητές από την Disney research και STATS Inc έχουν δημιουργήσει παρόμοια τεχνολογία, που δημιουργεί συνθετικές άμυνες με βάση την επιθετικό σχήμα του αντιπάλου. Αυτές οι άμυνες δεν είναι οι βέλτιστες άμυνες (αυτές που θα ελαχιστοποιήσουν την πιθανότητα η επίθεση να σκοράρει), αλλά άμυνες που ουσιαστικά απομιμούνται την αντίδραση των πραγματικών ομάδων. Το παρακάτω βίντεο από την STATS Inc είναι αρκετά κατατοπιστικό:
To πλήρες βίντεο, από όπου προέρχεται το απόσπασμα, θα το βρείτε εδώ https://www.youtube.com/watch?v=bW18HmLugwg&feature=youtu.be&t=820