Τρίτη, 20 Φεβρουαρίου 2018 11:05

Ευρωλίγκα SOS

Από :

(O Panagiotis S. - follow @lostgps - είναι, μεταξύ άλλων , αναγνώστης του BG. Έχουμε φάει και έχουμε πιει κρασί στην Βαρκελώνη, σε ένα μέρος που μας πήγε για παραδοσιακή παέγια. Αυτό φτάνει).

Ας αρχίσω γράφοντας ότι η Ευρωλίγκα είναι μια χαρά, δεν εκπέμπει SOS. Αν κάνατε κλικ γιατί ανησυχήσατε, χαλαρώστε και διαβάστε ένα κείμενο για στατιστική (ρωτήστε και τον γκουρού τι κρασί το συνοδεύει καλύτερα). Το SΟS του τίτλου αναφέρεται στη συντομογραφία του Strength of Schedule, του δείκτη δύναμης του προγράμματος των αγώνων μιας ομάδας. Είναι ένας όρος που συναντάται συχνά σε αρθρογραφίες για το NBA, αλλά δεν το βλέπουμε συχνά στην από δω μεριά του Ατλαντικού. Ή μάλλον το συζητάμε θεωρητικά σαν “εύκολο ή δύσκολο πρόγραμμα”, αλλά όχι ποσοτικά, γιατί δεν το μετράμε με κάποιο τρόπο. Ο δείκτης SoS εισάγει την ποσότητα στην κουβέντα. Καταπιάστηκα λοιπόν να τον εφαρμόσω στην Ευρωλίγκα, για να δούμε πως έχουν τα πράγματα. Ποια ομάδα είχε το πιο δύσκολο πρόγραμμα μέχρι τώρα; Και ποια το ευκολότερο; Όχι κρίνοντας με το μάτι, αλλά βάση αποτελεσμάτων.

Ο δείκτης αυτός λοιπόν – που από δω και πέρα θα τον γράφω SoS - μετρά τη δύναμη του προγράμματος μιας ομάδας ή ενός ατόμου (σε ατομικά αθλήματα), κρίνοντας φυσικά από τη δυναμικότητα των αντιπάλων της/του. Θεωρητικά το SoS είναι το άθροισμα της δυναμικότητας των αντιπάλων και όσο δυνατότεροι είναι οι αντίπαλοι, τόσο μεγαλύτερο συντελεστή SoS θα έχει η ομάδα/άτομο. Ο δείκτης χρησιμοποιείται σε διάφορες διοργανώσεις ως κριτήριο σε περίπτωση ισοβαθμίας.

SOS - Εισαγωγή στους τύπους

Υπάρχουν διάφοροι τρόποι πρακτικού υπολογισμού του SoS, καθώς υπάρχουν εξίσου διάφοροι τρόποι μέτρησης της δυναμικότητας του αντιπάλου. Κάποιοι χρησιμοποιούν αυθαίρετα ratings δυναμικότητας (χωρίζοντας τις ομάδες σε γκρουπ και δίνοντας τους συγκεκριμένους πόντους). Άλλοι χρησιμοποιούν το αποτέλεσμα (νίκες/ήττες) των αγώνων και άλλοι τη διαφορά πόντων στο αποτέλεσμα. Επίσης ο παράγοντας ”έδρα” χρησιμοποιείται σε μερικές περιπτώσεις για να ζυγίσει διαφορετικά τα αποτελέσματα. Ελπίζω να μην κουράσουν πολύ τα μαθηματικά που ακολουθούν.

Ο τρόπος που ακολούθησα είναι μέσω του RPI ή Ratings Percentage Index και είναι ο πιο συνήθης τρόπος για το μπάσκετ. Αυτός είναι ένας δείκτης για τη δυναμικότητα μιας ομάδας και η φόρμουλα υπολογισμού του είναι η εξής:

RPI = (WP * 1/4) + (OWP * 2/4) + (OOWP * 1/4)

Η εξήγηση είναι ότι το RPI συντελείται κατά ένα τέταρτο από το ποσοστό νικών της ομάδας (WP), κατά δύο τέταρτα από το ποσοστό νικών όλων των αντιπάλων (ΟWP) και κατά ένα τέταρτο από το ποσοστό νικών όλων των αντιπάλων αυτών των αντιπάλων (OOWP).

Και σε αυτό το πλαίσιο, το SoS προκύπτει από τα δύο τελευταία συστατικά του RPI:

SoS = (OWP * 2/3) + (OOWP * 1/3)

Επομένως το SoS συντελείται κατά δύο τρίτα από το ποσοστό νικών όλων των αντιπάλων (ΟWP) και κατά ένα τρίτο από το ποσοστό νικών όλων των αντιπάλων αυτών των αντιπάλων (OOWP).

Ας δούμε και πως υπολογίζονται όλα τα επιμέρους για κάποια ομάδα Α:

• Το WP είναι απλά το πηλίκο του αριθμού των νικών της Α διά τον αριθμό των αγώνων της.

• Το OWP είναι η μέση τιμή του ποσοστού νικών των αντιπάλων της Α, ας τις πούμε Β, Γ και Δ. Υπόψιν ότι υπολογίζουμε μόνο τους αντιπάλους της Α στα μέχρι τώρα παιχνίδια, οι μελλοντικοί αντίπαλοι δεν μας απασχολούν. Και μια σημαντική λεπτομέρεια: στον υπολογισμό δεν περιλαμβάνονται οι αγώνες τους με την Α. Δηλαδή πρώτα θα υπολογίσουμε το WP της ομάδας Β με τις Γ και Δ, μετά το WP της ομάδας Γ με τις Β και Δ και τέλος το WP της ομάδας Δ με τις Β και Γ. Κατόπιν παίρνουμε τη μέση τιμή όλων αυτών των επιμέρους WP και έτσι έχουμε το OWP για την Α.

• Το OOWP είναι η μέση τιμή του OWP κάθε αντιπάλου της Α. Δηλαδή υπολογίζουμε το OWP των Β, Γ και Δ, παίρνουμε τη μέση τιμή τους και έτσι έχουμε το OOWP για την Α. Φυσικά ισχύει ο παραπάνω κανόνας, δηλαδή για τον υπολογισμό OWP της Β, εξαιρούνται οι αγώνες της Β με Α,Γ,Δ.

Το αποτέλεσμα που προκύπτει για το SoS, είναι κάποια τιμή γύρω από το 0.500. Όταν βρίσκεται πάνω από το 0.500 σημαίνει ότι η ομάδα έχει δυσκολότερο πρόγραμμα. Πάρτε μια γεύση από SoS και RPI στο ΝΒΑ από τη σελίδα του ESPN εδώ. Αυτή αναφέρεται στα μέχρι τώρα παιχνίδια. Στο Tankathon θα δούμε τον υπολογισμό του SoS για τα εναπομείναντα παιχνίδια, εδώ.

Να αναφέρω εδώ ότι τα RPI και SoS χρησιμοποιούνται κατά κόρον στο NCAA ως κριτήριο ένταξης στα playoffs. Τα τελευταία χρόνια έχουν κάνει κάποιες ρυθμίσεις στη φόρμουλα και για τον υπολογισμό του WP κάθε νίκη πολλαπλασιάζεται με κάποιον συντελεστή, ανάλογα με το αν ήταν εντός, εκτός ή σε ουδέτερη έδρα. Επίσης διάφοροι έχουν προτείνει παραλλαγές του υπολογισμού, ώστε να περιλαμβάνει και το εύρος της κάθε νίκης, καθώς κρίνουν ανεπαρκή τη λογική χρησιμοποίησης μόνο του ποσοστού νικών. Βλέπετε εκεί το εύρος δυναμικότητας των ομάδων ποικίλει πολύ ανά τις διάφορες περιφέρειες και δεν παίζουν όλοι με όλους. Ανεξάρτητα από τη χρησιμότητα ή μη του RPI ως μέσο αξιολόγησης μιας ομάδας, το κύριο ζητούμενο εδώ είναι το SoS και ο παραπάνω αλγόριθμος είναι χρησιμότατος.

Ευρωλίγκα

Πόσο ταιριαστό είναι αυτό το μοντέλο υπολογισμού στην Ευρωλίγκα; Με τη νέα της μορφή απλοποιεί τα πράγματα. 16 ομάδες που παίζουν όλοι με όλους ακριβώς 2 φορές, είναι αρκετά απλό τοπίο εφαρμογής. Και πιστεύω ότι εδώ δε χρειάζεται προσαρμογή για το εύρος της νίκης. Από την άλλη, ο παράγοντας έδρα παραμένει σημαντικός. Πόσο σημαντικός όμως;
Υπολόγισα το ποσοστό των νικών των γηπεδούχων στην ιστορία της Ευρωλίγκας (εξαιρουμένων των αγώνων των Final 4) και είναι στο 63.29%. Μάλιστα τα τελευταία χρόνια βρίσκεται σε ελαφρώς αυξητική τάση (ενώ στο NBA βρίσκεται σε πτωτική, περίπου στο 60%). Θα ανεβάσω ένα γράφημα γι αυτό, κάποια άλλη στιγμή.

Για να βάλω και την έδρα στην εξίσωση, βρήκα και εφάρμοσα μια παραλλαγή στον υπολογισμό του SoS: Για το OWP μετράνε μόνο τα παιχνίδια του αντιπάλου σε σχέση με το που αγωνίζεται. Δηλαδή, έστω ότι έχουν γίνει τα εξής παιχνίδια: Α-Β, Γ-Α, Δ-Β, Β-Γ, Γ-Δ.

Η ομάδα Α έχει παίξει εντός με την Β και εκτός με την Γ. Για τον υπολογισμό του WP της ομάδας Β, μετράμε μόνο τα παιχνίδια που αυτή έχει παίξει εκτός έδρας με τους άλλους, δηλαδή σε αυτή την περίπτωση μόνο το Δ-Β. Έτσι το Β-Γ όπου έπαιξε εντός, εξαιρείται. Όταν γίνει και το παιχνίδι Β-Α, τότε θα μετρηθεί και το εντός έδρας WP της Β. Παρομοίως και για την Γ, μετράμε μόνο το Γ-Δ. Η ίδια λογική ακολουθεί και στον υπολογισμό του OOWP. Είναι λίγο πιο περίπλοκο, αλλά μοιάζει πιο δίκαιο.

Ελπίζω να μη με έχετε χάσει, γιατί τώρα έρχεται το κυρίως πιάτο. Χωρίς άλλη χρονοτριβή ακολουθεί ο πίνακας για την τρέχουσα σεζόν με το SoS και το RPI:

Με τη συμπλήρωση του 22ου γύρου λοιπόν, ο Ολυμπιακός έχει το υψηλότερο SoS και ο Αστέρας το χαμηλότερο, ενώ ο Παναθηναϊκός είναι στη μέση. Το εύρος τιμών είναι πολύ μικρότερο σε σχέση με το NBA, αλλά αυτό εξηγείται από το μικρότερο αριθμό ομάδων και το ότι στο ΝΒΑ δεν παίζουν όλοι μεταξύ τους τον ίδιο αριθμό αγώνων. Επίσης, όσο προχωράμε προς το τέλος της κανονικής σεζόν στην Ευρωλίγκα, το SoS συγκλίνει προς το 0.500 για όλους, καθώς όλοι θα έχουν παίξει μεταξύ τους ακριβώς 2 φορές. Στη μέση της σεζόν, το εύρος ήταν μεγαλύτερο (0.529 - 0.474).
Στη στήλη rSoS, δηλαδή το SoS για τα εναπομείναντα παιχνίδια, το νούμερο είναι ακριβώς η διαφορά του SoS από το 1.

Το RPI αντικατοπτρίζει πλήρως την τωρινή κατάταξη με μόνη διαφορά τη θέση του Αστέρα, που είχε σχετικά ευκολότερο πρόγραμμα και έχει χαμηλότερο RPI από την Μπάμπεργκ, αν και έχει μία νίκη παραπάνω από αυτήν.

Στις στήλες PW/PL βλέπουμε τις αναμενόμενες νίκες και ήττες, τις λεγόμενες και ως ”Πυθαγόρειες” μιας και για τον υπολογισμό τους, υπάρχει αναλογία με το γνωστό θεώρημα. Εδώ υπολογίζουμε το αναμενόμενο ποσοστό νικών κάθε ομάδας λαμβάνοντας υπόψιν μόνο τους πόντους που σημείωσε και δέχθηκε (και τίποτε άλλο) . Η στήλη WD δείχνει την διαφορά των πραγματικών νικών από τις αναμενόμενες. Και εδώ ο Ολυμπιακός έχει την πρωτιά με 3 νίκες παραπάνω απ’ ότι θα του αναλογούσαν με βάση τη διαφορά πόντων του. Και η Μπάρσα με το εκκωφαντικό -5 στην τελευταία θέση.

Βάζοντας όλα αυτά τα νούμερα σε ένα γράφημα έχουμε την παρακάτω εικόνα:

Στον οριζόντιο άξονα το SoS και στον κάθετο το RPI. Στα δεξιά οι ομάδες που έχουν το ευκολότερο πρόγραμμα στη συνέχεια και στα αριστερά αυτές με το δυσκολότερο.
Στο χρώμα και το μέγεθος των σημείων αποτυπώνεται η διαφορά των Πυθαγόρειων νικών με τις πραγματικές. Το σχήμα δηλώνει τον αριθμό των υπολειπόμενων αγώνων εντός έδρας.
Η συνέχεια φαντάζει ευκολότερη για τον Ολυμπιακό με 5 αγώνες εντός έδρας, αλλά και για τις Ρεάλ και Μπασκόνια. Δυσκολότερα μοιάζουν τα πράγματα για τον Παναθηναϊκό, με ένα λιγότερο εκτός. Ενδιαφέρουσα προβλέπεται η μάχη μεταξύ Μπασκόνια - Μακάμπι για την 8η θέση και μου θυμίζει την περυσινή μεταξύ Νταρουσάφακα και Αστέρα. Και μιας και είπαμε για πέρυσι, ας δούμε και πως ήταν η εικόνα πέρυσι τέτοιο καιρό.

Η διαφορά εδώ είναι ότι το χρώμα και το μέγεθος των σημείων υποδηλώνει τον αριθμό των νικών στους τελευταίους 8 αγώνες.

Παρατηρούμε το αναμενόμενο, ότι δηλαδή οι δυνατότερες ομάδες με το ευκολότερο πρόγραμμα έκαναν καθαρά τις περισσότερες νίκες, αλλά όχι μόνο στην έδρα τους. Το ποσοστό νικών των γηπεδούχων στις τελευταίες 8 αγωνιστικές έπεσε στο 56.3% ,από το 65.9% των πρώτων 22 αγωνιστικών!

Μόνο που φέτος η εικόνα αντιστρέφεται λίγο, με περισσότερες δυνατές ομάδες να συνωστίζονται στην αριστερή πλευρά του γραφήματος, με δυσκολότερο πρόγραμμα και λιγότερα ματς εντός. Θα δούμε στο παρκέ πως θα εξελιχθεί η μάχη της οκτάδας.

ΥΓ. Τον πίνακα και το γράφημα, καθώς και άλλα στατιστικά που θα ανεβάζω κατά καιρούς, μπορείτε να τα δείτε και διαδραστικά εδώ.

Σημείωση

1. Η φόρμουλα για τον υπολογισμό του αναμενόμενου ποσοστού νικών (EWP) μιας ομάδας είναι αυτή:

            EWP = (Πόντοι υπέρ ^ X) / (Πόντοι υπέρ ^ X + Πόντοι κατά ^ Χ)

Από αυτό βγαίνουν και οι αναμενόμενες νίκες και ήττες. Ο μαγικός εκθέτης Χ εδώ, εξαρτάται από τη διοργάνωση και το άθλημα, αλλά δυστυχώς και από την πηγή. Για το NBA, το ESPN χρησιμοποιεί τον αριθμό 16.4 που προέρχεται από το αμερικάνικο ποδόσφαιρο. Το Basketball Reference χρησιμοποιεί το 14, το οποίο φέρνει αποτελέσματα πιο κοντά στη πραγματικότητα. Για το WNBA χρησιμοποιείται το 10 και αυτό είναι το νούμερο που επέλεξε και ο Ανδρέας Χριστοφόρου για τα στατιστικά του στο badbasket.gr, όπως εξηγεί εδώ.

Έτρεξα μια προσομοίωση για όλες τις σεζόν της Ευρωλίγκας δοκιμάζοντας νούμερα από το 8 έως το 16 και όντως με το 10 έχουμε το μικρότερο σφάλμα στις προβλέψεις. Το 9.5 βγαίνει οριακά καλύτερο, αλλά η διαφορά δεν είναι σημαντική, οπότε κατέληξα κι εγώ στο 10.

Πηγές:

https://www.nbastuffer.com/analytics101/strength-of-schedule-sos/

http://www.laxpower.com/update18/ex_sos.php

http://www.laxpower.com/update18/ex_rpi.php

http://www.nationalchamps.net/NCAA/BCS/strength_of_schedule_explain.htm

http://www.nbaminer.com/strength-of-schedule-comparison/

https://8points9seconds.com/2010/02/14/advanced-stat-talk-a-different-way-to-look-at-strength-of-schedule/

http://www.bigbluehistory.net/bb/rpi.html

Basketballguru.gr 2018 All righs reserved.      Designed and Developed by Web Rely