Γενικοί δείκτες
Αρχίζουμε με τους γενικούς δείκτες επίθεσης, άμυνας και ρυθμού. Στο παρακάτω γράφημα απεικονίζονται οι αλλαγές στα Offensive Rating (δείκτης επίθεσης – σημειωμένοι πόντοι ανά 100 κατοχές), Defensive Rating (δείκτης άμυνας – πόντοι αντιπάλου ανά 100 κατοχές) και Pace (δείκτης ρυθμού κατοχών - κατοχές ανά παιχνίδι) για κάθε ομάδα. Τα πορτοκαλί σημεία δείχνουν την εκάστοτε τιμή για την κανονική περίοδο, τα πράσινα σημεία την τιμή στα πλέι οφ, εφόσον η αλλαγή ήταν θετική για την ομάδα και τα κόκκινα σημεία την τιμή στα πλέι οφ, εφόσον η αλλαγή ήταν αρνητική. Πάνω από τις γραμμές που ενώνουν τα σημεία αναγράφεται η διαφορά των τιμών.
H επίθεση σχεδόν όλων των ομάδων (πλην της Εφές, η οποία στο game 3 στη Βαρκελώνη ξεσάλωσε) δείχνει χειρότερη - βασικά είναι. Τι συμβαίνει; Είναι διαφορετικό το μπάσκετ των πλέι οφ και όντως η σημασία της άμυνας είναι μεγαλύτερη; Θα δώσουμε μερικά στοιχεία λίγο παρακάτω, σε μερικά σχετικά αποκαλυπτικά συμπεράσματα, πάντως η ταυτόχρονη μείωση του ρυθμού προδιαθέτει για ένα διαφορετικού "τυπου" μπάσκετ, έστω και λίγο διαφορετικού. Αξίζει να σημειωθεί εδώ, πως διαχρονικά στο ΝΒΑ, ο ρυθμός μειώνεται στα πλέι οφ περίπου 3%, μία μείωση της οποίας η σημασία δεν έχει εκτιμηθεί επακριβώς και υπόκειται στην σφαίρα της ερμηνείας του καθενός. Εδώ πάντως η μείωση είναι μεγαλύτερη.
Τώρα, ίσως παρατηρήσατε πως δεν έχουμε βάλει το net rating, διότι θέλουμε να εστιάσουμε στις επιδόσεις ανά κατηγορία και τις επιδράσεις σε αυτές. Είναι περίπου αυτονόητο πως όποιος έχει τα καλύτερο net rating (δηλαδή μέσες άκρες όποιος έχει την μεγαλύτερη διαφορά μεταξύ των πόντων που βάζει και εκείνων που δέχεται), έχει τις περισσότερες πιθανότητες να πάει καλά. Αν το μάτι πέσει κατευθείαν εκεί, υπάρχει ο κίνδυνος να μην σταθούμε όσο χρειάζεται στα υπόλοιπα, από τα οποία προκύπτει άλλωστε και ο δείκτης.
Four Factors
Στα Four Factors for basketball success, τους τέσσερις παράγοντες επιτυχίας όπως τους όρισε ο Dean Oliver, έχουμε αναφερθεί και σε παλαιότερες αναρτήσεις. Να υπενθυμίσουμε πως σύμφωνα με τον Dean Oliver λοιπόν, οι τέσσερις πιο σημαντικοί παράγοντες για τη νίκη είναι η ευστοχία, τα ριμπάουντ, τα λάθη και ο ρυθμός των ελεύθερων βολών. Αυτοί οι παράγοντες εφαρμόζονται και στην επίθεση και στην άμυνα, δίνοντας μας ουσιαστικά 8 διαφορετικούς δείκτες.
Συγκεκριμένα για την επίθεση, έχουμε την σταθμισμένη ευστοχία (eFG%), το ποσοστό των επιθετικών ριμπάουντ (ORB%) σε σχέση με τα συνολικά διαθέσιμα ριμπάουντ, το ποσοστό των εύστοχων βολών σε σχέση με τις προσπάθειες για σουτ (FTr%) και τα λάθη ανά 100 κατοχές (TOV%).
Για τους ακριβείς τύπους που υπολογίζουν αυτούς τους δείκτες μπορείτε να ανατρέξετε εδώ.
Στο παρακάτω διάγραμμα βλέπουμε τις αλλαγές των δεικτών από την κανονική περίοδο προς τα πλέι οφ, ανά ομάδα. Κάθε αύξηση στα νούμερα δείχνει θετική αλλαγή, με εξαίρεση τα λάθη, όπου θετική αλλαγή αποτελεί η μείωση τους φυσικά.
Σε αντιστοιχία με το πρώτο διάγραμμα παραπάνω, η ευστοχία στα πλέι οφ μειώθηκε, τα λάθη αυξήθηκαν. Κάπως έτσι προέκυψε και η μικρότερη επιθετική αποτελεσματικότητα, για την οποία μιλήσαμε ήδη. Προφανώς, οι ομάδες που προκρίθηκαν παρουσίασαν και την καλύτερη δυνατή εικόνα, με την εικόνα-εξαίρεση της Μπάρσα στα λάθη να δικαιολογείται από τον αντίπαλο.
Σε ο,τι αφορά ριμπάουντ και βολές, οι μεταβολές που βλέπετε μας κατευθύνουν στο εξής: Οι ομάδες είναι προσεκτικές στην άμυνα. Θα προτιμήσουν να γυρίσουν πίσω και να οργανωθούν, αντί να παίξουν με ρίσκο, θα δώσουν λιγότερους εύκολους ποντους.
Καθώς ήδη μιλάμε για την άμυνα, σε αυτό τον τομέα μετράμε τους ίδιους δείκτες για τον αντίπαλο, με εξαίρεση τα ριμπάουντ, όπου μετράμε το ποσοστό των αμυντικών ριμπάουντ (DRB%) σε σχέση με τα συνολικά διαθέσιμα ριμπάουντ.
Εδώ βλέπουμε το εξής ενδιαφέρον. Όσες ομάδες αποκλείστηκαν, επέτρεψαν στους αντιπάλους τους να σουτάρουν καλύτερα από ο,τι επέτρεπαν σε όσους αντιμετώπισαν στην κανονική περίοδο. Οι άμυνες των τεσσάρων χαμένων δεν ήταν τόσο αποτελεσματικές όσο στην κανονική περίοδο.
Στα λάθη η εικόνα συμβαδίζει με τα αποτελέσματα με λιγότερο ζήλο, όμως μέσες άκρες μια συνάφεια υπάρχει. Αντίθετα, η βελτίωση όλων στον αμυντικό ριμπάουντ, μάλλον οφείλεται στην αστοχία, σε συνδυασμό με την πιο συντηρητική προσέγγιση του παιχνιδιού που περιγράψαμε παραπάνω. Περισσότερα σουτ διαθέσιμα προς διεκδίκηση, προτίμηση του επιτιθέμενου να μην διεκδικεί πολλά επιθετικά ριμπάουντ, με σκοπό να οργανώσει καλύτερα την άμυνα. Τέλος, τρεις από τις τέσσερις ομάδες που προκρίθηκαν, πέτυχαν να δεχτούν λιγότερους πόντους από βολές, ενώ η τέταρτη (Φενερ) δεν ζημιώθηκε παραπάνω από όσο συνολικά στη σεζόν.
Four Factors – βαρύτητα
Βλέποντας τα παραπάνω, ποιος από τους παραπάνω παράγοντες είναι πιο σημαντικός για τη νίκη; O Dean Oliver έδωσε βαρύτητα 40% στην ευστοχία, 25% στα λάθη, 20% στα ριμπάουντ και 15% στις βολές. Αυτοί οι συντελεστές προήλθαν από ανάλυση της επίδρασης των παραγόντων αυτών σε αγώνες ΝΒΑ. Ισχύουν όμως για την τωρινή Ευρωλίγκα; Για να απαντήσω στο ερώτημα αυτό, υπολόγισα τους 8 παράγοντες (4 για την επίθεση και 4 για την άμυνα), για κάθε ομάδα στις τελευταίες τρεις σεζόν. Χρησιμοποίησα μόνο τους αγώνες της κανονικής περιόδου, για να έχουμε ίδιο σύνολο αγώνων για κάθε ομάδα. Συνολικά λοιπόν το δείγμα αποτελούταν από 48 συνδυασμούς ομάδων-σεζόν, με δεδομένα τους 8 παράγοντες και τον αριθμό νικών.
Πριν δούμε τα αποτελέσματα της ανάλυσης, ας δούμε λίγο την κατανομή των δεδομένων. Στο παρακάτω διάγραμμα, βλέπουμε την κατανομή των 8 παραγόντων ανά σεζόν. Κάθε κουκίδα δείχνει την τιμή του κάθε παράγοντα για κάθε ομάδα. Με μωβ χρώμα οι ομάδες που έφτασαν στο Φάιναλ 4, με τα χρώματα τους οι Ελληνικές ομάδες (για να δούμε που βρισκόμαστε) και με γκρι οι υπόλοιπες. Τα κουτάκια με τις γραμμές (box plots) χρησιμοποιούνται στη στατιστική για να δείξουν την κατανομή μιας μεταβλητής. Ας το εξηγήσω απλά: ό,τι βρίσκεται μέσα στο κουτί αποτελεί το 50% των τιμών και η οριζόντια γραμμή στη μέση μας δείχνει τη διάμεσο των τιμών. Πάνω και κάτω από κάθε κουτί βρίσκονται δύο κάθετες γραμμές, που δείχνουν το εύρος πάνω από το 75% και κάτω από το 25%. Επίσης μπορεί να έχουμε και ακραίες τιμές (outliers) που βρίσκονται έξω από τις γραμμές.
Εδώ θέλω να σταθώ στην ευστοχία. Εστιάζοντας στον πρώτο παράγοντα, την ευστοχία της ομάδας (Shoοting), φαίνεται καθαρά πως κάθε σεζόν έχουμε αύξηση. Και με εξαίρεση τον Ολυμπιακό του ‘16 όλες οι υπόλοιπες ομάδες που έφτασαν στο Φάιναλ Φορ, ήταν από τις πρώτες στην ευστοχία. Οι Ελληνικές ομάδες σταθερά κάτω από τη μέση της κατανομής και είναι κάτι που θα έπρεπε να απασχολεί όποιον κάνει τον προγραμματισμό (sic) κάθε καλοκαίρι.
Κοιτώντας την ευστοχία του αντιπάλου (Opp. Shooting), βλέπουμε πως οι φιναλίστ πετυχαίνουν να κρατήσουν τον αντίπαλο χαμηλά. Οι Ελληνικές ομάδες τα καταφέρνουν γενικά στην άμυνα όπως βλέπουμε (αν και ο Ολυμπιακός έχασε την πρωτιά φέτος).
Με αυτά τα δεδομένα λοιπόν, πραγματοποίησα μια στατιστική ανάλυση (multiple linear regression), η οποία με απλά λόγια προσπαθεί να φτιάξει ένα μοντέλο που να υπολογίζει τις νίκες κάθε ομάδας με βάσει τους 8 παράγοντες και συνοψίζεται στην παρακάτω εξίσωση:
Νίκες = β1 * «ευστοχία» + β2 * «λάθη» + β3 * «επ. ριμπάουντ» + β4 * «ρυθμός ελ. βολών» +
β5 * «ευστοχία αντιπάλου» + β6 * «λάθη αντιπάλου» + β7 * «αμ. ριμπάουντ» + β8 * «ρυθμός ελ. βολών αντιπάλου» + «τυπικό λάθος»
W = β1 * eFG% + β2 * TOV% + β3 * ORB% + β4 * FTr% +
β5 * op_eFG% + β6 * op_TOV% + β7 * DRB% + β8 * op_FTr% + «Εrror»
Γνωρίζουμε τις νίκες και τις τιμές των παραγόντων και ψάχνουμε τις τιμές των συντελεστών β1-β8.
Με τη βοήθεια ενός στατιστικού πακέτου (R stats στη συγκεκριμένη περίπτωση), παίρνουμε τα παρακάτω αποτελέσματα:
Συνοπτικά και χωρίς να μπω σε λεπτομέρειες, η στήλη “Estimate” μας δίνει τις τιμές β1-β8 κατά μέσο όρο. Για παράδειγμα, στο efg to 0.88558 μας λέει πως εάν ανέβει η ευστοχία κατά μια μονάδα τότε κατά μέσο όρο πρέπει να περιμένουμε 0.88558 νίκες παραπάνω. Και στο tov το -1.03886 μας λέει πως εάν πέσουν τα λάθη κατά μια μονάδα τότε κατά μέσο όρο πρέπει να περιμένουμε 1.03886 νίκες παραπάνω.
Τα αστεράκια στην τελευταία στήλη δείχνουν πως σχεδόν όλοι οι παράγοντες είναι στατιστικά σημαντικοί, εκτός από τα αμυντικά ριμπάουντ (drb). Δηλαδή θεωρητικά μπορούμε να τα αφαιρέσουμε από την εξίσωση και δε θα αλλάξει η πρόβλεψη νικών!
Το τυπικό λάθος (Residual standard error) είναι στο 1.779 και μας λέει πόσο έξω σε νίκες μπορούμε να πέσουμε κατά μέσο όρο. Τα υψηλά R-squared και F-statistic δείχνουν πως το μοντέλο έχει γενικά καλό «fit». Η πιο λάθος πρόβλεψη ήταν αυτή της Barcelona ‘16 με -4.2135 νίκες (Residual min), αλλά θυμόμαστε πως είχε πολλά στατιστικά παράδοξα εκείνη η ομάδα.
Και πως εξάγουμε την βαρύτητα από τα παραπάνω αποτελέσματα; Αν συγκρίνουμε τους συντελεστές με αυτά τα νούμερα θα βγάλουμε λάθος συμπεράσματα. Συγκρίνοντας τα απόλυτα νούμερα πχ “efg” με “tov”, 0.88558 με 1.03886, βλέπουμε πως τα λάθη έχουν μεγαλύτερο συντελεστή. Έτσι την πάτησα κι εγώ τρέχοντας στο τσατ του σάιτ και ανακοινώνοντας πως τα λάθη είναι πιο σημαντικά για να εισπράξω εμότζι με σοκαρισμένες φατσούλες. Φυσικά το αρχικό και βιαστικό (έπαιζαν και οι Bucks σε λίγη ώρα) συμπέρασμα ήταν λάθος (όσο λάθος και βιαστικό ήταν το συμπέρασμα πως η άμυνα των Celtics θα κατατρόπωνε τους Bucks).
Το πρόβλημα εδώ είναι πως οι διάφοροι παράγοντες έχουν διαφορετικό “είδος” τιμών. Άλλο πράγμα η ευστοχία και άλλο τα λάθη. Μήλα και πορτοκάλια. Και όπως είδαμε και στο γράφημα της κατανομής, άλλη κατανομή έχει η ευστοχία και άλλη τα λάθη. Για να βρούμε τη βαρύτητα τους πρέπει να κάνουμε “κανονικοποίηση” των μεταβλητών (coefficient standardization), ώστε να αναφέρονται στο ίδιο πράγμα και να έχουν την ίδια απόκλιση. Και αυτό σε στατιστικούς όρους σημαίνει πως για κάθε παράγοντα αφαιρούμε από την τιμή του τον μέσο όρο και διαιρούμε με την τυπική του απόκλιση. Ξανατρέχουμε κατόπιν την ίδια ανάλυση με τις νέες τιμές και τότε συγκρίνοντας τους συντελεστές β1-β8 έχουμε μια ξεκάθαρη και σωστή εικόνα για την βαρύτητα τους. Ιδού τα αποτελέσματα:
Στο επάνω μέρος έχουμε τους 8 παράγοντες και στο κάτω τους 4 που συνδυάζουν επίθεση και άμυνα. Η ευστοχία έχει βαρύτητα 43.1%, τα λάθη 28.2%, οι βολές 15.9% και τα ριμπάουντ 12.5%. Θυμίζω πως ο Oliver είχε δώσει 40%, 25%, 15%, 20% αντίστοιχα.
Κοιτώντας στο επάνω μέρος, βλέπουμε πως οι τρεις πιο σημαντικοί σχετικά παράγοντες είναι η ευστοχία του αντιπάλου με 22.3%, η ευστοχία της ομάδας με 21.1% και τα λάθη του αντιπάλου με 16.6%. Δηλαδή το μότο είναι κρατάμε τον αντίπαλο χαμηλά σε ευστοχία, σουτάρουμε καλά εμείς και πιέζουμε τον αντίπαλο να κάνει λάθη. Κοιτώντας πίσω στον γράφημα με την κατανομή, βλέπουμε πως οι ομάδες που έφτασαν στα Φάιναλ Φορ ήταν καλές και στους τρεις αυτούς τομείς.
Τα αμυντικά ριμπάουντ και οι βολές του αντιπάλου είναι οι λιγότερο σημαντικοί παράγοντες. Κλείνω με την επισήμανση πως αυτές οι τιμές αφορούν το μέσο όρο για τις τρεις τελευταίες σεζόν και πως ανά σεζόν υπόκεινται σε αλλαγές μικρές ή μεγαλύτερες. Λόγου χάρη φέτος η ευστοχία της ομάδας αποδείχθηκε ο πιο σημαντικός από τους 8 παράγοντες.
Ευτυχώς έφτασα σε αυτά τα συμπεράσματα ακριβώς με την έναρξη του πρώτου αγώνα Bucks-Celtics και όταν αυτός τελείωσε ήμουν σίγουρος πως επρόκειτο για στατιστικό λάθος, ένα outlier που θα διορθώνονταν με τους υπόλοιπους 4 αγώνες. Regression to the mean.