Data-nørdernes fest: Moneyball i NBA

Data-nørdernes fest: Moneyball i NBA
Offentliggjort

Nørderne gør deres indtog i NBA med statistiske modeller, video tracking og cost/benefit-analyser. Bloggen giver i dag en lille introduktion til de begreber som optræder i de kloge hoveders NBA.

Til dem som hverken har set filmen eller læst bogen, så handler Moneyball kort fortalt om, hvordan man hos Oakland Athletics (baseball-hold uden for San Francisco) fik opbygget gode hold med få midler ved at bruge statistiske modeller til at vurdere spillere. I ligaer som MLB, NFL og NBA, hvor der er en form for lønloft, er det strengt nødvendigt at udnytte sine penge på den mest optimale måde, da man ikke bare kan bruge løs. Oakland kunne via statistiske modeller finde spillere som havde lavere markedsværdi end deres spil berettigede. De var banebrydende i sin tid og i dag bliver metoderne brugt af alle baseball-hold.

I dag vil jeg gerne fortælle lidt om de tiltag der er kommet inden for basketball, som prøver at analysere spillet og udvide vores forståelse af, hvad der skal til for at vinde.

Boxscore for Los Angeles Lakers fra 22. Januar 2006. Læg lige mærke til Kobe Bean Bryant.

I NBA har avancerede statistiske modeller ikke været så udbredte. Når vi taler om en spillers statistikker, så menes bogholderi over de tal, som spilleren har produceret. Point, rebounds, assists, osv. Vi taler også om skudprocent (FG%), antal ramte skud delt med alle skud taget. De tal har været noteret siden spillet begyndte.

Men der foregår også mange ting på en basketball-bane, som ikke fanges i disse tal. Ligesom i andre spil, som fodbold og håndbold, så er basketball meget flydende. Vi kan ikke se, hvor svært et ramt skud var, vi kan ikke se, om en spiller tog sine rebounds ud af hænderne på medspillere og vi kan ikke se, om en spiller får steals, fordi han satser for ofte i forsvaret og dermed koster sit hold mere end han vinder. Boxscoren er altså en forenkling af, hvad der skete i en kamp.

Jeg vil opridse nogle af de tal, som man har udviklet for at få mere ud af boxscoren, men hvis man får nok af tal og formler, så er det for det første helt forståeligt (!) og for det andet kan man scrolle ned på den anden side af billedet af Dwight Howard og James Harden. Der er nørderiet slut.

Roy Hibbert.

Der er gået meget arbejde i at få bedre information ud af de tal, vi får fra en boxscore. Vi har alligevel alle disse tal, så vi kan lige så godt bruge dem. Derfra kommer bl.a. begreber som effective field goal percentage (eFG%), true shooting percentage (TS%) og Player Efficiency Rating (PER).

Når Thomas Bilde og Peter Wang kommenterer NBA på DK4/DR3, så refererer de ofte til Player Efficiency Rating, PER (udtales P-E-R). Det er en videreudvikling af tanken om, at vi kan få mere ud af tallene i boxscoren. PER prøver at samle alt det, en spiller bidrager med på banen (point, assists, rebounds, osv) i et enkelt tal. Det er så normaliseret, så ligaens gennemsnit i PER er på 15. De gode spillere ligger omkring 20 og højere i PER.

Kevin Durant fører lige nu ligaen i PER med 30,4 foran LeBron James med 29,8. Det virker jo meget rimeligt. De næste tre er Kevin Love, Anthony Davis og Chris Paul. Alle topspillere på hver deres position. Men PER vurderer også All-Star Center Roy Hibbert til at være gennemsnitlig med en PER på 15,2, nr 121 ud af 277 spillere med mere end 30 kampe og 15 min/kamp.

Så hvad er PER for noget? Den er opfundet af John Hollinger, der arbejdede for ESPN som journalist/analytiker før han blev hyret af Memphis Grizzlies. Hele formlen for PER ser sådan her ud:

Noget af en moppedreng. Vi tager lige et dunk. Den hedder uPER, fordi den skal regnes ud for alle spillere og så normaliseres, så gennemsnittet for ligaen bliver 15. PER udregner, hvor meget en spiller bidrager med for hvert minut, han spiller. Det er per minut for at kunne sammenligne startere og bænkspillere.

De blå termer tæller scoring og assists. Hvis man laver en aflevering, som fører til at modtageren bliver fejlet uden at score, men får to straffekast, så tælles det ingen steder, selvom det er et værdifuldt play. Det bidrag prøver PER at estimere og det er blandt andet det, som komplicerer de blå termer.

I gennemsnit giver en boldbesiddelse 1,06 point i NBA i denne sæson. Det kan man regne ud ved at kigge over alle kampe spillet i sæsonen. Det kaldes Value of Possession (VOP). Hvis en spiller har en turnover, så har han i snit kostet 1,06 point. Hvis han har et steal, så har han skabt 1,06 point. De røde og grønne termer i PER er måder man kan miste eller vinde bolden på og dermed tabe eller vinde 1,06 point. Turnovers, brændte skud, brændte straffekast tæller ned. Offensive/defensive rebounds, steals og blocks tæller op.

Den specifikke sammensætning af vægtene kan diskuteres, men PER er ret godt lavet. Det er også blevet den standard som man måler spillere på i dagens NBA. Det bliver brugt af kommentatorer både på ESPN og DK4 og er på vej ind i den normale fans bevidsthed. Når man diskuterer MVP-kandidater, så kigger man på PER-listen.

Andre Igoudala

Men PER har bestemt også svagheder. Det eneste forsvar som tæller med, er blocks, steals og rebounds. Derfor undervurderer PER kraftigt spillere som primært bidrager defensivt fx Roy Hibbert med en PER på 15,2 eller Andre Iguodala med en PER på 13,3. Chicago Bulls, der er bedst defensivt har kun to spillere på hele holdet over gennemsnittet på 15, Joakim Noah og Taj Gibson.

Dwight Howard og James Harden.

De bedste skud i NBA er frie dunk/lay-ups og treere fra hjørnet, hvor der er kortest fra bag linjen til kurven. Skuddet med det ringeste afkast er en lang toer, allerværst hvis der er en forsvarer lige i dit fjæs.

Kobe Bryant er komplet ligeglad. Undskyld, Suns-fans.

Houston Rockets er et af de hold, som har størst fokus på ”analytics”. Deres angreb er bygget op med et fokus på at tage skud med højt afkast, dvs. at tage bolden til kurven, skyde treere eller blive fejlet. De fører ligaen både trepointsskud og straffekast. Derfor passer James Hardens spillestil perfekt til det, Rockets gerne vil. 66% af James Hardens skud er enten treere eller lige ved kurven. Sammenlign med fx Kobe Bryant, som kun en enkelt sæson i sin karriere har skudt over 50% som treere eller lige ved kurven.

Men Rockets vil gerne presse spillestilen endnu mere. Så derfor eksperimenterer de i D-league (udviklingsliga under NBA) med deres hold Rio Grande Valley Vipers. Vipers spiller afsindigt hurtigt og der findes næsten ikke en dårlig treer for dem. Herunder er et billede af hvordan deres skud fordeler sig, lavet af Kirk Goldsberry fra Grantland:

Det er ret vanvittigt. 47% af alle deres skud er treere. 47%! Houston Rockets fører NBA med 32,5%, så forskellen er enorm. Om det er er det nye NBA, må tiden vise. Vipers har ligget i toppen af D-league de seneste par sæsoner og andelen af treere er generelt stigende i NBA (folk har endda snakket om et firepointsskud), men om udviklingen bliver helt så ekstrem, er ikke til at vide endnu.

Der findes meget mere materiale omkring hvad holdene i NBA gør for at analysere kampe og spillere. Bl.a. er der nu installeret kameraer i alle arenaer, som automatisk kan tracke spillerne og bolden. Det er en guldgrube af data, som på ingen måde bliver udnyttet fuldt ud endnu. Men dette lille indblik var alt, hvad der var plads til i dag. Jeg har også et par link, som jeg synes du skal se på i selskab med en kop kaffe:

ESPN med en god feature om Paul George:

Podcast om dette års draft med én af de absolutte eksperter, Jon Givony.

George Gervin fortæller røvere til Bill Simmons om bl.a. at spille 1-mod-1 mod Dr J. The Iceman er stadig 100x mere cool end dig og mig.

)

Ses!