Bettingsider

Expected Goals: xG, Data & Statistikk i Fotball

Data og statistikk har blitt veldig utbredt i fotballverdenen over de siste årene, og i spissen for dette står forventede mål, eller xG. Av xG kan man også utlede forventede antall poeng (eller xPoints).

Data og statistikk i fotball

Etter at bettingselskaper og profesjonelle klubber tidlig tok i bruk xG måltallet, har forventede mål nå blitt et fast innslag hos store, globale kringkastere.

Forventede mål, eller Expected Goals som xG også kalles, har tatt steget opp fra analytikernes bærbare datamaskiner og er nå regelmessig å finne hos både Premier League-managere og TV-eksperter.

Vi ser det også hyppig brukt innenfor Fantasy fotball, der forventede mål og forventede assists er populære begrep å støtte seg til når man skal argumentere for spilleres sjanser til å oppnå målpoeng.

Expected Goals: Hva er xG?

expected goals forklaring

Enkelt forklart er xG en beregning som er utviklet for å måle sannsynligheten for at en bestemt avslutning mot mål, faktisk resulterer i et mål. Dette er da blant annet basert på egenskapene til selve avslutningen og hendelsene som leder opp til den, og den fremkommer som et tall mellom null og én.

Hver avslutning sammenlignes med tusenvis av tidligere avslutninger med lignende egenskaper for å fastslå sannsynligheten for at akkurat denne ene avslutningen vil resultere i et mål.

xG-verdien forteller således mer om lagets prestasjoner, styrken i angrep, forsvar, og til og med enkeltspillere, enn hva selve kampresultatet eller visse andre data forteller.

Generelt om xG

Noen fotballfans ser på denne typen av statistikk som helt ubrukelig, så vi skal her forsøke å forklare hvorfor xG er nyttig, hvilke fordeler og ulemper som finnes, og hvorfor xG i noen situasjoner kanskje ikke er så nyttig.

xG er som miniskjørt. Det gir et hint, en god idé, men avslører ikke det viktigste. xG er med andre ord ubrukelig med mindre man setter det i en kontekst, og har noen som kan analysere tallene.

For å forstå xG, må vi se på fotball som helhet over mange år. Gjennom flere tiår var det bare det endelige resultatet og poengsummer trenere brydde seg om, altså hvorvidt deres lag vant eller tapte. Målet med fotball er alltid å få så mange poeng som mulig, så det er forståelig, men snart innså trenerne at de trengte å vite hvorfor de vant og hvorfor de tapte, og det for å kunne gjøre endringer for fremtiden.

Ballbesittelse ble tidlig en viktig faktor for trenere for å avgjøre hvor godt de spilte, for desto mer et lag har ballen, jo større var sannsynligheten for å score og jo mindre sannsynlig var det at de slapp inn mål.

Og så ble skudd – eller avslutninger mot mål – en faktor, for følelsen var at jo flere avslutninger et lag kom til, desto mer sannsynlig var det at de scoret, og kort tid etter ble avslutninger på mål en suksessfaktor. Men ikke alle avslutninger var like gode, og det er her xG kommer inn.

Vi kan godt tenke oss at to lag spiller mot hverandre, og at lag A har fem avslutninger mot mål og lag B har 10. På papiret ser det ut som om lag B gjorde det bedre, men hvis man tar en titt på et skuddkart, kan man se at lag B hadde alle 10 avslutningene fra 25-30 meter, mens lag A hadde alle fem av sine avslutninger innenfor straffefeltet, og at lag A faktisk hadde de beste sjansene og kanskje fortjente å vinne kampen.

XG er enten man vet det eller ikke, et begrep man allerede har brukt lenge. For hvor mange ganger har man ikke sett laget sitt skape flere store sjanser, og brent dem alle, bare for å se at motstanderen scorer fra 30 meter helt mot slutten. Etter kampen vil man si at det andre laget hadde flaks, og ikke fortjente seieren, for vi burde ha scoret minst tre. Og det er akkurat slikt xG prøver å måle.

Men xG – eller forventede mål – er kanskje en misvisende betegnelse, for hvis man i stedet hadde kalt det for sjansekvalitet, ville det kanskje vært færre klager? For sjansekvalitet er jo nettopp hva xG måler. xG måler kvaliteten på avslutningene for de enkelte spillerne, og det gir et tall mellom null og én for hvor sannsynlig det er at en avslutning vil føre til et mål. 0 er ingen sjanse for mål, mens 1 er et garantert mål.

Beregning av xG

expected goals sannsynligheter

Så hvordan kommer man frem til dette magiske xG-tallet mellom null og én, og hvordan beregnes det?

Tallet beregnes av datamaskiner og en maskinlæringsteknikk, som bruker modeller basert på hundre tusener av avslutninger, og de har sin opprinnelse i historiske data. I tillegg må man legge inn forskjellige variabler som påvirker sannsynligheten for at et mål blir scoret.

Når vi ser på en fotballkamp, kan vi intuitivt se hvilke sjanser som har større eller mindre sannsynlighet for å ende med scoring. Hvor nærme var spilleren målet? Avsluttet de fra en god vinkel? Var det en en-mot-en-situasjon? Eller var det en heading?

Problemet er at det i gjennomsnitt er 25 avslutninger per kamp, og det ville tatt lang tid, selv for de mest veltrente øynene i sporten, å tilordne sannsynligheten for scoring til hver av disse unike situasjonene.

Analyse har vært en del av fotballen i flere tiår, selv om det først nylig har blitt et fullverdig felt med datamaskinenes inntog. xG begynte å utvikle seg på begynnelsen av årtusenet til det det er i dag, og det finnes mange forskjellige modeller som beregner sannsynligheten.

Modellene er hovedsaklig forskjellige når det gjelder antall variabler som tas i betraktning. Noen modeller beregner for eksempel xG forenklet og inneholder ikke nok informasjon. Andre modeller arbeider med en mye større mengde informasjon og variabler, og gir dermed mye mer nøyaktige tall.

For eksempel kan en standard xG-modell som bare tar hensyn til avstanden til mål, vinkelen mot mål, kroppsdel og type assist eller tidligere handling, gi en avslutning en xG-verdi på 0.30. Mer presise modeller a la de som Opta og Statsbomb bruker, legger også til nøkkelinformasjon som målvakten sin posisjon og status, posisjonen til alle angripere og forsvarsspillere i bildet og avslutningens anslagshøyde, for å gi et mer nøyaktig bilde av sjansens kvalitet.

Hvis man for eksempel vet at keeperen var ute av posisjon, kan den samme avslutningen gis en verdi på 0.65 xG. Alternativt kan man ende opp på 0.10 xG dersom avslutning kom mot et «Sean Dyche forsvar» som hadde seks forsvarsspillere mellom ballen og målet.

Fordeler og ulemper med Expected Goals

De største fordelene er at xG forteller oss mer enn selve resultatet ved å vise oss hvem som var nærmest å vinne basert på kvaliteten på sjansene som ble skapt, og det er mer detaljert enn elementer som vanlige avslutninger og mål. I tillegg kan xG hjelpe oss med å analysere spillere mer i dybden ved å eliminere faktorer som flaks fra analysen, samt å vurdere spillernes potensial til å score flere mål.

På den annen side er det noen ulemper med xG. Det første punktet å merke seg er at xG ikke erstatter reelle mål, så fanatikere av forventede mål kan overvurdere betydningen av denne statistikken. Om lag A oppnår en xG på 2.00 mens lag B bare oppnår en xG på 1.00, betyr ikke det at lag A var klart best og skulle ha vunnet 2-1. Det betyr i beste fall at lag A skapte flere sjanser eller sjanser av høyere kvalitet enn lag B, og hadde størst sjanse til å vinne.

Dernest tar ikke statistikken hensyn til spillernes evner. Det betyr at en dyktig angrepsspiller og en sterk midtstopper, begge vil få samme xG dersom de avslutter på samme måte, og fra samme sted. Dette betyr at det er den gjennomsnittlige avslutningen som beregnes, og at avslutningsegenskaper, eller keeperevner for den saks skyld, ikke blir tatt med i beregningen.

En tredje greie er jo at det faktisk må være en avslutning mot mål for at en beregning skal kunne skje. Det det spiller ingen rolle hvor truende et kontringsangrep eller en spillesekvens er, for ballbesittelse og territorium er ikke inkludert i xG. Man har sett fantastiske kontringer som til slutt kan ende med et innlegg som den angripende spilleren så vidt ikke nådde, kanskje bare med en millimeter, foran tilnærmet åpent mål.

I så fall regnes det ikke som en sjanse, til tross for at det svært sannsynlig ville vært mål dersom ballen hadde kommet en cm lengre ut. Hvis det ikke er en avlutning på slutten av angrepet, vil det ikke telle med i xG.

En annen ulempe med xG er at tallet ikke sier noe om kamptilstanden. Med det menes at et lag kan ta en ledelse i første omgang og ha god kontroll, for deretter å bestemme seg for å forsvare ledelsen. Dette kan få motstanderen til å akkumulere opp mange avslutninger, kanskje med lav xG verdi, og på slutten av kampen kan det se ut som det vinnende laget var heldige når det faktisk kan ha vært et fornuftig valg av taktikk.

Generelt for et lag som leder i lengre perioder av kamper, kan deres xG se dårligere ut enn for et lag som ligger under i lengre perioder. Dette skyldes at det er opp til laget som ligger under til å presse på for å score enn laget som er fornøyd med å holde ledelsen, som da ofte trekker seg lengre tilbake og tillater flere avslutningsmuligheter som et resultat av dette.

Det er viktig å se på hvor de forventede målene kommer fra, og spesielt hvis det er straffer i kampen, ettersom de blåser opp xG tallet. Straffespark er den mest konsekvente avslutningen i fotball, og tildeles en statisk verdi på 0.78 – 0.79 xG av de fleste av modellene. Fra et spillperspektiv kan det derfor være nyttig å se på xG i åpent spill eller xG uten straffespark for å unngå at dataene blir skjeve.

Kontekst er alt, og xG scoren i en kamp kan eksempelvis ende 2.18 – 0.75. Men hvis laget med 2,18 xGF hadde to straffespark i kampen, som da er 1.78 xG, genererte de bare 0.40 xG bortsett fra disse to hendelsene, og xG-scoren ville ha vært misvisende med tanke på dominans i kampen dersom man ikke hadde visst om straffesparkene… for laget med 0.75 hadde jo høyest xG score fra åpent spill.

Fra forventede mål til forventede poeng – xPoints

Ved å være i besittelse av et lags xGF og xGA betyr det at vi kan beregne deres forventede antall poeng – xPoints.

Ved å beregne xPoints kan man få bedre innsikt i et lags prestasjoner over flere kamper enn ved bare å se på xG-differansene.

Man kan lage en xPoints-tabell – noen ganger kalt en “rettferdighetstabell” – for å se hvor mange poeng hvert lag kunne forventet å ha fått, basert på deres akkumulerte xG i hver kamp de har spilt.

Den beste metoden for å beregne xPoints er trolig å bruke en Monte Carlo-simulering basert på de forventede målene for å bestemme sannsynligheten for antall scorede mål, sannsynligheten for at ulike målforskjeller inntreffer, og også de forventede poengene for en kamp. Dette kan gjøres i Excel.

Men det ikke er den raskeste metoden, så i stedet kan man bruke en metode som er basert på resultatene fra tidligere kamper med lignende xG-differanser. Dette er ikke en perfekt erstatning for å gjøre en fullstendig simulering av en kamp, men i løpet av en sesong fungerer det ganske bra:

xG Differanse xPoints
1.5+ 2.7
1.5 < 1.0 2.3
1.0 < 0.5 2.0
0.5 < 0.0 1.5
0.0 < -0.5 0.7
-0.5 < -1.0 0.3
< -1.50 0.1

Forventede poeng kan så sammenlignes med faktisk oppnådde poeng, og dersom man på et tidspunkt utover i sesongen finner store avvik, er dette noe man bør se nærmere på. Man kan gjerne lage en slikt tabell etter 8, 10 eller 12 kamper, for å se hva status er da. Har et lag bare tatt 10 poeng etter 10 kamper, mens Xpoints antyder 16 poeng, kan det være verdt å finne ut av forskjellen.

Hva kan verdiene brukes til?

Ettersom xG gjør det mulig for oss å se utover nåværende resultater for å få et bedre inntrykk av den underliggende kvaliteten til både lag og spillere, kan xG også brukes i veddemål.

Ved hjelp av xG kan man oppdage unaturlige forskjeller i forhold til de faktiske resultatene, noe som kan være nyttig for å forutsi fremtidige resultater. Et lag som på kort sikt presterer bedre eller dårligere enn forventede antall mål, vil sannsynligvis snart nærme seg gjennomsnittet.

De siste årene har bookmakernes odds blitt mer xG-baserte, og måltallet er til en viss grad tatt med i oddsene de legger ut. Dette har gjort det vanskeligere å finne verdi ved hjelp av xG, men det er fortsatt noe som er verdt å vurdere før man plasserer et spill, ettersom det kan hjelpe til med å få en bedre forståelse av et lags prestasjonsnivå, både i det siste og på lang sikt. Men likevel er det jo summen av alle spill som mottas hos bookmakerne som bestemmer hvor oddsen ender til slutt, som da er det viktigste.

Laganalyse

xGF og xGA etter at en kamp er over, er noe som kan gi oss en mer nøyaktig fremstilling av kvaliteten på sjansene et lag skapte eller slapp til. Dette er spesielt nyttig i en idrett med få scoringer – som fotball – ettersom resultatet ikke alltid er en indikator på prestasjonen.

xG kan brukes til å få et bedre inntrykk av den underliggende lagkvaliteten utover de nåværende resultatene, og fremheve lag som over- eller underpresterer sine forventede tall, og der resultatene snart kan begynne å endre seg.

Hvis vi setter dette i sammenheng med spill på fotball, kan vi bruke xGF til å vise oss hvilke lag som skaper flest kvalitetssjanser. I Premier League er det ingen overraskelse at Man City ligger helt der oppe på denne statistikken, men det var Liverpool som genererte den høyeste xG forrige sesong med 94.79, og scoret 86 mål. Man City fikk overtaket på Liverpool ved å overgå deres xG på 89,55 og score 96 mål, noe som indikerer at Man City var mer kliniske foran mål. Disse tallene er forresten hentet fra Understat:

https://understat.com/league/EPL

Vi kan også se på lag som underpresterer sin xG, og her var Everton den største synderen i forrige sesong med en xG på 60.75, mens de bare scoret 40 mål. Dette tyder på at avslutningene deres var dårlige generelt. I forhold til xG-algoritmen scoret de nesten 21 mål mindre enn om avslutningene hadde vært gjennomsnittlige. Men det var forrige sesong…

Spilleranalyse

xG brukes ikke bare til å måle et lags produksjon, fordi hvert skudd registreres og genererer en xG for spesifikke spillere som kan ha en reell verdi i visse markeder, for eksempel Anytime målscorer. En individuell spillers xG vil være summen av xG-verdiene for avslutningene spilleren hadde i kampen.

xGF og xGA forteller oss også mye om spillere, spesielt spisser og målvakter. Et lag som har en høy xGA, men som ikke slipper inn mange mål, kan være en indikator på en solid keeper, slik som Man Utd, som tillot en xGA på 74.76, men bare slapp inn 58 mål. Dette kan indikerer at Andre Onana var en veldig travel keeper, noe som støttes av hans 3.9 redninger per kamp, noe som var den fjerde høyeste i Premier League forrige sesong.

Newcastle skapte flest store sjanser i Premier League forrige sesong med 134, og de genererte en xG på 84.48 og scoret 85 mål. Med vissheten om at de skaper sjanser av høy kvalitet med jevne mellomrom og at de har en spiss i Alexander Isak hvis målproduksjon var tett på xG med 22.07 mot 21 mål scoret, er han en person man kan se på som en Aytime målscorer.

Hvis man ønsker å satse penger på en Anytime målscorer, er det også nyttig å vite om vedkommende har kommet til målsjanser av høy kvalitet i det siste eller ikke. Som man ser vil xG vil gi et innblikk i det.

xG kan også brukes til å avgjøre når en spiller er inne i en god eller dårlig periode foran mål, mens gjennomsnittlig skuddkvalitet (xG/skudd) kan brukes til å se på om en spiller avslutter bra eller dårlig.

Oppsummert

Det er viktig å være klar over at alle xG-data er basert på modeller og tilnærminger, og det vil være en feilslutning å tro at xG representerer hele historien om en kamp. I beste fall presenterer xG én historie om kampen. Ulike modeller vil gi ulike resultater, så det er viktig å ta hensyn til dette når man skal gjøre seg opp en mening om et lags prestasjoner og hvorvidt de fortjente å vinne eller ikke.

Gjennomsnittet av ulike modeller vil sannsynligvis gi en bedre oversikt enn om man bruker én modell alene. Selv om xGF og xGA ernyttig statistikk, er det viktig å ikke ta alt for god fisk, og bruke andre statistikker sammen med dem for å få mest mulig ut av beregningen for å velge vinnende spill.

xG er fortsatt er under utvikling og vil bare bli mer nøyaktig med mer tid og testing, og det er også viktig ikke å ignorere konteksten vi finner i xGF og xGA, og også vurdere spillestilen til lag og kvaliteten på individuelle spillere når man vurderer bruken av xG i sine spillvalg.

Author image

Halvor Kristiansen

Skribent og eksperttipser
133 Innlegg

Det er fortrinnsvis fotball som er min lidenskap innenfor sport, og jeg har lang erfaring fra spillbransjen innenfor den genren. Først som spiller/tipper og ganske mange år senere på andre siden av bordet, som bookmaker, der jeg selv kalkulerte odds.

Ekspert på: Oddstips Dataanalyse Oddssetning