@Deebo:
Du får lige et hurtigt svar inden, så sengetiden ikke bliver overskredet alt for meget.
Allerførst vil jeg sige, at figuren bygger på et 20-kamps rullende gennemsnit, så Amorims kampe vægter temmelig meget ind - selv efter 19. spillerunde, hvor han blev fyret. Med andre ord var der også temmelig stor fremgang på denne "big chances for and against"-metrik gennem det meste af efteråret, hvor der jo i starten også udtrykkes et efterslæb fra forrige sæson (husk, at hvert datapunkt er et udtryk for gennemsnittet af de seneste 20 kampe).
Alene af den grund vil jeg i udgangspunktet være kritisk over for skarpe konklusioner på den baggrund. Jeg ville gerne se den på en 10 kampes eller 5 kampes rullende gennemsnit, hvor Amorims kampe ikke længere ville vægte med i de seneste kurver.
Er "big chances" en bedre metric at vurdere præstationerne på rullende end xG og kunne vi være blevet snydt af netop xG tallene under Amorim fordi vi ikke kiggede nok på "xG per shot" i stedet? Logikken siger jo at der er større chance for at modstanderen scorer på et enkelt 0,45 xG skud end at United scorer på fire skud med en samlet værdi på lad os sige 0,50 xG fordi den ene chance er større end de fire eller er det forkert antaget?
Den er lidt tricky. Modellen bygger jo på et kæmpestort antal afslutninger, så i det omfang at modellen er nogenlunde præcis, er der i princippet lige så god mulighed for at score ét mål på 0,4 XG, hvad end de 0,4 kommer fra to skud eller otte skud.
Derfor er XG per skud i den forstand ligegyldigt, for de otte skud med genenmsnitligt 0,05 XG per skud betyder jo basalt set, at man scorer på 1 ud af tyve skud. Når man så skyder otte gange, så har man 40 procents chance for at score ét mål. I det andet scenarie med gennemsnitlig 0,20 XG per skud har man med to skud også 40 procents chance for at score ét mål.
Men det er det dog ikke helt ligegyldigt alligevel, hvis man tager med i betragtning, hvad det afspejler, og hvad det oftest vil betyde fremadrettet. Antallet af skud er nemlig noget mere ustabilt, og hvis man har lav XG per skud, introducer man meget mere støj/variabilitet fremadrettet.
Samtidig er en stabil høj XG per skud formentlig et udtryk for en taktisk mere bæredygtig måde at spille sig frem til chancer i stedet for bare at have 10 plaffeministre på banen, så det er mere sandsynligt, at man vil kunne fortsætte konsistent med det.
På samme måde defensivt er en høj XG per skud imod et udtryk for, strukturel defensiv svaghed, mens en høj volumen af lav XG per skud ikke i samme grad formodes at forsætte.
Chat GPT kom med denne analogi, da jeg spurgte den til en god forklaring:
Think of two students with the same total score:
Student A: few questions, mostly correct (high quality)
Student B: many questions, lots of partial credit (low quality)
If exam conditions change:
Student B is more likely to drop off (depends on volume)
Student A’s performance is more robustTanken med analogien (ja, jeg ved godt, at det reelt ikke er en tanke) er, at det er mere bæredygtigt fremadrettet at svare næsten alt rigtigt, end at forlade sig på volumen.
Når Chat GPT ikke forfalder til ellers smarte analogier, skriver den sådan her:
There’s also a formal reason:
xG per shot has lower variance than shot counts
totals (xG) are a product of:
𝑥𝐺=(shots)×(xG per shot)
When two variables multiply:
the more volatile component (shots) introduces more noise
So:
Teams relying on shots rather than quality have less stable underlying processes.Det vil sige, at hvis man vil have et mere komplet billede af Amorim vs Carrick, er XG-XGA en del af billedet, men det er klart nyttigt at kombinere det med XG per shot og XG per shot against, hvilket jeg ikke har tid til at lede efter data til nu.
Men generelt outperformer XG-XGA metrics som big chances, fordi XG jo også fanger big chances (sammen med mindre), men mere præcist (der er forskel på en 0,25 XG og en Califiori 0,99 XG inde på målstregen efter et Bayindir-klovneri). Det betyder, at den er mere præcis end big chances, men at der også følger mere støj fra meget små XG-afslutninger med (og hvorfor det er en metric, der helst skal bruges på større samples).
Så det kan altså give rigtig god mening at se på både XG, XG per skud og big chances både for og imod i sammenhæng, og samtidig bruge øjnene og fortolke med kontekst, hvis ikke det også skulle stå klart fra alt, jeg tidligere har skrevet.
Spørg endelig, hvis du mangler noget i svaret, så svarer jeg på et mindre søvndyssende tidspunkt.