Milessons blogg
Landslag

World Games

1997 tog Sverige guld i Lahtis när innebandyn var uppvisningssport i World Games. 20 år senare står innebandyn återigen på World Games-menyn, denna gång som officiell medaljgren. Vinner Sverige igen?

En del av försnacket har handlat om det faktum att innebandyn inte kommer att spelas med innebandyregler i helgen. Från början var det till och med så att planen skulle vara en aning mindre än normalt, men det problemet har arrangörerna lyckats lösa. Väl det. Kvar är kortare speltid (3×15) och rejält bantade trupper (12+2 spelare). Jag tycker inte om det alls. Men så är jag otroligt gubbgrinigt lagd. Jag gillar inte att en extern instans går in och strömlinjeformar min sport för att passa i ett schema.

Tycker dock inte att det är så störande att det tar ut glädjen över att innebandyn äntligen fått ett erkännande av den olympiska familjen. Nu delar innebandyn visserligen scen med andra marginalidrotter som fensim, livräddning och korfball, men nog är det bättre än att vara utanför den gemenskapen som rossallhockey, armbrytning och i stort sett alla grenar i Nude Olympics är. Det är en bra start.

Jag kan ju inte hålla mig ifrån att prata Elo så jag måste tippa utgången av turneringen. Elo tippar ett par skillnader mot den officiella världsrankingen. Enligt Elo är Sverige, trots silvret i senaste VM, fortfarande rankat som bäst i världen. Dessutom är hemmafördelen tillräcklig för att Polen ska gå om USA.  Elo förutspår följande sluttabell (med officiella rankingen inom parentesen):

  1. Sverige (2)
  2. Finland (1)
  3. Schweiz (3)
  4. Tjeckien (4)
  5. Polen (6)
  6. USA (5)

Vinstchansen för respektive lag i gruppspelsmatcherna ses nedan:

wg_group

Känns som att det ska mycket till för att något lag ska skrälla i gruppspelet. För den riktigt nördige kan en omvandla procenten ovan till vinstmarginal (hänsyn tas till kortare speltid):

  • Finland slår Tjeckien med 6 mål
  • Schweiz slår USA med 10 mål
  • Finland slår Polen med 12 mål
  • Sverige slår USA med 14 mål
  • Tjeckien slår Polen med 8 mål
  • Sverige slår Schweiz med 6 mål

Känns inte helt och hållet rimligt, men vi får se hur det står sig. Det var allt jag tänkte ta idag. Har ju trots allt semester. Följ mig på twitter för fler och mer frekventa uppdateringar under helgen!

Joel Milesson

Smålänning i exil bosatt i Värmland med förkärlek för polsk dödsmetall, asiatisk mat och svenska fjäll. Tvärkulturell übernörd med för många intressen. Twitter: @Joel_Milesson

Kommentarer

Du är personligt ansvarig för innehållet i din kommentar.

Nästa artikel

Milessons blogg
Landslag

Världsrankingen står på egna ben

Somliga är garanterat trötta på det jävla tjatet men er struntar jag högeligen i för idag ska vi prata världsranking. Igen.

För igår kom det sig nämligen att jag äntligen gnetat mig igenom alla 1236 officiella damlandskamper som någonsin spelats. Lägg därtill 1764 herrlandskamper och det har blivit några timmar framför ett grårandigt exceldokument och ytterligare några där jag medelst en bulig panna försökt rätta till knölarna i väggen. Förutom allt det jobbiga har det varit ganska roligt. Jag menar, jag trodde aldrig att jag skulle längta efter en innebandymatch mellan Kina och Indien men så är nu fallet. Antar att jag blev galen på kuppen.

Men! Nu är jag i fas och världsrankingen är någorlunda redo att kastas ut ur boet för sina första knackliga steg längs internets brutala röda matta. Har byggt en hemsida dedikerad världsrankingen som jag kommer uppdatera med jämna mellanrum. Den hittar du här. Här på bloggen kommer jag att snacka lite mer om vissa saker som inte riktigt syns och analysera vad som händer och förklara lite varför. Som exempelvis att jag med hjälp av världsrankingen inte bara kan ta fram sannolikheten för ett lag att vinna utan också kan gissa slutresultatet.

För att ta ett exempel kan vi titta på Sveriges matcher i VM 2015 och sedan har jag slängt med Tyskland – Polen för att se vad som händer när en underdog vinner.

eloexempel2

Den förväntade målskillnaden beräknas i nuläget med en simpel formel och träffsäkerheten kan definitivt bli bättre, kommer att bli bättre, men den kommer nog aldrig bli så träffsäker att det blir ett verktyg för betting. Det är trots allt idrott. Ibland, som i matchen mot Tjeckien, är Sverige odödliga och vinner med femton bollar. Ibland, som i matchen mot Lettland, när tändningen kanske inte är helt på top går det inte riktigt lika enkelt. Fördelen med detta är att det också avspeglar sig i de poäng som matchen genererar. Detta blir extra tydligt i matchen mellan Tyskland och Polen där Tyskland, det sämre rankade laget, vann med tre mål trots att modellen förutspådde en tvåmålsseger för Polen. Tyskland kunde då casha in mer poäng än Sverige gjorde under hela mästerskapet.

Detta kan först låta lite märkligt men det är just denna funktion som gör rankingen levande. Det är de oväntade resultaten som driver förändringarna, precis som det ska vara. Poängfördelningen mellan nationerna kommer bli normalfördelad runt 1500. Alltså kommer merparten av nationerna ha en poäng som ligger mer eller mindre nära medel, och bara ett fåtal kommer ha en mycket högre eller mycket lägre poäng än det. Ju fler länder som är med i rankingen desto tydligare kommer det att bli, och ju fler matcher länderna spelar desto mer precis blir rankingen. Idag är träffsäkerheten ungefär 70,5 % för både herr- och damlandskamper. Och trenden är på väg uppåt. Speciellt viktigt är matcher mellan länder från olika världsdelar för att jämna ut diskrepansen mellan olika delar i innebandysfären.

Vi kan ju ta och titta på världsrankingarna med detta system (klicka på bilderna för att förstora):

En sak som ställer till lite besvär är nya nationers första 5-15 matcher. På grund av att alla lag initialt börjar på 1500 tar det några matcher innan de stabiliserat sig på rätt nivå. Hur många matcher beror lite på motståndet man möter. Säg till exempel att Kina skulle möta Sverige och förlora med 50 mål i sin första match. Det hade på grund av Sverige är 800 poäng högre rankat ändå inte gett ett särskilt stort utslag. Men om Kina hade förlorat mot Filippinerna, som skulle vara sämre rankat än Kina, med sju mål hade poängväxlingen blivit större och därmed hade Kina efter matchen hamnat närmre sin verkliga nivå. Jag förutsätter kallt att Kina idag är ett av världens sämsta innebandylandslag, förlåt Kina, men upp till bevis i AOFC Cup om ett par veckor. Filippinerna hade fått en ganska rejäl skjuts uppåt och fått poäng som man inte riktigt var värda.

Detta är precis vad som hänt med Singapore i damrankingen. De har mött många nya landslag och därmed fått många gratispoäng. Detta hände också Polen på damsidan (som faktiskt var rankade fyra ett tag) och Spanien på herrsidan (rankade sjua som bäst) men som ni kan se har det ordnat till sig.

Nu kommer jag börja ranka alla herrlag som spelat i högstaligan från 1989 till nutid. I runda slängar 4000 matcher. Fler bulor på väggen att räta ut. Till dess kan du kolla in elofloorball.wordpress.com så blir jag nöjd och glad.

Vilket är historiens starkaste lag? Jag lovar att återkomma med svaret!

Glad midsommar.

Joel Milesson

Smålänning i exil bosatt i Värmland med förkärlek för polsk dödsmetall, asiatisk mat och svenska fjäll. Tvärkulturell übernörd med för många intressen. Twitter: @Joel_Milesson

Kommentarer

Du är personligt ansvarig för innehållet i din kommentar.

Nästa artikel

Milessons blogg
Landslag

Landslagsranking: April 2017

Här följer en kortare redogörelse för innebandylandskamper spelade i april och vad resultaten i dessa matcher har inneburit för min inofficiella världsranking.

17-04

Förutom nyss avslutade Euro Floorball Tour har endast två landskamper rapporterats in under april; Dubbelmöte mellan Holland och Frankrike i Utrecht, Holland.

Första matchen slutade med uddamålsseger för hemmalaget vilket gjorde att man gick om Malaysia till en 34:e plats. Dagen efter var det däremot Frankrike som drog det längsta strået vilket petade ner Holland till 35:e plats igen. Frankrike gick i sin tur förbi Nya Zeeland och skuggar därmed Holland på en 36:e plats. Det ska dock sägas att Nya Zeeland endast har spelat 12 landskamper och förlorat alla. De är därmed med största sannolikhet övervärderade just nu och lär fortsätta neråt i rankingen så just det är väl inget direkt ögonbrynshöjande.

Så över till EFT. Eftersom det är en turnering har hemmafördelen slopats, dessutom är faktorn för turneringsmatcher större än för träningsmatcher vilket ger fler poäng vid vinst (Hur systemet fungerar kan du läsa om här). Genomgående vann favoriterna vilket betyder att det inte blev några förändringar i toppen av världsrankingen. Sverige drog ifrån övriga lag och spelade in hela 25,0 poäng, och man börjar med det närma sig sin egen rekordnotering på 2312,5 poäng som man hade efter segern mot Schweiz i förra VM-semifinalen.

Alla andra lag förlorade poäng under EFT. Tjeckien tappade mest med sina -17,6 poäng och ligger i skrivande stund på 1902,5 poäng vilket är Tjeckiens sämsta notering på tre år. Schweiz förlorade 2,7 poäng men eftersom man gick in i turneringen med sin högsta poäng någonsin har man fortfarande en fin siffra. Regerande världsmästarna Finland förlorade 4,7 poäng och har med det backat 15 poäng sedan VM-finalen.

Totalt slutade sju av åtta matcher med seger för det lag som var högre rankat. Den enda matchen där ett sämre rankat lag vann var i Frankrikes seger mot Holland.

Joel Milesson

Smålänning i exil bosatt i Värmland med förkärlek för polsk dödsmetall, asiatisk mat och svenska fjäll. Tvärkulturell übernörd med för många intressen. Twitter: @Joel_Milesson

Kommentarer

Du är personligt ansvarig för innehållet i din kommentar.

Nästa artikel

Milessons blogg
Landslag

Världsrankingen på djupet

Eftersom responsen på Elo-rankingsystemet varit helt fantastisk och folk vill veta mer om själva beräkningarna tänkte jag gå igenom det lite mer på djupet i det här inlägget där jag pratar om Elo-modellens fina sidor och sedan avslutar jag med ett efterlängtat (?) komplett räkneexempel genom att titta på en fiktiv match mellan Slovakien och Lettland. 

Detta inlägg är alltså en uppföljning till mitt försök att skapa ett nytt system för att ranka innebandylandslag. Du hittar det inlägget här. En uppmärksam läsare (tack Line!) kunde notera att ett fel letat sig in i Ekvation 2 som jag nu åtgärdat.  Den beräknade givetvis Pp (som i prediktion) och inte Ph (som i hemmalag) som jag skrivit tidigare. Jag inser också vid en ny titt att mina beteckningar kunde valts med lite större omsorg för att vara lite mer logiska så därför tänkte jag revidera dessa för att inte krångla till det i onödan. Försök glöm det jag skrev då och så tar vi nya tag idag. Mycket nya beteckningar jämfört med första versionen alltså. Nedan följer all nomenklatur som används, och vilken funktion dessa har gås igenom efter hand de används.

Nomenklatur

  • α är en faktor för autokorrelation.
  • D är måldifferensen ur hemmalagets synvinkel
  • Ea är bortalagets Elo-poäng, inför matchen.
  • Eh är hemmalagets Elo-poäng, inför matchen.
  • En är den nya Elo-poängen, efter matchen.
  • Eo är den gamla Elo-poängen, inför matchen.
  • G är justering för måldifferensen.
  • H är en justering för hemmaplansfördel, 35.
  • K är en viktningsfaktor för matchens betydelse.
  • Rh är matchens utfall ifrån hemmalagets synvinkel.
  • Rp är matchens förmodade utfall ur hemmalagets synvinkel.

Matematisk beskrivning av modellen

Elo-systemet tar det tidigare värdet hos båda lagen och ändrar sedan dessa efter matchen beroende på resultatet i densamma enligt Ekvation 1:

ekvation1

Den beräknar hemmalagets nya Elo-poäng, En, genom att ta lagets Elo-poäng innan matchen, Eo, och sedan lägga på förändringen efter matchen, som alltså beror på saker som hur väntat resultatet, är, Rh-Rp, vilken typ av match det är, K, samt hur stor måldifferensen blev, G. Om laget inte spelat någon match än och därmed inte har något Eo används ett initialvärde. Här finns det två skolor.

Antingen får alla länder samma initialvärde och litar på att modellen fixar till eventuella fel. Fördelen med detta är att vi får ett konstant medelvärde. Om alla länder börjar på 1500 (vilket verkar vara praxis i Elo-kretsar) kommer medelvärdet för alla lag vara 1500 eftersom lagen tar poäng ifrån varandra i ett ”nollsumme-spel”, där vinnaren tar lika mycket som förloraren förlorar. Detta är ju trevligt då det är lätt att göra uppskattningar, och lätt att se hur bra ett lag är jämfört med alla andra. Nackdelen med att göra på detta sätt är ju att ett lag kan gå in på en nivå som är långt ifrån deras verkliga vilket gör att deras tidiga matcher kommer generera en missvisande poängsumma.

Det andra sättet är att ge länderna ett mer eller mindre godtyckligt initialvärde. Eventuellt kan man titta på lagets första tio matcher och sedan efterjustera för att pricka en nivå som ligger mer i linje med deras verkliga. På detta sätt kommer man ju omkring problemet med felaktiga resultat i början, men förlorar det stabila medelvärdet. Jag har gjort försök med båda och inte riktigt bestämt mig för hur jag ska göra. Det resultat jag redovisade igår var baserat på varierande initialvärden.

Rh redovisas i Tabell 1 nedan.

tabell1

Sannolikheten för hemmaseger, Rp, beräknas med Ekvation 2.

H används i nuläget endast i träningslandskamper då modellen inte har något sätt att ta hänsyn till matcher på neutral mark (en sak som går att implementera relativt enkelt men som innebär en oerhört tidskrävande process att gå igenom samtliga 1721 landskamper och peta in ett värde. Det ska göras, men finns saker som går före i kön just nu). I träningslandskamper vinner hemmalaget i 55 % av fallen. 35 poäng läggs därför på hemmalagets Elo-poäng vilket innebär 5 % större sannolikhet för hemmaseger. Två jämnbra nationer som har 50/50 på neutral mark kommer alltså att ha 55/45 då matchen spelas i någon av länderna. I Figur 1 ses hur sannolikheten för vinst beror av skillnaden i Elo-poäng.

sannolikhet-for-vinst

Faktorn som viktar matchens betydelse, K, kan egentligen tänkas bestå av två delar. Dels den som syns i Tabell 2 här nedan. Där ser vi alltså viktningsförhållandet som ska göra skillnad på match och match. Ett sömnigt dubbelmöte mot Norge i mars ska helt enkelt inte spela lika stor roll i rankingen som en semifinalseger. Hur det här inbördes förhållandet ska se ut är inte hugget i sten i nuläget, men nedanstående duger gott än så länge. Jag har sett 20 användas för fotboll och basket, 8 för ishockey och 4 för baseboll.

tabell2

Men sedan finns där en osynlig komponent som styr hur trögt systemet i sin helhet är. Höga K-värden medför att ”minnet” är kort, vilket alltså betyder att nya matcher ger stort utslag. Höga K-värden är alltså ett sätt att säga att det finns mycket information att hämta i en match. Låga K-värden betyder såklart det motsatta; att den enskilda matchen inte spelar så stor roll, vilket gör att det är långsiktiga trender som är viktiga. Jämför  fotboll med baseboll och du ser att det finns mycket mer information i en fotbollsmatch än en basebollmatch. Att dessa värden hamnar på rätt nivå är såklart oerhört viktigt för om K-värdet är för högt kommer modellen att bli explosiv och ostadig, men om K-värdet är för lågt blir modellen för långsam och hinner inte plocka upp mer eller mindre tillfälliga formtoppar. Experimentering med K-värdet kommer definitivt vara en av de saker jag tittar på i framtiden.

Sedan har vi den sista komponenten i Ekvation 1: Justeringen för måldifferens, G, som kan ses i Ekvation 3.

ekvation3

Denna faktor används för göra skillnad på en 1-0 seger och en 10-0 seger och också jämföra med det förväntade resultatet. Skillnaden mellan den verkliga måldifferensen och den förväntade måldifferensen (ungefär 3,2 mål per 100 Elo-poäng skillnad) logaritmeras för att lite ta udden ur de matcher som rinner iväg. Det ska helt enkelt vara viktigare att gå från 3-2 till 4-2 än från 13-2 till 14-2. Om G understiger 1 kommer den ändå sättas till 1.

Det är enklare att se hur det fungerar i Figur 2 nedan.

Om det lag som vinner har 100 Elo-poäng än motståndaren (Plus 100) innan matchen och vinstmarginalen är fyra mål medför det att G blir i runda slängar 1,6. Men om laget som vinner istället har 100 mindre än motståndarna (Minus 100) blir G ungefär 1,9. Vi kan också se att faktorn för måldifferens verkar enligt principen ”diminishing returns”. För att på något sätt ta i beaktande att innebandymatcher har en tendens att rinna iväg målmässigt är G konstruerad så att den inte blir 10 gånger större om ett lag vinner med 10 mål jämfört med 1 mål. Snarare blir den ungefär dubbelt så stor, exakt hur mycket beror på skillnaden i Elo-rank. Det kommer dock aldrig vara någon skillnad på 3-0 och 19-16 eftersom differensen är densamma.

Exempel: Träningsmatch Slovakien – Lettland, 4-5

Exempelmatchen spelas mellan Slovakien och Lettland, där Slovakien står som hemmalag. Eär den ingående Elo-poängen, vilken är 1491 för Slovakien och 1620 för Lettland. Skillnaden mellan lagen är 129 poäng. Eftersom matchen är en träningsmatch där Slovakien är hemmalag får Slovakien en hemmalagsbonus på 35 poäng och står därmed på 1526 poäng. Då är skillnaden 94 poäng.

När jag räknar utgår jag alltid från hemmalaget. Och när jag räknat ut hemmalagets En är det bara att dra bort samma siffra för att få bortalagets En eftersom det alltid är så att lagen tar poäng ifrån varandra. Det blir således aldrig mer poäng i omlopp, snittet är konstant.

e2

Först räknas Rp ut enligt ekvation 2. Detta betyder alltså att Slovakien väntas vinna med 37 % sannolikhet om man spelar träningslandskamp mot Lettland. Om de båda möts i ett mästerskap är sannolikheten istället 32 %.

Vi använder ekvation 3 för att ta fram G.

e3

Då har vi allt för att peta in i Ekvation 1.  Rh hämtas från Tabell 1 och eftersom Slovakien (hemmalaget) förlorade är Rh = 0. K hämtas från Tabell 2 och eftersom det är en träningsmatch är K = 10.

e1

Slovakien får alltså en Elo-poäng på 1486 efter matchen, en minskning med 5 poäng. Lettland, som började på 1620 poäng får således 1625 efter matchen.

På samma sätt kan man räkna ut att om Slovakien vunnit med 5-4 hade man tagit 11 poäng av Lettland och stått på 1502 efter matchen medan Lettland skulle stå på 1609, detta eftersom att en seger är mer värd för det sämre rankade laget. Om Slovakien istället vunnit med 5-4 i ett VM hade man knyckt hela 52 poäng av Lettland, medan det varit 26 om det varit i en turnering. Om en turneringsmatch slutat lika hade Slovakien, som är det sämst rankade laget, tagit 6 poäng av Lettland. Det är just att Elo-ranken är så organisk som är dess storhet och det som gör att lagens poäng automatiskt kommer att gå mot deras verkliga nivå. Det handlar bara om att ta fram rätt faktorer för att få så precist resultat som möjligt.


Utvecklingen pågår, och tips mottages tacksamt, gärna på twitter eller på mail. Det går också bra att kommentera här nedan om du har några frågor, jag ska göra mitt bästa för att svara på dem. Innebandyns statistikrevolution har börjat!


 

Joel Milesson

Smålänning i exil bosatt i Värmland med förkärlek för polsk dödsmetall, asiatisk mat och svenska fjäll. Tvärkulturell übernörd med för många intressen. Twitter: @Joel_Milesson

Kommentarer

Du är personligt ansvarig för innehållet i din kommentar.

Nästa artikel

Milessons blogg
Landslag

Världsranking 2.0

Okej, det är väl lika bra att skicka med en disclaimer med detta blogginlägg. Det kommer nämligen innehålla mer matematik och ungerska schackmästare än innebandy. Jag har nämligen roat mig med att analysera 1721 landskamper och knåpat ihop ett världsrankingsystem som jag vågar påstå är rejält mycket mer användbart än det som används idag. Med en diger mängd felsök och tester kan det bli riktigt intressant. Ett inlägg för statistikfetischisten helt klart.

Eftersom vi lever i popcorn-hjärnans era och dagens ungdom inte gärna läser saker över 140 tecken och dessutom inte är sådär jätteglada i naturkunskap överlag har jag fixat en liten länklista som leder till artikelns olika kapitel. Så slipper du som skyr ekvationer som pesten blunda när du scrollar. För the long story är det bara att bläddra neråt.

Vill också be om ursäkt till Albin Skur som fått utstå mången virriga meddelanden i inkorgen under arbetets gång. F’låt Hunkbin.

Bakgrund

Tanken att göra detta har funnits ett tag, men det var först när jag kollade upp världsrankingen inför VM 2016 som jag bestämde mig. I huvudsak går det att sammanfatta min motivation i en enda mening:

The IFF Rankings are based on the standings of the two previous WFC´s

Jäklar tänkte jag. Det är ju inte ens dåligt. Ren jävla lättja. Alla matcher utanför VM och VM-kval spelar således ingen som helst roll. Egentligen spelar inte heller matcherna någon roll då det enda som är viktigt är placeringen. Det är också helt omöjligt att sätta en siffra på hur mycket bättre ett lag är än ett annat. Det enda man kan utläsa av rankingen är exempelvis att Sverige för nuvarande är tre placeringar bättre än Danmark, vilket råkar vara lika mycket som USA har ner till Polen. Men jag vill påstå att det är förbannat många gånger mer sannolikt att Polen slår USA än att Danmark slår Sverige.

Så jag började fundera på hur det skulle gå att skapa ett bättre system för världsranking, som tog hänsyn till alla matcher men också kunde beskriva förhållandet mellan nummer 21 och 22 på listan på ett mer uttömmande vis än att det skiljer en placering på världsrankingen.

Och ganska snart snubblade jag över en herre som föddes i en stad som heter något så fantastiskt som Egyházaskesző.

Det ligger i nuvarande Ungern, och herren ifråga hette Élő Árpád Imre. Inte helt lätt att uttala det heller, men efter att han flyttat till USA som tioåring blev han något mindre tungvrickande Arpad Emmerich Elo. Han var professor i fysik på Marquette Universtity, och dessutom mästare på schack. Han gick lite i samma tankar som jag; hur ska man göra för att förbättra det befintliga rankingsystemet. Skillnaden mot mig är bland mycket annat att han har en professur i fysik, medan jag bara är en wannabe. Han fick saker gjorda. Och jag känner inte att jag behöver uppfinna hjulet igen. Så eftersom att hans rankingsystem fortfarande 60 år efter införandet används för att ranka schackspelare testade jag att anpassa det till internationell innebandy.

Grundläggande princip

Förenklat kan man säga att det är ett poängsystem där vinnaren tar poäng av förloraren. Alltså, varje spelare har en poäng, en Elo-rank. Magnus Carlsen har exempelvis 2840 i skrivande stund. När två spelare möts, exempelvis nyss nämnde Carlsen och hans närmaste utmanare, den gode Fabiano Caruana med sina 2823 poäng, ställs deras poäng mot varandra. Spelaren som vinner tar poäng av sin motståndare, men hur mycket beror på skillnaden i Elo-rank.

Eftersom Carlsen har högre poäng än Caruana ses det som mer sannolikt att det är han som kommer gå segrande ur partiet och att han slår Caruana är inte en lika stor bedrift som om Caruana slår Carlsen, och därmed ger en seger för Carlsen ett mindre antal poäng än vad Caruana fått om han hade vunnit. Blir det istället Remi (lika) tar den lägre rankade spelaren en liten summa från den med högre rank, men inte alls lika mycket som om spelaren istället hade vunnit. Hade Carlsen vunnit mot mig hade han inte fått några poäng alls, men hade jag slagit Carlsen hade jag fått en jäkla massa. Är du med?

Det fina med en sådan modell är att den är självutjämnande. En övervärderad spelare kommer åka på stora poängtapp och snabbt sjunka i rank, medan en undervärderad spelare kommer vinna stora poängsegrar och stiga i rank. Tills de har nått sin verkliga nivå. Precis som med alla statistiska modeller blir noggrannheten bättre och bättre ju mer data man petar in.

Detta system har anpassats till olika lagsporter tidigare, som exempelvis basket, baseball och fotboll, men med vissa modifikationer. Jag har lånat vissa bitar här och var för att försöka få till en algoritm som passar innebandyn så bra som möjligt. Jag vill dock igen rejält understryka att jag inte förtjänar någon som helst kredd för principen, det enda jag gjort är att mejsla fram en modell som fungerar någorlunda väl för innebandy.

Matematisk modell

OBS! Den matematiska modellen har modifierats något sedan den som beskrivs här nedan. Här kan du läsa om den nuvarande versionen.

Grunden vilar stadigt på den som Arpad Elo byggt, vilken i sin tur bygger på sannolikhetslärans fördärvade vanvett. Jag är inte så vidare värst hemma i det fältet ska erkännas, men jag ska försöka guida dig så gott jag kan genom den matematik som min modell bygger på.

Allt utgår från nedanstående, förhållandevis enkla, ekvation (som vi kan kalla för Ekvation 1). Denna beräknas efter varje match som nationen spelar för att få fram en ny Elo-rank.

r3

Där:

  • Rn är nationens nya rankingpoäng
  • Ro är nationens gamla rankingpoäng
  • Ph är det faktiska utfallet av matchen ur hemmalagets synvinkel
  • Pp är det förväntade utfallet av matchen ur hemmalagets synvinkel
  • F är en viktningsfaktor

Rn är alltså summan av den gamla rankingpoängen plus förändringen efter matchen, det vill säga differensen mellan faktiskt och förväntat utfall multiplicerat med viktningsfaktorn. Ro är således samma sak som lagets Rn efter deras förra match. Ro för respektive nations första match sätts i nuläget relativt godtyckligt.

Sverige och Finland börjar på en Elo-rank på 1700 medan Schweiz, Tjeckien, Norge och Danmark börjar på 1500. Georgien och Kroatien börjar på 1200 medan Indien och Iran börjar på 1000. Det enda som styr detta initiala värde är min magkänsla. Det är dock mycket enkelt att ändra detta värde till något som ligger närmre det verkliga värdet, men jag har inte brytt mig särskilt mycket då Elo-modeller är självreglerande. Lagen kommer förr eller senare hamna rätt.

Ph är det faktiska utfallet av matchen ur hemmalagets synvinkel enligt Tabell 1.

ph

Pp är det förväntade utfallet av matchen ur hemmalagets synvinkel. Denna bestäms genom att jämföra lagens Elo-rank enligt Ekvation 2.

p2

Där:

  • Rh är hemmalagets Elo-rank innan matchen
  • Ra är bortalagets Elo-rank innan matchen
  • H är en parameter för hemmaplanfördel

Rh och Ra är således respektive lags Ro. Vid vänskapslandskamper (men inte vid turneringar och mästerskap) tillkommer också en parameter för hemmafördel. Jag har sett att hemmalaget vinner 55% av vänskapsmatcherna. Hemmalaget får då ett litet tillskott till deras Elo-rank om 35 poäng vilket korresponderar med en ökning på 5 %. Detta betyder sannolikheten att ett lag vinner över en helt jämlik motståndare i grunden är exakt 50 %, men tillskottet gör att sannolikheten klättrar upp till 55 %, alltså samma sannolikhet som det rent statistiskt är att hemmalaget vinner matchen.

För att åskådliggöra Ekvation 2 har jag i Figur 1 visat hur Ph förändras med differensen i Elo-rank mellan lagen.

Figur 1: Sannolikheten för seger som funktion av skillnaden i Elo-rank

Såhär långt är det förhoppningsvis inte helt obegripligt, men nu ska vi blanda in en viktningsfaktor som är lite klurigare då den innehåller bökiga begrepp som naturlig logaritm, absolutvärde och Eulers tal. Ekvationen för att bestämma viktningsfaktor kan ses i Ekvation 3.

f3

Där:

  • K är hastighetsförändringen
  • D är måldifferensen
  • A är en faktor för autokorrelation
  • e är Eulers tal

Schack är ganska binärt såtillvida att antingen vinner man eller förlorar man (eller spelar remi), och om man vinner så vinner man, om man förlorar så förlorar man. I innebandy är det stor skillnad på att vinna med 6-5 och vinna med 16-5, men att göra mål när man leder med 6-5 är ju väldigt mycket viktigare än att göra mål när man leder med 16-5. Av denna anledning logarimerar jag måldifferensen. F kan aldrig understiga 1.

Jag ville att min modell skulle klara av att ta hänsyn till såväl vinstmarginal som vilken typ av match det handlar om. Hastighetsförändringen K beror således på om det är en träningsmatch eller en mästerskapsturnering enligt Tabell 2.

k

I praktiken medför detta att ju viktigare matchen är desto större utslag gör det för Elo-ranken.

Allt sammantaget går att åskådliggöra någorlunda i Figur 2, där viktningsfaktorn F skrivs som en funktion av vinstmarginalen D för olika fall av skillnad i Elo-rank. Figuren gäller enbart vid turneringsmatcher. Träningsmatcher kommer enligt Ekvation 3 och Tabell 2 alltså få ett lägre F än det som ses nedan medan en mästerskapsmatch tvärtom hade ökat F mot figuren nedan.

kd

Figur 2. Viktningsfaktor som funktion av måldifferens och differens i Elo-rank

Om det lag som vinner har en Elo-rank 100 mer än motståndaren (Plus 100) innan matchen och vinstmarginalen är fyra mål medför det att F blir i runda slängar 1,6. Men om laget som vinner istället har 100 mindre än motståndarna (Minus 100) blir F ungefär 1,9. Vi kan också se att faktorn för måldifferens verkar enligt principen ”diminishing returns”. För att på något sätt ta i beaktande att innebandymatcher har en tendens att rinna iväg målmässigt är F konstruerad så att den inte blir 10 gånger större om ett lag vinner med 10 mål jämfört med 1 mål. Snarare blir den ungefär dubbelt så stor, exakt hur mycket beror på skillnaden i Elo-rank. Det kommer dock aldrig vara någon skillnad på 3-0 och 19-16 eftersom differensen är densamma.

Nu är jag fan klar.

Världsranking

Så, då har jag kommit fram till det viktiga: Min ranking. Men först en länk till Internationella Innebandyförbundets officiella ranking här.

Och här kommer motsvarande ranking för min modell. Vilken såklart visar alla nationers Elo-rank över tid.

rank

Det var kanske inte världens lättaste graf att läsa, så jag slänger upp nuvarande världsranking enligt min modell, med Elo-ranken i parentes.

vr2

Kom ihåg att en poängskillnad på 10 medför vinst i 51 % av fallen, poängskillnad på 100 medför vinst i 64% av fallen, 200 poängs skillnad medför vinst i 76 % av fallen och 500 poängs marginal medför vinst i 95 % av fallen. Enligt denna modell vinner Sverige mot Finland i 59 % av fallen, Schweiz i 85 % av fallen och Tjeckien i 89 % av fallen. Enligt statistiken vinner Sverige mot Finland i 61 % av fallen, mot Schweiz i 84 % av fallen och mot Tjeckien i 95 % av fallen. Måste säga att jag är ganska nöjd med den precisionen.

Är det ens någon mening?

Kort svar: Nej, skitstor skillnad är det inte. Det har dessutom tagit en jävla tid. Men å andra sidan tycker jag det är roligt att nörda ner mig i saker, speciellt statistik och innebandy. Och jag tycker faktiskt att innebandyvärlden förtjänar ett rankingsystem som är lite mer mångsidigt än det som finns idag. Det finns ju faktiskt några roliga grejer man kan göra med denna modell.

Exempelvis:

  • De enda gånger det bäst rankade laget enligt min modell inte vunnit VM-guld var 2008 och 2016 och då gick matcherna till övertid. Kanske inte skitcoolt att pricka rätt på VM-segrare med 83 % sannolikhet, MEN:
  • När Finland tog sitt historiska första VM-guld 2008 skilde futtiga 17 poäng inför matchen, och sannolikheten att Sverige skulle vinna var således 52 % mot Finlands 48 %. Matchen gick till förlängning där Finland vann. OCH:
  • När Finland vann sitt andra VM-guld 2010 hade min modell Finland som knappa favoriter, 52/48.
  • Modellen har rätt segrare i 78 % av mästerskapmatcherna och 82 % av alla matcher.

Men hur står modellen sig mot den officiella? Det är lite knepigt att avgöra, men om man tar de två senaste mästerskapen, VM 2014 och VM 2016 kan vi göra en liten jämförelse. Vid båda mästerskapen jämförs den officiella världsrankingen i VM-kvalet med modellens Elo-rank precis innan mästerskapet börjar. Jämförelsen görs genom att se över hur båda rankingsystemen placerar de tio främsta. För varje placering fel ges modellen en straffpoäng. Exempelvis hade min modell Lettland på plats 6 innan VM 2014, men Lettland slutade femma. Då får jag en straffpoäng. Minst antal straffpoäng vinner.

För VM 2014 prickar den officiella rankingen 3 länders slutliga placering; Sverige (1), Finland (2) och Estland (8). Totalt missar världsrankingen att få in Slovakien (12) och Danmark (14) på topp 10, och man får totalt 15 straffpoäng. För VM 2016 prickar världsrankingen hela sex länder; Schweiz (3), Tjeckien (4), Norge (6), Tyskland (7), Estland (8) och Slovakien (9). Man missar dock återigen Danmark (12) som hamnade på en fin femteplats. Totalt får man 14 straffpoäng.

För VM 2014 prickar min modell 5 länders slutliga placering; Sverige (1), Finland (2), Tjeckien (3), Schweiz (4) och Estland (8). Missar däremot Slovakien (11) som kommer tia. Totalt 8 straffpoäng. För VM 2016 prickar modellen 4 länders slutliga placering;  Schweiz (3), Tjeckien (4), Norge (6) och Tyskland (7), men får med alla topp 10-lagen för totalt 12 straffpoäng.

VM-tipset slutar alltså 20-29 till Elo-modellens favör.

Tiden får utröna om tendensen är något mer än en tendens.

Den största fördelen jag ser är att det finns ett mått för hur mycket bättre lagen är än varandra. Vi kan ta exemplet jag använde i inledningen då jag skrev att enligt IFF är Sverige (2) tre placeringar bättre än Danmark (5), vilket är lika mycket som USA (11) är före Polen (14). Men enligt min modell är Sverige (1) sex placeringar bättre än Danmark (7) och slår Danmark i 97 % av fallen medan Polen (12) är till och med bättre rankade än USA (13) och vinner i 57 % av fallen. Det är en jävla skillnad. Siffran är numera inte bara en placering, det är också ett mått.

Självklart finns det brister i modellen.

  • Den tar inte hänsyn till lag som inte spelat på länge. Ungern har inte spelat en match sedan VM 2014 och det medför att siffrorna haltar en aning. Ryssland hade ett långt uppehåll på 2000-talet som ställde till rankingen. Hur modellen ska hantera brist på matchning är ett problem att lösa.
  • De utomeuropeiska lagen tenderar att vara sämre rankade enligt min modell jämfört med den officiella, vilket jag dock tror är mer rätt, då många europeiska lag som inte klarar kvalet håller högre klass än de flesta asiatiska lag. Utomeuropeiska lag har lättare att komma till VM och det gynnar dem enligt den officiella algoritmen för ranking.
  • Ingen hänsyn tas till träningsmatcher som spelas på neutral plan. Inte heller någon fördel av hemmaplan under mästerskap eller turneringar beaktas.
  • Modellen beräknar också viktningsfaktorn, F, lite märkligt om laget som vinner har mycket högre rank än förloraren (>400). Då får vinnaren en högre faktor vid vinster med mindre än fyra måls differens än för vinster med mer än fyra måls differens. I praktiken betyder det inte så mycket för när ett så mycket bättre lag vinner får de ändå bara någon enstaka poäng och 1,4 gånger lite är inte mycket mer än 1,2 gånger lite, men det stör mig något enormt. Jag har inte hittat vad felet beror på ännu.
  • Det går att tweaka saker som initialvärde och för att få bättre precision.
  • Modellen är fortfarande i prototypstadiet, så det existerar säkert tusentals brister som jag inte insett ännu.

Bonusstatistik

För den som tycker att det ovan är 2300 ord dravel kommer här något lite mer kondenserat.

  • Världshistoriens första landskamp spelades 28/9 1985 mellan Sverige och Finland. Matchen slutade 12-1 till Sverige.
  • Finland vann första gången mot Sverige på sitt fjärde försök. Matchen slutade 3-2.
  • Sveriges har spelat 281 matcher, och på dessa tagit 722 poäng. Målskillnaden är 2356-734
  • Finland har varit bättre än Sverige vid två tillfällen. Under korta perioder VM 2008 och 2010 som också slutade med VM-guld.
  • Schweiz har släppt in flest mål av alla, 1206 stycken. Iran har gjort minst antal mål, 2 stycken.
  • Den högsta Elo-ranken någonsin är 2260,3. Det var Sverige som slog rekordet efter semifinalen under VM i Riga.
  • Indien har spelat 9 matcher, förlorat alla. Målskillnaden 6-334.
  • Spanien har tredje bäst poängsnitt av alla, 1,74, jämfört med Sveriges 2,57 och Finlands 2,05.
  • 8 landskamper har slutat 1-0. Tjeckien och Schweiz har mötts i tre av dem.
  • Tjeckiens poängsnitt är 1,36 vilket räcker till en medför att man har länder som Österrike, Australien, Italien och Serbien framför sig.
  • Thailand är det enda lag från Asien som har positiv målskillnad, 78-57.
  • Nya Zeeland är det lag som spelat flest landskamper utan att ta en enda poäng, 12 stycken.
  • Sverige har förlorat 23 landskamper. 22 mot Finland och 1 mot Tjeckien.
  • Schweiz och Norge är de enda lag som förutom Finland och Tjeckien tagit poäng av Sverige. Schweiz tio gånger och Norge en.
  • Japan har målrekordet i en landskamp. 59 stycken mot Indien. Då höll man också nollan.
  • Den enda landskamp som slutat med tvåsiffrigt åt båda håll är Ungern – Slovenien som slutade 11-10 efter förlängning.
  • Finland har spelat flest landskamper, 283 stycken.

Det var en liten del av vad som finns att hämta. Nu väntar jag bara på att IFF ska slå en pling.

Har du funderingar, tveka inte på att höra av dig till mig, antingen här nedan i kommentarsfältet, på twitter eller på mail.

 

Ha det gott

 

 

Joel Milesson

Smålänning i exil bosatt i Värmland med förkärlek för polsk dödsmetall, asiatisk mat och svenska fjäll. Tvärkulturell übernörd med för många intressen. Twitter: @Joel_Milesson

Kommentarer

Du är personligt ansvarig för innehållet i din kommentar.

Nästa artikel