investering

Grafkriminalitet

Eivind Berg 8 min å lese
Grafkriminalitet
Photo by Isaac Smith / Unsplash

Den britiske statsministeren Benjamin Disraeli sa en gang at det finnes tre typer løgn: Løgn, forbasket løgn og statistikk. Hadde han levd i dag hadde han også nevnt grafer på Twitter.

Vi bruker grafer for å forklare hva som har skjedd. For å spå hva som kommer til å skje. Til å vise hvorfor børsene skal opp eller ned. For å sammenligne dagens situasjon med tidligere situasjoner.

Utfordringen er at mange grafer som går viralt er grafkriminalitet. Det er grafer som aldri burde vært publisert fordi de er bevisst misvisende for å fremheve et gitt synspunkt. Eller fordi de er laget av noen som rett og slett ikke kan data.

Det irriterer meg. For det meste rent faglig. Derfor er det på tide med et innlegg med noen av de vanligste måtene du blir lurt av grafer.

Manipulering av akser

Den vanligste formen for lureri er å kutte Y-aksen slik at endringene er mer dramatiske enn de egentlig er. I Nordeas siste årsrapport kan du se tre tydelige eksempler på kutting av Y-aksen:

Det er mye enklere å tolke stolpene enn det er å regne på tall. Økningen i fortjeneste er drøyt ni prosent, mens hvis du bare ser på grafen fremstår fortjenesten som tredoblet fra 2021 til 2022.

Uansett om Nordea gjør en uskyldig feil eller om det er et bevisst forsøk på å villede skaper det tvil. Hva ønsker de egentlig å oppnå ved å visualisere veksten i gevinst og inntekt som mye høyere enn den er?

Nordea er langt fra alene. 1. april kom artikkelen fra E24 om solid oppgang i forbruksgjelden i kategorien "forbrukslån-eksplosjonen".

Det stemmer at gjelden økte med to milliarder i mars. Det stemmer sikkert at mange sliter og derfor må bruke kredittkort. Henter du grafen rett fra kilden (Gjeldsregisteret) viser den samme data uten å kutte Y-aksen.

Er ikke da dette en ikke-sak?

Her er annet eksempel som skal få frem en negativ utvikling. Hvis du ser raskt på grafen ser du at antall bitcoin-adresser med over én bitcoin falt i gulvet i 2021. På tide å selge? Men ser du på Y-aksen er det faktiske fallet bare drøyt én prosent.

Her er et eksempel fra AksjeNorge som viser positiv utvikling:

Økningen i antall nordmenn som eier aksjer er gledelig, men den ser mye større ut enn den faktisk er på grunn av Y-aksen. Y-aksen året etterpå har et større spenn, og da ser økningen fra 2018 til 2019 mye mindre ut. Økningen i 2020 ser voldsom ut. Det var den også, men der stolpene i grafen viser en økning på minst 50 prosent er det faktiske tallet rundt 20 prosent.

Korrelasjon

For å lete etter sammenheng mellom dagens situasjon og tidligere tider er det populært å legge to grafer oppå hverandre. Er vi på vei inn i en ny finanskrise som i 2008? Var tekboblen i 2021 identisk med dotcom? Får vi stagflasjon som på 70-tallet?

Leser du Financial Times kan du tro det siste.

Selv om det ikke er åpenbart er dette også grafkriminalitet fordi starttidspunktet på X-aksen er tilfeldig valgt. Hvordan ser grafen ut hvis den blå tidslinjen starter i 2010 og den rød i 1970. Helt annerledes. Derfor er det viktig å tenke kausalitet når du ser grafer som korrelerer. Er det en årsakssammenheng der også?

Grafen til Financial Times er ærligere enn mange andre fordi den bare har én Y-akse, og Y-aksen har riktig skala.

Følgende graf får deg til å tro at aksjemarkedet skal ned. Det kan være riktig, men her har du et eksempel på både et tilfeldig startpunkt på X-aksen, og at Y-aksen til venstre er satt slik at grafene skal korrelere helt til den ikke gjør det.

Følgende graf til venstre er et annet eksempel på det samme. Den viser at spareraten går ned og kredittkortbruken går i været i USA:

Grafen viser at den amerikanske forbrukeren sliter, og at resesjonen er på vei. Litt det samme som E24-artikkelen over. Det kan godt være riktig, men det ser mye verre ut enn det er siden den ene Y-aksen begynner på 0 og den andre begynner på 700.

Leter du litt finner du også mange grafer som setter sammen to helt urelaterte datapunkter for å vise at de korrelerer. Som for eksempel at aksjen til Gamestock gjør det bedre når det er fullmåne.

Jeg antar at de fleste tar slike grafer som ren underholdning. 

Subtil grafkriminalitet

Det finnes flere andre varianter av grafkriminalitet som er mindre alvorlig, men som det er greit å være obs på. Du må ikke ha manipulert noen av aksene for at jeg skal kalle det grafkriminalitet. Ta for eksempel utviklingen til aksjekursen i Kahoot. Den er grusom og aksjen er ned over 80 prosent fra toppen.

Tilfeldige startpunkt blir på denne måten ofte brukt for å bekrefte en historie. Som at du aldri skal investere i Kahoot. Zoomer du litt ut er det faktisk ikke så verst likevel.

En annen subtil variant er å ekstrapolere verdier og legge de til grafen. Ta 60/40-porteføljen. Den hadde et skrekkelig år i fjor, men ser du raskt på denne grafen er comebacket enormt i 2023.

Problemet er at den tar utgangspunkt i avkastningen frem til 8. februar og antar samme avkastning resten av året. Det sier også grafen. Den er ærlig sånn sett, men poenget er at det er helt feil å vise data på denne måten.

Farger faller også inn i denne kategorien. Her er grafen i Tibber-appen for et par dager siden. Ikke bare kutter de Y-aksen, men de bruker farger feil.

Leser du grafen er grønn billig. Oransje er dyrt. Men når forskjellen er sju øre (fire prosent) mellom laveste og høyeste pris skal hele grafen ha samme farge, og den fargen bør samsvare med gjennomsnittsprisen over en lang periode.

Dette er ikke de eneste variantene av subtil grafkriminalitet. Et annet eksempel er å vise endringer som ikke gir mening for formålet. For eksempel vil det være helt feil å lage en graf som viser at styringsrenten gikk opp 50 prosent fra to til tre prosent.

Bevisst villedning

Ren juks er det lite av fordi det er så åpenbart. Det skjer likevel, og noe av det groveste er fra Høyres valgkamp for noen år siden. De presterte å fjerne datapunkter på X-aksen, og samtidig jukse med Y-aksen for å få frem poenget sitt.

Utslippene går ned med Høyre!

I praksis fulgte utslippene bare trenden. Hvis vi tar med oss 2014, 2015 og 2016 gikk faktisk norske klimautslipp opp i de årene! Det passet jo ikke historien Høyre ville så da var det bare å utelate de årene.

Med litt lureri kan altså en negativ utvikling fremstilles som positiv.

Høyres graf er ikke den verste jeg har sett. Følgende graf viser antallet drap med våpen i Florida med formål om å vise at "Stand your ground" fører til færre drap. Kort forklart sier loven at du kan bruke våpen til selvforsvar når du tror det er nødvendig (selv om det faktisk ikke er det).

En kjapp titt på grafen viser at antall drap gikk ned fra 2005. Eneste problemet er at Y-aksen er invertert så den viser egentlig det motsatte.

Hva er god graf?

Datavisualisering er et tema jeg har relativt sterke meninger om. I praksis handler det om å endre data fra rader og kolonner til noe visuelt for at det skal være enklere å ta det innover seg.

Tidlig i karrieren ble jeg eksponert for Stephen Few som en av de ledende ekspertene for hvorfor og hvordan data bør presenteres på en best mulig måte. Det er hovedsakelig tre grunner til hvorfor:

  1. Oppdagelse: Bruk grafer til å lete etter interessante fakta i data.
  2. Forståelse: Utforske og finne mening i data.
  3. Kommunikasjon: Enklere informere andre.

For å sitere Stephen Few:

Data visualization is the use of visual representations to explore, make sense of, and communicate data.

Dette bør gjøres gjennom grafer, og ikke tabeller, fordi øyet oppfatter det raskere. Ta dette eksempelet fra Few:

Sett opp mot:

Det er åpenbart hva som er den beste måten å representere dataen på hvis du skal tolke trenden. Så har du hvordan. Det finnes mange retningslinjer for hvordan du skal visualisere et datasett. Her er noen regler:

  • Grafen skal være lesbar og den skal være enkel å tolke. Her er et eksempel på noe som ikke er lett å tolke.
  • Alt må beskrives. Du skal ikke lure på hva X-aksen eller Y-aksen betyr. Du skal ha en beskrivende tittel på grafen. Det skal ikke være tvil om hva Y-aksen eller X-aksen er. I tillegg må måltallet være forståelig.
  • Den må ha riktige farger. Unngå rød og grønn for å garantere at fargeblinde har mulighet til å se grafen. Her er et eksempel for hvordan du ikke skal gjøre det. Hvilken farge skal du bruke for sølv? Tja. Hva med gull?
  • Bruk den riktige typen grafen for formålet. Det er lett å være fancy, men du kommer langt med stolpe- og linjediagrammer.
  • For guds skyld ikke bruk 3d.
  • Vær forsiktig med paidiagrammer. Det er vanskeligere å tolke vinkler enn stolper. Bruk kun når det er et fåtall datapunkt og du ønsker å sammenligne verdien måte opp mot andre verdier og opp mot hele datasettet. Og når du
  • Vær ærlig: Bruk riktige X- og Y-akser.

Så hva er min favorittgraf? Det er lite som slår et godt Sankey-diagram:

Del innlegget
Kommentarer

Logg inn for å kommentere

Flere innlegg Eivind Berg

Sparing og investering forklart

Bli med 8500+ andre som ser forbi markedsføringen til bankene og får den informasjonen de trenger.

Herlig! Du er nå medlem.

Velkommen tilbake! Du er nå innlogget.

Herlig! Du har nå meldt deg inn på Eivind Berg.

Herlig! Sjekk eposten din for å logge inn.

Betalingsinformasjonen din ble oppdatert.

Obs! Betalingsinformasjonen ble ikke oppdatert.