Aktuellt:

Santesson (red) – Fem reformer som inte kostar en spänn
Timbro, 2012

The end comes when we no longer talk with ourselves. It is the end of genuine thinking and the beginning of the final loneliness. The remarkable thing is that the cessation of the inner dialogue marks also the end of our concern with the world around us. It is as if we noted the world and think about it only when we have to report it to ourselves.

Eric Hoffer 

Sök på inslag.se:

  Vänta…
politik
popsociologi
fler inslag
söndag
feb102008

Analys i slumpens rike

En samhällsvetare värd sitt salt kan ta vilket socialt mönster som helst och ge tre, fyra teoretiska förklaringar till det. Denna fabuleringsförmåga skulle inte vara så förödande om det inte vore för att även komplett slumpmässig variation ger upphov till mönster, så kallad regression mot medelvärdet:

  • Varför tenderar mycket långa föräldrar att få något kortare barn?
  • Om en idrottare haft en ovanligt bra säsong, varför tenderar nästa säsong att vara sämre?
  • Varför tenderar en regeringskoalition som sjunkit ovanligt snabbt i opinionsmätningarna att sedermera stiga igen?

Där inga som helst samband finns, där utfallet är slumpmässigt, kommer avvikelser från medelvärdet att följas av en tendens att med tiden återgå till medelvärdet igen. Extremt höga värden tenderar att följas av lägre, medan låga värden tenderar att följas av högre. Kort sagt tenderar slumpmässig variation att jämna ut sig över tiden. Och detta mönster kan snillrika experter koka ihop teoretiska förklaringar till, trots att det räcker med en näve slump för att skapa ”sambandet”.

Som alla väsentliga frågor, kan även denna illustreras med en övning i Excel.

Säg att vi studerar 3oo partiers framgång i opinionsundersökningar under tolv månader. Opinionsstödet mäter vi på en skala från 1 till 10. Oss ovetande varierar opinionsframgången i själva verket slumpmässigt mellan månaderna med ett medelvärdet på 5,5. Men vi börjar leta efter mönster. Först plottar vi partiernas genomsnittliga stöd under januari till juni mot stödet under juli till december. Vi får då följande bild:

 nollsamband.GIF

Tja, detta var ett präktigt hagelskott som inte verkar säga så mycket. Men skenet bedrar. När man jämför förändringen mellan första och andra halvåret uppträder ett mönster. I följande bild ger x-axeln medelvärdet under första halvåret, medan y-axeln ger differensen mellan medelvärdena för första och andra halvåret.

tothemean.GIF 

Berg, sjunken, djup stån opp! Det kan kanske tyckas litet mystiskt att ett sådant mönster uppträder i en slumpmässig fördelning. Tänker man efter är det inte särskilt konstigt. I det här fallet varierar vår variabel mellan1 och 10, vilket betyder att medelvärdet tenderar att bli 5,5. För ett parti som, rent slumpmässigt, råkade få ett dåligt första halvår med ett medelvärde under 5,5 kommer det förväntade medelvärdet för hösten följaktligen att ligga högre än vårens, medan det omvända gäller för partier som råkade få en stark vårsäsong.

Så enkla statistiska samband behöver dock inte hindra en uppfinningsrik analytiker från att kläcka djupsinnigheter. Först behövs en säljande beteckning. Vad sägs om utmattningsfenomen, som namn på vår ”upptäckt”? Målande och lätt att komma ihåg. Det gäller att ha hit-känsla när man väljer namn. Därefter behövs en ”modell” som ger litet teoretisk fernissa till vår förklaring. Några termer med boxar och pilar gör susen:

modell2.gif

Sådärja. Här ser man klart och tydligt hur det hänger ihop, med en dubbelriktad pil som grädde på moset: se så komplext det är! Och vi har siffror som backar upp modellen. Tidig framgång ger ju sen motgång, titta bara på plotten. Oslagbart! Nästa hållplats: expertpanelerna.

[Dataset, Excel-dokument, 142 kb] 

Reader Comments (6)

Inget fan av regressionsanalys? Det kan vara användbart, men problemet är väl att "riktiga" förklaringar visar på vilka mekanismer som är aktiva, och inte korrelationer (som bekant inte är detsamma som kausalitet).

11 februari 2008 | Unregistered CommenterOscar

Jodå. Absolut inget fel med regressionsanalys per se. Med exempelvis fallstudier skulle man antagligen hamna /ännu mer/ snett i exemplet ovan. Tänk dig: Man väljer ut Top 10 % och Botten 10 % från första halvåret, följer deras karaktäristiska förändringar under andra halvåret, och kokar sedan ihop lämpliga just so-historier. Brrr...

Det är snarare dålig forskningsdesign som är måltavlan här - vikten av bra sample och kontrollgrupper.

11 februari 2008 | Registered CommenterPeter Santesson

Det här var riktigt roligt!

Men att kalla mean reversion för "sen motgång" påminner lite om när dumdrygvänstern kallar skattelättnader (för hushållsnära tjänster) för "subventioner". Jag säger som kidsen: LOL ROFL!

Peter, är du frisk nu?

12 februari 2008 | Unregistered CommenterPontus

Det var inte jag som var sjuk, utan min lille son, som läkarkåren med en dags varsel bestämde sig för att plocka halsmandlarna på. Äventyret medförde att vi tvingades spendera ett antal dygn på barnkliniken - en upplevelse som var mycket intressant och mördande långtråkig på samma gång. Nu är han pigg som en mört igen. Det är gott läkkött i småbarn.

Är det en typiskt svensk ovana att kalla frånvaro av skatt för en subvention? På något sätt känns det som att ordet säger mycket om grundsynen på äganderätter.

12 februari 2008 | Unregistered CommenterPeter S-W

"privata äganderätter" bör det väl vara?

14 februari 2008 | Unregistered Commenterbergh

I stand corrected.

14 februari 2008 | Registered CommenterPeter Santesson

PostPost a New Comment

Enter your information below to add a new comment.

My response is on my own website »
Author Email (optional):
Author URL (optional):
Post:
 
Some HTML allowed: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <code> <em> <i> <strike> <strong>