Outliers & statistik

Se hur en enda datapunkt påverkar korrelation, medelvärde och gruppjämförelser

⚠️ Denna sida har inte faktagranskats ännu. Texten kan innehålla fel. Bli en hjälte!

En enda datapunkt kan avgöra om du hittar ett ”signifikant samband” eller inte. Det här är särskilt problematiskt i psykologisk forskning där stickprovsstorlekarna ofta är små.

Nedan finns fyra interaktiva demonstrationer som visar hur en outlier påverkar korrelationer (demo 1–2), centralmått (demo 3) och gruppjämförelser med t-test (demo 4). I demo 1–3: dra den färgade punkten och se hur statistiken förändras i realtid. I demo 4: använd reglagen för att ändra outlier-värde och stickprovsstorlek. För korrelationerna krävs |r| ≥ 0,50 för signifikans vid p < .05 (tvåsidigt, n = 16). i

Demo 1: En outlier skapar ett samband

De 15 blå punkterna har i princip ingen korrelation (r ≈ 0). Dra den röda outlier-punkten och se hur en enda avvikande observation kan göra korrelationen ”signifikant”.

Med outlier
0.05
 
Utan outlier
0.05
 

Dra den röda punkten!

Demo 2: En outlier döljer ett samband

De 15 blå punkterna har en tydlig positiv korrelation (r ≈ 0,80). Dra den röda outlier-punkten bort från trenden och se hur sambandet försvinner.

Med outlier
0.55
 
Utan outlier
0.80
 

Dra den röda punkten!

Demo 3: Medelvärde vs median

Alla 18 blå punkter har liknande värden. Dra den röda punkten åt sidan och se hur medelvärdet följer efter — medan medianen knappt rör sig.

Medelvärde
50.0
Median
50.0

Dra den röda punkten åt höger eller vänster!

Demo 4: En outlier flippar en gruppjämförelse

I en RCT jämförs behandlingsgruppen (KBT) med en kontrollgrupp. En enda patients extremvärde kan avgöra om studien visar signifikant behandlingseffekt. Använd reglagen för att utforska hur outlier-värde, stickprovsstorlek och gruppplacering påverkar resultatet.

Behandlingen fungerar — behandlingsgruppen mår klart bättre. Utan outlier är resultatet signifikant. Med en outlier är det fortfarande signifikant, men Cohen's d krymper tydligt.
55
25
Behandling (KBT)
Kontroll
Outlier
Medelvärde (med outlier)
Medelvärde (utan outlier)

Statistik i

Mått Med outlier Utan outlier
M (behandling)
M (kontroll)
Cohen's d i
p-värde i
Signifikant? (α = .05)
Δd (bias):

Bias-kurva: Cohen's d som funktion av outlier-värdet

Cohen's d med outlier
Cohen's d utan outlier
Ej signifikant område

Sammanfattning — varför outliers spelar roll

Pearsons r är känslig för extremvärden eftersom den bygger på medelvärden och standardavvikelser. En enda outlier kan:

I praktiken: Inspektera alltid dina data med spridningsdiagram innan du tolkar r. Överväg Spearmans rangkorrelation eller robusta metoder om du misstänker outliers. Rapportera resultaten med och utan potentiella extremvärden.

Läs mer: Bortfall, outliers & saknade data · Korrelationsanalys · Oberoende t-test

🎬 Videolektioner (Elisabeth Borg):
Att studera samband — korrelation · Konfidensintervall och t-test
💬 Rapportera problem