Se hur en enda datapunkt påverkar korrelation, medelvärde och gruppjämförelser
⚠️ Denna sida har inte faktagranskats ännu. Texten kan innehålla fel. Bli en hjälte!
En enda datapunkt kan avgöra om du hittar ett ”signifikant samband” eller inte. Det här är särskilt problematiskt i psykologisk forskning där stickprovsstorlekarna ofta är små.
Nedan finns fyra interaktiva demonstrationer som visar hur en outlier påverkar korrelationer (demo 1–2), centralmått (demo 3) och gruppjämförelser med t-test (demo 4). I demo 1–3: dra den färgade punkten och se hur statistiken förändras i realtid. I demo 4: använd reglagen för att ändra outlier-värde och stickprovsstorlek. För korrelationerna krävs |r| ≥ 0,50 för signifikans vid p < .05 (tvåsidigt, n = 16). i
De 15 blå punkterna har i princip ingen korrelation (r ≈ 0). Dra den röda outlier-punkten och se hur en enda avvikande observation kan göra korrelationen ”signifikant”.
Dra den röda punkten!
De 15 blå punkterna har en tydlig positiv korrelation (r ≈ 0,80). Dra den röda outlier-punkten bort från trenden och se hur sambandet försvinner.
Dra den röda punkten!
Alla 18 blå punkter har liknande värden. Dra den röda punkten åt sidan och se hur medelvärdet följer efter — medan medianen knappt rör sig.
Dra den röda punkten åt höger eller vänster!
I en RCT jämförs behandlingsgruppen (KBT) med en kontrollgrupp. En enda patients extremvärde kan avgöra om studien visar signifikant behandlingseffekt. Använd reglagen för att utforska hur outlier-värde, stickprovsstorlek och gruppplacering påverkar resultatet.
| Mått | Med outlier | Utan outlier |
|---|---|---|
| M (behandling) | ||
| M (kontroll) | ||
| Cohen's d i | ||
| p-värde i | ||
| Signifikant? (α = .05) |
Pearsons r är känslig för extremvärden eftersom den bygger på medelvärden och standardavvikelser. En enda outlier kan:
I praktiken: Inspektera alltid dina data med spridningsdiagram innan du tolkar r. Överväg Spearmans rangkorrelation eller robusta metoder om du misstänker outliers. Rapportera resultaten med och utan potentiella extremvärden.
Läs mer: Bortfall, outliers & saknade data · Korrelationsanalys · Oberoende t-test