Deskriptiv statistik

⚠️ Denna sida har inte faktagranskats ännu. Texten kan innehålla fel. Bli en hjälte!

1. Varför? 2. Centralmått 3. Spridningsmått 4. I jamovi 5. Outliers 6. Frekvenstabeller 7. Visualiseringar 8. Checklista
1. Varför deskriptiv statistik?

Innan du kör något statistiskt test behöver du titta på din data. Deskriptiv statistik är det första steget i varje analys.

Fyra skäl att alltid börja här

  • Hitta fel och omöjliga värden. En ålder på 999 eller ett negativt PHQ-9-poäng avslöjar inmatningsfel som annars förvänger hela analysen.
  • Upptäck outliersExtremvärden som avviker markant från övrig data. Kan vara verkliga eller felaktiga.. Extremvärden kan dra medelvärden åt fel håll och snedvrida hela resultatet.
  • Förstå fördelningens form. Är data normalfördelad? Skev? Har den två toppar? Det avgör vilka statistiska tester du kan använda.
  • Granskare och tidskrifter kräver det. Nästan alla vetenskapliga artiklar inleds med en demografisk tabell (Table 1) som sammanfattar stickprovet med deskriptiv statistik.
Tumregel: kör aldrig ett t-test, en ANOVA eller en regression utan att först ha tittat på deskriptiv statistik. Det tar fem minuter och kan spara timmar av felsökning.
2. Centralmått

Centralmått svarar på frågan: var ligger "mitten" av din data? Det finns tre att välja mellan:

Medelvärde (Mean, M)

Summan av alla värden delat med antalet observationer (M = Σx / n). Medelvärdet är det vanligaste centralmåttet och fungerar bäst för normalfördelad data. Det är känsligt för outliersExtremvärden som avviker markant från övrig data. Kan vara verkliga eller felaktiga. — ett enda extremvärde kan dra medelvärdet åt sig.

Median (Mdn)

Det mittersta värdet när data är sorterade i storleksordning. Om n är jämnt tar man medelvärdet av de två mittersta värdena. Medianen är robust mot outliers och föredras för sned fördelningEn fördelning där data är asymmetrisk — t.ex. inkomstdata där många har låg inkomst och få har mycket hög..

Typvärde (Mode)

Det värde som förekommer oftast. Används främst för kategoriska variabler (t.ex. "Vilken diagnos är vanligast?"). En fördelning kan ha flera typvärden (bimodal, multimodal).

När använder du vilket?

SituationCentralmåttRapportera med
Normalfördelad, kontinuerlig dataMedelvärde (M)Standardavvikelse (SD)
Sned fördelning / outliersMedian (Mdn)IQR eller range
Kategorisk / nominal dataTypvärde (mode)Frekvenser (n, %)
I APA-stil skrivs medelvärde och standardavvikelse typiskt som: M = 12.4, SD = 3.2. Median skrivs: Mdn = 11.0.
3. Spridningsmått

Spridningsmått berättar hur mycket värdena varierar kring centralmåttet. Utan dem vet du inte om deltagarna är lika varandra eller extremt olika.

Standardavvikelse (SD)

Det genomsnittliga avståndet från medelvärdet. Rapporteras tillsammans med medelvärdet. Ett lågt SD innebär att värdena klustrar tätt kring medel; ett högt SD innebär stor spridning.

Ca 68 % av värdena ligger inom ±1 SD från medel, och ca 95 % inom ±2 SD, om data är normalfördelad. Se normalfördelnings-visualiseringen för interaktiv demonstration.

Varians (SD²)

Standardavvikelsen i kvadrat. Används i beräkningar (t.ex. ANOVA) men rapporteras sällan direkt eftersom enheten är svårtolkad (t.ex. "år²").

Range (variationsvidd)

Skillnaden mellan det största och minsta värdet: Max − Min. Enkelt men känsligt för outliers — ett enda extremvärde ändrar hela range.

IQR (Interquartile Range, kvartilavstånd)

Skillnaden mellan tredje och första kvartilenKvartiler delar sorterad data i fyra lika stora delar. Q1 = 25:e percentilen, Q2 = medianen, Q3 = 75:e percentilen.: Q3 − Q1. Omsluter de mittersta 50 % av data. Rapporteras tillsammans med medianen när data är snedvriden.

Sammanfattning

MåttFormelAnvänds medKänsligt för outliers?
Standardavvikelse (SD)√(Σ(xM)² / (n−1))MedelvärdeJa
Varians (SD²)Σ(xM)² / (n−1)(Beräkningar)Ja
RangeMax − MinAllaMycket
IQRQ3 − Q1MedianNej
4. Så gör du i jamovi
  1. Öppna din datafil i jamovi (File > Open). Se dataguiden om du behöver hjälp med import.
  2. Gå till Analyses > Exploration > Descriptives.
  3. Flytta dina variabler till rutan Variables. För gruppjämförelser: flytta gruppvariabeln till Split by.
  4. Under Statistics, bocka i: Mean, Median, Std. deviation, Minimum, Maximum, Skewness, Kurtosis.
  5. Under Plots, bocka i: Histogram och Box plot (gärna även Violin).
  6. För kategoriska variabler: bocka i Frequency tables under Statistics för att få frekvensfördelningen.
  7. Resultaten visas direkt i höger panel. Dubbelklicka på tabellen för att kopiera värden.

Välj Descriptives:

Välj Analyses > Exploration > Descriptives

Lägg till variabler:

Flytta variabler till Variables

Välj statistik:

Bocka i statistik under Statistics

Välj plots:

Bocka i Histogram och Box plot under Plots

Resultat:

Deskriptiv statistik resultat

Tolka skewness och kurtosis

SkewnessMått på fördelningens symmetri. 0 = symmetrisk, positivt = högerskev (svans åt höger), negativt = vänsterskev. (snedhet): Värden nära 0 tyder på symmetrisk fördelning. Positivt värde = högerskev (svans åt höger), negativt = vänsterskev. Tumregel: |skewness| > 1 indikerar tydlig snedhet.

KurtosisMått på hur "toppig" eller "platt" fördelningen är jämfört med normalfördelningen. Hög kurtosis = tunga svansar. (toppighet): Värden nära 0 (excess kurtosis) liknar normalfördelningen. Höga positiva värden innebär tunga svansar (fler extremvärden än förväntat).

5. Outliers (extremvärden)

En outlier är ett värde som sticker ut rejält från resten. I jamovis boxplot syns de som enskilda punkter utanför morrhåren. Ibland är de verkliga (en patient som svarade ovanligt bra på behandling), ibland felaktiga (någon som matade in 999 istället för 9).

Hur upptäcker du dem?

  • Boxplot — punkter utanför morrhåren (IQR-regeln: > 1.5 × IQR från Q1/Q3)
  • Min/Max — ligger värdena inom rimliga gränser?
  • Z-poäng — |z| > 3 anses extremt. OBS: metoden har en inbyggd svaghet — extremvärdet i sig blåser upp SD så att det kan maskera sig självt.
  • MAD (Median Absolute Deviation) — robustare alternativ till Z-poäng. Använder medianen istället för medelvärdet.
Först: Avgör varför outlieren finns. Inmatningsfel → radera. Genuin extrem variation → behåll. En datapunkt som ensam ändrar slutsatsen → kör analys med och utan, rapportera båda.

Ta bort eller behålla?

Argument för att ta bortArgument för att behålla
Inmatningsfel eller tekniskt problemVärdet är verkligt och kliniskt relevant
Deltagaren uppfyllde inte inklusionskriterierAtt ta bort minskar generaliserbarhet
En observation ändrar hela resultatetSelektiv borttagning riskerar p-hacking
Tumregel: Kör alltid analysen med och utan outliers. Om resultaten är likartade har de begränsad påverkan. Rapportera båda. För en fullständig guide om outliers, saknade data och bortfall, se Bortfall, outliers & saknade data.
6. Frekvenstabeller

För kategoriskaVariabler som består av grupper eller kategorier, t.ex. diagnos, kön, behandlingsgrupp. Kallas även nominala variabler. variabler är frekvenstabellen det viktigaste deskriptiva verktyget. Den visar hur många observationer (n) och vilken andel (%) som tillhör varje kategori.

Exempel: diagnos

Diagnosn%
Egentlig depression4235.0
Generaliserat ångestsyndrom2823.3
Paniksyndrom2218.3
Social ångest1815.0
Specifik fobi108.3

N = 120. Tabellen visar att egentlig depression är den vanligaste diagnosen i stickprovet.

Table 1 (demografisk tabell)

I de flesta vetenskapliga artiklar presenteras stickprovet i en Table 1 som blandar deskriptiva mått för både kontinuerliga och kategoriska variabler:

VariabelBehandling (n = 60)Kontroll (n = 60)
Ålder, M (SD)34.2 (8.7)33.8 (9.1)
Kön (kvinna), n (%)38 (63.3)41 (68.3)
PHQ-9, M (SD)16.4 (4.2)15.9 (4.5)
Utbildning (universitet), n (%)32 (53.3)29 (48.3)
I jamovi får du en liknande tabell genom att flytta gruppvariabeln till Split by i Descriptives. Då redovisas statistiken separat för varje grupp.
7. Visualiseringar

En bra graf säger mer än en tabell full med siffror. Tre figurer är särskilt användbara:

Histogram

Visar fördelningens form genom att dela upp data i intervall (bins). Använd för att:

  • Bedöma om data är normalfördelad (klockformad kurva)
  • Upptäcka bimodala fördelningar (två toppar — kanske två undergrupper?)
  • Identifiera snedhet (lång svans åt höger eller vänster)

Boxplot (låddiagram)

Visar median, kvartilerKvartiler delar sorterad data i fyra lika stora delar. Q1 = 25:e percentilen, Q2 = medianen, Q3 = 75:e percentilen. och outliers i en kompakt figur. Särskilt bra för att:

  • Jämföra grupper sida vid sida
  • Identifiera outliers (visas som enskilda punkter utanför morrhåren)
  • Se om fördelningen är symmetrisk (medianen i mitten av lådan)

Violin plot

En boxplot plus en densitetskurva i ett. Du ser hela fördelningens form, inte bara kvartilerna. Ju bredare "fiolen" är, desto fler observationer finns på den nivån.

För mer avancerade figurer som raincloud plots, spaghettidiagram och forest plots, se figurguiden.
8. Checklista innan inferensstatistik

Bocka av punkterna innan du går vidare till huvudanalyserna.

0/8 klart
  • Kontrollerat variabeltyper och skalnåiver i jamovi
  • Beräknat centralmått och spridningsmått för alla kontinuerliga variabler
  • Visualiserat fördelningar (histogram och/eller boxplot)
  • Identifierat eventuella outliersExtremvärden som avviker markant från övrig data. Kan vara verkliga eller felaktiga. och beslutat hur de ska hanteras
  • Kört analyser både med och utan outliers för att kontrollera robusthet
  • Kontrollerat normalfördelning (histogram + skewness/kurtosis, ev. Shapiro-WilkStatistiskt test för normalfördelning. I jamovi: Exploration > Descriptives > bocka i Shapiro-Wilk.)
  • Kontrollerat och redovisat saknade data (missing values)
  • Skapat Table 1 (demografisk tabell med centralmått och frekvenser per grupp)
🎬 Videolektioner (Elisabeth Borg): Centralmått · Spridningsmått · Tabeller och diagram

← Tillbaka till Stora analysguiden: Deskriptiv statistik

Skärmdumpar från jamovi baseras på material av Dr Jonas Rafi (Jamoviguiden), använt under CC BY 4.0.

💬 Rapportera fel eller ge feedback