⚠️ Denna sida har inte faktagranskats ännu. Texten kan innehålla fel. Bli en hjälte!
Innan du kör något statistiskt test behöver du titta på din data. Deskriptiv statistik är det första steget i varje analys.
Centralmått svarar på frågan: var ligger "mitten" av din data? Det finns tre att välja mellan:
Summan av alla värden delat med antalet observationer (M = Σx / n). Medelvärdet är det vanligaste centralmåttet och fungerar bäst för normalfördelad data. Det är känsligt för outliersExtremvärden som avviker markant från övrig data. Kan vara verkliga eller felaktiga. — ett enda extremvärde kan dra medelvärdet åt sig.
Det mittersta värdet när data är sorterade i storleksordning. Om n är jämnt tar man medelvärdet av de två mittersta värdena. Medianen är robust mot outliers och föredras för sned fördelningEn fördelning där data är asymmetrisk — t.ex. inkomstdata där många har låg inkomst och få har mycket hög..
Det värde som förekommer oftast. Används främst för kategoriska variabler (t.ex. "Vilken diagnos är vanligast?"). En fördelning kan ha flera typvärden (bimodal, multimodal).
| Situation | Centralmått | Rapportera med |
|---|---|---|
| Normalfördelad, kontinuerlig data | Medelvärde (M) | Standardavvikelse (SD) |
| Sned fördelning / outliers | Median (Mdn) | IQR eller range |
| Kategorisk / nominal data | Typvärde (mode) | Frekvenser (n, %) |
Spridningsmått berättar hur mycket värdena varierar kring centralmåttet. Utan dem vet du inte om deltagarna är lika varandra eller extremt olika.
Det genomsnittliga avståndet från medelvärdet. Rapporteras tillsammans med medelvärdet. Ett lågt SD innebär att värdena klustrar tätt kring medel; ett högt SD innebär stor spridning.
Standardavvikelsen i kvadrat. Används i beräkningar (t.ex. ANOVA) men rapporteras sällan direkt eftersom enheten är svårtolkad (t.ex. "år²").
Skillnaden mellan det största och minsta värdet: Max − Min. Enkelt men känsligt för outliers — ett enda extremvärde ändrar hela range.
Skillnaden mellan tredje och första kvartilenKvartiler delar sorterad data i fyra lika stora delar. Q1 = 25:e percentilen, Q2 = medianen, Q3 = 75:e percentilen.: Q3 − Q1. Omsluter de mittersta 50 % av data. Rapporteras tillsammans med medianen när data är snedvriden.
| Mått | Formel | Används med | Känsligt för outliers? |
|---|---|---|---|
| Standardavvikelse (SD) | √(Σ(x−M)² / (n−1)) | Medelvärde | Ja |
| Varians (SD²) | Σ(x−M)² / (n−1) | (Beräkningar) | Ja |
| Range | Max − Min | Alla | Mycket |
| IQR | Q3 − Q1 | Median | Nej |
Mean, Median, Std. deviation, Minimum, Maximum, Skewness, Kurtosis.Histogram och Box plot (gärna även Violin).Välj Descriptives:
Lägg till variabler:
Välj statistik:
Välj plots:
Resultat:
SkewnessMått på fördelningens symmetri. 0 = symmetrisk, positivt = högerskev (svans åt höger), negativt = vänsterskev. (snedhet): Värden nära 0 tyder på symmetrisk fördelning. Positivt värde = högerskev (svans åt höger), negativt = vänsterskev. Tumregel: |skewness| > 1 indikerar tydlig snedhet.
KurtosisMått på hur "toppig" eller "platt" fördelningen är jämfört med normalfördelningen. Hög kurtosis = tunga svansar. (toppighet): Värden nära 0 (excess kurtosis) liknar normalfördelningen. Höga positiva värden innebär tunga svansar (fler extremvärden än förväntat).
En outlier är ett värde som sticker ut rejält från resten. I jamovis boxplot syns de som enskilda punkter utanför morrhåren. Ibland är de verkliga (en patient som svarade ovanligt bra på behandling), ibland felaktiga (någon som matade in 999 istället för 9).
| Argument för att ta bort | Argument för att behålla |
|---|---|
| Inmatningsfel eller tekniskt problem | Värdet är verkligt och kliniskt relevant |
| Deltagaren uppfyllde inte inklusionskriterier | Att ta bort minskar generaliserbarhet |
| En observation ändrar hela resultatet | Selektiv borttagning riskerar p-hacking |
För kategoriskaVariabler som består av grupper eller kategorier, t.ex. diagnos, kön, behandlingsgrupp. Kallas även nominala variabler. variabler är frekvenstabellen det viktigaste deskriptiva verktyget. Den visar hur många observationer (n) och vilken andel (%) som tillhör varje kategori.
| Diagnos | n | % |
|---|---|---|
| Egentlig depression | 42 | 35.0 |
| Generaliserat ångestsyndrom | 28 | 23.3 |
| Paniksyndrom | 22 | 18.3 |
| Social ångest | 18 | 15.0 |
| Specifik fobi | 10 | 8.3 |
N = 120. Tabellen visar att egentlig depression är den vanligaste diagnosen i stickprovet.
I de flesta vetenskapliga artiklar presenteras stickprovet i en Table 1 som blandar deskriptiva mått för både kontinuerliga och kategoriska variabler:
| Variabel | Behandling (n = 60) | Kontroll (n = 60) |
|---|---|---|
| Ålder, M (SD) | 34.2 (8.7) | 33.8 (9.1) |
| Kön (kvinna), n (%) | 38 (63.3) | 41 (68.3) |
| PHQ-9, M (SD) | 16.4 (4.2) | 15.9 (4.5) |
| Utbildning (universitet), n (%) | 32 (53.3) | 29 (48.3) |
En bra graf säger mer än en tabell full med siffror. Tre figurer är särskilt användbara:
Visar fördelningens form genom att dela upp data i intervall (bins). Använd för att:
Visar median, kvartilerKvartiler delar sorterad data i fyra lika stora delar. Q1 = 25:e percentilen, Q2 = medianen, Q3 = 75:e percentilen. och outliers i en kompakt figur. Särskilt bra för att:
En boxplot plus en densitetskurva i ett. Du ser hela fördelningens form, inte bara kvartilerna. Ju bredare "fiolen" är, desto fler observationer finns på den nivån.
Bocka av punkterna innan du går vidare till huvudanalyserna.
← Tillbaka till Stora analysguiden: Deskriptiv statistik
Skärmdumpar från jamovi baseras på material av Dr Jonas Rafi (Jamoviguiden), använt under CC BY 4.0.