Co je kvartil?
Kvartil je statistický termín, který popisuje rozdělení pozorování do čtyř definovaných intervalů založených na hodnotách dat a na tom, jak se porovnávají s celým souborem pozorování.
Klíčové způsoby
Pochopení kvartilů
Pro pochopení kvartilu je důležité chápat medián jako měřítko centrální tendence. Medián ve statistice je střední hodnota množiny čísel. Je to bod, ve kterém přesně polovina dat leží pod a nad centrální hodnotou.
Při množině 13 čísel, která jsou seřazena (vzestupně nebo sestupně), by tedy medián byl sedmé číslo. Šest čísel, která předcházejí této hodnotě, jsou nejnižší čísla v datech a šest čísel za mediánem jsou nejvyšší čísla v daném datovém souboru. Protože medián není ovlivněn extrémními hodnotami nebo odlehlými hodnotami v rozložení, je někdy preferován před průměrem.
Medián je robustní odhad polohy, ale neříká nic o tom, jak jsou data na obou stranách jeho hodnoty rozložena nebo rozptýlena. V tom nastupuje kvartil. Kvartil měří rozptyl hodnot nad a pod průměrem tím, že rozdělení dělí do čtyř skupin.
Jak fungují kvartily
Stejně jako medián rozděluje data na polovinu tak, že 50% měření leží pod mediánem a 50% nad ním, kvartil rozděluje data na čtvrtiny tak, že 25% měření je menší než spodní kvartil, 50% je menší než medián a 75% je menší než horní kvartil.
Kvartil rozděluje data do tří bodů – spodního kvartilu, mediánu a horního kvartilu – a vytváří tak čtyři skupiny datového souboru. Dolní kvartil neboli první kvartil se označuje jako Q1 a je prostředním číslem, které spadá mezi nejmenší hodnotu datového souboru a medián. Druhý kvartil, Q2, je také mediánem. Horní nebo třetí kvartil, označovaný jako Q3, je centrálním bodem, který leží mezi mediánem a nejvyšším číslem rozdělení.
Nyní můžeme zmapovat čtyři skupiny vytvořené z kvartilů. První skupina hodnot obsahuje nejmenší číslo do Q1, druhá skupina zahrnuje Q1 do mediánu, třetí skupina je medián do Q3, čtvrtá kategorie zahrnuje Q3 do nejvyššího datového bodu celé množiny.
Každý kvartil obsahuje 25% z celkového počtu pozorování. Obecně jsou data uspořádána od nejmenších po největší:
Příklad kvartilu
Předpokládejme, že rozložení skóre z matematiky ve třídě 19 studentů ve vzestupném pořadí je:
Nejprve si označte medián, Q2, což je v tomto případě 10. hodnota: 75.
Q1 je středový bod mezi nejmenším skóre a mediánem. V tomto případě Q1 spadá mezi první a páté skóre: 68. (Všimněte si, že medián může být také zahrnut při výpočtu Q1 nebo Q3 pro lichou množinu hodnot. Pokud bychom zahrnuli medián na obou stranách středového bodu, pak Q1 bude střední hodnota mezi prvním a desátým skóre, což je průměr pátého a šestého skóre—(páté + šesté)/2 = (68 + 69)/2 = 68,5).
Q3 je střední hodnota mezi Q2 a nejvyšším skóre: 84. (Nebo pokud započítáte medián, Q3 = (82 + 84)/2 = 83).
Nyní, když máme naše kvartily, pojďme interpretovat jejich čísla. Skóre 68 (Q1) představuje první kvartil a je 25. percentil. 68 je medián dolní poloviny skóre stanoveného v dostupných datech – tedy medián skóre od 59 do 75.
Q1 nám říká, že 25 % bodů je méně než 68 a 75 % bodů ve třídě je více. Q2 (medián) je 50. percentil a ukazuje, že 50 % bodů je méně než 75 a 50 % bodů je více než 75. Konečně Q3, 75. percentil, odhaluje, že 25 % bodů je více a 75 % je méně než 84.
Zvláštní úvahy
Pokud je datový bod pro Q1 vzdálenější od mediánu než Q3 od mediánu, pak můžeme říci, že je větší rozptyl mezi menšími hodnotami datového souboru než mezi většími hodnotami. Stejná logika platí, pokud je Q3 vzdálenější od Q2 než Q1 od mediánu.
Případně, pokud existuje sudý počet datových bodů, medián bude průměr prostředních dvou čísel. V našem příkladu výše, pokud bychom měli 20 studentů místo 19, medián jejich skóre bude aritmetický průměr 10. a 11. čísla.
Kvartily se používají k výpočtu mezikvartilového rozsahu, což je míra variability kolem mediánu. Mezikvartilový rozsah se jednoduše vypočítá jako rozdíl mezi prvním a třetím kvartilem: Q3-Q1. Ve skutečnosti je to rozsah střední poloviny dat, který ukazuje, jak jsou data rozložená.
Pro velké datové sady má Microsoft Excel funkci QUARTILE pro výpočet kvartilů.