Co jsou stupně svobody?
Stupně volnosti se vztahují k maximálnímu počtu logicky nezávislých hodnot, což jsou hodnoty, které mají volnost se měnit, v datovém vzorku.
Klíčové způsoby
Pochopení stupňů svobody
Nejjednodušší způsob, jak pojmově porozumět stupňům svobody, je na příkladu:
Vzorec pro stupně volnosti se rovná velikosti vzorku dat minus jedna:
D
f
=
N
−
1
kde:
D
f
=
stupňů volnosti
N
=
velikost vzorku
\begin{aligned} &\text{D}_\text{f} = N – 1 \\ &\textbf{where:} \\ &\text{D}_\text{f} = \text{stupně volnosti} \\ &N = \text{velikost vzorku} \\ \end{aligned}
Df=N−1where:Df=stupňů volnostiN=velikost vzorku
Stupně volnosti jsou běžně diskutovány ve vztahu k různým formám testování hypotéz ve statistice, jako je chí-kvadrát. Je nezbytné vypočítat stupně volnosti, když se snažíme pochopit důležitost statistiky chí-kvadrát a platnost nulové hypotézy.
Chi-Square testy
Existují dva různé druhy testů chí-kvadrát: test nezávislosti, který klade otázku vztahu, jako například: „Existuje vztah mezi pohlavím a výsledky SAT?“, a test dobroty-fit, který se ptá něco jako „Pokud je mince hozena 100 krát, bude padat panna 50 krát a orel 50 krát?“
U těchto testů se využívají stupně volnosti k určení, zda lze určitou nulovou hypotézu odmítnout na základě celkového počtu proměnných a vzorků v rámci experimentu. Například při zvažování studentů a výběru kurzu není velikost vzorku 30 nebo 40 studentů pravděpodobně dostatečně velká, aby generovala významná data. Platnější je získat stejné nebo podobné výsledky ze studie s použitím velikosti vzorku 400 nebo 500 studentů.
Dějiny stupňů svobody
Gosset ve svých spisech nepoužíval konkrétně termín „stupně volnosti“. Podal však vysvětlení tohoto pojmu v průběhu vývoje toho, co by nakonec bylo známo jako Studentova T-distribuce. Skutečný termín se stal populárním až v roce 1922. Anglický biolog a statistik Ronald Fisher začal používat termín „stupně volnosti“, když začal publikovat zprávy a údaje o své práci na vývoji chí-čtverců.