Co je statistický význam?
Statistická významnost odkazuje na tvrzení, že soubor pozorovaných dat není výsledkem náhody, ale může být místo toho připsán konkrétní příčině. Statistická významnost je důležitá pro akademické obory nebo odborníky z praxe, kteří se silně spoléhají na analýzu dat a výzkumu, jako je ekonomie, finance, investice, medicína, fyzika a biologie.
Statistická významnost může být považována za silnou nebo slabou. Při analýze datového souboru a provádění nezbytných testů, aby se zjistilo, zda jedna nebo více proměnných má vliv na výsledek, pomáhá silná statistická významnost podpořit skutečnost, že výsledky jsou reálné a nejsou způsobeny štěstím nebo náhodou. Jednoduše řečeno, pokud je hodnota p malá, pak je výsledek považován za spolehlivější.
Klíčové způsoby
Problémy vznikají při testech statistické významnosti, protože výzkumníci obvykle pracují se vzorky větších populací a ne se samotnými populacemi. Výsledkem je, že vzorky musí být reprezentativní pro danou populaci, takže údaje obsažené ve vzorku nesmí být žádným způsobem zkreslené. Ve většině věd, včetně ekonomie, může být výsledek považován za statisticky významný, pokud má hladinu spolehlivosti 95% (nebo někdy 99%).
Pochopení statistického významu
Velikost vzorku je důležitou složkou statistické významnosti v tom, že větší vzorky jsou méně náchylné k motolicím motolicím motolicím motolicím. Při testování významnosti by se měly používat pouze náhodně vybrané reprezentativní vzorky. Úroveň, na níž lze akceptovat, zda je událost statisticky významná, je známa jako úroveň významnosti.
Výzkumníci používají k určení statistické významnosti měření známé jako hodnota p: pokud hodnota p klesne pod hladinu významnosti, pak je výsledek statisticky významný. Hodnota p je funkcí průměru a směrodatných odchylek vzorků dat.
Hodnota p označuje pravděpodobnost, s jakou došlo k danému statistickému výsledku, za předpokladu, že za výsledek je zodpovědná pouze náhoda. Pokud je tato pravděpodobnost malá, pak může výzkumník dojít k závěru, že za pozorovaná data může být zodpovědný nějaký jiný faktor.
„P-hacking“ je praxe vyčerpávajícího porovnávání mnoha různých souborů dat při hledání statisticky významného výsledku. To podléhá zkreslení při vykazování, protože výzkumníci vykazují pouze příznivé výsledky – nikoli negativní.
Zvláštní úvahy
Statistická významnost ne vždy vypovídá o praktickém významu, což znamená, že výsledky nelze aplikovat na reálné obchodní situace. Statistická významnost může být navíc nesprávně interpretována, pokud výzkumníci při vykazování svých výsledků nepoužívají pečlivě jazyk. Skutečnost, že je výsledek statisticky významný, neznamená, že není výsledkem náhody, jen že je méně pravděpodobné, že tomu tak bude.
To, že dvě datové řady spolu silně korelují, ještě neznamená příčinnou souvislost. Například počet filmů, ve kterých herec Nicolas Cage v daném roce hraje, velmi silně koreluje s počtem náhodných utonutí v bazénech. Tato korelace je však nepravdivá, protože neexistuje žádné teoretické příčinné tvrzení, které by bylo možné učinit.
Dalším problémem, který může se statistickou významností nastat, je, že minulá data a výsledky z těchto dat, ať už statisticky významné nebo ne, nemusí odrážet stávající nebo budoucí podmínky. Při investování se to může projevit tím, že se cenový model v době finanční krize rozpadne, protože se mění korelace a proměnné se vzájemně neinteragují jako obvykle. Statistická významnost může investorovi také pomoci rozpoznat, zda je jeden model oceňování aktiv lepší než jiný.
Typy zkoušek statistické významnosti
V závislosti na prováděném výzkumu se používá několik typů testů významnosti. Testy mohou být například použity pro jeden, dva nebo více vzorků dat různých velikostí pro průměry, odchylky, proporce, spárovaná nebo nespárovaná data nebo různá rozložení dat.
Jerzy Neyman a Egon Pearson se snažili stavět na Fisherově metodě a nakonec vyvinuli alternativní přístup. Tato metoda vyžaduje více práce, než se data shromáždí, ale umožňuje výzkumníkům navrhnout svou studii tak, aby kontrolovala pravděpodobnost dosažení falešných závěrů.
Null Hypotéza Testování
Statistická významnost se používá při testování nulových hypotéz, kdy se výzkumníci snaží podpořit své teorie odmítnutím jiných vysvětlení. Ačkoliv je metoda někdy nepochopena, zůstává nejpopulárnější metodou testování dat v medicíně, psychologii a dalších oborech.
Nejčastější nulovou hypotézou je, že dotyčný parametr je roven nule (typicky indikující, že proměnná má nulový vliv na výsledek zájmu). Pokud výzkumníci odmítají nulovou hypotézu s jistotou 95% nebo vyšší, mohou tvrdit, že pozorovaný vztah je statisticky významný. Nullovy hypotézy mohou být také testovány na rovnost účinku pro dvě nebo více alternativních léčeb.
Na rozdíl od obecně rozšířené mylné představy nemůže vysoká statistická významnost dokázat, že hypotéza je pravdivá nebo nepravdivá. Ve skutečnosti statistická významnost měří pravděpodobnost, že by došlo k pozorovanému výsledku, za předpokladu, že nulová hypotéza je pravdivá.
Odmítnutí nulové hypotézy, i když velmi vysoký stupeň statistické významnosti nemůže nikdy nic dokázat, může jen přidat podporu existující hypotéze. Na druhou stranu, neodmítnutí nulové hypotézy je často důvodem k odmítnutí hypotézy.
Kromě toho může být účinek statisticky významný, ale má jen velmi malý dopad. Například může být statisticky významné, že společnosti, které používají dvouvrstvý toaletní papír ve svých koupelnách, mají produktivnější zaměstnance, ale zlepšení absolutní produktivity každého pracovníka bude pravděpodobně nepatrné.