Co je dvouocasý test?
Dvoustranný test je ve statistice metoda, při níž je kritická oblast rozdělení oboustranná a testuje se, zda je vzorek větší nebo menší než určitý rozsah hodnot. Používá se při testování nulové hypotézy a testování statistické významnosti. Pokud testovaný vzorek spadá do některé z kritických oblastí, přijímá se místo nulové hypotézy alternativní hypotéza.
Klíčové způsoby
Pochopení dvouocasého testu
Základním konceptem inferentiální statistiky je testování hypotéz, které určuje, zda je tvrzení pravdivé, nebo není dán populační parametr. Test hypotéz, který je navržen tak, aby ukázal, zda je průměr vzorku významně větší a výrazně menší než průměr populace, se označuje jako dvousečný test. Dvoustranný test dostává své jméno podle testování plochy pod oběma ocasy normálního rozdělení, i když test může být použit i v jiných nenormálních rozděleních.
Dvoustranný test je navržen tak, aby zkoumal obě strany specifikovaného rozsahu dat určeného příslušným rozdělením pravděpodobnosti. Rozdělení pravděpodobnosti by mělo představovat pravděpodobnost specifikovaného výsledku na základě předem stanovených standardů. To vyžaduje stanovení limitu určujícího nejvyšší (nebo horní) a nejnižší (nebo nižší) akceptované hodnoty proměnných zahrnutých do rozsahu. Každý datový bod, který existuje nad horní hranicí nebo pod dolní hranicí, je považován za mimo rozsah akceptace a v oblasti označované jako rozsah odmítnutí.
Neexistuje žádná vlastní norma týkající se počtu datových bodů, které musí existovat v rámci přijatelného rozsahu. V případech, kdy je vyžadována přesnost, například při výrobě farmaceutických léků, může být zavedena míra odmítnutí 0,001% nebo nižší. V případech, kdy je přesnost méně kritická, například počet potravinových položek v sáčku s přípravkem, může být vhodná míra odmítnutí 5%.
Zvláštní úvahy
Dvoustranný test lze použít i prakticky při určitých výrobních činnostech ve firmě, například při výrobě a balení cukrovinek v konkrétním zařízení. Pokud výrobní zařízení určí jako svůj cíl 50 cukrovinek na sáček s přijatelnou distribucí 45 až 55 cukrovinek, považuje se v rozmezí pro odmítnutí každý sáček nalezený s množstvím nižším než 45 nebo vyšším než 55.
Aby se potvrdilo, že obalové mechanismy jsou správně kalibrovány tak, aby odpovídaly očekávanému výstupu, může být pro potvrzení přesnosti proveden náhodný odběr vzorků. Jednoduchý náhodný vzorek odebírá malou, náhodnou část celé populace, aby reprezentovala celý datový soubor, kde má každý člen stejnou pravděpodobnost, že bude vybrán.
Pozor na to, jestli je statistický test jednoocasý nebo dvouocasý, protože to výrazně ovlivní interpretaci modelu.
Two-Tailed vs. One-Tailed Test
Je-li test hypotéz nastaven tak, aby ukazoval, že výběrový průměr by byl vyšší nebo nižší než populační průměr, označuje se to jako jednostranný test. Jednostranný test získává své jméno z testování oblasti pod jedním z ocasů (stran) normálního rozdělení. Při použití jednostranného testu analytik testuje možnost vztahu v jednom směru zájmu a vůbec nebere v úvahu možnost vztahu v jiném směru.
Pokud testovaný vzorek spadne do jednostranné kritické oblasti, bude místo nulové hypotézy přijata alternativní hypotéza. Jednosměrný test je také znám jako směrová hypotéza nebo směrový test.
Dvoustranná zkouška je naproti tomu určena ke zkoumání obou stran specifikovaného rozsahu dat, aby se vyzkoušelo, zda je vzorek větší nebo menší než rozsah hodnot.
Příklad dvouocasého testu
Jako hypotetický příklad si představte, že nový burzovní makléř, jménem XYZ, tvrdí, že jejich makléřské poplatky jsou nižší než poplatky vašeho současného burzovního makléře, ABC) Data dostupná od nezávislé výzkumné firmy naznačují, že průměr a směrodatná odchylka všech klientů ABC makléřů jsou 18, respektive 6 dolarů.
Vezme se vzorek 100 klientů ABC a poplatky za zprostředkování se vypočítají s novými sazbami XYZ brokera. Pokud je průměr vzorku 18,75 USD a směrodatná odchylka vzorku je 6 USD, lze usuzovat na rozdíl v průměrném vyúčtování za zprostředkování mezi ABC a XYZ brokerem?
Tato vypočtená hodnota Z spadá mezi dvě mezní hodnoty definované takto: – Z2.5 = -1.96 a Z2.5 = 1.96.
Tím dochází k závěru, že neexistuje dostatek důkazů pro vyvození toho, že existuje nějaký rozdíl mezi sazbami vašeho stávajícího makléře a nového makléře. Nulovou hypotézu proto nelze odmítnout. Alternativně p-hodnota = P(Z< -1,25)+P(Z >1,25) = 2 * 0,1056 = 0,2112 = 21,12%, což je více než 0,05 nebo 5%, vede ke stejnému závěru.
Jak je navržen dvouocasý test?
Dvoustranný test je určen k určení, zda je tvrzení pravdivé, nebo není zadán populační parametr. Zkoumá obě strany specifikovaného rozsahu dat určeného příslušným rozložením pravděpodobnosti. Jako takové by rozdělení pravděpodobnosti mělo představovat pravděpodobnost specifikovaného výsledku na základě předem stanovených standardů.
Jaký je rozdíl mezi dvouocasým a jednoocasým testem?
Dvoustranný test hypotéz je navržen tak, aby ukázal, zda je průměr vzorku významně větší a významně menší než průměr populace. Dvoustranný test získává své jméno na základě testování plochy pod oběma ocasy (stranami) normálního rozdělení. Naproti tomu jednostranný test hypotéz je nastaven tak, aby ukázal, že průměr vzorku by byl vyšší nebo nižší než průměr populace.
Co je Z-skóre?
Z-skóre numericky popisuje vztah hodnoty k průměru skupiny hodnot a měří se z hlediska počtu směrodatných odchylek od průměru. Pokud je Z-skóre 0, znamená to, že skóre datového bodu je shodné s průměrným skóre, zatímco Z-skóre 1,0 a -1,0 by indikovalo hodnoty o jednu směrodatnou odchylku nad nebo pod průměrem. Ve většině velkých datových souborů má 99% hodnot Z-skóre mezi -3 a 3, což znamená, že leží v rámci tří směrodatných odchylek nad a pod průměrem.