Stratifikovaný náhodný odběr vzorků

Co je Stratifikovaný náhodný odběr vzorků?

Stratifikovaný náhodný výběr je metoda výběru, která zahrnuje rozdělení populace do menších podskupin známých jako strata. Ve stratifikovaném náhodném výběru nebo stratifikaci jsou strata tvořena na základě sdílených atributů nebo charakteristik členů, jako je příjem nebo dosažené vzdělání.

Stratifikovaný náhodný výběr se také nazývá proporcionální náhodný výběr nebo kvótový náhodný výběr.

Klíčové způsoby

Stratifikovaný náhodný odběr vzorků

Jak funguje stratifikované náhodné vzorkování

Při dokončování analýzy nebo výzkumu na skupině subjektů s podobnými charakteristikami může výzkumník zjistit, že velikost populace je příliš velká na to, aby mohl dokončit výzkum. Aby analytik ušetřil čas a peníze, může zvolit schůdnější přístup výběrem malé skupiny z populace. Malá skupina se označuje jako velikost vzorku, což je podmnožina populace, která se používá k reprezentaci celé populace. Vzorek může být vybrán z populace několika způsoby, jedním z nich je stratifikovaná metoda náhodného výběru.

Stratifikovaný náhodný výběr zahrnuje rozdělení celé populace do homogenních skupin nazývaných strata (množné číslo pro stratum). Z každé vrstvy jsou pak vybrány náhodné vzorky. Vezměme si například akademického výzkumníka, který by rád znal počet studentů MBA v roce 2007, kteří dostali pracovní nabídku do tří měsíců od ukončení studia.

Výzkumník brzy zjistí, že absolventů MBA bylo za rok téměř 200 000. Mohli by se rozhodnout, že vezmou jen jednoduchý náhodný vzorek 50 000 absolventů a provedou průzkum. Ještě lepší by bylo, kdyby rozdělili populaci do vrstev a vybrali náhodný vzorek ze vrstev. K tomu by vytvořili skupiny populace na základě pohlaví, věkového rozmezí, rasy, země národnosti a profesního původu. Náhodný vzorek z každé vrstvy se odebere v počtu úměrném velikosti vrstvy ve srovnání s populací. Tyto podskupiny vrstev se pak spojí a vytvoří náhodný vzorek.

Stratifikovaný odběr vzorků se používá ke zvýraznění rozdílů mezi skupinami v populaci, na rozdíl od jednoduchého náhodného odběru vzorků, který zachází se všemi členy populace jako se stejnými, se stejnou pravděpodobností, že budou odebrány vzorky

ČTĚTE:   Cleaved

Příklad stratifikovaného náhodného odběru vzorků

Předpokládejme, že výzkumný tým chce určit GPA vysokoškolských studentů po celých USA. Výzkumný tým má potíže se sběrem dat od všech 21 milionů vysokoškolských studentů; rozhodne se vzít náhodný vzorek populace pomocí 4000 studentů.

Nyní předpokládejme, že se tým podívá na různé atributy účastníků vzorku a zeptá se, zda jsou nějaké rozdíly v GPA a studentských oborech. Předpokládejme, že zjistí, že 560 studentů studuje angličtinu, 1 135 přírodovědné obory, 800 informatické obory, 1 090 inženýrské obory a 415 matematické obory. Tým chce použít proporcionální stratifikovaný náhodný vzorek, kde je vrstva vzorku úměrná náhodnému vzorku v populaci.

Předpokládejme, že tým zkoumá demografii vysokoškoláků v USA a zjišťuje procento toho, v čem studenti studují: 12% obor angličtina, 28% obor věda, 24% obor informatika, 21% obor inženýrství a 15% obor matematika. Z procesu stratifikovaného náhodného výběru je tedy vytvořeno pět vrstev.

Tým pak musí potvrdit, že vrstva populace je úměrná vrstvě ve vzorku; nicméně zjistí, že podíly nejsou stejné. Tým pak musí znovu odebrat vzorek 4000 studentů z populace a náhodně vybrat 480 studentů angličtiny, 1200 přírodních věd, 960 informatiky, 840 strojírenství a 600 studentů matematiky.

S těmi má poměrný stratifikovaný náhodný vzorek vysokoškolských studentů, který poskytuje lepší zastoupení studentů vysokoškolských oborů v USA.Výzkumníci pak mohou zvýraznit konkrétní vrstvu, pozorovat různé studie amerických vysokoškolských studentů a pozorovat různé průměry známek.

Jednoduché náhodné versus Stratifikované náhodné vzorky

Jednoduché náhodné vzorky a stratifikované náhodné vzorky jsou oba statistické nástroje měření. Jednoduchý náhodný vzorek se používá k reprezentaci celé datové populace. Stratifikovaný náhodný vzorek rozděluje populaci do menších skupin nebo vrstev na základě sdílených charakteristik.

Jednoduchý náhodný vzorek se často používá v případech, kdy je k dispozici jen velmi málo informací o datové populaci, kdy má datová populace příliš mnoho rozdílů na to, aby se dala rozdělit do různých podskupin, nebo když existuje pouze jedna odlišná charakteristika mezi datovou populací.

ČTĚTE:   Strukturální nezaměstnanost

Například cukrářská firma může chtít studovat nákupní zvyklosti svých zákazníků, aby určila budoucnost své produktové řady. Pokud má 10 000 zákazníků, může jako náhodný vzorek použít výběr 100 z těchto zákazníků. To, co z těchto 100 zákazníků zjistí, pak může použít na zbytek své základny. Na rozdíl od stratifikace bude vzorek 100 členů odebírat čistě náhodně bez ohledu na jejich individuální charakteristiky.

Přiměřená a neúměrná stratifikace

Stratifikovaný náhodný výběr vzorků zajišťuje, že každá podskupina dané populace je přiměřeně zastoupena v celé výběrové populaci výzkumné studie. Stratifikace může být úměrná nebo nepřiměřená. V úměrné stratifikované metodě je velikost vzorku každé vrstvy úměrná velikosti populace dané vrstvy.

Pokud by například výzkumník chtěl vzorek 50 000 absolventů s použitím věkového rozmezí, bude poměrný stratifikovaný náhodný vzorek získán pomocí tohoto vzorce: (velikost vzorku/velikost populace) x velikost vrstvy. Níže uvedená tabulka předpokládá velikost populace 180 000 absolventů MBA ročně.

Věková skupina

Počet osob ve vrstvě

90 000

60 000

30 000

180 000

Velikost vzorku ve Stratě

25 000

16 667

50 000

Velikost výběrového souboru vrstev pro absolventy MBA ve věkovém rozmezí 24 až 28 let se vypočítá jako (50 000/180 000) x 90 000 = 25 000. Stejná metoda se používá pro ostatní věkové skupiny. Nyní, když je známa velikost výběrového souboru vrstev, může výzkumník provést jednoduchý náhodný výběr v každé vrstvě, aby vybral své účastníky průzkumu. Jinými slovy, 25 000 absolventů z věkové skupiny 24 až 28 let bude vybráno náhodně z celé populace, 16 667 absolventů z věkového rozmezí 29 až 33 let bude vybráno náhodně z populace a tak dále.

V disproporčním stratifikovaném vzorku není velikost každé vrstvy úměrná její velikosti v populaci. Výzkumník může rozhodnout o výběru vzorku 1/2 absolventů v rámci věkové skupiny 34-37 let a 1/3 absolventů v rámci věkové skupiny 29-33 let.

Je důležité si uvědomit, že jedna osoba se nemůže vejít do více vrstev. Každá entita se musí vejít pouze do jedné vrstvy. Mít překrývající se podskupiny znamená, že někteří jedinci budou mít vyšší šance být vybráni do průzkumu, což zcela popírá koncept stratifikovaného výběru jako typu výběru pravděpodobnosti.

ČTĚTE:   Charge Card

Správci portfolií mohou použít stratifikovaný náhodný výběr k vytvoření portfolií replikací indexu, jako je dluhopisový index.

Výhody Stratifikovaného náhodného odběru vzorků

Hlavní výhodou stratifikovaného náhodného odběru vzorků je, že zachycuje klíčové charakteristiky populace ve vzorku. Podobně jako vážený průměr tato metoda odběru vzorků vytváří ve vzorku charakteristiky, které jsou úměrné celkové populaci. Stratifikovaný náhodný odběr vzorků funguje dobře u populací s různými atributy, ale jinak je neúčinný, pokud nelze vytvořit podskupiny.

Nevýhody stratifikovaného náhodného odběru vzorků

Bohužel, tato metoda výzkumu nemůže být použita v každé studii. Nevýhodou metody je, že musí být splněno několik podmínek, aby mohla být použita správně. Výzkumníci musí identifikovat každého člena zkoumané populace a klasifikovat každého z nich do jedné a pouze jedné subpopulace. Výsledkem je, že stratifikovaný náhodný výběr je nevýhodný, když výzkumníci nemohou s jistotou klasifikovat každého člena populace do podskupiny. Také nalezení vyčerpávajícího a definitivního seznamu celé populace může být náročné.

Překrývání může být problémem, pokud existují subjekty, které spadají do více podskupin. Při jednoduchém náhodném výběru je pravděpodobnější, že budou vybráni ti, kteří jsou ve více podskupinách. Výsledkem může být zkreslení nebo nepřesná reflexe populace.

Výše uvedené příklady to usnadňují: vysokoškolák, absolvent, muž a žena jsou jasně definované skupiny. V jiných situacích by to však mohlo být mnohem obtížnější. Představte si, že by byly začleněny charakteristiky, jako je rasa, etnicita nebo náboženství. Proces třídění se stává obtížnější a stratifikované náhodné vzorkování se stává neúčinnou a méně ideální metodou.