Co je vzorek?
Vzorek odkazuje na menší, zvládnutelnou verzi větší skupiny. Jedná se o podmnožinu obsahující charakteristiky větší populace. Vzorky se používají při statistickém testování, když je velikost populace příliš velká na to, aby test zahrnoval všechny možné členy nebo pozorování. Vzorek by měl reprezentovat populaci jako celek a neměl by odrážet žádné zkreslení ke konkrétnímu atributu.
Existuje několik technik odběru vzorků používaných výzkumníky a statistiky, z nichž každá má své výhody a nevýhody.
Klíčové způsoby
Pochopení ukázek
Vzorek je nezaujatý počet pozorování odebraných z populace. Zjednodušeně řečeno, populace je celkový počet pozorování (tj. jednotlivců, zvířat, položek, dat atd.) obsažených v dané skupině nebo kontextu. Vzorek, jinými slovy, je část, část nebo zlomek celé skupiny a působí jako podmnožina populace. Vzorky se používají v různých prostředích, kde se provádí výzkum. Vědci, obchodníci, vládní agentury, ekonomové a výzkumné skupiny patří mezi ty, kteří používají vzorky pro své studie a měření.
Vzorky použité výzkumníky se musí podobat širší populaci, aby bylo možné učinit přesné závěry nebo předpovědi. Všichni účastníci ve vzorku by měli mít stejné charakteristiky a vlastnosti. Pokud se tedy studie týká mužských vysokoškolských prváků, vzorek by mělo tvořit malé procento mužů, kteří odpovídají tomuto popisu. Podobně pokud výzkumná skupina provádí studii o spánkových vzorcích svobodných žen nad 50 let, vzorek by měl zahrnovat pouze ženy v rámci této demografické skupiny.
Zvláštní úvahy
Ve skutečnosti by v době, kdy by data z populace byla shromážděna a analyzována, uběhlo několik let, takže by analýza byla bezcenná, protože by se objevila nová populace. Výzkumníci místo toho mohou udělat to, že odeberou vzorek populace a získají data z tohoto vzorku.
Aby se dosáhlo nezaujatého výběru, musí být výběr náhodný, aby všichni z populace měli stejnou a pravděpodobnou šanci, že budou přidáni do výběrové skupiny. To je podobné losování a je základem pro jednoduchý náhodný výběr.
U nezaujatého vzorku musí být výběr náhodný, aby všichni v populaci měli stejnou šanci na přidání do skupiny.
Druhy odběru vzorků
Jednoduché náhodné vzorkování
Jednoduché náhodné vzorkování je ideální, pokud je každá entita v populaci identická. Pokud se výzkumníci nezajímají o to, zda jsou jejich subjekty ve vzorku samci nebo samice nebo kombinace obou pohlaví v nějaké formě, může být jednoduché náhodné vzorkování dobrou technikou výběru.
Řekněme, že v roce 2016 sedělo ke zkoušce CFA 200 000 testovaných, z toho 40% byly ženy a 60% muži. Náhodný vzorek vybraný z populace by tedy měl mít 400 žen a 600 mužů na celkem 1000 testovaných.
Ale co případy, kdy je důležité znát poměr mužů a žen, kteří prošli testem po méně než 40 hodinách studia? Tady by byl stratifikovaný náhodný vzorek vhodnější než jednoduchý náhodný vzorek.
Stratifikovaný náhodný odběr vzorků
Tento typ odběru vzorků, označovaný také jako poměrný náhodný odběr vzorků nebo kvótový náhodný odběr vzorků, rozděluje celkovou populaci do menších skupin. Ty jsou známé jako vrstvy. Lidé v rámci vrstev mají podobné charakteristiky.
Co kdyby byl věk důležitým faktorem, který by výzkumníci chtěli zahrnout do svých dat? Pomocí stratifikované techniky náhodného výběru by mohli vytvořit vrstvy nebo vrstvy pro každou věkovou skupinu. Výběr z každé vrstvy by musel být náhodný, aby všichni v závorce měli pravděpodobnou šanci, že budou zahrnuti do vzorku. Například dvěma účastníkům, Alexovi a Davidovi, je 22, respektive 24 let. Výběr vzorku nemůže vybrat jednoho nad druhým na základě nějakého preferenčního mechanismu. Oba by měli mít stejnou šanci, že budou vybráni ze své věkové skupiny. Strany by mohly vypadat nějak takto:
Z tabulky vyplývá, že populace byla rozdělena do věkových skupin. Například v roce 2016 složilo zkoušku CFA 30 000 lidí ve věku 20 až 24 let. Při použití stejného poměru bude mít výběrová skupina (30 000 ÷ 200 000) × 1 000 = 150 odběratelů, kteří spadají do této skupiny. Alex nebo David – nebo oba nebo ani jeden – mohou být zařazeni mezi 150 náhodných účastníků výběrového souboru.
Existuje mnohem více vrstev, které by mohly být sestaveny při rozhodování o velikosti vzorku. Někteří výzkumníci by mohli při rozhodování o tom, jak vytvořit vzorek, vyplnit pracovní funkce, země, rodinný stav atd.
Příklady vzorků
V roce 2017 bylo na světě téměř 7,6 miliardy obyvatel, z toho 49,6% tvořily ženy a 50,4% muži. Celkový počet lidí v dané zemi může být také velikostí populace. Celkový počet studentů ve městě může být brán jako počet obyvatel a celkový počet psů ve městě je také velikostí populace. Z těchto populací mohou být odebrány vzorky pro výzkumné účely.
Po vzoru naší zkoušky CFA mohli výzkumníci odebrat vzorek 1000 účastníků CFA z celkového počtu 200 000 účastníků testu – populace – a provést požadované údaje o tomto počtu. Průměr tohoto vzorku by byl vzat pro odhad průměru účastníků testu CFA, kteří prošli, i když studovali pouze méně než 40 hodin.
Vzorkovaná skupina by neměla být zaujatá. To znamená, že pokud je výběrový průměr z 1000 účastníků zkoušky CFA 50, měl by být také populační průměr z 200 000 účastníků zkoušky přibližně 50.
Proč analytici používají vzorky místo měření populace?
Populace je často příliš velká nebo rozsáhlá na to, aby bylo možné změřit každého člena, a měření každého člena by bylo drahé a časově náročné. Vzorek umožňuje vyvodit závěry o populaci pomocí statistických metod.
Co je jednoduchý náhodný vzorek?
Tato výběrová metoda využívá respondenty nebo datové body, které jsou náhodně vybrány z většího souboru. Při dostatečně velkém vzorku odstraní náhodný vzorek zkreslení.
Proč Náhodné vzorky umožňují přesnost?
Zákony statistiky implikují, že přesná měření a hodnocení lze provádět o populaci pomocí vzorku. Analýza rozptylu (ANOVA), lineární regrese a pokročilejší modelovací techniky jsou platné kvůli zákonu velkých čísel a centrální limitní větě.
Jak velký vzorek potřebujete?
To bude záviset na velikosti populace a typu analýzy, kterou chcete provést (např. jaké intervaly spolehlivosti používáte). Energetická analýza je technika pro matematické vyhodnocení nejmenší velikosti vzorku potřebné na základě vašich potřeb. Dalším pravidlem je, že váš vzorek by měl být dostatečně velký, ale ne větší než 10% velikosti populace.