Co je to centrální limitní věta?

Co je to centrální limitní věta?
Anonim

Odpovědět:

Centrální limitní teorém činí přísnou intuitivní představu, že odhady průměrného (odhadovaného z nějakého vzorku) některých měření spojených s některou populací se zvyšují s rostoucí velikostí vzorku.

Vysvětlení:

Představte si les obsahující 100 stromů.

Nyní si představte, že (poněkud nerealisticky), měřeno v metrech, jedna čtvrtina z nich má výšku 2, jedna čtvrtina má výšku 3, jedna čtvrtina z nich má výšku 4 a jedna čtvrtina jich má výška 5.

Představte si měření výšky každého stromu v lese a pomocí informací vytvořte histogram s vhodně zvolenými velikostmi přihrádky (např. 1,5 až 2,5, 2,5 až 3,5, 3,5 až 4,5 a 5,5 až 6,5; bin, ke kterému hranice patří, ale na tom nezáleží).

Pomocí histogramu můžete odhadnout rozdělení pravděpodobnosti stromů. To by samozřejmě nebylo normální.Pokud by byly koncové body zvoleny vhodně, bylo by to jednotné, protože by existoval stejný počet stromů odpovídající jedné ze specifikovaných výšek v každé přihrádce.

Nyní si představte, jak jít do lesa a měřit výšku jen dvou stromů; vypočítat střední výšku těchto dvou stromů a poznamenat si to. Opakujte tuto operaci několikrát, takže budete mít sbírku průměrných hodnot pro vzorky o velikosti 2. Pokud byste měli vykreslit histogram odhadů průměru, již by nebyl jednotný. Místo toho je pravděpodobné, že by existovalo více měření (odhady průměru na základě vzorků o velikosti 2) v blízkosti celkové průměrné výšky všech stromů v lese (v tomto konkrétním případě

#(2 + 3 + 4 + 5)/4 = 3.5# metrů).

Jako by bylo víc odhady průměru blízko skutečná populace (což je známo v tomto nereálném příkladu), než daleko od průměru, by tvar tohoto nového histogramu byl blíže normální distribuci (s vrcholem blízkým střední hodnotě).

Teď si představte, jak jít do lesa a opakovat cvičení s výjimkou toho, že měříte výšku 3 stromů, počítáte průměr v každém případě a zapíšete si to. Histogram, který by byl konstruován, by měl ještě více odhadů střední hodnoty v blízkosti skutečného průměru, s menším rozptylem (možnost výběru tří stromů v jednom vzorku tak, aby všichni pocházeli z jedné z koncových skupin - buď velmi vysoký nebo velmi krátký --- je menší než sbírání tří stromů s výběrem výšek). Tvar histogramu obsahující odhad průměrné velikosti (každá průměrná hodnota založená na třech měřeních) by byl blíže tvaru normálního rozdělení a odpovídající směrodatná odchylka (odhadů průměru, nikoli mateřské populace) by byla menší.

Tento postup opakujte pro 4, 5, 6, atd., Stromy na průměr, a histogram, který byste vytvořili, bude vypadat stále více jako normální rozdělení (s postupně většími velikostmi vzorku), s průměrem distribuce odhady průměru být blíže k pravému průměru, a směrodatná odchylka odhadů znamenat užší a užší.

Zopakujete-li cvičení pro (degenerovaný) případ, ve kterém jsou všechny stromy měřeny (při několika příležitostech, zaznamenávají průměr v každém případě), pak bude mít histogram odhady průměru pouze v jednom ze zásobníků (ten, který odpovídá skutečnému průměru), bez jakýchkoliv změn tak, aby směrodatná odchylka (odhadovaná pravděpodobnost rozdělení) od "histogramu" byla nulová.

Centrální limitní teorém tedy konstatuje, že průměr nějakého odhadu průměru některé populace asymptoticky přibližuje skutečný průměr a směrodatnou odchylku odhadu průměru (spíše než standardní odchylku distribuce mateřské populace). pro větší velikosti vzorků se postupně zmenšuje.