Vad är Central Limit Theorem (CLT)?

The Central Limit Theorem (CLT) är ett statistiskt begrepp som anger att provets medelfördelning för en slumpmässig variabel antar en nästan normal eller normal fördelning om urvalsstorleken är tillräckligt stor. I enkla termer säger satsen att samplingsfördelningen av medelvärdet är ett väsentligt begrepp i matematik och statistik. I allmänhet hänvisar ett medelvärde till genomsnittet eller det vanligaste värdet i en samling närmar sig en normalfördelning när storleken på provet ökar, oavsett formen på den ursprungliga befolkningsfördelningen.

Centralgränssats (CLT) Diagram som visar konvergens till normal distribution

När användaren ökar antalet prover till 30, 40, 50, etc., kommer diagrammet för provorganet att gå mot en normalfördelning. Provstorleken måste vara 30 eller högre för att den centrala gränssatsen ska kunna hållas.

En av de viktigaste komponenterna i satsen är att medelvärdet av provet kommer att vara medelvärdet för hela befolkningen. Om du beräknar medelvärdet av flera prover av befolkningen, lägger till dem och hittar deras genomsnitt, blir resultatet uppskattningen av befolkningens medelvärde.

Detsamma gäller vid användning av standardavvikelse Standardavvikelse Från en statistisk synpunkt är standardavvikelsen för en datamängd ett mått på storleken på avvikelserna mellan värdena för de observationer som finns. Om du beräknar standardavvikelsen för alla prover i populationen, lägger till dem och hittar genomsnittet, blir resultatet standardavvikelsen för hela populationen.

Hur fungerar den centrala gränssatsen?

Den centrala gränssatsen utgör grunden för sannolikhetsfördelningen. Det gör det enkelt att förstå hur populationsuppskattningar beter sig när de utsätts för upprepad provtagning. Typ II-fel Vid statistisk hypotesprovning är ett typ II-fel en situation där ett hypotesprov inte avvisar nollhypotesen som är falsk. I andra . Vid ritning i ett diagram visar satsen formen på fördelningen som bildas med hjälp av upprepade populationsprover.

När provstorlekarna blir större tenderar fördelningen av medel från de upprepade proverna att normalisera och likna en normalfördelning. Resultatet förblir detsamma oavsett vad den ursprungliga formen på distributionen var. Det kan illustreras i figuren nedan:

Central Limit Theorem (CLT) - Hur det uppstår

Från figuren ovan kan vi dra slutsatsen att trots att den ursprungliga formen på distributionen var enhetlig, tenderar den mot en normalfördelning när värdet på n (provstorlek) ökar.

Förutom att visa den form som provmedlet kommer att ta, ger den centrala gränssatsen också en översikt över distributionens medelvärde och varians. Provets medelvärde för fördelningen är det faktiska populationsmedelvärde från vilket proverna togs.

Variansen hos provfördelningen är å andra sidan variationen i populationen dividerad med n . Ju större provstorleken på distributionen är, desto mindre är variansen för provets medelvärde.

Exempel på Central Limit Theorem

En investerare är intresserad av att uppskatta avkastningen för ABC-aktiemarknadsindex som består av 100 000 aktier. På grund av indexets stora storlek Dow Jones Industrial Average (DJIA) Dow Jones Industrial Average (DJIA), även kallad "Dow Jones" eller helt enkelt "Dow", är en av de mest populära och allmänt erkända aktiemarknadsindex, kan investeraren inte analysera varje aktie självständigt och väljer istället att använda slumpmässigt urval för att få en uppskattning av indexets totala avkastning.

Investeraren plockar slumpmässiga urval av bestånden, varvid varje urval omfattar minst 30 aktier. Proverna måste vara slumpmässiga och alla tidigare valda prover måste bytas ut i efterföljande prover för att undvika partiskhet.

Om det första provet ger en genomsnittlig avkastning på 7,5% kan nästa prov ge en genomsnittlig avkastning på 7,8%. Med slumpmässigt samplings karaktär kommer varje prov att ge ett annat resultat. När du ökar storleken på provstorleken för varje prov du väljer kommer provmedlet att börja bilda sina egna fördelningar.

Fördelningen av provorganet kommer att röra sig mot normalt när värdet på n ökar. Den genomsnittliga avkastningen för bestånden i urvalsindexet uppskattar avkastningen för hela index på 100 000 aktier, och den genomsnittliga avkastningen fördelas normalt.

Historien om den centrala gränssatsen

Den ursprungliga versionen av den centrala gränssatsen myntades av Abraham De Moivre, en franskfödd matematiker. I en artikel publicerad 1733 använde De Moivre normalfördelningen för att hitta antalet huvuden som härrörde från flera kast av ett mynt. Konceptet var dåligt populärt och glömdes snabbt ut.

Men 1812 introducerades konceptet på nytt av Pierre-Simon Laplace, en annan berömd fransk matematiker. Laplace återinförde normalfördelningskonceptet i sitt arbete med titeln "Théorie Analytique des Probabilités", där han försökte approximera binomialfördelning med normalfördelningen.

Matematikern fann att genomsnittet av oberoende slumpmässiga variabler, när de ökade i antal, tenderar att följa en normalfördelning. Vid den tiden lockade Laplaces resultat om den centrala gränssatsen uppmärksamhet från andra teoretiker och akademiker.

Senare 1901 utvidgades den centrala gränssatsen av Aleksandr Lyapunov, en rysk matematiker. Lyapunov gick ett steg framåt för att definiera konceptet i allmänna termer och bevisa hur konceptet fungerade matematiskt. De karakteristiska funktioner som han använde för att tillhandahålla satsen antogs i modern sannolikhetsteori.

Relaterade avläsningar

Finance är den officiella leverantören av den globala Financial Modeling & Valuation Analyst (FMVA) ™ FMVA®-certifiering. Gå med i 350 600 studenter som arbetar för företag som Amazon, JP Morgan och Ferrari-certifieringsprogram, utformade för att hjälpa alla att bli en ekonomisk analytiker i världsklass . För att fortsätta lära dig och utveckla din karriär kommer de ytterligare finansresurserna nedan att vara användbara:

  • Bayes-sats Bayes-sats I statistik och sannolikhetsteori är Bayes-satsen (även känd som Bayes-regeln) en matematisk formel som används för att bestämma den villkorade
  • Central Tendens Central Tendens Central Tendens är en beskrivande sammanfattning av en dataset genom ett enda värde som speglar mitten av datadistributionen. Tillsammans med variationen
  • Law of Large Numbers Law of Large Numbers I statistik och sannolikhetsteori är lagen om stora siffror en sats som beskriver resultatet av att upprepa samma experiment ett stort antal
  • Total sannolikhetsregel Total sannolikhetsregel Total sannolikhetsregel (även känd som lagen om total sannolikhet) är en grundläggande regel i statistik relaterad till villkorad och marginal

Rekommenderas

Stängdes Crackstreams ner?
2022
Är MC ledningscentral säker?
2022
Lämnar Taliesin en kritisk roll?
2022