Vad är den empiriska regeln?

I matematik säger den empiriska regeln att i en normal datamängd kommer praktiskt taget varje datadel att falla inom tre standardavvikelser Standardavvikelse Från en statistisk synpunkt är standardavvikelsen för en datamängd ett mått på storleken på avvikelserna mellan värdena av observationerna i medelvärdet. Medelvärdet är genomsnittet av alla siffror inom uppsättningen.

Den empiriska regeln kallas också Three Sigma-regeln eller 68-95-99.7-regeln eftersom:

  • Inom den första standardavvikelsen från medelvärdet vilar 68% av all data
  • 95% av all data faller inom två standardavvikelser
  • Nästan all data - 99,7% - faller inom tre standardavvikelser (.3% som återstår används för att ta hänsyn till avvikare, som finns i nästan varje dataset)

Empirisk regel

Normal distribution

Den empiriska regeln uppstod eftersom samma form av distributionskurvor fortsatte att visas om och om igen för statistiker. Den empiriska regeln gäller en normalfördelning. I en normalfördelning faller praktiskt taget all data inom tre standardavvikelser från medelvärdet. Medelvärdet är ett väsentligt begrepp i matematik och statistik. I allmänhet hänvisar ett medelvärde till genomsnittet eller det vanligaste värdet i en samling av, mode och median är alla lika.

  • Medelvärdet är genomsnittet av alla siffror i datamängden.
  • Läget är det nummer som upprepas oftast inom datamängden.
  • Medianen är värdet på spridningen mellan de högsta och lägsta siffrorna inom uppsättningen.

Detta betyder att medelvärdet, läget och medianmedianmedianen är ett statistiskt mått som bestämmer medelvärdet för en datamängd som anges i stigande ordning (dvs. från det minsta till det största värdet). Medianen ska alla hamna i mitten av datasetet. Hälften av data ska vara i den övre delen av uppsättningen och den andra hälften nedan.

Bestämning av standardavvikelsen

Den empiriska regeln är särskilt användbar för att prognostisera resultat inom en datamängd. Först måste standardavvikelsen beräknas. Formeln ges nedan:

Standardavvikelse - formel

Den komplicerade formeln ovan bryts ner på följande sätt:

  1. Bestäm medelvärdet för datamängden, som är summan av datamängden, dividerat med antalet siffror.
  2. För varje nummer i uppsättningen, subtrahera medelvärdet och kvadrera sedan det resulterande talet.
  3. Med hjälp av de kvadrerade värdena bestämmer du medelvärdet för varje.
  4. Hitta kvadratroten av de medel som beräknades i steg 3.

Det är standardavvikelsen mellan de tre primära procentsatserna för normalfördelningen, inom vilken majoriteten av data i uppsättningen ska falla, exklusive en mindre procentsats för avvikare.

Använda den empiriska regeln

Som nämnts ovan är den empiriska regeln särskilt användbar för att prognostisera resultat inom en datamängd. Statistiskt, när standardavvikelsen har bestämts kan datauppsättningen lätt utsättas för den empiriska regeln och visar var datastyckena ligger i fördelningen.

Prognoser Prognoser Prognoser avser praxis att förutsäga vad som kommer att hända i framtiden genom att ta hänsyn till händelser i det förflutna och nuet. I grund och botten är det ett beslutsverktyg som hjälper företag att hantera effekterna av framtidens osäkerhet genom att undersöka historiska data och trender. är möjligt eftersom även utan att känna till alla dataspecifikationer, kan framskrivningar göras om var data kommer att falla inom uppsättningen, baserat på 68%, 95% och 99,7% dikter som visar var all data ska vila.

I de flesta fall är den empiriska regeln primär för att hjälpa till att bestämma resultaten när inte all information är tillgänglig. Det gör det möjligt för statistiker - eller de som studerar data - att få inblick i var data kommer att falla när allt är tillgängligt. Den empiriska regeln hjälper också till att testa hur normal en datamängd är. Om uppgifterna inte följer den empiriska regeln är det inte en normalfördelning och måste beräknas därefter.

Relaterade avläsningar

Finance är den officiella leverantören av den globala Financial Modeling & Valuation Analyst (FMVA) ™ FMVA®-certifiering. Gå med i 350 600 studenter som arbetar för företag som Amazon, JP Morgan och Ferrari-certifieringsprogram, utformade för att hjälpa alla att bli en ekonomisk analytiker i världsklass . För att fortsätta lära dig och utveckla din karriär kommer de ytterligare finansresurserna nedan att vara användbara:

  • Central Tendens Central Tendens Central Tendens är en beskrivande sammanfattning av en dataset genom ett enda värde som speglar mitten av datadistributionen. Tillsammans med variationen
  • Nominell data Nominell data I statistiken är nominell data (även känd som nominell skala) en typ av data som används för att märka variabler utan att ge något kvantitativt värde
  • Icke-parametriska tester Icke-parametriska tester I statistik är icke-parametriska tester metoder för statistisk analys som inte kräver en fördelning för att uppfylla de antaganden som ska analyseras.
  • Volatilitet Volatilitet Volatilitet är ett mått på fluktuationer i värdet på ett värdepapper över tid. Den indikerar risknivån i samband med prisförändringarna för ett värdepapper. Investerare och handlare beräknar ett värdepappers volatilitet för att bedöma tidigare variationer i priserna

Rekommenderas

Vad är kontokostnader?
Vad är återbetalningsperioden?
Vad är serie A-finansiering?