Vad är bestämningskoefficienten?

Bestämningskoefficienten (R² eller r-kvadrat) är ett statistiskt mått i en regressionsmodell som bestämmer variansandelen i den beroende variabeln som kan förklaras med den oberoende variabeln Oberoende variabel En oberoende variabel är en ingång, antagande eller drivkraft som ändras för att bedöma dess inverkan på en beroende variabel (resultatet). . Med andra ord, bestämningskoefficienten berättar för en hur bra data passar modellen (godheten av passform).

Determinationskoefficient

Även om bestämningskoefficienten ger några användbara insikter om regressionsmodellen, bör man inte enbart förlita sig på åtgärden vid bedömningen av en statistisk modell. Den avslöjar inte information om orsakssamband mellan de oberoende och beroende variablerna Beroende variabel En beroende variabel är en som kommer att ändras beroende på värdet på en annan variabel, kallad den oberoende variabeln. och det anger inte riktigheten i regressionsmodellen. Därför bör användaren alltid dra slutsatser om modellen genom att analysera bestämningskoefficienten tillsammans med andra variabler i en statistisk modell.

Bestämningskoefficienten kan ta alla värden mellan 0 och 1. Dessutom uttrycks det statistiska måttet ofta i procent.

Tolkning av bestämningskoefficienten (R²)

Den vanligaste tolkningen av bestämningskoefficienten är hur väl regressionsmodellen passar de observerade data. Till exempel visar en bestämningskoefficient på 60% att 60% av uppgifterna passar regressionsmodellen. Generellt indikerar en högre koefficient en bättre passform för modellen.

Det är dock inte alltid så att en hög r-kvadrat är bra för regressionsmodellen. Koefficientens kvalitet beror på flera faktorer, inklusive måttenheterna för variablerna, arten av de variabler som används i modellen och den tillämpade datatransformationen. Ibland kan en hög koefficient ibland indikera problem med regressionsmodellen.

Ingen universell regel reglerar hur man bestämmer koefficienten för bestämning i en modell. Det sammanhang som prognosen eller experimentet bygger på är extremt viktigt, och i olika scenarier kan insikterna från det statistiska måttet variera.

Beräkning av koefficienten

Matematiskt kan bestämningskoefficienten hittas med hjälp av följande formel:

Formel

Var:

  • SS- regression - summan av kvadrater på grund av regression (förklarad summan av kvadrater)
  • SS totalt - den totala summan av rutor

Även om termerna "total summan av kvadrater" och "summan av kvadrater på grund av regression" verkar förvirrande, är variablernas betydelse enkel.

Den totala summan av kvadrater mäter variationen i observerade data (data som används vid regressionsmodellering). Summan av kvadrater på grund av regression mäter hur väl regressionsmodellen representerar de data som användes för modellering.

Fler resurser

Finance är den officiella leverantören av den globala Financial Modeling & Valuation Analyst (FMVA) ™ FMVA®-certifiering. Gå med i 350 600 studenter som arbetar för företag som Amazon, JP Morgan och Ferrari-certifieringsprogram, utformade för att hjälpa alla att bli en ekonomisk analytiker i världsklass . För att fortsätta lära dig och utveckla din karriär kommer de ytterligare finansresurserna nedan att vara användbara:

  • Grundläggande statistikbegrepp inom ekonomi Grundläggande statistikbegrepp för ekonomi En solid förståelse för statistik är avgörande för att hjälpa oss att bättre förstå ekonomi. Dessutom kan statistikbegrepp hjälpa investerare att övervaka
  • Binomial distribution Binomial distribution Binomial distribution är en vanlig sannolikhetsfördelning som modellerar sannolikheten för att uppnå ett av två resultat under ett givet antal parametrar
  • Centralgränssats Centralgränssats Den centrala gränssatsen anger att samplets medelvärde för en slumpmässig variabel antar en nästan normal eller normal fördelning om urvalsstorleken är stor
  • Regressionsanalys Regressionsanalys Regressionsanalys är en uppsättning statistiska metoder som används för att uppskatta sambandet mellan en beroende variabel och en eller flera oberoende variabler. Den kan användas för att bedöma styrkan i sambandet mellan variabler och för att modellera det framtida förhållandet mellan dem.

Rekommenderas

Stängdes Crackstreams ner?
2022
Är MC ledningscentral säker?
2022
Lämnar Taliesin en kritisk roll?
2022