Vad är den justerade R-kvadraten?

Den justerade R-kvadraten är en modifierad version av R-kvadrat som redogör för prediktorer som inte är signifikanta i en regressionsmodell. Med andra ord visar den justerade R-kvadraten huruvida tillägg av ytterligare prediktorer förbättrar en regressionsmodell eller inte. För att förstå justerad R-kvadrat krävs en förståelse av R-kvadrat.

Sammanfattning:

  • Den justerade R-kvadraten är en modifierad version av R-kvadrat som justerar för prediktorer som inte är signifikanta i en regressionsmodell.
  • Jämfört med en modell med ytterligare ingångsvariabler indikerar en lägre justerad R-kvadrat att de ytterligare ingångsvariablerna inte tillför värde till modellen.
  • Jämfört med en modell med ytterligare inmatningsvariabler indikerar en högre justerad R-kvadrat att de ytterligare inmatningsvariablerna adderar värde till modellen.

Vad är R-kvadrat?

R-kvadrat, även kallad bestämningskoefficient Koefficient för bestämning En bestämningskoefficient (R² eller r-kvadrat) är ett statistiskt mått i en regressionsmodell som bestämmer variansandelen i den beroende, används för att förklara graden till vilka ingångsvariabler (prediktorvariabler) förklarar variationen hos utdatavariabler (förutsagda variabler). Det varierar från 0 till 1. Till exempel, om R-kvadraten är 0,9, indikerar det att 90% av variationen i utdatavariablerna förklaras av inmatningsvariablerna. Generellt sett indikerar en högre R-kvadrat en bättre passform för modellen. Tänk på följande diagram:

Justerad R-kvadrat

Den blå linjen refererar till linjen som passar bäst och visar förhållandet mellan variabler. Linjen beräknas genom regressionsanalys Regressionsanalys Regressionsanalys är en uppsättning statistiska metoder som används för att uppskatta sambandet mellan en beroende variabel och en eller flera oberoende variabler. Den kan användas för att bedöma styrkan i sambandet mellan variabler och för att modellera det framtida förhållandet mellan dem. och ritas där de vertikala avstånden (blå prickade linjer) för de gula prickarna till linjen för bästa passning minimeras.

De gula prickarna hänvisar till diagrammet för in- och utdatavariabler. Inmatningsvariabeln plottas på x-axeln medan utgående variabel ritas på y-axeln. Grafen ovan består till exempel av följande dataset:

Justerad R-kvadrat - Grafdata

De blå streckade linjerna hänvisar till avståndet mellan diagrammet för in- och utgångsvariabler från linjen som passar bäst. R-kvadraten härleds från avståndet mellan alla gula prickar från linjen som passar bäst (den blå linjen). Till exempel skulle följande diagram illustrera en R-kvadrat av 1:

R-kvadrat 1

Problem med R-kvadrat

R-kvadrat kommer med ett inneboende problem - ytterligare ingångsvariabler gör att R-kvadrat förblir detsamma eller ökar (detta beror på hur R-kvadrat beräknas matematiskt). Därför, även om de ytterligare inmatningsvariablerna inte visar något samband med utdatavariablerna, kommer R-kvadraten att öka. Ett exempel som förklarar en sådan händelse ges nedan.

Förstå den justerade R-kvadraten

I huvudsak tittar den justerade R-kvadraten på om ytterligare ingångsvariabler bidrar till modellen. Tänk på ett exempel med hjälp av data som samlats in av en pizzaägare, som visas nedan:

Stickprov

Antag att pizzaägaren kör två regressioner:

Regression 1: Pris på deg (inputvariabel), Pris på Pizza (outputvariabel)

Regression 1 ger en R-kvadrat av 0,9557 och en justerad R-kvadrat av 0,9493.

Regression 2: Temperatur (ingångsvariabel 1), Pris på deg (ingångsvariabel 2), Pris på Pizza (utmatningsvariabel)

Regression 2 ger en R-kvadrat av 0,9573 och en justerad R-kvadrat av 0,9431.

Även om temperaturen inte borde utöva någon förutsägbar effekt på priset på en pizza, ökade R-kvadraten från 0,9557 (Regression 1) till 0,9573 (Regression 2). En person kan tro att Regression 2 har högre prediktiv kraft eftersom R-kvadraten är högre. Även om ingångsvariabeln för temperatur är värdelös för att förutsäga priset på en pizza, ökade den R-kvadraten. Här kommer den justerade R-kvadraten in.

Den justerade R-kvadraten tittar på om ytterligare ingångsvariabler bidrar till modellen. Den justerade R-kvadraten i regression 1 var 0,9493 jämfört med den justerade R-kvadraten i regression 2 på 0,9493. Därför kan den justerade R-kvadraten identifiera att ingångsvariabeln för temperatur inte hjälper till att förklara utmatningsvariabeln (priset på en pizza). I ett sådant fall skulle den justerade R-kvadraten peka på modellskaparen att använda Regression 1 snarare än Regression 2.

Exempel på justerad R-kvadrat

Tänk på två modeller:

  • Modell 1 använder inmatningsvariablerna X1, X2 och X3 för att förutsäga Y1.
  • Modell 2 använder inmatningsvariablerna X1 och X2 för att förutsäga Y1.

Vilken modell ska användas? Information om båda modellerna ges nedan:

Exempel

Jämförelse av R-kvadrat mellan modell 1 och modell 2 förutspår R-kvadrat att modell 1 är en bättre modell eftersom den har större förklarande kraft (0,5923 i modell 1 jämfört med 0,5612 i modell 2).

Jämförelse av R-kvadrat mellan modell 1 och modell 2 förutsäger den justerade R-kvadraten att ingångsvariabeln X3 bidrar till att förklara utmatningsvariabeln Y1 (0,4231 i modell 1 mot 0,3512 i modell 2).

Som sådan bör modell 1 användas, eftersom den ytterligare X3-ingångsvariabeln bidrar till att förklara utgångsvariabeln Y1.

Ytterligare resurser

Finance erbjuder Financial Modelling & Valuation Analyst (FMVA) ™ FMVA®-certifiering. Gå med i 350 600 studenter som arbetar för företag som Amazon, JP Morgan och Ferrari-certifieringsprogram för dem som vill ta sin karriär till nästa nivå. För att fortsätta lära och utveckla din karriär kommer följande finansresurser att vara till hjälp:

  • Grundläggande statistikbegrepp för finans Grundläggande statistikbegrepp för ekonomi En gedigen förståelse för statistik är avgörande för att hjälpa oss att bättre förstå ekonomi. Dessutom kan statistikbegrepp hjälpa investerare att övervaka
  • Hög-låg-metod jämfört med regressionsanalys Hög-låg-metod jämfört med regressionsanalys Den höga lågmetoden och regressionsanalysen är de två huvudsakliga kostnadsberäkningsmetoderna som används för att uppskatta mängden fasta och rörliga kostnader. Vanligtvis måste chefer dela upp blandade kostnader i sina fasta och variabla komponenter för att förutsäga och planera för framtiden.
  • Oberoende variabel Oberoende variabel En oberoende variabel är en ingång, antagande eller drivrutin som ändras för att bedöma dess inverkan på en beroende variabel (resultatet).
  • Typer av finansiell analys Typer av finansiell analys Finansiell analys innebär att man använder finansiella data för att bedöma företagets resultat och ge rekommendationer om hur det kan förbättras framöver. Finansanalytiker utför främst sitt arbete i Excel, med hjälp av ett kalkylblad för att analysera historisk data och göra prognoser Typer av finansiell analys

Rekommenderas

Stängdes Crackstreams ner?
2022
Är MC ledningscentral säker?
2022
Lämnar Taliesin en kritisk roll?
2022