Vad är LASSO?

LASSO, förkortning för Least Absolute Shrinkage and Selection Operator, är en statistisk formel vars huvudsyfte är funktionsvalet och reglering av datamodeller. Metoden introducerades först 1996 av statistikprofessor Robert Tibshirani. LASSO introducerar parametrar till summan av en modell, vilket ger den en övre gräns som fungerar som en begränsning för summan att inkludera absoluta parametrar inom ett tillåtet intervall.

lasso

LASSO-metoden reglerar modellparametrar genom att krympa regressionskoefficienterna och minska några av dem till noll. Funktionsvalsfasen inträffar efter krympningen, där varje icke-nollvärde väljs för att användas i modellen. Denna metod är betydelsefull för minimering av prediktionsfel som är vanliga i statistiska modeller Kvantitativ analys Kvantitativ analys är processen att samla in och utvärdera mätbara och verifierbara data såsom intäkter, marknadsandelar och löner för att förstå beteendet och prestandan hos en företag. Under datateknikens tid betraktas kvantitativ analys som det föredragna sättet att fatta välgrundade beslut. .

LASSO erbjuder modeller med hög prediktionsnoggrannhet. Noggrannheten ökar eftersom metoden inkluderar krympning av koefficienter, vilket i gengäld minskar variansen och minimerar förspänningen. Det fungerar bäst när antalet observationer är lågt och antalet funktioner är högt. Det är starkt beroende av parameter λ, som är den styrande faktorn i krympning. Ju större λ blir, desto fler koefficienter tvingas vara noll.

När λ är lika med noll blir modellen regressionen Ordinära minsta kvadrater. Följaktligen, när λ ökar, minskar variansen betydligt, och förspänningen i resultatet ökar också. Lasso är också ett användbart verktyg för att eliminera alla variabler som är irrelevanta och som inte är relaterade till svarsvariabeln.

LASSO i statistiska linjära modeller

En statistisk modell är en matematisk representation av ett problem i verkligheten. Modellen bör uttrycka problemet så nära den verkliga världen som möjligt och samtidigt göra det enkelt och lätt att förstå. En modell består av förklarande och svarsvariabler.

Den förklarande variabeln är en oberoende variabel som bestäms av forskaren. De oberoende variablerna är ingångarna i modellen som kan mätas av forskaren för att bestämma deras effekt på modellens resultat.

Den responsvariabeln är en beroende variabel beroende variabeln en beroende variabel är en som kommer att ändras beroende på värdet av en annan variabel, som kallas den oberoende variabeln. som utgör huvudfokus för experimentet. Det bildar resultatet av experimentet, vilket kan vara ett enda resultat när det gäller univariata modeller, eller, i fallet med multivariata modeller, flera resultat.

LASSO utgör en integrerad del av modellbyggprocessen, särskilt med hjälp av funktionsvalet. Funktionsvalfasen hjälper till att välja förklarande variabler, vilka är de oberoende variablerna och därmed ingångsvariablerna i modellen.

Ingångsvariablerna är viktiga element som bestämmer modellens output och som hjälper till att mäta deras effekt på svarsvariablerna. Att välja rätt variabler avgör modellens noggrannhet. Funktionsvalet i LASSO hjälper till att välja variablerna på rätt sätt.

Uppskattning med LASSO

Statistiska modeller är beroende av LASSO för exakt variabelval och reglering. I linjär regression Regressionsanalys Regressionsanalys är en uppsättning statistiska metoder som används för att uppskatta samband mellan en beroende variabel och en eller flera oberoende variabler. Den kan användas för att bedöma styrkan i sambandet mellan variabler och för att modellera det framtida förhållandet mellan dem. till exempel LASSO introducerar en övre gräns för summan av kvadrater, vilket minimerar felen som finns i modellen. LASSO-uppskattaren beror på parametern λ.

Parametern λ styr krympningens styrka, där en ökning av λ resulterar i en ökning av krympningen. Den övre gränsen för summan av alla koefficienter är omvänt proportionell mot parametern λ. När den övre gränsen ökar i värde minskar parametern λ. När den övre gränsen minskar ökar parametern λ samtidigt.

När den övre gränsen ökar mot oändligheten, närmar sig parametern λ noll och omvandlar därför experimentet till en ordinär minsta kvadrat, där parametern λ alltid är lika med noll. När de övre gränskoefficienterna närmar sig noll ökar värdet på parameter λ mot oändlighet.

LASSO geometri

LASSO bildar en diamantform i tomten för sin begränsningsregion, som visas i bilden nedan. Diamantformen inkluderar hörn, till skillnad från den cirkulära formen som bildas av åsen. Närheten till den första punkten till hörnet visar att modellen har en koefficient, som är lika med noll.

Regionsbegränsningsregionen för åsen bildar en cirkulär form som inte innehåller några hörn som liknar det som bildas av LASSO-begränsningsregionen när den ritas. Åsregressionskoefficienterna kan därför inte vara lika med noll.

Vägt LASSO

Viktad LASSO är resultatet av att en forskare isolerat regressionskoefficienterna. Detta innebär att istället för att straffa en gemensam parameter λ för alla koefficienter, straffas koefficienterna individuellt med olika parametrar.

Vikten kan bestämmas med hjälp av en LASSO-algoritm för att tilldela vikter på lämpligt sätt för noggrann modellering. En liknande viktning av regressionskoefficienter är kooperativet LASSO, där koefficienterna straffas i grupper som anses likartade.

Ytterligare resurser

Finance är den officiella leverantören av Certified Banking & Credit Analyst (CBCA) ™ CBCA ™ Certification Certified Banking & Credit Analyst (CBCA) ™ ackreditering är en global standard för kreditanalytiker som täcker ekonomi, redovisning, kreditanalys, kassaflödesanalys, förbundsmodellering, återbetalning av lån och mer. certifieringsprogram, utformat för att förvandla vem som helst till en ekonomisk analytiker i världsklass.

För att fortsätta lära dig och utveckla dina kunskaper om ekonomisk analys, rekommenderar vi starkt ytterligare finansresurser nedan:

  • Prognosmetoder Prognosmetoder Toppprognosmetoder. I den här artikeln kommer vi att förklara fyra typer av intäktsprognosmetoder som finansanalytiker använder för att förutsäga framtida intäkter.
  • Oberoende variabel Oberoende variabel En oberoende variabel är en ingång, antagande eller drivrutin som ändras för att bedöma dess inverkan på en beroende variabel (resultatet).
  • Multipel av linjär regression Multipel linjär regression Multipel linjär regression avser en statistisk teknik som används för att förutsäga resultatet av en beroende variabel baserat på värdet av oberoende variabler
  • Scenarioanalys Scenarioanalys Scenarioanalys är en teknik som används för att analysera beslut genom att spekulera i olika möjliga resultat i finansiella investeringar. I ekonomisk modellering, detta

Rekommenderas

Stängdes Crackstreams ner?
2022
Är MC ledningscentral säker?
2022
Lämnar Taliesin en kritisk roll?
2022