Vad är elastiskt nät?

Elastisk netto linjär regression använder påföljderna från både lasso- och åstekniker för att reglera regressionsmodeller. Tekniken kombinerar både lasso LASSO LASSO, förkortning för Least Absolute Shrinkage and Selection Operator, är en statistisk formel vars huvudsakliga syfte är funktionsval och reglering av och åkregressionsmetoder genom att lära av deras brister för att förbättra regleringen av statistiska modeller.

Elastiskt nät

Den elastiska nätmetoden förbättrar lassos begränsningar, dvs där lasso tar några prover för högdimensionella data, den elastiska nätproceduren ger inkludering av "n" antal variabler tills mättnad. I ett fall där variablerna är starkt korrelerade grupper tenderar lasso att välja en variabel från sådana grupper och ignorera resten helt.

För att eliminera de begränsningar som finns i lasso inkluderar det elastiska nätet ett kvadratiskt uttryck (|| β || 2) i straffet, som, när det används isolerat, blir åsregression. Det kvadratiska uttrycket i straffet lyfter förlustfunktionen mot att vara konvex. Det elastiska nätet drar nytta av det bästa från båda världar - dvs lasso och åskregression.

I proceduren för att hitta den elastiska nätmetodens uppskattning finns det två steg som involverar både lasso- och regressionstekniker. Den hittar först åkregressionskoefficienterna och utför sedan det andra steget genom att använda en lasso-form av krympning av koefficienterna.

Denna metod utsätter därför koefficienterna i två typer av krympningar. Den dubbla krympningen från den naiva versionen av det elastiska nätet orsakar låg effektivitet i förutsägbarhet och hög förspänning. För att korrigera för sådana effekter omskalas koefficienterna genom att multiplicera dem med (1 + λ 2 ).

Snabb sammanfattning

  • Den elastiska nätmetoden utför variabelt urval och reglering samtidigt.
  • Den elastiska nättekniken är lämpligast där måttdata är större än antalet använda prover.
  • Gruppering och val av variabler är nyckelrollerna för den elastiska nättekniken.

Elastisk nätgeometri

När det ritas på ett kartesiskt plan, faller det elastiska nätet mellan åsen och lasso-regressionsdiagrammen, eftersom det är kombinationen av dessa två regressionsmetoder. Tomten för det elastiska nätet uppvisar också singularitet vid hörnpunkterna, vilket är viktigt för gleshet. Det uppvisar också strikta konvexa kanter där konvexiteten beror på värdet av α.

Konvexitet är också beroende av grupperingseffekten beroende av korrelationen Korrelation En korrelation är ett statistiskt mått på förhållandet mellan två variabler. Måttet används bäst i variabler som visar ett linjärt förhållande mellan varandra. Datapassningen kan visas visuellt i en spridningsdiagram. av de valda variablerna. Ju högre korrelationen av variablerna är, desto högre är grupperingseffekten och därmed desto högre är antalet variabler som ingår i urvalet.

Val av variabler

Modellbyggnad kräver val av variabler för att bilda en delmängd av prediktorer. Elastiskt nät använder p >> n-problemmetoden, vilket innebär att antalet prediktors antal är högre än antalet prover som används i modellen. Elastiskt nät är lämpligt när variablerna bildar grupper som innehåller starkt korrelerade oberoende variabler Oberoende variabel En oberoende variabel är en ingång, antagande eller drivkraft som ändras för att bedöma dess inverkan på en beroende variabel (resultatet). .

Variabelt urval ingår i modellbyggnadsproceduren för att öka noggrannheten. Om en grupp variabler är starkt korrelerad och en av variablerna väljs i urvalet inkluderas hela gruppen automatiskt i urvalet.

CATREG Incorporation

CATREG är en algoritm som underlättar transformation av variabler, både linjära och icke-linjära. Algoritmen använder steg- och splinefunktioner för att transformera variabler antingen icke-monotont eller monotont i icke-linjära transformationer. CATREG kan samtidigt omvandla och reglera variabler icke-monotont utan att nödvändigtvis först behöva expandera variabler till grundläggande funktioner eller dummyvariabler.

Elastiska funktioner för nettoförlust kan också benämnas som den begränsade typen av den vanliga regressionsförlustfunktionen med minsta kvadrat. CATREG-algoritmen ingår i det elastiska nätet, vilket förbättrar effektiviteten och enkelheten hos den resulterande algoritmen. Som jämförelse överträffar det elastiska nätet lasso, vilket i sig överträffar åsen regression när det gäller effektivitet och enkelhet.

Elastisk nätreglering

Under regleringsförfarandet bildar straffet l 1 avsnitt en gles modell. Å andra sidan gör den kvadratiska delen av straffet l 1- delen mer stabil i vägen till reglering, eliminerar kvantitetsgränsen för variabler som ska väljas och främjar grupperingseffekten.

Grupperingseffekten hjälper variablerna att enkelt identifieras med hjälp av korrelation. Detta förbättrar provtagningsproceduren. Det ökar också antalet valda variabler, eftersom när en variabel samplas i en starkt korrelerad grupp läggs alla andra variabler i den gruppen automatiskt till i urvalet.

Effektiva grader av frihet

Effektiva frihetsgrader mäter komplexiteten hos en modell. Frihetsgrader är viktiga under uppskattningen eller den exakta förutsägelsen av en modellpassning. Grader av frihet ingår också i inlärningen av linjära smoothers. I vilken metod som helst relaterad till l en straff, den icke-linjära naturen hos modeller höjer utmaningen i analysen.

Elastiskt nät kan också användas i andra applikationer, till exempel i gles PCA, där det erhåller huvudkomponenter som modifieras av glesa belastningar. Den andra applikationen finns i kärnelastiskt nät, där genereringen av klasskärnmaskiner sker med supportvektorer.

Ytterligare resurser

Finance erbjuder Certified Banking & Credit Analyst (CBCA) ™ CBCA ™ Certification Certified Banking & Credit Analyst (CBCA) ™ ackreditering är en global standard för kreditanalytiker som täcker ekonomi, redovisning, kreditanalys, kassaflödesanalys, covenant modellering, lån återbetalningar och mer. certifieringsprogram för dem som vill ta sin karriär till nästa nivå. För att fortsätta lära dig och utveckla din kunskapsbas, vänligen utforska de ytterligare relevanta finansresurserna nedan:

  • Beslutsträd Beslutsträd Ett beslutsträd är ett stödverktyg med en trädliknande struktur som modellerar sannolika resultat, resurskostnader, verktyg och möjliga konsekvenser.
  • Beroende variabel Beroende variabel En beroende variabel är en som kommer att ändras beroende på värdet på en annan variabel, kallad den oberoende variabeln.
  • Multipel linjär regression Multipel linjär regression Multipel linjär regression avser en statistisk teknik som används för att förutsäga resultatet av en beroende variabel baserat på värdet av oberoende variabler
  • Overfitting Overfitting Overfitting är en term som används i statistik som refererar till ett modelleringsfel som uppstår när en funktion motsvarar för nära en viss uppsättning data

Rekommenderas

Stängdes Crackstreams ner?
2022
Är MC ledningscentral säker?
2022
Lämnar Taliesin en kritisk roll?
2022