Introduktion til polynomial regression

Regression er defineret som metoden til at finde forholdet mellem de uafhængige og afhængige variabler for at forudsige resultatet. Den første polynomiale regressionsmodel blev anvendt i 1815 af Gergonne. Det bruges til at finde den bedste fit line ved hjælp af regressionslinjen til at forudsige resultaterne. Der er mange typer regressionsteknikker, polynomial regression er en af ​​dem. Før du forstår dette, tilrådes det at have korrekt viden om lineær regression, så det vil være let at markere forskellene mellem dem.

Hvorfor polynomregression?

  • Dette er en af ​​regressionsteknikkerne, som professionelle bruger til at forudsige resultatet. Det defineres som forholdet mellem de uafhængige og afhængige variabler, når den afhængige variabel er relateret til den uafhængige variabel, der har en niende grad. Det kræver ikke, at forholdet mellem afhængige og uafhængige variabler skal være lineære, så hvis linjen er en kurve, end den kan have nogen polynomisk betegnelse.
  • Den største forskel mellem lineær og polynomisk regression er, at lineær regression kræver, at de afhængige og uafhængige variabler er lineært relaterede, mens dette bedre kan passe til linjen, hvis vi inkluderer en højere grad til den uafhængige variabeltid i ligningen. Ligningen af ​​den polynomiale regression, der har en niende grad, kan skrives som:

Y = b0 + a1x + a2x 2 + a3x 3 +…. ANX n

  • Hvis vi tilføjer højere grader som kvadratisk, forvandler den linjen til en kurve, der bedre passer til dataene. Generelt bruges det, når punkterne i datasættet er spredt, og den lineære model ikke er i stand til at beskrive resultatet klart. Vi bør altid holde øje med Overfitting og Underfitting, mens vi overvejer disse grader til ligningen.
  • Det er bedre at overveje den grad, der passerer gennem alle datapunkter, men sommetider at tage en højere grad, f.eks. 10 eller 20, kan passere gennem alle datapunkter og reducere fejlen, men det indfanger også støj fra de data, der overfylder modellen og det kan undgås ved at tilføje flere prøver til træningsdatasættet. Så det tilrådes altid at vælge en optimal grad, der passer til modellen.

Der er to teknikker, der bruges til at bestemme ligningens grad:

  • Valg fremad: Det er metoden til at øge graden, indtil den er betydelig nok til at definere modellen.
  • Valg bagud: Det er metoden til at sænke graden, indtil den er betydelig nok til at definere modellen.

Procedure til anvendelse af polynomisk regression

Find nedenstående trin eller procedure til anvendelse af polynomial regression på ethvert datasæt:

Trin 1: Importer det respektive datasæt til en hvilken som helst platform (R eller Python), og installer de krævede pakker, der kræves til anvendelse af modellen.

Trin 2: Opdel datasættet i trænings- og testsæt, så vi kan anvende algoritmen på træningsdatasættet og teste det ved hjælp af testdatasættet.

Trin 3: Anvend metoder til analyse af data til at undersøge baggrunden for dataene som middelværdi, median, tilstand, første kvartil, anden kvartil osv.

Trin 4: Anvend den lineære regressionsalgoritme på datasættet og undersøg modellen.

Trin 5: Anvend den polynomiale regressionsalgoritme på datasættet, og studer modellen for at sammenligne resultaterne enten RMSE eller R-kvadratet mellem lineær regression og polynomial regression.

Trin 6: Visualiser og forudsig både resultaterne af lineær og polynomial regression og identificer, hvilken model der forudsiger datasættet med bedre resultater.

Polynomregression anvender

  • Det bruges i mange eksperimentelle procedurer til at producere resultatet ved hjælp af denne ligning.
  • Det giver et stort defineret forhold mellem de uafhængige og afhængige variabler.
  • Det bruges til at undersøge sedimenternes isotoper.
  • Det bruges til at undersøge stigningen i forskellige sygdomme inden for enhver population.
  • Det bruges til at studere genereringen af ​​enhver syntese.

Funktioner ved polynomial regression

  • Det er en type ikke-lineær regressionsmetode, der fortæller os forholdet mellem den uafhængige og afhængige variabel, når den afhængige variabel er relateret til den uafhængige variabel i den niende grad.
  • Den bedste pasningslinje bestemmes af graden af ​​den polynomiale regressionsligning.
  • Modellen, der er afledt af den polynomiale regression, påvirkes af outliers, så det er altid bedre at behandle outliers, inden algoritmen anvendes på datasættet.
  • Funktionen Polynomialfeature () konverteres til et træk i matrix afhængigt af ligningens grad.
  • Kurvenes art kan studeres eller visualiseres ved hjælp af et simpelt spredningsdiagram, som giver dig en bedre idé om linearitetsforholdet mellem variablerne og beslutter i overensstemmelse hermed.

Konklusion

Polynomial regression bruges i mange organisationer, når de identificerer et ikke-lineært forhold mellem de uafhængige og afhængige variabler. Det er en af ​​de vanskelige regressionsteknikker sammenlignet med andre regressionsmetoder, så at have dybtgående viden om fremgangsmåden og algoritmen vil hjælpe dig med at opnå bedre resultater.

Anbefalede artikler

Dette er en guide til en polynomial regression. Her diskuterer vi funktionerne og anvendelserne af polynomial regression. Du kan også gennemgå vores andre foreslåede artikler for at lære mere–

  1. SVM-algoritme
  2. Kernemetoder
  3. LINEST Excel-funktion
  4. Maskinlæringsalgoritmer
  5. Lineær regression vs logistisk regression | Topforskelle

Kategori: