Introduktion til lineær algebra i maskinlæring

Lineær algebra er en del af matematikken, der inkluderer lineære ligninger og deres repræsentationer gennem matrixer og vektorrum. Det hjælper med at beskrive funktionerne i algoritmer og implementere dem. Det bruges sammen med tabeldata eller billeder til bedre justering af algoritmerne for at få det bedste resultat ud af det. I dette emne skal vi lære om Lineær Algebra i maskinlæring.

Matrix: Det er en matrix med tal i en rektangulær form repræsenteret af rækker og kolonner.

Eksempel:

Vektor: En vektor er en række eller en søjle i en matrix.

Eksempel:

Tensor: Tensorer er en række numre eller funktioner, der transmitterer med bestemte regler, når koordinatændringer.

Hvordan fungerer lineær algebra i maskinlæring?

Da maskinuddannelse er kontaktpunktet for datalogi og statistik, hjælper Lineær Algebra med at blande videnskab, teknologi, økonomi og konti og handel helt. Numpy er et bibliotek i Python, der arbejder på multidimensionelle arrays til videnskabelige beregninger i Data Science og ML.

Lineær algebra fungerer på forskellige måder, som det afspejles i nogle eksempler, der er anført nedenfor:

1. Datasæt og datafiler

En data er en matrix eller en datastruktur i Lineær Algebra. Et datasæt indeholder et sæt numre eller data på en tabelform. Rækker repræsenterer observationer, mens kolonner repræsenterer træk ved det. Hver række er af samme længde. Så data er vektoriseret. Rækkerne er forudkonfigureret og indsættes til modellen ad gangen for lettere og autentiske beregninger.

2. Billeder og fotografier

Alle billeder er i tabelform. Hver celle i sort / hvide billeder består af højde, bredde og en-pixel-værdi. Tilsvarende har farvebilleder 3-pixelværdier i det bortset fra højde og bredde. Det danner en matrix i Lineær Algebra. Alle former for redigering såsom beskæring, skalering osv. Og manipulationsteknikker udføres ved hjælp af algebraiske operationer.

3. Regularisering

Regularisering er en metode, der minimerer størrelsen på koefficienter, mens den indsættes i data. L1 og L2 er af nogle almindelige metoder til implementering i regularisering, som er mål for størrelsen af ​​koefficienter i en vektor.

4. Deep Learning

Denne metode bruges mest i neurale netværk med forskellige løsninger i det virkelige liv, såsom maskinoversættelse, billedteksttekst, talegenkendelse og mange andre felter. Det fungerer med vektorer, matrixer og endda tensorer, da det kræver lineære datastrukturer tilføjet og multipliceret sammen.

5. En varm kodning

Det er en populær kodning for kategoriske variabler for lettere betjening i algebra. En tabel er konstrueret med en kolonne for hver kategori og række for hvert eksempel. Ciffer 1 tilføjes for kategorisk værdi efterfulgt af 0 i resten og så videre, som citeret nedenfor:

6. Lineær regression

Lineær regression, en af ​​de statistiske metoder, bruges til at forudsige numeriske værdier for regressionsproblemer samt til at beskrive forholdet mellem variabler.

Eksempel: y = A. b, hvor A er datasæt eller matrix, b er koefficient og y er output.

7. Analyse af hovedkomponenter eller PCA

Hovedkomponentanalyse er anvendelig, mens man arbejder med højdimensionelle data til visualisering og modeloperationer. Når vi finder irrelevante data, har vi en tendens til at fjerne de overflødige kolonner. Så PCA fungerer som en løsning. Matrixfaktorisering er PCAs hovedmål.

8. Nedbrydning med en værdi eller SVD

Det er også en matrixfaktoriseringsmetode, der generelt bruges til visualisering, støjreduktion osv.

9. Latent semantisk analyse

I denne proces er dokumenter repræsenteret som store matrixer. Dokument, der er behandlet i disse matrixer, er let at sammenligne, forespørge og bruge. En matrix er konstrueret, hvor rækker repræsenterer ord og kolonner repræsenterer dokumenter. SVD bruges til at reducere antallet af kolonner, mens ligheden bevares.

10. Anbefalingssystemer

Forudsigelige modeller er afhængige af anbefaling af produkter. Ved hjælp af Linear Algebra fungerer SVD til at rense data ved hjælp af euklidiske afstands- eller prikprodukter. Når vi for eksempel køber en bog på Amazon, kommer anbefalinger baseret på vores købshistorik, hvor vi holder andre irrelevante varer til side.

Fordele ved lineær algebra i maskinlæring

  • Fungerer som et solidt fundament for maskinlæring med inkludering af både matematik og statistik.
    Både tabelformede og billeder kan bruges i lineære datastrukturer.
  • Det er også distribuerende, associerende og kommunikativt.
  • Det er en enkel, konstruktiv og alsidig tilgang i ML.
  • Lineær algebra er anvendelig på mange områder såsom forudsigelser, signalanalyse, ansigtsgenkendelse osv.

Linear Algebra-funktioner i maskinlæring

Der er nogle lineære algebrafunktioner, som er vigtige i ML- og Data Science-operationer som beskrevet nedenfor:

1. Lineær funktion

Den lineære regressionsalgoritme bruger en lineær funktion, hvor output er kontinuerligt og har en konstant hældning. Lineære funktioner har en lige linje i grafen.

F (x) = mx + b

Hvor, F (x) er værdien af ​​funktionen,

m er linjens hældning,

b er værdien af ​​funktionen, når x = 0,

x er værdien af ​​x-koordinat.

Eksempel: y = 5x + 25

Lad x = 0, så y = 5 * 1 + 25 = 25

Lad x = 2, så y = 5 * 2 + 25 = 40

2. Identitetsfunktion

Identitetsfunktion hører under den uovervågede algoritme og bruges mest i neurale netværk i ML, hvor output fra det flerlagede neurale netværk er lig med dets input, som nævnt nedenfor:

For hvert x, f (x) kort til x dvs. x kort til sig selv.

Eksempel: x + 0 = x

x / 1 = x

1 ---> 1

2 ---> 2

3 ---> 3

3. Sammensætning

ML bruger sammensætning og pipelining-funktioner i højere orden i sine algoritmer til matematiske beregninger og visualiseringer. Sammensætningsfunktionen er beskrevet som nedenfor:

(GOF) (x) = g (f (x))

Eksempel: lad g (y) = y

f (x) = x + 1

GOF (x + 1) = x + 1

4. Invers funktion

Det inverse er en funktion, der vender sig selv. Funktioner f og g omvendt, hvis tåge og gof er defineret og er identitetsfunktioner

Eksempel:

5. Invertible funktion

En funktion, der har omvendt, er invertible.

en til en

Konklusion

Linear Algebra er et underfelt i matematik. Den har dog bredere anvendelse i Machine Learning fra notation til implementering af algoritmer i datasæt og billeder. Ved hjælp af ML har algebra fået en større indflydelse i virkelige applikationer såsom søgemaskine-analyse, ansigtsgenkendelse, forudsigelser, computergrafik osv.

Anbefalede artikler

Dette er en guide til lineær algebra i maskinlæring. Her diskuterer vi, hvordan fungerede Linear Algebra i maskinlæring med fordelene og nogle eksempler. Du kan også se på den følgende artikel.

  1. Hyperparameter-maskinlæring
  2. Klynge i maskinlæring
  3. Data Science Machine Learning
  4. Uovervåget maskinlæring
  5. Forskellen mellem Lineær Regression vs Logistisk Regression

Kategori: