Introduktion til uovervåget maskinlæring

Har du nogensinde tænkt på, hvordan et barn er i stand til at skelne mellem æbler og appelsiner, når han ikke ved, hvad de faktisk er, hvordan de smager, men baseret på farve og størrelse kan han opdele dem i 2 grupper uden forudgående information? Kan vi forvente den samme segmentering som et barn gør fra maskiner, hvis farve- og størrelsesoplysningerne gives? Lad os se, hvordan vi kan gøre det! I dette emne skal vi lære om uovervåget maskinlæring.

”Maskinlæring”, som udtrykket antyder, vi lærer maskiner til at udføre menneskelignende opgaver, og hvordan lærer mennesker, enten fra nogen eller ved observation. Samme som mennesker, som maskinen lærer.

Maskinindlæring kan opdeles i 3 dele: -

  1. Overvåget læring
  2. Uovervåget læring
  3. Forstærkning læring

Typer af maskinlæring

Forstærkningslæring er agentbaseret læring, der involverer belønning og straf ved handlinger, der er truffet af en agent. Slutmålet er at maksimere den samlede belønning i processen med at lære af miljøet.

Når du har input-output-data, kan korte, mærkede data for eksempel, givet højde og vægt for at bestemme, om en person er mand eller kvinde, kan betragtes som en Overvåget læringsopgave (fra nogen i tilfælde af mennesker).

Men i mange virkelige scenarier er disse mærkede eller annoterede data ikke altid tilgængelige. Mange gange står vi overfor problemer med at segmentere objekter baseret på deres egenskaber, som ikke eksplicit er nævnt. Hvordan løses dette problem? Nå, uovervåget læring er løsningen.

Wikipedia siger, at uovervåget læring er en type selvorganiseret hebbisk læring, der hjælper med at finde tidligere ukendte mønstre i datasæt uden forudgående eksisterende etiketter. I uovervåget læring har vi ikke nogen etiketoplysninger, men alligevel ønsker vi at få indsigt fra dataene baseret på dets forskellige egenskaber.

Typer af uovervåget maskinlæring

Uovervågede læringsopgaver kan bredt opdeles i 3 kategorier:

  1. Sammenslutningsregel minedrift
  2. clustering
  3. Anbefalingssystem

1. Sammenslutningsregelmining

Når vi har transaktionsdata for noget, kan det være for produkter, der sælges, eller transaktionsdata til det der betyder noget, jeg vil gerne vide, er der noget skjult forhold mellem køber og produkterne eller produkt til produkt, så jeg på en eller anden måde kan udnytte disse oplysninger for at øge mit salg. Udvinding af disse relationer er kernen i Association Rule Mining. Vi kan bruge AIS, SETM, Apriori, FP vækstalgoritmer til udtræk af relationer.

2. Clustering

Clustering kan udføres alle data, hvor vi ikke har klasse- eller etiketoplysninger. Vi ønsker at gruppere dataene således, at observationer med lignende egenskaber hører til den samme klynge / gruppe, og afstand mellem klynger skal være maksimal. Mens intra-klyngedistribution bør være mindst. Vi kan klynge vælgerens data for at finde ud af udtalelsen om regeringen eller klyngeprodukter, baseret på deres funktioner og brug. Segmentpopulation baseret på indkomstfunktioner eller brug klynger i salg og marketing.

Vi kan bruge K-Means, K-Means ++, K-Medoids, Fuzzy C-middel (FCM),

Expectation-Maximization (EM), Agglomerative Clustering, DBSCAN, typer af hierarkisk clustering som enkelt kobling, komplet binding, median linking, Ward's metodealgoritmer til clustering.

3. Anbefalingssystem

Anbefalingssystem er dybest set en udvidelse af sammenslutningsregelmining i den forstand, i ARM udtrækker vi relationer, og i anbefalingssystem bruger vi disse relationer til at anbefale noget, der har større acceptmuligheder fra slutbrugeren. Anbefalingssystemer har vundet popularitet, efter at Netflix annoncerede en stor præmie på $ 1.000.000 præmie i 2009.

Anbefalingssystemer fungerer på transaktionsdata, det være sig økonomisk transaktion, e-handel eller købmandsforretning. I dag lokker gigantiske spillere i e-handelsbranchen kunder ved at fremsætte en tilpasset anbefaling til hver bruger baseret på deres tidligere købshistorik og lignende opkøbsdata fra andre brugere.

Metoder til udvikling af anbefalingssystemer kan bredt opdeles i samarbejdsfiltrering og indholdsbaseret filtrering. I samarbejdsfiltrering igen har vi bruger-bruger Collaborative filtrering og Item-Item Collaborative filtrering, som er hukommelsesbaserede tilgange & Matrix-faktorisering og Singular Value Decomposition (SVD) er modelbaserede tilgange.

Anvendelser af uovervåget læring

Da verdensdata stiger enormt hver dag, har uovervåget læring mange anvendelser. Vi opretter altid data ved hjælp af sociale medieplatforme eller noget videoindhold på YouTube, og mange gange gør vi ikke engang bevidst. Alle disse data er ustrukturerede, og det vil være trættende og dyre at mærke dem til overvågede læringsopgaver.

Følgende er nogle seje anvendelser af uovervåget maskinlæring.

  1. Supermarked eller e-handelsbutik / markedsplads: Ekstrakteringsregler fra kunder fra transaktionsdata og anbefalinger til forbrugere om at købe produkter.
  2. Platform på sociale medier: Uddrag forhold til forskellige brugere for at foreslå produkter eller tjenester. Anbefal nye mennesker til social forbindelse.
  3. Tjenester: Anbefalinger af rejsetjenester, en anbefaling af huse til leje eller matchmaking-tjenester.
  4. Banking: Clusterkunder baseret på deres økonomiske transaktioner. Cluster-falske transaktioner til afsløring af svig.
  5. Politik: Clustervælgerens meninger om chancerne for en sejr for et bestemt parti.
  6. Datavisualisering: Med gruppering og t-distribueret stokastisk naboindlejring (t-SNE) kan vi visualisere højdimensionelle data. Dette kan også bruges til dimensionalitetsreduktion.
  7. Underholdning: Anbefalinger til film, musik, som Netflix og Amazon gør.
  8. Billedsegmentering: Clusterbillede dele baseret på nærmeste pixelværdier.
  9. Indhold: personaliserede aviser, anbefalinger fra websider, e-learning-applikationer og e-mail-filtre.
  10. Strukturel opdagelse: Med klynger kan vi opdage enhver skjult struktur i dataene. Cluster twitter-data til sentimentanalyse.

Konklusion

Uovervåget maskinlæring er ikke for kvantificerbar, men kan løse en masse problemer, hvor overvågede algoritmer mislykkes. Der er mange applikationer til uovervåget læring i mange domæner, hvor vi har ustrukturerede og umærkede data. Vi kan bruge uovervåget indlæringsteknikker til at lære vores maskiner at gøre et bedre job end os. I de senere år har maskiner overgået mennesker med hensyn til opgaver, der betragtes som løst af mennesker i århundreder. Jeg håber, at du med denne artikel forstod, hvad der er, og hvordan uovervåget maskinlæringsteknikker kan bruges til at løse problemer i den virkelige verden.

Anbefalede artikler

Dette er en guide til uovervåget maskinlæring. Her diskuterer vi typer af maskinlæring og typer af uovervåget maskinlæring sammen med dens applikationer. Du kan også se på de følgende artikler for at lære mere -

  1. Maskinlæringsalgoritmer
  2. Hvad er maskinlæring?
  3. Introduktion til maskinlæring
  4. Værktøj til maskinindlæring
  5. Klynge i maskinlæring
  6. Hyperparameter-maskinlæring
  7. Hierarkisk klynge-algoritme
  8. Hierarkisk klynge | Agglomerativ og opdelende klynge
  9. Top 8 faser i maskinlæringscyklus

Kategori: