Introduktion til R-programmeringssprog

I dagens verden er det vigtigt for en virksomhed at forstå en stor mængde data. Brug af regneark er ikke den bedste mulighed for forretninger i disse dage. her vil vi diskutere mere om R-programmeringssprog.

R er et open source-programmeringssprog samt et softwaremiljø, der bruges til statistisk analyse, grafisk repræsentation og rapportering. Det blev skabt af Ross Ihaka og Robert Gentleman. Det betragtes som en dialekt af S-sproget. Det bruges vidt af forskere over hele verden. Det gør det nemt at analysere dataene mere effektivt og effektivt.

R-programmeringssprog distribueres frit under GNU General Public License. Det fungerer i flere operativsystemer som Unix, Linux, Windows og Mac. De filer, der er nødvendige for at installere R fra de forudkompilerede binære versioner, distribueres fra webstedet for det omfattende R Archive Network (CRAN).

R-programmeringssprog har mange funktioner til statistisk analyse og grafiske repræsentationer.

Fordele ved at bruge R-programmeringssprog

  • R er gratis og er den første store fordel.
  • Du kan installere R i så mange computere, som du vil
  • R er let at samarbejde og lære
  • Alle kan skrive en tilføjelsespakke til R
  • Giver den mest avancerede analyse
  • R har kapacitet til reproducerbar forskning. Som et resultat af dette projekt kan let gentages, når der er nye data tilgængelige

Sådan installeres R-programmeringssprog

Følg disse enkle trin for at installere R på din computer.

  1. Download R fra nettet, og åbn R-filen i download-mappen.

  1. Dobbeltklik på filen for at åbne den. Dette fører dig til et sikkerhedsadvarslingsvindue.

  1. Klik på Kør. Dette fører dig igen til et vindue, hvor du spørger, om du vil tillade, at følgende program fra en ukendt udgiver foretager ændringer i dette computervindue. Klik på Ja.
  2. Det næste vindue giver dig mulighed for at vælge sproget. Vælg sproget, og klik på Ok.
  3. Dette åbner vinduet Opsætningsguide.

  1. Klik på Næste. Efter dette får du GNU General Public License. Læs det, og klik på Næste.

  1. I det næste vindue skal du vælge destinationen. Standardplaceringen er Programfiler. Vælg og klik på Næste.

  1. Det næste vindue giver dig mulighed for at vælge de komponenter, der skal installeres. Marker altid afkrydsningsfeltet for kernefiler, og vælg mellem 32-bit filer eller 64-bit filer i henhold til dit system. Klik på Næste

  1. Det næste vindue spørger, om du vil tilpasse startmulighederne. Vælg Nej, og klik på Næste.

  1. Det næste vindue hjælper dig med at vælge en Start-menu-mappe.

  1. Klik på Næste. Det næste vindue giver dig mulighed for at vælge Yderligere opgaver og giver dig mulighed for at oprette et skrivebordsikon eller et hurtigstartikon. Marker begge afkrydsningsfelter for Registreringsposter. Vælg Næste.

  1. R vil blive installeret. Vælg knappen Afslut for at afslutte installationen.

Begyndende med R

Når R er installeret, kan du åbne R ved hjælp af

Startmenu à Alle programmer à R

eller

Du kan også dobbeltklikke på R-genvejsikonet på skrivebordet

R-konsollen vises som vist på billedet herunder. RGui er den korte form af R Graphical User Interface. Det er den nemmeste måde at interagere med R-sproget på. Du kan konfigurere nogle aspekter af RGui. Dialogboksen RGui-konfigurationseditor vises på billedet herunder

R-konsollen er det sted, hvor du kan indtaste kommandoer. Nogle gange bliver du bedt om at skrive kommandoen i et script og derefter køre kommandoerne. Et script er et separat vindue, hvor du kan skrive dine kommandoer. Nedenfor billedet viser dig, hvordan du åbner et script

For at køre kommandoerne i scriptet kan du enten kopiere indsætte kommandoer i kommandovinduet eller vælge de kommandoer, du vil køre, og klikke på knappen Kør linje eller markering.

Når du skriver kommandoer i konsollen, kan du også bruge tidligere brugte kommandoer ved hjælp af pil op eller pil ned.

Sådan fungerer R

Nedenstående billede forklarer dig arbejdsgangen til R

Hver gang R kører, gemmes variabler, funktioner og andre i hukommelsen på computeren i form af objekter med et navn. Brugeren kan udføre forskellige operationer på disse objekter ved hjælp af operatører og funktioner. En R-funktion kan repræsenteres som vist på billedet herunder

Argumenterne kan være objekter, der er defineret som standard eller specificeret af brugeren. Funktionerne udføres via kommandoer, der er indtastet af brugeren. Resultaterne vises derefter på skærmen og gemmes som et objekt i computerhukommelsen.

Grundlæggende om R-programmeringssprog

her er det grundlæggende i R-programmeringssprog, som du har brug for at vide for at arbejde med R.

  • Kommandoer, objekter og funktioner

Hver gang du vil interagere med R, kan du indtaste en kommando i konsolens dialogboks og trykke på enter. Hvis du har indtastet en forkert kommando, får du en fejlmeddelelse. Du kan nemt foretage en simpel beregning ved hjælp af R. Du kan bruge alle de aritmetiske operatører på samme måde som brugt i den anden computerapplikation uden at behøver ikke at skrive ligesignalet. Bare tryk på enter, så får du output.

Eksempel

7 + 3

(1) 10

3 3

(1) 27

10 * (10 + 2)

(1) 120

(2 * (17, 2 + 5)) / 56

(1) 0, 7929

I ovenstående eksempler kan du finde (1) foran alle svarene. Dette betegner, at der kun er et tal i svaret. Når der er mere end et tal i svaret, hjælper det dig med at finde ud af svaret i grupperne. Og hvis der tilføjes en parentes, udføres disse beregninger først. Hvis der tilføjes mere end et beslag, kan du gruppere dine konsoller ved hjælp af Ad Infinitum.

  • objekter

Hvis du vil udføre yderligere beregninger ved hjælp af output fra en beregning, skal du give det et navn og bestille R for at gemme det som et objekt. Et eksempel er givet nedenfor

svar <- 4 + 4

I dette eksempel kaldes <- tildelingssymbolet eller det tildelte symbol. Dette symbol beder R om at gøre objektet til venstre til output fra kommandoen til højre. Du kan også gemme resultaterne af en beregning foretaget med objekter som et andet objekt. Du kan fjerne et objekt ved hjælp af rm () -funktionen og bekræfte det ved hjælp af funktionen ls ().

  • Funktioner

R har et stort udvalg af kode, der hjælper dig med at udføre matematiske beregninger, tegne en graf og udføre statistisk analyse. Disse koder kaldes funktioner. Hvert funktionsnavn slutter i et par parenteser, og du kan også med det samme skrive navnet på funktionen og navnet på objektet for at udføre den handling, du har brug for.

eksempler

sqrt (100)

(1) 10

Du kan også tilføje et objektnavn for at udføre beregningen

synd (15+ svar)

Værdien af ​​objektet "svar" tages her til beregning

Vektorer, matrixer og datarammer

R er den bedste løsning til at håndtere objekter, der er gruppen af ​​tal eller grupper af tegn. Grupper med et tal, der er organiseret som sekvenser, kaldes Vectors. Grupper, der er organiseret som to-dimensionelle tabeller kaldes matrixer. Tabeller, der indeholder et tal i nogle kolonner og nogle andre data i andre kolonner kaldes Data Frames.

  • Vektorer

Lad os se på et eksempel for at forstå, hvad vektor er, og hvordan den bruges i R

Eksempel

A <- seq (10, 20)

I dette eksempel har du oprettet et nyt objekt kaldet A, og det indeholder rækkefølgen af ​​tal fra 10 til 20. Du kan kontrollere dette ved blot at skrive A og få output. Det forklares nedenfor

EN

(1) 10 11 12 13 14 15 16 17 18 19 20

En af de vigtigste funktioner i Vector er c (). Det betyder 'sammenkædet'. Et eksempel er givet nedenfor

B <- c (2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22)

B (Tryk på enter)

(1) 2 4 6 8 10 12 14 16 18 20 22

Du kan også udføre aritmetiske operationer i en vektor.

A + B

(1) 12 15 18 21 24 27 30 33 36 39 42

  • Matricer

Når du har data, der kan arrangeres i to dimensioner, kaldes det Matrix. Matrix betegnes med matrix () -funktion.

Eksempel

mat2 <- matrix (data = seq (1, 12), nrows = 3, ncols = 4, dimnames = list (c ("række 1", "række 2", "række 3"), c ("Col 1", “Col 2”, “Col 3”, “Col 4”)

Ovenstående eksempel forklares detaljeret nedenfor

mat2 <- opsætter et objekt kaldet mat2

matrix (data = seq (1, 12) her objekt er matrixen og data i matrixen er en sekvens af tal fra 1 til 12

nrows = 3, ncols = 4 betyder, at antallet af rækker er 3 og antallet af kolonner er 4

dimnames = liste (c ("Række 1", "Række 2", "Række 3"), c ("Col 1", "Col 2", "Col 3", "Col 4") giver navnene til rækkerne og kolonner.

Outputet er som følger

mat1col1Col2Col3COL4
Række 114710
Række 225811
Række 336912

Datatyper og datarammer

Data registreres altid som tal eller kvantitative data. Numeriske objekter kan yderligere opdeles i reelle tal, komplekse tal eller heltal osv. I tilfælde af, at du ville finde ud af, om den vektor, du bruger, er i numerisk form, kan du bruge funktionstilstanden () og kende, hvilken type numerisk du kan bruge funktionsklassen ().

Der er en speciel type data i R, der kaldes en faktor. Denne type data er, hvor tingene er opdelt i klasser.

  • sænket

Du kan finde det enkelte antal eller grupper inden for datastrukturen ved hjælp af underskrifter. Det vil være meget nyttigt.

Eksempel

X <- rnorm (10, 2, 0, 1)

I dette eksempel oprettes en vektor i navnet X, der består af 10 tilfældige tal afledt af en normal fordeling med middelværdien 2 og standardafvigelse 0, 1.

Abonnementer behøver ikke nødvendigvis at være enkeltnumre. Det kan være et objekt eller endda en funktion. Logiske udtryk kan også inkluderes i abonnementet.

  • undersæt

En delmængde er en funktion, der bruges til at udlede en del af en matrix eller dataramme. Det har tre hovedafsnit - først navnet på underættet, derefter et logisk udtryk, tredje, der informerer R om hvilke kolonner der skal vælges.

Eksempel

Tæller <- read.csv ("Countts.csv", header = T)

Fra nedenstående tabel kan du oprette en undergruppe

KønMidlertidigVægtVægt
MHed75292
FHed65180
MKold69.03161
FKold73, 25323

Tæller 2 = 70)

Dette giver dig output, hvis vægt er mindre end 70.

R programmeringssprog Pakker

R-installation leveres med alle de grundlæggende pakker. Der er mange andre pakker, som hjælper dig med at indlæse nye funktioner og objekter. Du kan også oprette en ny pakke i R. Nogle af de grundlæggende pakker inkluderet i R under dens installation er vist nedenfor

  • gitter
  • MASSE
  • nlme
  • klynge
  • overlevelse

Du kan bruge det installerede. pakker () -funktion for at vide mere om de installerede pakker.

Statistiske metoder

R leveres med forskellige statistiske metoder, der er indbygget. De er

  • Betyde
  • median
  • Mode
  • Fordelinger
  • kovarians
  • Regression
  • Ikke-lineære blandede effekter
  • GLM
  • GAM og en masse metoder

R har også forskellige statistiske procedurer som det følgende

  • Klassiske parametriske prøver
  • Ikke-parametriske prøver
  • Lineær modellering
  • Ikke-lineær regressionsmodellering
  • clustering
  • Smoothing

Konklusion

I bund og grund er, at programmeringssprog R hjælper både forskere og forretningsfolk med at udføre effektiv dataanalyse. R-pakker gør det nemt for virksomheder at foretage analysen. De kræver ikke computerprogrammører eller omfattende programmering for at bruge R. R Programmeringssprog hjælper med at skabe grafik på en mere tiltalende måde.

Anbefalede artikler

Her er din guide til at forstå installationen, komme i gang, fordele, grundlæggende kommandoer og funktioner i R-programmeringssprog.

  1. Er Python et scriptingsprog?
  2. Sådan installeres Angular 2?
  3. Sådan installeres Swift?
  4. Er MySQL-programmeringssprog?

Kategori: