Introduktion til R-pakker

Pakken er en samling af funktioner og datasæt. Pakker hjælper med at forbedre funktionaliteten i et programmeringssprog. Hvis vi vil gemme og behandle databaser (dvs. SQL-lignende funktionaliteter ved hjælp af datarammer), kan vi bruge dplyr-pakken i R. Pakker indeholder også dokumentation for, hvordan man bruger funktionerne og datasættene i en given pakke.

Hvor finder vi pakker?

Pakker er tilgængelige på internettet gennem forskellige kilder. Der er dog visse betroede opbevaringssteder, hvorfra vi kan hente pakkerne.

Her er de to vigtige lagre, der er tilgængelige online.

  • CRAN (Comprehensive R Archive Network): Dette er det officielle R-samfund med et netværk af FTP og webservere, der indeholder den nyeste kode og dokumentation fra R. Før du poster dine pakker online går den gennem en række tests, der overholder CRAN-politikken .
  • GitHub: GitHub er et andet berømt arkiv, men ikke specifikt for R. Online-samfundet kan dele deres pakker med andre mennesker, og det bruges til versionskontrol er godt. GitHub er en open-source og har ikke nogen gennemgangsproces.

Liste over nyttige R-pakker

Der er flere pakker i R og kan downloades fra CRAN eller GitHub. Nedenfor er de pakker, der kan bruges til specifikke formål.

1. Indlæsning af data fra eksterne kilder

  • Haven: R læser og skriver data fra SAS.
  • DBI: O o etablere kommunikation mellem den relationelle database og R.
  • RSQlite: Det bruges til at læse data fra relationelle databaser.

2. Datamanipulation

  • Dplyr: Det bruges til datamanipulation som underindstilling, giver genveje til at få adgang til data og genererer sql-forespørgsler.
  • Tidyr - Det bruges til at konvertere data til små formater.
  • stringr - manipulere strengudtryk og karakterstrenge.
  • lubridat - At arbejde med data og tid.

3. Data visualisering

  • Rgl: At arbejde på 3D-visualiseringer.
  • ggvis: At oprette og opbygge grammatik af grafik.
  • googlevis: At bruge google-visualiseringsværktøjer i R.

4. Web-baserede pakker

  1. XML: At læse og skrive XML-dokumenter i R.
  2. Httpr: Arbejd med http-forbindelser.
  3. Jsonlite: Sådan læser du json-datatabeller.

At få R-pakker

Vi kan kontrollere de tilgængelige pakker, der findes i R ved hjælp af nedenstående kode.

  • available.packages (): Der er ca. 5200 pakker tilgængelige i CRAN-netværket.

CRAN har opgavevisninger, som grupperer pakker under et bestemt emne.

Installation af R-pakker

Vi kan installere pakker direkte gennem IDE eller gennem kommandoer. For at installere pakker bruger vi nedenstående funktion og specificerer pakkenavnet.

Syntaks:

install.packages()

Kode:

install.packages(“ggplot2”)

Ovenstående kode installerer ggplot2-pakken og dens afhængige pakker, hvis nogen.

Vi kan installere flere pakker ad gangen ved at specificere pakkenavnene under en tegnvektor.

Syntaks:

install.packages(c(“package 1”, ”package 2”, ”package 3”))

Kode:

install.packages(c(“ggplot2”, ”slidify”, ”deplyr”))

Installation ved hjælp af R Studio

Fordelen ved at bruge et R-studio er, at det er GUI (Graphical User interface). Vi kan vælge de pakker, der skal installeres, og kilden til den.

Vi kan gå til værktøjer -> Installer pakker.

Indlæser R-pakker

Efter installation af R-pakken er vi nødt til at indlæse dem i R for at begynde at gøre brug af de installerede pakker.

Vi bruger nedenstående funktion til at indlæse pakkerne.

Syntaks:

library(package name)

Bemærk: Pakkenavnet behøver ikke angives i tilbud.

Kode:

library(ggplot2)

Der er visse pakker, der viser meddelelser, når de indlæses. Nogle af dem, ikke. Vi kan se detaljerne i biblioteket installeret ved hjælp af nedenstående kode.

Kode:

library(ggplot2)
search()

Produktion:

“Pakke: gitter” “pakke: ggplot2” “pakke: mærker”

“Pakke: knitr” “pakke: glidify” “værktøjer: rstudio”

Oprettelse af din egen pakke

Før vi opretter vores egen pakke. Vi bør holde nedenstående tjekliste i tankerne, inden vi fortsætter med at oprette en pakke.

  • Organisering af koden er en af ​​de vigtigste ting, mens du skriver kode i pakken. Vi mister halvdelen af ​​tiden på at søge efter kodeplacering i stedet for at forbedre koden. Læg alle filerne i en mappe, der er let tilgængelig.
  • At dokumentere koden hjælper dig med at forstå formålet med koden. Når vi ikke gentager koden ofte, glemmer vi, hvorfor vi har skrevet koden på en bestemt måde. Det kan også hjælpe folk med at forstå din kode bedre, når de deles med dem.
  • Deling af scripts via e-mail er blevet arkaisk. Den nemme måde er at uploade din kode og distribuere den på GitHub. Det er muligt, at du får feedback, der kan hjælpe dig med at forbedre koden.

For at oprette din egen pakke er vi nødt til at installere devtools-pakken.

Kode:

install.packages("devtools")

For at hjælpe med dokumentationen kan vi bruge nedenstående pakke.

Kode:

install.packages("roxygen2")

Efter installation af pakkeudstyrene. Du kan oprette din egen pakke.

Kode:

devtools::create ("packagename")

I stedet for “pakkenavn” kan du give det navn, du ønsker. Du kan nu tilføje dine funktioner under denne pakke.

Du kan oprette det samme filnavn som dit funktionsnavn.

Syntaks:

Devtools:create(“firstpackage”)

Distribueringspakke

Du kan distribuere din pakke på github ved hjælp af devtools-pakken.

Vi bruger nedenstående kode til at distribuere vores pakke på github.

Kode:

devtools::install_github("yourusername/firstpackage")

Du kan give dit github-brugernavn og det pakkenavn, du har oprettet ovenfor.

Her er de påkrævede filer til en pakke

  • Funktioner
  • Dokumentation
  • Data

Når vi først har alle ovenstående filer, er vi gode til at lægge dem i depotet.

Anbefalede artikler

Dette er en guide til R-pakker. Her diskuterer vi listen over nyttige R-pakker, installation af pakker ved hjælp af R studio og oprettelse af din egen pakke osv. Du kan også se på følgende artikler for at lære mere -

  1. Hvad er R-programmeringssprog?
  2. Karrierer inden for R-programmering
  3. R-programmering vs Python
  4. MySQL vs SQLite
  5. Liste over R-pakker

Kategori: