Introduktion til liste over R-pakker

En pakke i R-programmeringssprog er en enhed, der giver de nødvendige funktionaliteter, der kan bruges ved at indlæse den i R-miljøet. En liste over R-pakker ligner et bibliotek i C, C ++ eller Java. Så i bund og grund kan en pakke have adskillige funktionaliteter som funktioner, konstanter osv., Som vi tillader brugeren at bruge dem i sammenhæng med et bestemt problem. I R kan en påkrævet pakke indlæses vha. Funktionen bibliotek (). I tilfælde af at en pakke ikke er til stede, kan den installeres ved hjælp af funktionen install.packages (). Pakker gør tilsyneladende vanskelige opgaver let gennem dets færdige funktioner.

Hvad er R-pakker?

Der er mange pakker i R, og valg af en pakke afhænger af dens anvendelse. Selvom der er visse pakker, der er vidt brugt på grund af de funktionaliteter, de leverer, er det ikke tilfældet, at andre pakker er mindre vigtige. Forskellige pakker har forskellige formål; nogle er relateret til statistiske teknikker, andre vedrører visualiseringer osv.

I det følgende afsnit vil vi se på nogle af de vigtige pakker i R:

1. Bil

Denne pakke er ledsager til anvendt regression. Det er en stor pakke, der giver forskellige funktionaliteter til statistisk analyse. Import af denne pakke i R-miljøet importerer andre relaterede pakker såsom MASS, statistik, grafik osv. Nogle af funktionerne i pakken inkluderer Anova, avPlots, Boxplot, carPalette, densitetsplott, infIndexPlot, lineær hypotese, logit, outlier test, qqPlot, restdiagrammer, scatterplot, scatterplot matrix osv. De omfattende funktioner i pakken kan måles ud fra antallet af funktioner, den leverer.

2. Korrekt

Pakken giver en grafisk visning af en korrelationsmatrix og et konfidensinterval. Pakken indeholder også algoritmer til udførelse af matrixreorganisering. Talrige indstillinger inkluderer valg af nødvendige farver, tekstetiketter, farveetiketter, layout osv. Forskellige visualiseringsmetoder eller parametermetoder i corrplot-pakken er "cirkel", "firkant", "ellipse", "antal", "skygge", "farve" og "pie". Korplotfunktionen, der indeholder forskellige muligheder, giver en visuelt tiltalende repræsentation af sammenhæng mellem forskellige variabler, som ellers under normale omstændigheder som tal er vanskelige at fortolke. Positive korrelationer vises i blå og negative korrelationer i rødt. Farveintensiteten og størrelsen på cirklen er proportional med korrelationskoefficienterne.

3. DataExplorer

Denne pakke omhandler automatisk udforskning og behandling af data. Det giver en automatiseret dataudforskningsproces beregnet til analytiske opgaver og forudsigelig modellering. Dette er afgørende, da det gør det muligt for brugeren at forstå data og udtrække indsigt. Hver variabel i analysen scannes og analyseres af pakken. Desuden tilvejebringer pakken funktionaliteter til visualisering af disse variabler ved hjælp af typiske grafiske teknikker. Det giver også almindelige databehandlingsmetoder til behandling og format af data.

4. Gmodels

Gmodels-pakken indeholder forskellige værktøjer i R til plotning af data. Det indeholder forskellige funktioner, såsom glh.test, der bruges til at teste, udskrive eller sammenfatte en generel lineær hypotese til en regressionsmodel. Funktionen gør. kontraster konverterer menneskelige læsbare kontraster til den form, som R kræver til beregning. Matrixen, der returneres af make.contrasts, kan bruges som argumentet til kontrastargumentet for modelfunktioner. CoefFrame-funktionen passer til en model til hver undergruppe defineret af og returnerer derefter en dataramme med en række for hver pasning og en kolonne for hver parameter. Den estimable funktion beregner og tester kontraster og andre estimable lineære funktioner af modelkoefficienter for lm, glm osv. Funktionen fit.contrast beregner og tester vilkårlige kontraster for regressionsobjekter.

5. Gplots

Denne pakke giver visualiseringsfunktionaliteter gennem mangfoldige programmeringsværktøjer. Funktionerne i pakken arbejder med begrebet beregning og plotning. De grafiske egenskaber ved pakken demonstreres af forskellige funktioner såsom bånd plot, boxplot2, col2hex, ci2d, hist2d, tekst plot, sink plot, ballon pilot, plotCI, plot middel osv. Disse funktioner muliggør arbejde med indstillinger relateret til farve, tekst og andre indviklede grafiske aspekter af visualiseringen. De beskæftiger sig også med komplekse elementer, der er involveret i statistikbaseret visualisering, f.eks. Lmplot2, residplot-funktioner, der gør det muligt for brugeren at køre detaljeret regressionsdiagnose gennem diagnostiske plot. Hvis der skal plottes flere data i samme område, men med separate akser, er dette muligt ved hjælp af over-plot-funktionen i pakken.

6. Ggplot2

Det er en af ​​de meget berømte pakker i R, der giver omfattende visuelle evner og præsenterer resultaterne selv af komplekse statistiske og matematiske teknikker. De mange funktionaliteter, der leveres af pakken, gør det muligt for analytikeren at udlede indsigt fra data på den mest interaktive måde. R-beskrivelsen for funktionen er "et system til erklærende oprettelse af grafik, der er baseret på grammatikken i grafik". Denne grammatik af grafik betyder, at brugeren skal fortælle 'ggplot2' om den måde, variabler skal kortlægges til æstetik, så dette betyder i det væsentlige, at specificering af, hvilke grafiske aspekter der skal bruges, og ggplot2 vil fungere i overensstemmelse hermed baseret på detaljerne.

7. Lubridat

Denne R-pakke gør det lettere at arbejde med datoer og klokkeslæt. Den lette pakke muliggør nem manipulering af dato- og tidsdata. Det analyserer et tal og giver passende dataindretning, faktisk analyserer funktionerne i pakken en lang række formater og separatorer, der forenkler parsningsprocessen. En af de bemærkelsesværdige funktioner er, at pakken giver funktionaliteter til håndtering af datoer med forskellige tidszoner.

8. Hmisc

Navngivet Harrell Diverse, Hmisc-pakken indeholder mange funktioner, der kan udnyttes til dataanalyse, grafik på højt niveau og hjælpeprogrammer. Det inkluderer også funktioner til beregning af prøvestørrelse og magt, import og annotering af datasæt, beregning af manglende værdier, tilvejebringelse af avancerede tabelfunktionaliteter, klynge af variabler, manipulation af tegnsnoren, konvertering af R-objekter til HTML-kode osv.

9. Gitter

Pakken tilbyder et højt niveau datavisualiseringssystem, der er inspireret af Trellis-grafik. Det understreger på multivariate data. Pakkens kraftige visualiseringsfunktioner giver den nødvendige grafiske løsning. Nogle af de bemærkelsesværdige funktioner i pakken er B_07_cloud, som hjælper med at producere 3d-scatter-plot og wireframe-overfladeplan; D_level. farver, en funktion til beregning af falske farver, der repræsenterer numerisk eller kategorisk variabel; B_06_levelplot, en funktion, der genererer niveau plot og kontur plot; A_01_Lattice, en funktion, der giver grafiske funktioner til gitter. B_09_tmd er en funktion, der genererer Tukey Mean - Difference plot; B_11_oneway, en funktion der passer til envejsmodellen. Pakken giver således omfattende funktionaliteter til visualiseringer gennem forskellige funktioner.

10. MatrixModels

Denne pakke tillader modellering med sparse og tætte 'Matrix'-matrixer. For at opnå dette bruger den modulopspådomning og respons, modulklasser. Alle funktioner, der leveres af pakken, er lige så vigtige, hvoraf nogle er lm.fit.sparse, som er en montørfunktion til sparsomme lineære modeller, opløsCoef, der løser for koefficienter og koefficientforøgelse, model. En matrix, der konstruerer muligvis sparsomt design eller modelmatrixer, glm4, der passer til generaliserede lineære modeller.

11. Multcomp

Pakken giver mulighed for flere sammenligninger af k-grupper i generaliserede lineære modeller. En liste over ni standardprocedurer, dvs. Dunnet, Tukey, Sequen, AVE, Changepoint, Williams, Marcus, McDermott og Tetrade leveres til brugeren, og brugeren vælger sammenligningerne baseret på kravet. Derudover tilvejebringes også en gratis inputgrænseflade til kontrastmatrixen, som muliggør specielle sammenligninger. Det bemærkelsesværdige træk er, at sammenligningerne i sig selv ikke er begrænset til noget bestemt design såsom afbalanceret eller simpel, snarere er programmerne designet på en sådan måde, at de passer til flere sammenligninger inden for den generelle lineære model, der giver mulighed for covariater, korrelerede midler, manglende værdier, etc.

12. OpenMx

Denne pakke omhandler dybest set udvidet strukturel ligningsmodellering. Det giver funktionaliteter til at oprette strukturelle ligningsmodeller. Disse modeller kan manipuleres ved hjælp af programmering. Modellerne kan specificeres med matrixer eller stier som LISREL eller RAM. Nogle af modellerne inkluderer flere grupper, bekræftelsesfaktor, blandingsfordeling, kategorisk tærskel, differentieret pasfunktion osv.

13. Plyr

Det er en meget vigtig pakke, der giver funktionaliteter til datamanipulation. Det giver værktøjer til opdeling, anvendelse og kombination af data. Det leveres med et sæt værktøjer, der hjælper med at løse et fælles sæt problemer. F.eks. Kan det være nødvendigt, at vi nogle gange er nødt til at opdele en stor opgave i mindre opgaver, der er håndterbare, så arbejder vi på hver af brikkerne og derefter til sidst sætter vi alle brikkerne sammen igen.

14. Qcc

Pakken får betydning på grund af forskellige kvalitetsanalysefunktionaliteter, den leverer. Det giver Shewhart-kvalitetskontroldiagrammer til kontinuerlige, attributter og tæller data. Blandt andre vigtige diagrammer er Cusum- og EWMA-diagrammer og driftskarakteristikskurver. Det tilbyder også processfunktionsanalysefunktionalitet. Pareto-diagram og årsags-og-virkningskort og multivariate kontroldiagrammer er nyttige værktøjer, der leveres af pakken.

15. RandomForest

Som navnet antyder, bruges denne pakke til at opbygge en tilfældig skovalgoritme. Pakken implementerer Breimans tilfældige skovalgoritme, der er baseret på Beiman og Cutlers originale FORTRAN-kode. Algoritmen bruges til klassificering og regression. Pakken kan også bruges i uovervåget tilstand til at vurdere nærhed mellem datapunkter.

16. Psyk

Det er en pakke beregnet til et specielt formål. Pakken indeholder en procedure til psykologisk, psykometrisk og personlighedsundersøgelse. Funktioner er primært til multivariat analyse ved hjælp af forskellige multivariate statistiske teknikker.

Konklusion-liste over R-pakker

Der er adskillige pakker i R, og anvendelsen af ​​en pakke afhænger af kravene. Listen over R-pakker-samfundet er vokset meget hurtigt, og hver eneste dag tilføjes en pakke. Flere pakker kan give lignende funktionaliteter, men valget af en pakke skal være baseret på dens omhyggelige undersøgelse.

Anbefalede artikler

Dette er en guide til en liste over R-pakker. Her diskuterer vi introduktionen til R-pakker og nogle vigtige pakker af R. Du kan også gennemgå vores andre foreslåede artikler for at lære mere -

  1. Java-pakker
  2. Hvad er JNDI i Java?
  3. JColorChooser
  4. R-programmering vs Python

Kategori: