Oversigt over R-dataramme

Datarammer er en liste over vektorer med samme længde. Forskellen mellem matrix- og datarammer er imidlertid, at datarammerne accepterer forskellige typer data. (Karakter, numerisk osv.). I dette emne skal vi lære om R Data Frame.

Fordele ved brug af datarammer

  • Distribueret indsamling af data og organiseret.
  • Det har bedre optimeringer sammenlignet med en relationsdatabase.
  • Indeholder en række forskellige data, der er heterogene.

Oprettelse af en dataramme i R

Vi opretter data_frame. Nedenfor er eksemplet til at erklære en dataramme.

Data_frame <- data.frame (variable 1, variable 2, variable n…)

I ovenstående eksempel har vi ikke defineret variablerne. Lad os nu se, hvordan vi tildeler værdier til variabler og gemmer dem i datarammen.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)

Produktion:

Antal alfa-bolæere

1 2 x SAND

2 3 y SAND

3 4 z FALSE

Struktur af dataramme

Når vi vil vide strukturen i en bestemt dataramme. Vi kan bruge nedenstående funktion.

Stjerne ()

str(Data_frame)

Produktion:

Antal: num 2 3 4

alfa: Faktor m / 3 niveauer “x”, ”y”, ”z”: 1 2 3

Booleans: logi TRUE TRUE FALSE

Uddrag af specifikke data fra datarammen

1. Brug af kolonnenavnet

Vi kan udtrække et bestemt sæt af data fra datarammen.

Fra vores eksempel ovenfor, lad os kun udpakke den første kolonne fra datarammen, der er nummer.

Data_ frame <- data. Frame(Number)

Produktion:

Nummer

1 2

2 3

3 4

2. Brug af rækkerne

Vi kan udtrække dataene fra rækkerne ligesom nedenstående eksempel.

Lad os antage, at vi kun ønsker at udskrive to rækker i kolonnen Antal.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(1:2, ) print(output)

Produktion:

Antal alfa-bolæere

1 2 x SAND

2 3 y SAND

3 4 z FALSE

------------

Antal alfa-bolæere

1 2 x SAND

2 3 y SAND

Vi kan observere forskellen i første og anden output.

3. Udskrivning af specifikke rækker og kolonner

Vi kan også udskrive specifikke rækker og kolonner.

I nedenstående eksempel udskriver vi 1. og 2. række, kolonner

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(c(1, 2), c(1, 2)) print(output)

Produktion:

Antal alfa-bolæere

1 2 x SAND

2 3 y SAND

3 4 z FALSE

-------------

Antal alfa

1 2 x

2 3 y

4. Føj en anden kolonne til datarammen

Vi kan tilføje en anden kolonne sammen med værdier til datarammen.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- Data_frame
print(out)

Produktion:

Antal alfa Booleans-klasse

1 2 x SAND A

2 3 y SAND B

3 4 z FALSE C

5. Tilføjelse af en række til datarammen

Vi bruger rbind-funktionen til at tilføje en ny række til den eksisterende dataramme.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- rbind(Data_frame, c(5, "x", FALSE, "D"))
print(out)

Produktion:

Antal alfa Booleans-klasse

1 2 x SAND A

2 3 y SAND B

3 4 z FALSE C

4 5 x FALSE D

6. Kombination af begge datarammer

Vi kan også kombinere to datarammer til at producere en enkelt output.

For at kombinere to datarammer skal vi have den samme kolonne for datarammerne.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame1 <- data.frame(Number, alpha, Booleans)
print(Data_frame1)
Number <- c(4, 5, 6)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame2 <- data.frame(Number, alpha, Booleans)
print(Data_frame2)
out <- rbind(Data_frame1, Data_frame2)
print(out)

Produktion:

Antal alfa-bolæere
1 2 x SAND
2 3 y SAND
3 4 z FALSE
--------------
Antal alfa-bolæere
1 4 x SAND
2 5 y SAND
3 6 z FALSE

--------------

Antal alfa-bolæere
1 2 x SAND
2 3 y SAND
3 4 z FALSE
4 4 x SAND
5 5 y SAND
6 6 z FALSE

Inspicerer datarammer

Nedenfor er de forskellige måder at inspicere en dataramme og giver information om en dataramme ligesom ovenstående stjernefunktion.

1. Navne - Angiver navnene på variablerne i dataframe

Syntaks : names(data frame name)

Eksempel

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
names(Data_frame)

output : (1) “Number” “alpha” “Booleans”

2. Resume - Giver statistik for datarammen.

Syntaks: summary(data frame name)

Eksempel

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
summary(Data_frame)

Produktion:

Antal alfa-bolæere
Min. : 2, 0 x: 1 Mode: logisk
1. kv .:2, 5 y: 1 FALSE: 1
Median: 3, 0 z: 1 SAND: 2
Middelværdi: 3, 0 NA'er: 0
3. kv .:3.5
Maks. : 4, 0

3. Head - Angiver data for de første par rækker.

Syntaks: Head( name of the data frame)

Eksempel

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
head(Data_frame)

Produktion:

Antal alfa-bolæere
1 2 x SAND
2 3 y SAND
3 4 z FALSE
4 5 a SAND
5 6 b FALSE
6 7 c FALSE

4. Hale- Udskriver de sidste par rækker i datarammen.

Syntaks: tail( name of the data frame)

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
tail(Data_frame)

Produktion:

Antal alfa-bolæere
5 6 b FALSE
6 7 c FALSE
7 8 d FALSE
8 9 f FALSE
9 10 g FALSE
10 11 j FALSE

Konklusion

Datarammer er et vigtigt koncept i R-programmering. Det er let, men alligevel kraftigt ved at oprette datasæt, der let kan ændres og fås adgang til. Ligesom matrix kan man få adgang til datasættene gennem rækker og kolonnenavne med let at tilføje og fjerne data.

Anbefalede artikler

Dette er en guide til R Data Frame. Her drøfter vi Oprettelse af dataramme i R med strukturen og uddrag af specifikke data fra datarammen. Du kan også se på de følgende artikler for at lære mere -

  1. Datatyper i C
  2. Data Science Karriere
  3. Big Data Technologies
  4. Data Science Platform
  5. Java Booleans

Kategori: