Oversigt over R-dataramme
Datarammer er en liste over vektorer med samme længde. Forskellen mellem matrix- og datarammer er imidlertid, at datarammerne accepterer forskellige typer data. (Karakter, numerisk osv.). I dette emne skal vi lære om R Data Frame.
Fordele ved brug af datarammer
- Distribueret indsamling af data og organiseret.
- Det har bedre optimeringer sammenlignet med en relationsdatabase.
- Indeholder en række forskellige data, der er heterogene.
Oprettelse af en dataramme i R
Vi opretter data_frame. Nedenfor er eksemplet til at erklære en dataramme.
Data_frame <- data.frame (variable 1, variable 2, variable n…)
I ovenstående eksempel har vi ikke defineret variablerne. Lad os nu se, hvordan vi tildeler værdier til variabler og gemmer dem i datarammen.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
Produktion:
Antal alfa-bolæere
1 2 x SAND
2 3 y SAND
3 4 z FALSE
Struktur af dataramme
Når vi vil vide strukturen i en bestemt dataramme. Vi kan bruge nedenstående funktion.
Stjerne ()
str(Data_frame)
Produktion:
Antal: num 2 3 4
alfa: Faktor m / 3 niveauer “x”, ”y”, ”z”: 1 2 3
Booleans: logi TRUE TRUE FALSE
Uddrag af specifikke data fra datarammen
1. Brug af kolonnenavnet
Vi kan udtrække et bestemt sæt af data fra datarammen.
Fra vores eksempel ovenfor, lad os kun udpakke den første kolonne fra datarammen, der er nummer.
Data_ frame <- data. Frame(Number)
Produktion:
Nummer
1 2
2 3
3 4
2. Brug af rækkerne
Vi kan udtrække dataene fra rækkerne ligesom nedenstående eksempel.
Lad os antage, at vi kun ønsker at udskrive to rækker i kolonnen Antal.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(1:2, ) print(output)
Produktion:
Antal alfa-bolæere
1 2 x SAND
2 3 y SAND
3 4 z FALSE
------------
Antal alfa-bolæere
1 2 x SAND
2 3 y SAND
Vi kan observere forskellen i første og anden output.
3. Udskrivning af specifikke rækker og kolonner
Vi kan også udskrive specifikke rækker og kolonner.
I nedenstående eksempel udskriver vi 1. og 2. række, kolonner
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(c(1, 2), c(1, 2)) print(output)
Produktion:
Antal alfa-bolæere
1 2 x SAND
2 3 y SAND
3 4 z FALSE
-------------
Antal alfa
1 2 x
2 3 y
4. Føj en anden kolonne til datarammen
Vi kan tilføje en anden kolonne sammen med værdier til datarammen.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- Data_frame
print(out)
Produktion:
Antal alfa Booleans-klasse
1 2 x SAND A
2 3 y SAND B
3 4 z FALSE C
5. Tilføjelse af en række til datarammen
Vi bruger rbind-funktionen til at tilføje en ny række til den eksisterende dataramme.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- rbind(Data_frame, c(5, "x", FALSE, "D"))
print(out)
Produktion:
Antal alfa Booleans-klasse
1 2 x SAND A
2 3 y SAND B
3 4 z FALSE C
4 5 x FALSE D
6. Kombination af begge datarammer
Vi kan også kombinere to datarammer til at producere en enkelt output.
For at kombinere to datarammer skal vi have den samme kolonne for datarammerne.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame1 <- data.frame(Number, alpha, Booleans)
print(Data_frame1)
Number <- c(4, 5, 6)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame2 <- data.frame(Number, alpha, Booleans)
print(Data_frame2)
out <- rbind(Data_frame1, Data_frame2)
print(out)
Produktion:
Antal alfa-bolæere
1 2 x SAND
2 3 y SAND
3 4 z FALSE
--------------
Antal alfa-bolæere
1 4 x SAND
2 5 y SAND
3 6 z FALSE
--------------
Antal alfa-bolæere
1 2 x SAND
2 3 y SAND
3 4 z FALSE
4 4 x SAND
5 5 y SAND
6 6 z FALSE
Inspicerer datarammer
Nedenfor er de forskellige måder at inspicere en dataramme og giver information om en dataramme ligesom ovenstående stjernefunktion.
1. Navne - Angiver navnene på variablerne i dataframe
Syntaks : names(data frame name)
Eksempel
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
names(Data_frame)
output : (1) “Number” “alpha” “Booleans”
2. Resume - Giver statistik for datarammen.
Syntaks: summary(data frame name)
Eksempel
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
summary(Data_frame)
Produktion:
Antal alfa-bolæere
Min. : 2, 0 x: 1 Mode: logisk
1. kv .:2, 5 y: 1 FALSE: 1
Median: 3, 0 z: 1 SAND: 2
Middelværdi: 3, 0 NA'er: 0
3. kv .:3.5
Maks. : 4, 0
3. Head - Angiver data for de første par rækker.
Syntaks: Head( name of the data frame)
Eksempel
Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
head(Data_frame)
Produktion:
Antal alfa-bolæere
1 2 x SAND
2 3 y SAND
3 4 z FALSE
4 5 a SAND
5 6 b FALSE
6 7 c FALSE
4. Hale- Udskriver de sidste par rækker i datarammen.
Syntaks: tail( name of the data frame)
Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
tail(Data_frame)
Produktion:
Antal alfa-bolæere
5 6 b FALSE
6 7 c FALSE
7 8 d FALSE
8 9 f FALSE
9 10 g FALSE
10 11 j FALSE
Konklusion
Datarammer er et vigtigt koncept i R-programmering. Det er let, men alligevel kraftigt ved at oprette datasæt, der let kan ændres og fås adgang til. Ligesom matrix kan man få adgang til datasættene gennem rækker og kolonnenavne med let at tilføje og fjerne data.
Anbefalede artikler
Dette er en guide til R Data Frame. Her drøfter vi Oprettelse af dataramme i R med strukturen og uddrag af specifikke data fra datarammen. Du kan også se på de følgende artikler for at lære mere -
- Datatyper i C
- Data Science Karriere
- Big Data Technologies
- Data Science Platform
- Java Booleans