Export dát z R: Ako exportovať dáta z R do CSV, Excel

Obsah:

Anonim

Ako exportovať údaje z R.

V tomto tutoriále sa dozvieme, ako exportovať údaje z prostredia R do rôznych formátov.

Na export údajov na pevný disk potrebujete cestu k súboru a príponu. Najskôr je cesta miestom, kde sa budú údaje ukladať. V tomto výučbe uvidíte, ako ukladať údaje na:

  • Pevný disk
  • disk Google
  • Dropbox

Po druhé, R umožňuje používateľom exportovať údaje do rôznych typov súborov. Pokrývame základnú príponu súboru:

  • csv
  • xlsx
  • RDS
  • SAV
  • SPSS
  • STATA

Celkovo nie je ťažké exportovať údaje z R.

V tomto návode sa naučíte

  • Exportovať na pevný disk
  • Ako exportovať údajový rámec do súboru CSV v R
  • Ako exportovať údaje z R do súboru Excel
  • Export údajov z R do iného softvéru
  • Export údajov z R do súboru SAS
  • Ako exportovať dáta z R do súboru STATA
  • Interakcia s cloudovými službami
  • disk Google
  • Exportovať do Dropboxu

Exportovať na pevný disk

Najskôr môžete údaje uložiť priamo do pracovného adresára. Nasledujúci kód vytlačí cestu k vášmu pracovnému adresáru:

directory <-getwd()directory

Výkon:

## [1] "/Users/15_Export_to_do" 

V predvolenom nastavení sa súbor uloží pod cestu nižšie.

Pre systém Mac OS:

/Users/USERNAME/Downloads/ 

Pre Windows:

C:\Users\USERNAME\Documents\

Môžete si samozrejme zvoliť inú cestu. Môžete napríklad zmeniť cestu k priečinku na stiahnutie.

Vytvorte dátový rámec

Najskôr importujme dátovú množinu mtcars a získajme priemer mpg a disp zoskupený podľa prevodových stupňov.

library(dplyr)df <-mtcars % > %select(mpg, disp, gear) % > %group_by(gear) % > %summarize(mean_mpg = mean(mpg), mean_disp = mean(disp))df

Výstup :

## # A tibble: 3 x 3## gear mean_mpg mean_disp##   lt;dbl>## 1 3 16.10667 326.3000## 2 4 24.53333 123.0167## 3 5 21.38000 202.4800

Tabuľka obsahuje tri riadky a tri stĺpce. Súbor CSV môžete vytvoriť pomocou funkcie write.csv v R.

Ako exportovať údajový rámec do súboru CSV v R

Základná syntax súboru write.csv v R na export DataFrame do CSV v R:

write.csv(df, path)arguments-df: Dataset to save. Need to be the same name of the data frame in the environment.-path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory

Príklad:

write.csv(df, "table_car.csv")

Vysvetlenie kódu

  • write.csv (df, "table_car.csv"): Vytvorte súbor CSV na pevnom disku:
    • df: názov dátového rámca v prostredí
    • "table_car.csv": Pomenujte súbor table_car a uložte ho ako csv

Poznámka : Funkciu write.csv v R môžete použiť ako write.csv2 () na oddelenie riadkov bodkočiarkou pre export R do údajov csv.

write.csv2(df, "table_car.csv")

Poznámka : Len na pedagogické účely sme vytvorili funkciu nazvanú open_folder (), aby sme vám otvorili priečinok adresára. Musíte len spustiť kód uvedený nižšie a zistiť, kde je uložený súbor csv. Mali by ste vidieť názvy súborov table_car.csv pre export údajov R do CSV.

# Run this code to create the functionopen_folder <-function(dir){if (.Platform['OS.type'] == "windows"){shell.exec(dir)} else {system(paste(Sys.getenv("R_BROWSER"), dir))}}# Call the function to open the folderopen_folder(directory)

Ako exportovať údaje z R do súboru Excel

Teraz sa naučíme, ako exportovať údaje z R do Excelu:

Export dát z R do Excelu je pre používateľov Windows triviálny a pre používateľov Mac OS zložitejší. Obaja používatelia použijú knižnicu xlsx na vytvorenie súboru programu Excel. Malý rozdiel spočíva v inštalácii knižnice. Knižnica xlsx skutočne používa na vytvorenie súboru jazyk Java. Na export údajov R do programu Excel je potrebné nainštalovať program Java, ak nie je vo vašom prístroji.

Používatelia Windows

Ak ste používateľom systému Windows, môžete knižnicu nainštalovať priamo pomocou programu conda na export dátového rámca do programu Excel R:

conda install -c r r-xlsx

Po nainštalovaní knižnice môžete používať funkciu write.xlsx (). V pracovnom adresári sa vytvorí nový zošit programu Excel na export R do údajov programu Excel

library(xlsx)write.xlsx(df, "table_car.xlsx")

Ak ste používateľom systému Mac OS, musíte postupovať podľa týchto krokov:

  • Krok 1: Nainštalujte si najnovšiu verziu Java
  • Krok 2: Nainštalujte knižnicu rJava
  • Krok 3: Nainštalujte knižnicu xlsx

Krok 1) Môžete si stiahnuť Javu z oficiálnych stránok spoločnosti Oracle a nainštalovať si ju.

Môžete sa vrátiť do programu Rstudio a skontrolovať, ktorá verzia Java je nainštalovaná.

system("java -version")

V čase tutoriálu je najnovšia verzia Java 9.0.4.

Krok 2) Musíte nainštalovať rjava do R. Odporúčali sme vám nainštalovať R a Rstudio pomocou Anacondy. Anakonda riadi závislosti medzi knižnicami. V tomto zmysle bude Anaconda zvládať zložitosť inštalácie rJava.

Najskôr je potrebné aktualizovať conda a potom nainštalovať knižnicu. Nasledujúce dva riadky kódu môžete skopírovať a vložiť do terminálu.

conda - conda updateconda install -c r r-rjava

Ďalej otvorte rjavu v Rstudiu

library(rJava)

Krok 3) Nakoniec je čas nainštalovať xlsx. Opäť môžete na to použiť conda:

conda install -c r r-xlsx

Rovnako ako používatelia systému Windows, aj vy môžete ukladať údaje pomocou funkcie write.xlsx ()

library(xlsx)

Výkon:

## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")

Export údajov z R do iného softvéru

Export údajov do iného softvéru je rovnako jednoduchý ako ich import. Knižnica „útočisko“ poskytuje pohodlný spôsob exportu údajov do

  • spss
  • sas
  • stata

Najskôr importujte knižnicu. Ak nemáte „útočisko“, môžete ho nainštalovať tu.

library(haven) 

Súbor SPSS

Nižšie je uvedený kód na export údajov do softvéru SPSS:

write_sav(df, "table_car.sav") 

Export údajov z R do súboru SAS

Rovnako jednoduché ako spss, môžete exportovať do sas

write_sas(df, "table_car.sas7bdat")

Ako exportovať dáta z R do súboru STATA

Knižnica v prístave umožňuje zápis súboru .dta.

write_dta(df, "table_car.dta")

R

Ak chcete uložiť údajový rámec alebo akýkoľvek iný objekt R, môžete použiť funkciu save ().

save(df, file ='table_car.RData')

Môžete skontrolovať súbory vytvorené vyššie v súčasnom pracovnom adresári

Interakcia s cloudovými službami

V neposlednom rade je R vybavený fantastickými knižnicami na interakciu so službami cloud computingu. Posledná časť tohto tutoriálu sa zaoberá exportom / importom súborov z:

  • disk Google
  • Dropbox

Poznámka : Táto časť tutoriálu predpokladá, že máte účet v službách Google a Dropbox. Ak nie, môžete si ho rýchlo vytvoriť pre - Disk Google: https://accounts.google.com/SignUp?hl=sk - Dropbox: https://www.dropbox.com/h

disk Google

Musíte si nainštalovať knižnicu googledrive, aby ste získali prístup k funkcii umožňujúcej interakciu s Diskom Google.

Knižnica zatiaľ v službe Anaconda nie je k dispozícii. Môžete ho nainštalovať pomocou nižšie uvedeného kódu v konzole.

install.packages("googledrive") 

a otvoríš knižnicu.

library(googledrive)

Pre používateľov, ktorí nie sú užívateľmi Conda, je inštalácia knižnice ľahká, môžete použiť funkciu install.packages ('NAME OF PACKAGE) s názvom balíka v zátvorke. Nezabudnite na „“. Upozorňujeme, že program R má nainštalovať balík do `libPaths () automaticky. Stojí za to vidieť to v akcii.

Odovzdajte na Disk Google

Ak chcete nahrať súbor na disk Google, musíte použiť funkciu drive_upload ().

Zakaždým, keď reštartujete program Rstudio, zobrazí sa výzva na povolenie tidyverse prístupu na Disk Google.

Základná syntax drive_upload () je

drive_upload(file, path = NULL, name = NULL)arguments:- file: Full name of the file to upload (i.e., including the extension)- path: Location of the file- name: You can rename it as you wish. By default, it is the local name. 

Po spustení kódu musíte potvrdiť niekoľko otázok

drive_upload%<("table_car.csv", name ="table_car")

Výkon:

## Local file:## * table_car.csv## uploaded into Drive file:## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk## with MIME type:## * text/csv

Zadaním 1 do konzoly potvrdíte prístup

Potom budete presmerovaný na Google API, aby ste povolili prístup. Kliknite na Povoliť.

Po dokončení autentifikácie môžete prehliadač ukončiť.

V konzole programu Rstudio vidíte súhrn vykonaného kroku. Google úspešne nahral súbor lokálne na Disk. Google priradil ID každému súboru na jednotke.

Tento súbor môžete vidieť v tabuľke Google.

drive_browse("table_car")

Výkon:

Budete presmerovaní do tabuľky Google

Import z Disku Google

Nahrávanie súboru z Disku Google s ID je pohodlné. Ak poznáte názov súboru, môžete získať jeho ID nasledovne:

Poznámka : V závislosti na vašom internetovom pripojení a veľkosti vášho Disku to chvíľu trvá.

x <-drive_get("table_car")as_id(x)

ID ste uložili do premennej x. Funkcia drive_download () umožňuje stiahnutie súboru z Disku Google.

Základná syntax je:

drive_download(file, path = NULL, overwrite = FALSE)arguments:- file: Name or id of the file to download-path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive-overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.

Súbor si môžete konečne stiahnuť:

download_google & lt; - drive_download(as_id(x), overwrite = TRUE)

Vysvetlenie kódu

  • drive_download (): Funkcia na stiahnutie súboru z Disku Google
  • as_id (x): Pomocou ID môžete prehľadávať súbor na Disku Google
  • overwrite = TRUE: Ak súbor existuje, prepíšte ho, inak sa vykonávanie zastavilo. Ak chcete lokálne zobraziť názov súboru, môžete použiť:

Výkon:

Súbor je uložený vo vašom pracovnom adresári. Pamätajte, že pre otvorenie súboru je potrebné pridať rozšírenie súboru. Celé meno môžete vytvoriť pomocou funkcie paste () (tj. Table_car.csv)

google_file <-download_google$local_pathgoogle_filepath <-paste(google_file, ".csv", sep = "")google_table_car <-read.csv(path)google_table_car

Výkon:

## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800

Nakoniec môžete súbor odstrániť z jednotky Google.

## remove filedrive_find("table_car") %>%drive_rm()

Výkon:

Je to pomalý proces. Odstránenie si vyžaduje čas

Exportovať do Dropboxu

R interaguje s Dropboxom prostredníctvom knižnice rdrop2. Knižnica tiež nie je k dispozícii v hoteli Anaconda. Môžete si ho nainštalovať cez konzolu

install.packages('rdrop2')
library(rdrop2)

Musíte poskytnúť dočasný prístup k Dropboxu pomocou svojich prihlasovacích údajov. Po dokončení identifikácie môže R vytvoriť, odstrániť upload a download do vášho Dropboxu.

Najskôr musíte dať prístup k svojmu účtu. Poverenia sa ukladajú do medzipamäte počas celej relácie.

drop_auth()

Budete presmerovaní na Dropbox, aby ste potvrdili autentifikáciu.

Dostanete stránku s potvrdením. Môžete ho zavrieť a vrátiť sa na R

Priečinok môžete vytvoriť pomocou funkcie drop_create ().

  • drop_create ('my_first_drop'): Vytvorte priečinok v prvej vetve Dropboxu
  • drop_create ('First_branch / my_first_drop'): Vytvorte priečinok v existujúcom priečinku First_branch.
drop_create('my_first_drop')

Výkon:

V DropBoxe

Ak chcete nahrať súbor .csv do svojho Dropboxu, použite funkciu drop_upload ().

Základná syntax:

drop_upload(file, path = NULL, mode = "overwrite")arguments:- file: local path- path: Path on Dropbox- mode = "overwrite": By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")

Výkon:

V DropBoxe

Súbor csv si môžete prečítať z Dropboxu s funkciou drop_read_csv ()

dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv")dropbox_table_car

Výkon:

## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800

Po dokončení používania súboru a jeho odstránení. Musíte napísať cestu k súboru vo funkcii drop_delete ()

drop_delete('my_first_drop/table_car.csv')

Výkon:

Je tiež možné odstrániť priečinok

drop_delete('my_first_drop')

Výkon:

Zhrnutie

Všetky funkcie môžeme zhrnúť v tabuľke nižšie

Knižnica

Cieľ

Funkcia

základňa

Exportovať súbor CSV

write.csv ()

xlsx

Exportovať excel

write.xlsx ()

útočisko

Exportovať spss

write_sav ()

útočisko

Export sas

write_sas ()

útočisko

Exportovať údaje

write_dta ()

základňa

Export R

uložiť ()

disk Google

Odovzdajte Disk Google

drive_upload ()

disk Google

Otvorte na Disku Google

drive_browse ()

disk Google

Načítať ID súboru

drive_get (as_id ())

disk Google

Stiahnutie z Disku Google

download_google ()

disk Google

Odstrániť súbor z Disku Google

drive_rm ()

rdrop2

Autentifikácia

drop_auth ()

rdrop2

Vytvorte priečinok

drop_create ()

rdrop2

Nahrajte do Dropboxu

drop_upload ()

rdrop2

Prečítajte si CSV z Dropboxu

drop_read_csv

rdrop2

Odstrániť súbor z Dropboxu

drop_delete ()