1. Instalace

Instalační program RStudio by měl být stažen z oficiálních stránek projektu. RStudio lze nainstalovat na Osobní počítač a na serveru spravovaném Linuxem. Níže hovoříme o verzi programu pro osobní počítače.

Instalační programy RStudio jsou dostupné pro všechny nejběžnější operační systémy, včetně Windows XP/Vista/7, Mac OS X 10.5, Debian 6+/Ubuntu 10.04 a Fedora 13. Vyberte příslušný soubor ze seznamu a stáhněte jej. Instalace je standardní, bez jakýchkoliv speciálních funkcí.

2. Práce s konzolí

2.1. obecná informace

RStudio Console (Console) poskytuje celá řada možnosti, díky kterým je práce s R snadná a produktivní. Zvládnutí těchto možností spolu s funkcemi dostupnými v panelech Zdroj (Editor kódu) a Historie (Historie) může více než splatit čas strávený učením.

2.2. Dokončení kódu

RStudio podporuje automatické doplňování kódu pomocí klávesy Tab. Pokud je například v pracovním prostoru objekt nazvaný pollResults , můžete napsat poll , stisknout Tab a RStudio automaticky doplní název tohoto objektu. Podobně můžete získat popisky funkcí zadáním jejich názvů. Například zadáním názvu dílčí funkce a stisknutím klávesy Tab získáme následující:

Dokončování kódu funguje také pro argumenty funkcí; pokud například zadáte subset( a stisknete Tab, dostanete:

2.3. Návrat k předchozím příkazům

Při práci s R je vždy potřeba znovu provést ten či onen příkaz, který již byl dříve proveden. Stejně jako standardní konzole R podporuje konzole RStudio možnost procházet dříve provedenými příkazy pomocí kláves se šipkami.

Můžete také použít klávesovou zkratku Ctrl+Up (Command-Up na počítačích Mac) k zobrazení seznamu naposledy provedených příkazů a k výběru konkrétního příkazu z tohoto seznamu:

Stejná klávesová zkratka je vhodná i pro rychlé vyhledání dříve volaných funkcí, které mají v názvu konkrétní předponu. Chcete-li například vyhledat funkce, které mají ve svém názvu plot, stačí napsat plot a stisknout Ctrl+Up:

2.4. Název okna konzoly

V záhlaví okna konzoly je několik dalších možností:

  • Zobrazit pracovní adresář.
  • Možnost přerušení aktuálních výpočtů.
  • Minimalizace a maximalizace okna konzoly ve vztahu k panelu Editor kódu (zdroj) (pomocí tlačítek vpravo horním rohu nebo poklepáním na název okna).

2.5. Klávesové zkratky

Ctrl+L – Vymaže okno konzoly od textu

Esc - přeruší výpočty

3. Editace a provádění kódu

3.1. obecná informace


Editor kódu RStudio obsahuje řadu možností produktivity, jako je zvýrazňování kódu, dokončování kódu, úprava více souborů a vyhledávání a nahrazování. určité části kód.

Kromě toho má RStudio flexibilitu spouštět kód přímo z okna editoru. Pro mnoho uživatelů je to preferovaný způsob práce s R. Spouštění příkazů z okna Editor kódu místo příkazový řádek Konzole usnadňují přehrávání stejných příkazů a umožňují „zabalit“ takové příkazy do jediné funkce pro pozdější použití.

3.2. Správa souborů


RStudio podporuje zvýraznění syntaxe a další specializované možnosti pro práci s kódem následujících typů souborů:

  • R skripty
  • Sweave dokumenty
  • TeXové dokumenty
Chcete-li vytvořit nový soubor, použijte nabídku Soubor -> Nový:

Chcete-li otevřít existující soubor, musíte použít nabídku Soubor -> Otevřít nebo Otevřít poslední (např otevření souboru, s které práce byly provedeny v poslední době). Pokud je současně otevřeno několik souborů, provede se rychlý přechod z jednoho dokumentu do druhého pomocí odpovídajících karet v horní části okna editoru kódu. Pro navigaci mezi velkým počtem otevřených souborů použijte ikonu >> v pravé horní části okna Editoru; můžete také použít nabídku Zobrazit -> Přepnout na.



3.3. Dokončení kódu

Jak je uvedeno výše při práci s konzolou, RStudio podporuje automatické doplňování kódu pomocí klávesy Tab. Pokud je například v pracovním prostoru objekt nazvaný pollResults , můžete napsat poll , stisknout Tab a RStudio automaticky doplní název tohoto objektu.


3.4. Hledání a nahrazování částí kódu

Editor kódu RStudio má schopnost najít a nahradit části textu, které potřebujete. Chcete-li provést tuto operaci, musíte použít klávesovou zkratku Ctrl + F nebo sekci nabídky Upravit -> Najít a nahradit. V horní části okna editoru je tlačítko v podobě lupy - jeho stisknutím se zároveň otevře dialogové okno, ve kterém se nastavují parametry vyhledávání.



3.5. Automatické vytváření funkcí

Editor kódu RStudio dokáže analyzovat výběr textu a automaticky jej převést na funkci pro pozdější opětovné použití. Všechny "volné" proměnné ve zvýrazněném kódu (tj. objekty, na které se odkazuje, ale nejsou vytvořeny v rámci výběru) budou převedeny na argumenty funkce:

3.6. Komentování kódu

Chcete-li okomentovat vybrané části kódu (nebo odstranit komentáře), použijte položku nabídky Upravit -> Řádky komentářů/Odkomentování (viz také obrázek níže):

3.7. Spuštění kódu

RStudio podporuje spouštění kódu přímo z okna Editoru (spouštěné příkazy se odesílají do Konzole, kde se také objeví výsledek jejich spuštění).

Chcete-li spustit aktuální řádek kódu, můžete použít kombinaci kláves Ctrl+Enter nebo tlačítko Run Line(s) umístěné v horní části okna Editoru:


Existují dvě možnosti, jak spustit více řádků kódu současně:

  • Vyberte požadované řádky a stiskněte Ctrl+Enter (nebo použijte tlačítko Run Line(s) umístěné v horní části okna Editoru);
  • Stisknutím Ctrl+Shift+Enter spustíte všechny řádky ve skriptu.

3.8. Klávesové zkratky

Ctrl+Shift+N - vytvoření nového dokumentu

Ctrl+O - otevřít dokument

4. Kódová navigace

4.1. obecná informace

RStudio obsahuje řadu možností, které vám umožní rychle procházet R kódem. Naučit se tyto možnosti může vést k výraznému zvýšení efektivity práce a také k lepšímu pochopení kódu napsaného ostatními.

4.2. Přejít na soubor nebo funkci

Pokud znáte název souboru skriptu nebo název funkce, můžete jej rychle najít pomocí vyhledávacího pole Přejít na soubor/funkci na hlavním panelu nástrojů RStudia:


Možnost "Přejít na soubor/funkci" funguje tak, že neustále indexuje kód, který vytvoříte. Konkrétní soubory, které mají být indexovány, jsou definovány takto:

  • Pokud je aktivní jakýkoli projekt RStudio: všechny soubory ve složce tohoto projektu jsou indexovány;
  • Pokud projekt není aktivní: Všechny otevřené projekty jsou indexovány tento moment soubory s R-scripty.

Klávesové zkratky pro vyvolání možnosti Přejít na soubor/funkci: Ctrl+

4.3. Přejít na definici funkce

Díky průběžné indexaci R kódu (viz výše) vám může RStudio pomoci najít definici libovolné funkce. Chcete-li přejít na kód funkce, umístěte ukazatel myši na jeho název (nemusíte jej vybrat celý) a vyberte příkaz Přejít na definici funkce:

Na definici funkce můžete také přejít následujícími způsoby:

  • Použitím klávesová zkratka F2.
  • Pomocí Ctrl + klikněte na název funkce.
  • Pomocí editoru kódu nebo konzoly.

Je možné přeskočit na definici nejen vlastních funkcí, ale i funkcí z libovolného balíčku R. Kód funkce z dalších balíčků R se zobrazí ve speciálním Prohlížeči zdrojový kód(podokno Prohlížeč zdrojů) a je pouze pro čtení.

4.4. Navigace pomocí skriptu

Existuje několik způsobů, jak procházet kód uložený jako skript v samostatném souboru:

  • Výše popsaná možnost „Přejít na soubor/funkci“ vám umožňuje vyhledávat uvnitř otevřít soubor se scénářem
  • Příkaz Přejít na řádek se používá ke skoku na konkrétní řádek ve skriptu.

Můžete také použít možnosti z příslušné nabídky (Nástroje kódu):



4.5. Obousměrná kódová navigace

Při procházení kódu (zejména při postupném přechodu z jedné funkce na druhou) je často nutné rychle se vrátit na předchozí místo, kde jste kód upravili. RStudio uchovává seznam těchto úprav a umožňuje vám přecházet z jedné do druhé libovolným směrem pomocí příkazů Zpět (Zpět) a Vpřed (Vpřed) (dostupných z nabídky Úpravy (Úpravy) a také v levém horním rohu okno Editor kódu). Příkazy Zpět a Vpřed umožňují opakovat následující akce:

  • Otevření dokumentu (nebo přepínání mezi záložkami)
  • Přejít na definici funkce
  • Přejít na konkrétní řádek kódu
  • Přechod na funkci pomocí nabídky Funkce
Příkazy Zpět a Vpřed lze vyvolat pomocí klávesových zkratek Ctrl+F9 / Ctrl+F10 (Cmd+F9 / Cmd+F10 na počítačích Mac).

5. Použití historie příkazů

5.1. obecná informace

Za běhu RStudio vytvoří databázi všech příkazů, které uživatel zadá do konzoly. Tuto databázi můžete zobrazit pomocí panelu Historie.

5.2. Přehled historie příkazů

Záložka Historie v jednom ze servisních panelů RStudia se používá k zobrazení historie dříve provedených příkazů. Příkazy jsou zobrazeny v pořadí, v jakém byly provedeny (poslední příkazy jsou na konci seznamu) a seskupeny podle času:

5.3. Hledat v historii příkazů

V pravém horním rohu seznamu dříve provedených příkazů je pole pro zadání vyhledávací dotazy(např. zápletka). Podmínky vyhledávání lze zadat zadáním několika slov oddělených mezerami (například název nějaké datové tabulky):



Jakmile najdete příkaz, který potřebujete, můžete si také prohlédnout další příkazy, které běžely ve stejnou dobu. Chcete-li to provést, klikněte na šipku umístěnou napravo od doby provedení odpovídajícího příkazu:

5.4. Provedení příkazu

Příkazy v panelu Historie lze vybírat a používat dvěma způsoby (podle názvů dvou tlačítek v levé horní části panelu):

  • Odeslat do konzoly – Odešle vybrané příkazy do konzoly. Pamatujte však, že příkazy odeslané do konzoly nebudou provedeny, dokud nestisknete klávesu Enter.
  • Odeslat do zdroje – odešle vybrané příkazy do aktivního dokumentu editoru kódu. Pokud Editor aktuálně nemá žádné aktivní otevřené dokumenty, bude vytvořen nový nepojmenovaný dokument.

V seznamu dříve provedených příkazů je možné vybrat jeden nebo více řádků:


6. Pracovní adresáře a pracovní prostory

6.1. obecná informace

Vzhledem k tomu, jak R ve výchozím nastavení zpracovává soubory .RData a jejich pracovní prostory, dává smysl organizovat práci tak, aby soubory z různých projektů byly uloženy v různé složky. Níže uvedený materiál popisuje možnosti dostupné v RStudio pro organizaci takového pracovního modelu.

6.2. Výchozí pracovní adresář


Podobně jako standardní verze R se RStudio řídí principem „původního pracovního adresáře“. Obvykle se jedná o domovskou složku uživatele. Při spuštění RStudio se stane následující:

  • Spustí soubor .Rprofile (pokud existuje) ze zdroje pracovní složka.
  • Načte soubor .RData (pokud existuje) z této složky do pracovního prostoru R.
  • Proveďte další akce popsané v servisním souboru R spuštění.

Pokud byly v pracovním prostoru provedeny změny, po ukončení RStudio se zobrazí dialogové okno s dotazem, zda má být pracovní prostor uložen jako soubor .RData v aktuální pracovní složce. Toto chování lze změnit v nastavení RStudia (menu Nástroje -> Možnosti -> R Obecné) takto:

  • Změnit počáteční pracovní adresář
  • Aktivovat/Deaktivovat automatické stahování Soubor .RData z původní pracovní složky R (při spuštění obnovit .RData do pracovního prostoru)
  • Vyberte, zda chcete soubor .RData ukládat vždy (Vždy), nikdy (Nikdy) nebo se při vypínání zeptat na uložení (Zeptat se).

6.3. Změna pracovního adresáře

Aktuální pracovní adresář je zobrazen v horní části okna konzoly. Existuje několik způsobů, jak změnit pracovní adresář:

  • použít funkci setwd()
  • Použijte sekci nabídky Nástroje -> Změnit pracovní adresář...
  • Na kartě Soubory vyberte Více -> Nastavit jako pracovní adresář

Uvědomte si možné důsledky změny pracovní složky:

  • Dostupné v kódu relativní odkazy soubory se stanou neplatnými.
  • Po dokončení bude soubor .RData uložen do nové složky.

Vzhledem k tomu, že tyto vedlejší účinky mohou vést k chybám při provádění kódu, doporučuje se začít ze složky, která odpovídá aktuálnímu projektu, a neměnit ji, dokud relace neskončí.

Pokud jsou všechny soubory relevantní pro konkrétní projekt uloženy ve stejné složce, má smysl z ní udělat zdrojovou složku pro R. Způsoby, jak toho dosáhnout, se budou lišit v závislosti na operační systém. Na všech platformách jej však instalace RStudia spojí s .RData , .R a dalšími soubory souvisejícími s R. Při otevírání takových souborů RStudio automaticky nastaví pracovní složku na tu, ve které je uložen otevíraný soubor. Mějte však na paměti, že pokud je RStudio již spuštěno, otevření nových souborů s ním spojených nezmění pracovní adresář.

Následující příkazy lze použít k uložení pracovního prostoru do pracovní složky R nebo načtení prostoru z pracovní složky během aktivní relace RStudio:

Mějte na paměti, že funkce load() přidá načtený pracovní prostor k aktuálnímu. Pokud tedy existují objekty se stejným názvem v aktivním a zatěžovacím prostoru, pak objekty v zatěžovacím prostoru nahradí objekty se stejným názvem v aktivním prostoru. To může vést k nežádoucím následkům. Proto před načtením nového pracovního prostoru může mít smysl vyčistit aktivní prostor. To lze provést pomocí následujícího příkazu:


Na kartě Pracovní prostor jsou také možnosti k provádění operací popsaných výše:

  • Načte projekt a zobrazí jeho název na panelu nástrojů Projekty (umístěném v pravém pravém rohu pracovního okna programu).
  • 7.3. Práce s projekty

    Otevření projektu

    Existuje několik způsobů, jak otevřít projekty:

    • Pomocí příkazu Otevřít projekt, který je dostupný na kartě Projekty hlavní nabídky a panelu nástrojů, přejděte k dříve vytvořenému souboru projektu (například MyProject.Rproj).
    • Výběr projektu ze seznamu naposledy upravených projektů (tato možnost je dostupná také na kartě Projekty v hlavní nabídce a na panelu nástrojů).
    • Dvakrát klikněte na soubor zástupce projektu (viz výše).

    Když otevřete projekt v RStudio, provedou se následující kroky:

    • Spustí se nová relace R;
    • Příkazy se spouštějí ze servisního souboru.Rprofile (pokud je v hlavní složce projektu nějaký);
    • Soubor .Rhistory se načte ze složky projektu do panelu Historie a používá se k procházení dříve provedených příkazů;
    • Adresář projektu se stane pracovním adresářem R;
    • Editor kódu otevírá dříve upravené skripty s R-kódem.
    • Tím se resetují ostatní nastavení RStudia (jako jsou aktivní záložky, oddělovače oken atd.) do stavu, ve kterém byly před posledním uzavřením projektu.

    Ukončení projektu

    Když vyberete příkaz Ukončit R z části Soubor hlavní nabídky, příkaz Zavřít projekt z panelu nástrojů Projekt nebo jednoduše otevřete nový projekt, stane se následující:

    • Soubory .RData a/nebo .Rhistory se zapisují do složky projektu (pokud to aktuální nastavení programu umožňuje);
    • Seznam skriptů zahrnutých v projektu je uložen, abyste je mohli příště otevřít;
    • Uloží další nastavení RStudio (viz výše);
    • Aktuální relace R končí.

    Práce s více projekty současně

    Můžete pracovat na více projektech současně pouhým spuštěním příslušného počtu kopií RStudia. To lze provést dvěma způsoby:

    • Použijte příkaz Otevřít projekt v novém okně, který se nachází v části Projekt v hlavní nabídce.
    • Otevřete více projektů z prohlížeče souborů kliknutím na příslušné zástupce.
    Nastavení projektů

    Existuje několik možností, jak přizpůsobit chování každého konkrétního projektu v RStudio. Tyto možnosti jsou dostupné příkazem Možnosti projektu v části Projekt v hlavní nabídce programu:


    Záložka Obecné (Všeobecné): Pomocí této záložky můžete změnit globální nastavení chování projektů. Pokud je nepotřebujete měnit, ponechte hodnotu Výchozí (Výchozí). K dispozici jsou následující možnosti:
    • Obnovit .RData do pracovního prostoru při spuštění - Načte soubor .RData (pokud existuje) z původního pracovního adresáře R. Pokud je soubor .RData velký, je nejlepší nastavit tuto volbu na "Ne". Tím se výrazně zkrátí doba spouštění programu.
    • Uložit pracovní prostor do .RData při ukončení - uložení pracovního prostoru jako souboru .RData při ukončení programu. Možné možnosti: "Výchozí" (používá se globální nastavení), "Ano" (Ano), "Ne" (Ne) a "Zeptat se" (Zeptat se). Všimněte si, že pokud nebyl pracovní prostor změněn, nebudete vyzváni k uložení změn, i když je nastavena hodnota "Ask".
    • Vždy ukládat historii (i když neukládáte .RData) - umožňuje zajistit, aby byl soubor .Rhistory s historií příkazů vždy uložen, i když se při ukončení programu rozhodnete soubor .RData neukládat.
    Úprava záložek(Editace):
    • Indexovat zdrojové soubory R - umožňuje vytvářet skripty R-kódu z konkrétního projektu indexované pro navigaci v kódu (viz výše). Normálně by tato možnost měla být povolena, ale pokud jsou ve složce projektu „tisíce“ souborů, lze tuto možnost deaktivovat, aby nedošlo ke zpomalení programu.
    • Vložit mezery pro tabulátor - nastavuje akci klávesy Tab, tzn. kolik mezer se má objevit, když je stisknuto.
    • Kódování textu – nastavuje kódování textu v souborech skriptů. Soubory, jejichž kódování neodpovídá zadanému, lze stále otevřít a správně rozpoznat pomocí příkazu Znovu otevřít s kódováním z nabídky Soubor.
    Záložka Kontrola verzí(Kontrola verzí):
    • Systém správy verzí – umožňuje určit systém, který bude použit pro správu verzí. RStudio automaticky detekuje přítomnost správy verzí skenováním složky .git nebo .svn. Toto nastavení by se tedy nemělo měnit. Důvody pro provedení změn mohou zahrnovat:
    1. Projekt má složku .git i složku .svn a vy chcete jednoznačně určit, který řídicí systém má být použit.
    2. Projekt není propojen s žádným systémem správy verzí a chcete přidat logické úložiště git (ekvivalent spuštění git init z kořenové složky projektu).
    • Origin – zobrazí původ systému správy verzí.

    Když pracujete se skriptem R, můžete jej automaticky aktualizovat. Balíček „taskscheduleR“ pomáhá nastavit plán spouštění R skriptu v Plánu úloh systému Windows denně, týdně, každých N minut, po Spuštění Windows a tak dále.

    1. Nainstalujte knihovnu balíků „taskscheduleR“(devtools) install.packages("devtools") install_github("jwijffels/taskscheduleR") knihovnu(taskscheduleR)

      Používáme balíček „devtools“, který umožňuje stahovat a instalovat balíčky přímo z GitHubu.

    2. Ke konfiguraci spouštění skriptu můžete dále použít buď interaktivní konfiguraci prostřednictvím formuláře, nebo napsáním několika řádků kódu.

    Nastavení plánu R skriptu v Plánovači úloh prostřednictvím doplňků:

    Nastavení plánu R skriptu pomocí funkcí balíčku taskcheduleR:

    Vlastnosti balíčku:

    • Získejte seznam všech úloh ve Windows Task Scheduler
    • Odstraňte úlohu z Plánovače úloh systému Windows
    • Přidejte úlohu spuštění skriptu R
      • K dispozici jsou následující plány: 'JEDNOU', 'MONTHLY', 'WEEKLY', 'DAILY', 'HOURLY', 'MINUTE', 'ONLOGON', 'ONIDLE'
    ## Zadejte název souboru skriptu R pro další práci s ním myscript<- system.file("extdata", "helloworld.R", package = "taskscheduleR") ## Запуск скрипта разово через 35 секунд taskscheduler_create(taskname = "myscript", rscript = myscript, schedule = "ONCE", starttime = format(Sys.time() + 35, "%H:%M")) ## Запуск скрипта ежедневно в 10:15, начиная с завтрашнего дня ## Важно: необходимо поменять формат даты, если он не совпадает с тем, что стоит на компьютере (пример: %m/%d/%Y) taskscheduler_create(taskname = "myscriptdaily", rscript = myscript, schedule = "DAILY", starttime = "10:15", startdate = format(Sys.Date()+1, "%d/%m/%Y")) ## Запуск скрипта каждую неделю в 10:15 по понедельникам taskscheduler_create(taskname = "myscript_mon", rscript = myscript, schedule = "WEEKLY", starttime = "10:15", days = "MON") ## Запуск каждые 5 минут, начиная с 10:15 taskscheduler_create(taskname = "myscript_5min", rscript = myscript, schedule = "MINUTE", starttime = "10:15", modifier = 5) ## Получить data.frame со всеми задачами tasks <- taskscheduler_ls() str(tasks) ## Удалить задачи taskscheduler_delete(taskname = "myscript") taskscheduler_delete(taskname = "myscriptdaily") taskscheduler_delete(taskname = "myscript_,mon") taskscheduler_delete(taskname = "myscript_5min") taskscheduler_delete(taskname = "myscript_withargs_a") taskscheduler_delete(taskname = "myscript_withargs_b")

    Čemu věnujeme pozornost:

    • Formát data. Musí odpovídat formátu data v počítači. V opačném případě dostaneme buď chybu v nastavení plánu spouštění skriptu, nebo úplně jiné datum.
    • Počítačová činnost. Při spuštění skriptu musí být počítač zapnutý.
    • Dostupnost dalších plánů skriptů. Při nastavování nového plánu se stejným názvem se předchozí plán smaže.

    Pomocí system() a Rscript můžete spustit skript jako asynchronní proces na pozadí:

    Systém( "Rscript -e "zdroj(\"váš-skript.R\")"", wait = FALSE ) ... save.image ("script-output.RData" ) cat ("Skript dokončen\n\n" )

    Snad to pomůže!

    Chci spustit skript R na pozadí z konzoly R.

    Z konzole obvykle spouštím skript R jako zdroj ("~/.active-rstudio-document"). Abych mohl pokračovat v práci, musím počkat, až bude skript dokončen. Místo toho chci, aby R běžel na pozadí, zatímco já Mohu pokračovat v práci v konzole. Také musím být nějak upozorněn, když R ukončí zdrojový příkaz. Je to možné v R?

    To může být docela užitečné, protože často vidíme, že práce trvá dlouho.

    PS - Chci, aby původní skript běžel ve stejném paměťovém prostoru, ne nový. Takže řešení jako fork, system atd mi nebudou fungovat. Vidím, zda mohu spustit skript R jako samostatné vlákno a ne samostatný proces.

    R je populární open source programovací jazyk, který se specializuje na statistické výpočty a grafy. Je široce používán statistiky k vývoji statistického softwaru a provádění analýzy dat. Jednou ze silných stránek R je jeho rozšiřitelnost. Uživatelé mohou vytvářet a publikovat své vlastní balíčky. R Komunita je velmi aktivní, neustále se přidávají vlastní statistické balíčky pro konkrétní oblasti vědy. Díky čemu je R použitelný v mnoha oblastech.

    CRAN (Comprehensive R Archive Network) je sada webů (zrcadel), které hostí mnoho balíčků a samotných distribucí R. R si můžete stáhnout z kterékoli z nich, ale my použijeme RStudio.

    V této příručce se dozvíte, jak nainstalovat a nakonfigurovat R na Ubuntu 14.04. Většina instrukcí bude fungovat i pro jiné operační systémy, je potřeba změnit jen pár příkazů. Vše o všem by vám nemělo trvat déle než 10-15 minut.

    Samozřejmě budeme potřebovat Ubuntu 14.04, protože na to je určen článek a 1 gigabajt RAM v systému. Pokud není dostatek paměti, musíte připojit odkládací oddíl.

    Všechny příkazy jsou prováděny jako běžný uživatel, pokud je potřeba root přístup, použijeme sudo.

    Příprava systému

    K instalaci R použijeme APT (Advanced Packaging Tool). Používá speciální soubor k uložení seznamu zdrojů, ze kterých budou balíčky staženy. Toto je /etc/apt/sources.list. Pokud chceme získat nejnovější verzi R, musíme do seznamu zdrojů přidat správný repozitář. Chcete-li to provést, přidejte následující řádek do /etc/apt/sources.list, v Ubuntu 14.04 to bude vypadat takto, ale pro ostatní verze to bude jiné:

    sudo sh -c 'echo "deb http://cran.rstudio.com/bin/linux/ubuntu trusty/" >> /etc/apt/sources.list'

    Zde najdete úložiště pro vaši verzi operačního systému

    Abychom mohli nainstalovat balíčky z tohoto úložiště do APT, musíme přidat jeho veřejný klíč. V Ubuntu je CRAN podepsán klíčem s ID E084DAB9. Přidejte jej do systému:

    gpg -keyserver keyserver.ubuntu.com -recv-key E084DAB9

    A pak v apt:

    gpg -a -export E084DAB9 | sudo apt key add -

    R instalace

    Nyní, když je APT správně nakonfigurován, můžeme přejít k instalaci.

    Nejprve musíme aktualizovat seznam dostupných balíčků, protože jsme změnili zdroje:

    aktualizace sudo apt-get

    Nyní můžeme nainstalovat R. Příznak y automaticky potvrdí instalaci programu:

    sudo apt-get -y install r-base

    Nyní máte na svém systému nainstalovanou nejnovější verzi R. Můžete ji otestovat spuštěním:

    Uvidíte něco podobného tomuto:

    R verze 3.2.1 (2015-06-18) - "Světově známý astronaut"
    Copyright (C) 2015 The R Foundation for Statistical Computing
    Platforma: x86_64-pc-linux-gnu (64-bit)

    R je svobodný software a je dodáván s ABSOLUTNĚ ŽÁDNOU ZÁRUKOU.
    Za určitých podmínek ji můžete dále distribuovat.
    Pro podrobnosti o distribuci zadejte „licence()“ nebo „licence()“.

    Podpora přirozeného jazyka, ale běžící v anglickém národním prostředí

    R je společný projekt s mnoha přispěvateli.
    Další informace získáte zadáním „přispěvatelé()“.
    ‘citation()’ o tom, jak citovat balíčky R nebo R v publikacích.

    Pro některá ukázka zadejte 'demo()', pro online nápovědu 'help()' nebo
    'help.start()' pro rozhraní prohlížeče HTML, které vám pomůže.
    Napište 'q()' pro ukončení R.

    Nyní jste v interaktivní konzoli R a můžete provádět libovolné příkazy R. Pro ukončení použijte funkci:

    > q(uložit = "ne")

    Instalace R balíčků z CRAN

    Ve výchozím nastavení R nainstaluje několik standardních balíčků, ale možná budete chtít nainstalovat další balíčky. K tomu potřebujete alespoň 1 GB RAM.

    Jak již bylo zmíněno dříve, CRAN hostí nejen samotný R, ale také mnoho dalších balíčků. Chcete-li nainstalovat nebo aktualizovat balíčky z CRAN, musíte použít funkci R install.packages(). Pokud například chcete nainstalovat balíček, použijte následující příkaz:

    > install.packages("balíček")

    Stojí za zmínku, že balíček bude nainstalován pouze pro aktuálního uživatele a nebude dostupný ostatním.

    Můžete také nainstalovat balíček R pro všechny uživatele, k tomu musíte použít práva superuživatele. Jako příklad si nainstalujme lesklý balíček, který je velmi oblíbený mezi vývojáři webových aplikací R. Jedním ze způsobů, jak nainstalovat balíček jako root, je přihlásit se jako root, spustit R a zavolat funkci install.packages(). To se ale nedoporučuje. Můžeme jen spustit příkaz R pomocí sudo. Parametr repo určuje, ze kterého úložiště bude balíček stažen.

    sudo su - -c "R -e \"install.packages('shiny', repos = 'http://cran.rstudio.com/')\""

    Balíček bude nyní dostupný všem uživatelům. Pojďme zkontrolovat. Spustit R:

    Stáhněte si balíček:

    > knihovna (lesklá)

    Jak vidíte, příkaz nevygeneroval žádné chyby. Nyní zavřít R:

    > q(uložit = "ne")

    Instalace balíčku DevTools

    Balíčky hostované na CRAN lze nainstalovat pomocí funkce install.packages(), ale na GitHubu je hostováno mnohem více balíčků. Chcete-li nainstalovat balíčky R z Github, musíte použít balíček DevTools. Pojďme to nainstalovat. Balíček vyžaduje, aby fungovaly tři knihovny libcurl4-gnutils-dev, libxml2-dev a libssl-devc, nainstalujte je:

    sudo apt-get -y install libcurl4-gnutls-dev libxml2-dev libssl-dev

    Nyní můžete nainstalovat devtools. Nezapomeňte, že je potřeba jej nastavit pro všechny uživatele, jak je popsáno výše.

    sudo su - -c "R -e \"install.packages('devtools', repos='http://cran.rstudio.com/')\""

    Instalace devtools bude trvat několik minut.

    Instalace R balíčků z GitHubu

    Nyní, když je DevTools nainstalován, můžeme nainstalovat libovolný balíček z GitHubu pomocí funkce install_github(). Stejně jako při instalaci z CRAN musíte spustit příkaz jako root, abyste nainstalovali balíčky pro všechny uživatele. Zkusme nainstalovat shinyjs z GitHubu, který přidává funkčnost do lesklého balíčku. Balíček na GitHubu je identifikován jeho autorem a názvem:

    sudo su - -c "R -e \"devtools::install_github('daattali/shinyjs')\""

    Zkontrolujeme, zda je shinyjs správně nainstalován jeho stažením. Spustit R:

    Zkuste si stáhnout shinyjs:

    > knihovna (shinyjs)

    již víte, jak zavřít interpret R:

    > q(uložit = "ne")

    Další kroky

    Nyní máte ve svém systému nainstalovaný a nakonfigurovaný plně funkční interpret jazyka R. Další informace naleznete na adrese

    Chcete-li vytvořit proměnnou (například x) a přiřadit jí hodnotu (například 1234), stačí zadat příkaz x=1234 . Nyní bude v libovolných výrazech název proměnné (v našem případě x) automaticky nahrazen hodnotou (v našem případě je to 1234).

    Chcete-li zjistit hodnotu proměnné, stačí zadat název proměnné a R vrátí její hodnotu. Bude to vypadat takto:
    > x=1234
    > x
    1234

    Přiřazením nové hodnoty proměnné můžete použít starou hodnotu, to znamená vytvářet konstrukce jako
    >a=5
    > a
    5
    > a=a+3
    > a
    8

    Je důležité vědět, že názvy proměnných se mohou skládat z latinských písmen, číslic a podtržítek (přípustné jsou například následující názvy: a, x, x1, a_x, O_o, the_Variable_with_Long_Name, a459x4h36J4lbgT62). V tomto případě musí být prvním znakem písmeno! Nakonec záleží na případu, což znamená, že RainForest a RainFORest jsou různé proměnné.

    Vektory aneb jak pracovat s datovými řadami?

    Co jsou vektory v R?

    Řekněme, že máme skupinu 5 lidí a potřebujeme uložit jejich věk. Můžete vytvořit například pět proměnných
    > věk_1=25
    > věk_2=20
    > věk_3=9
    > věk_4=44
    > věk_5=37
    Výhodnější je však vytvořit jednu proměnnou, do které umístíte všech 5 hodnot. Taková řada dat, spojená jedním jménem, ​​uložená v určitém pořadí, je polem dat nebo vektorem.

    Assign("age",c(25,20,9,44,37))
    nebo zkráceně: věk

    Nyní lze každý jednotlivý prvek volat podle jeho sériového čísla v sérii, například čtvrtý prvek lze získat takto:
    > věk
    44
    S takovými jednotlivými prvky můžete provádět všechny stejné operace jako s běžnými čísly.

    Funkce append nebo jak přidat prvky do existujícího vektoru?

    Řekněme, že se v naší skupině objevil další člověk, kterému je 31 let. Můžeme znovu vytvořit vektor věku, ale nyní se šesti prvky místo pěti. Existuje však další způsob - použít funkci append:
    > append(věk,31)
    25 20 9 44 37 31
    Všimněte si, že bychom mohli vložit více hodnot tím, že si zapamatujeme funkci c():
    > append(age,c(31,33,35))
    25 20 9 44 37 31 33 35

    Funkce také umožňuje vkládat prvky kamkoli do vektoru pomocí parametru after. Standardně je nastaveno after=length(x), což znamená, že prvky jsou přidány na konec. Ale řekněme, že chceme vložit naši šestou osobu za druhou:
    > append(věk, 31, po=2)
    25 20 31 9 44 37

    Operace s vektory aneb co lze s vektory dělat?

    Můžete pracovat se všemi prvky vektoru současně. Přidání čísla do vektoru je tedy ekvivalentní přidání tohoto čísla ke každému prvku vektoru. Nebo například, chcete-li zobrazit, kolik desetiletí žil každý člověk z našeho příkladu, můžete to udělat takto:
    > věk/10
    2.5 2.0 0.9 4.4 3.7

    Podobně se sčítáním, odčítáním a dalšími operacemi popsanými v odstavci o

    Jak porovnávat vektory, prvky vektorů?

    Předpokládejme, že potřebujeme zjistit, které prvky vektoru (ať je to stejně staré) jsou větší než určité číslo (například který z našeho malého vzorku je dospělý). R pro každý prvek řekne, zda je podmínka splněna, tj. TRUE (true) nebo FALSE (not true). Bude to vypadat takto:
    > věk
    25 20 31 9 44 37
    > věk >= 18
    PRAVDA PRAVDA NEPRAVDA PRAVDA PRAVDA

    Ale možná budete muset získat jednu odpověď, například je pravda, že všechny prvky odpovídají podmínce? nebo jsou vůbec nějaké prvky odpovídající podmínce? K tomu používáme dvě funkce, all() a any()

    all(x1,x2,...,xn) - odpovídá na otázku, je pravda, že všechny podmínky (x1, x2, ... a xn) jsou pravdivé? to znamená, že jde o logické spojení. Například:
    > všichni (věk >= 7, věk PRAVDA
    # Všechny subjekty nejsou mladší než sedm let a mladší šedesáti let
    > všichni (věk >=18, 1 > 0)
    NEPRAVDIVÉ
    # jednotka je samozřejmě větší než nula, ale mezi našimi předměty je jeden devítiletý, takže to není pravda

    any(x1,x2,...,xn) - odpoví na otázku, zda je alespoň jedna z podmínek (x1, x2, ..., xn) správná? to znamená, že jde o logickou disjunkci. Příklad:
    > libovolný (věk >=18, 1 > 0)
    SKUTEČNÝ

    Nakonec je možné porovnat dva vektory mezi sebou. K tomu je ale nutné buď, aby délka většího byla násobkem délky menšího, nebo aby byly délky stejné. Příklady:
    > a > a > b
    NEPRAVDA NEPRAVDA NEPRAVDA PRAVDA PRAVDA

    Jak nastavit posloupnost čísel?

    • operátor:
    • seq(od,do,podle,délky,podél) - vytvoří sekvenci začínající od, končící do krok za. Délku řady můžete zadat pomocí parametru length nebo přirovnat délku k jinému vektoru podél . Argumenty: od, do, podle, délky, podél (stejná délka jako...)
    • rep(a, times, every) - opakujte vektor a krát krát nebo pokaždé, když každý prvek a. Argumenty: vektor, časy, každý

    Řazení

    • sort(v,zvýšení) - seřadí vektor v; rostoucí - booleovský, true - vzestupně, nepravda - sestupně, můžete psát rostoucí=klesající;
    • objednat()