Úvod do R
Vznik R
R je jazykem a prostředím pro statistické výpočty a grafiku.
Jedná se o
GNU projekt
podobný jazyku a prostředí S vyvinutému v Bell Laboratories
(dříve AT&T, nyní Lucent Technologies) Johnem Chambersem a kolegy.
R lze považovat za odlišnou implementaci jazyka S. Existují některé
významné rozdíly mezi R a S, nicméně většina kódu
napsaného pro S bude beze změn fungovat též v R.
Široká škála metod a snadná rozšiřitelnost
R poskytuje širokou škálu statistických
(lineární a nelineární modely, klasické testy, analýza časových řad,
klasifikace, klastrování, ...) a grafických technik.
R je dále snadno rozšiřitelné o další metody.
Jazyk S implementovaný v R je velice často volen jako nástroj pro výzkum
nových statistických metod, přičemž R samotné poskytuje cestu
k účasti na těchto aktivitách.
Grafy na profesionální úrovni
Jednou z nejsilnějších částí R je snadnost, s kterou lze vytvářet
dobře navrhnuté obrázky a grafy v profesionální kvalitě.
Do grafů lze snadno v případě potřeby vkládat matematické symboly a vzorce.
Standardní nastavení pro kresbu grafů bylo voleno s maximální pečlivostí,
nicméně uživateli je ponechána plná kontrola nad výsledným vzhledem grafu.
Volná šiřitelnost
R je dostupné jako volně šiřitelný software (Free Software)
při dodržení podmínek
GNU General Public License
nadace
Free Software Foundation
(nevylučuje komerční využití programu).
R lze zkompilovat a spouštět na mnoha UNIXových platformách
a jim podobných systémech (FreeBSD, Linux, ...) a dále
v operačních systémech Windows a MacOS.
Zdrojový kód a předkompilované verze programu R pro nejběžnější
operační systémy jsou dostupné na stránkách nadace
R Foundation for Statistical Computing.
Uživatelská podpora v České republice
Uživatelskou podporu (instalace, kurzy, procedury v R na zakázku, ...) poskytuje
v České republice
StatKom.
Prostředí R
Analýza dat
R poskytuje softwarové prostředky pro manipulaci s daty, výpočty a grafická zobrazování.
R zahrnuje
- prostředky pro efektivní manipulaci a ukládání dat,
- sadu operátorů pro výpočty na polích a maticích,
- rozsáhlé, konzistentní a integrované prostředky pro analýzu dat,
- grafické prostředky pro analýzu a zobrazování data, ať již na obrazovce
nebo tištěné podobě,
- dobře navržený, jednoduchý a efektivní programovací jazyk obsahující
podmínky, cykly, uživatelem definované rekurzivní funkce, prostředky pro vstup
a výstup.
Proč ,,prostředí``?
Výraz ,,prostředí`` má za úkol charakterizovat R jako od počátku plánovaný
a koherentní systém a odlišit ho od jiných programů pro analýzu dat, jež
jsou často pouhými postupně budovanými spojeními velmi speciálních
a neflexibilních nástrojů.
R jako programovací jazyk
R, podobně jako S je navrženo jako skutečný programovací jazyk
a umožňuje tedy uživateli přidávat dovednosti definování nových funkcí.
Většina samotného systému je napsána v R dialektu jazyka S, což umožňuje
uživateli snadno sledovat volené algoritmy. Výpočetně náročné postupy
mohou být naprogramovány v C, C++ nebo Fortranu, poté připojeny k R a volány za běhu.
Pokročilí uživatelé mohou psát kódy v C, jež přímo manipulují
s R objekty.
Více než statistický software
Mnozí uživatelé si pod R představují statistický software.
Je lepší si pod R představit prostředí, v němž jsou kromě
jiného implementovány statistické metody. Pomocí balíčků
(packages) lze R snadno rozšiřovat. Přibližně osm balíčků
je součástí oficiální distribuce R. Mnohé další balíčky
pokrývající velmi rozsáhlou oblast moderní statistiky jsou dostupné
přes CRAN (Comprehensive R Archive Network).
Dokumentace
R má svůj vlastní, LaTeXu podobný formát pro tvorbu dokumentace, jenž je
používán při poskytování jak on-line dokumentace v několika formátech,
tak tištěné dokumentace.