Metodická příručka "Statistická analýza a vizualizace dat pomocí R." Metodická příručka "Statistická analýza a vizualizace dat pomocí R" Existují dva hlavní typy objektů

Minule (v listopadu 2014; velmi se stydím, že mi to pokračování trvalo tak dlouho!) jsem mluvil o základních schopnostech jazyka R I přes přítomnost všech obvyklých řídicích konstrukcí, jako jsou smyčky a podmíněné bloky, klasický přístup ke zpracování dat založený na iteracích má k tomu daleko Nejlepší rozhodnutí, protože cykly v R neobvykle pomalý. Nyní vám tedy řeknu, jak vlastně potřebujete pracovat s daty, aby vás proces výpočtu nenutil vypít příliš mnoho šálků kávy čekáním na výsledek. Kromě toho věnuji chvíli povídání o tom, jak využít moderní nástroje pro vizualizaci dat v R. Protože pohodlí prezentace výsledků zpracování dat v praxi není o nic méně důležité než výsledky samotné. Začněme něčím jednoduchým.

Vektorové operace

Jak si pamatujeme, základní typ v R není vůbec číslo, ale vektor, a základní aritmetické operace pracují s vektory prvek po prvku:

> x<- 1:6; y <- 11:17 >x + y 12 14 16 18 20 22 18 > x > 2 NEPRAVDA NEPRAVDA PRAVDA PRAVDA PRAVDA > x * y 11 24 39 56 75 96 17 > x / y 0,09090909 0,1606263671 3333333 0,37500000 0,05882353

Vše je zde celkem jednoduché, ale je celkem logické položit si otázku: co se stane, když se délky vektorů neshodují? Pokud řekněme napíšeme k<- 2, то будет ли x * k соответствовать умножению вектора на число в математическом смысле? Короткий ответ - да. В более общем случае, когда длина векторов не совпадает, меньший вектор просто продолжается повторением:

>z<- c(1, 0.5) >x * z 1 1 3 2 5 3

U matric je situace přibližně stejná.

> x<- matrix(1:4, 2, 2); y <- matrix(rep(2,4), 2, 2) >x * y [,1] [,2] 2 6 4 8 > x / y [,1] [,2] 0,5 1,5 1,0 2,0

V tomto případě bude „normální“ a ne bitové násobení matice vypadat takto:

> x %*% y [,1] [,2] 8 8 12 12

To vše je samozřejmě velmi dobré, ale co uděláme, když potřebujeme aplikovat vlastní funkce na prvky vektorů nebo matic, tedy jak to lze udělat bez smyčky? Přístup, který R používá k řešení tohoto problému, je velmi podobný tomu, na který jsme zvyklí ve funkcionálních jazycích – připomíná funkci map v Pythonu nebo Haskellu.

Užitečná funkce lapply a jeho přátelé

První funkcí v této rodině je lapply. Umožňuje vám aplikovat danou funkci na každý prvek seznamu nebo vektoru. Navíc výsledkem bude přesně ten seznam, bez ohledu na typ argumentu. Nejjednodušší příklad použití funkcí lambda:

>q<- lapply(c(1,2,4), function(x) x^2) >q 1 4 16

Pokud funkce, kterou chcete použít na seznam nebo vektor, vyžaduje více než jeden argument, lze tyto argumenty předat přes lapply.

>q<- lapply(c(1,2,4), function(x, y) x^2 + y, 3)

Funkce funguje podobným způsobem se seznamem:

> x<- list(a=rnorm(10), b=1:10) >lapply(x, mean)

Zde funkce rnorm specifikuje normální rozdělení (v tomto případě deset normálně rozdělených čísel v rozsahu od 0 do 1) a střední hodnota vypočítá průměrnou hodnotu. Funkce sapply je přesně stejná jako funkce lapply kromě toho, že se pokouší zjednodušit výsledek. Pokud má například každý prvek seznamu délku 1, bude místo seznamu vrácen vektor:

> sapply(c(1,2,4), funkce(x) x^2) 1 4 16

Pokud je výsledkem seznam vektorů stejné délky, pak funkce vrátí matici, ale pokud není nic jasné, pak jen seznam, jako lapply.

> x<- list(1:4, 5:8) >sapply(x, funkce(x) x^2) [,1] [,2] 1 25 4 36 9 49 16 64

Pro práci s maticemi je vhodné použít funkci Apply:

> x<- matrix(rnorm(50), 5, 10) >použít(x, 2, průměr) > použít(x, 1, součet)

Zde pro začátek vytvoříme matici pěti řádků a deseti sloupců, poté nejprve vypočítáme průměr za sloupce a poté součet v řádcích. Aby byl obrázek úplný, je třeba poznamenat, že úloha výpočtu průměru a součtu řádků je tak běžná, že R poskytuje pro tento účel speciální funkce rowSums, rowMeans, colSums a colMeans.
Lze také použít funkci použít vícerozměrná pole:

> arr<- array(rnorm(2 * 2 * 10), c(2, 2, 10)) >použít(arr, c(1,2), průměr)

Poslední volání lze nahradit čitelnější možností:

> rowMeans(arr, dim = 2)

Přejděme k funkci mapply, což je vícerozměrná obdoba lapply. Začněme jednoduchým příkladem, který najdete přímo ve standardní dokumentaci R:

> mapply(rep, 1:4, 4:1) 1 1 1 1 2 2 2 3 3 4

Jak vidíte, stane se zde to, že funkce rep je aplikována na sadu parametrů, které jsou generovány ze dvou sekvencí. Samotná funkce rep jednoduše opakuje první argument tolikrát, kolikrát je zadáno jako druhý argument. Takže předchozí kód je jednoduše ekvivalentní následujícímu:

> seznam(rep(1,4), rep(2,3), rep(3,2), rep(4,1))

Někdy je nutné aplikovat funkci na nějakou část pole. To lze provést pomocí funkce tapply. Podívejme se na následující příklad:

> x<- c(rnorm(10, 1), runif(10), rnorm(10,2)) >F<- gl(3,10) >tapply(x,f,mean)

Nejprve vytvoříme vektor, jehož části jsou tvořeny z náhodných proměnných s různým rozdělením, poté vygenerujeme vektor faktorů, což není nic jiného než deset jedniček, pak deset dvojek a stejný počet trojek. Poté vypočteme průměr pro odpovídající skupiny. Funkce tapply se standardně snaží výsledek zjednodušit. Tuto volbu lze zakázat zadáním simplify=FALSE jako parametr.

> tapply(x, f, range, simplify=FALSE)

Když lidé mluví o funkcích aplikace, obvykle mluví také o funkci rozdělení, která rozděluje vektor na kousky, podobně jako tapply . Pokud tedy zavoláme split(x, f), dostaneme seznam tří vektorů. Takže pár lapply/split funguje stejně jako tapply s hodnotou zjednodušení nastavenou na FALSE:

> lapply(rozdělit(x, f), střední hodnota)

Funkce rozdělení je užitečná nad rámec práce s vektory: lze ji také použít pro práci s datovými rámci. Zvažte následující příklad (vypůjčil jsem si ho z kurzu R Programming na Coursera):

> knihovna(datové sady) > hlava(kvalita vzduchu) Ozon Solar.R Teplota větru Měsíc Den 1 41 190 7,4 67 5 1 2 36 118 8,0 72 5 2 3 12 149 12,6 74 5 3 4 18 313 3 5 NA5 146 35 NA 56 5 5 6 28 NA 14,9 66 5 6 > s<- split(airquality, airquality$Month) >lapply(s, function(x) colMeans(x[, c("Ozone", "Solar.R", "Wind")]))

Zde pracujeme s datasetem, který obsahuje informace o podmínkách ovzduší (ozón, sluneční záření, vítr, teplota ve Fahrenheitech, měsíc a den). Můžeme snadno vykazovat měsíční průměry pomocí rozdělení a překrytí, jak je uvedeno v kódu. Použití sapply nám však poskytne výsledek v pohodlnější podobě:

> sapply(s, function(x) colMeans(x[, c("Ozone", "Solar.R", "Wind")])) 5 6 7 8 9 Ozon NA NE NA NA NA NE NA Solar.R NA 190.16667 216.483871 NA 167,4333 Vítr 11,62258 10,26667 8,941935 8,793548 10,1800

Jak vidíte, některé hodnoty hodnot nejsou definovány (a k tomu se používá rezervovaná hodnota NA). To znamená, že některé (alespoň jedna) hodnoty ve sloupcích Ozone a Solar.R byly také nedefinované. V tomto smyslu se funkce colMeans chová zcela správně: pokud existují nějaké nedefinované hodnoty, pak je průměr nedefinovaný. Problém lze vyřešit vynucením ignorování hodnot NA pomocí parametru na.rm=TRUE:

> sapply(s, function(x) colMeans(x[, c("Ozón", "Solar.R", "Wind")], na.rm=TRUE)) 5 6 7 8 9 Ozon 23.61538 29.44444 59.115385 59.961548 38 Solar.R 181,29630 190,16667 216,483871 171,857143 167,43333 Vítr 11,62258 10,26667 8,941935 8,7935800 10,1

Proč potřebujete tolik funkcí k vyřešení velmi podobných problémů? Myslím, že tuto otázku si položí každý druhý, kdo tohle všechno četl. Všechny tyto funkce se ve skutečnosti snaží vyřešit problém zpracování vektorových dat bez použití smyček. Jedna věc je ale dosáhnout vysoké rychlosti zpracování dat a druhá věc je získat alespoň část flexibility a kontroly, kterou poskytují řídicí konstrukce, jako jsou smyčky a podmíněné příkazy.

Vizualizace dat

Systém R je neuvěřitelně bohatý na nástroje pro vizualizaci dat. A zde stojím před těžkou volbou – o čem se bavit, když je areál tak velký. Pokud v případě programování existuje nějaká základní sada funkcí, bez které se nic neobejde, pak ve vizualizaci existuje obrovské množství různých úloh a každou z nich lze (zpravidla) řešit více způsoby, každou z nich která má svá pro a proti. Navíc vždy existuje mnoho možností a balíčků, které vám umožní vyřešit tyto problémy různými způsoby.
O standardních vizualizačních nástrojích v R toho bylo napsáno hodně, proto bych zde rád pohovořil o něčem zajímavějším. V posledních letech je balíček stále oblíbenější ggplot2, tak si o něm povíme.

Abyste mohli začít pracovat s ggplot2, musíte nainstalovat knihovnu pomocí příkazu install.package("ggplot2"). Dále jej připojíme k použití:

> knihovna("ggplot2") > hlava(diamanty) karátový výbrus barva jasnost hloubka tabulka cena x y z 1 0,23 Ideal E SI2 61,5 55 326 3,95 3,98 2,43 2 0,21 Premium E SI1 59,8 61 326 383 3,8 Dobrý 9 65 327 4,05 4,07 2,31 4 0,29 Premium I VS2 62,4 58 334 4,20 4,23 2,63 5 0,31 Dobrý J SI2 63,3 58 335 4,34 4,82S 2,852 26 336 3,9 4 3,96 2,48 > head(mtcars) mpg cyl disp hp drat hm qsec vs am převodový karburátor Mazda RX4 21,0 6 160 110 3,90 2,620 16,46 0 1 4 4 Mazda RX4 Wag 21,0 6 160 110 3,90 2,875 17 04 17,02 0.04 93 3,85 2. 320 18,61 1 1 4 1 Hornet 4 2 Pohon 21,4 6 258 110 3,08 3,215 19,44 1 0 3 1 Hornet Sportabout 18,7 8 360 175 3,15 3,440 17,02 0 0 3 2 Valiant 22,16 01 0 3 1

Data diamantů a mtcars jsou součástí balíčku ggplot2 a právě s nimi budeme nyní pracovat. U prvního je vše jasné - jedná se o údaje o diamantech (čistota, barva, cena atd.) a druhým souborem jsou údaje z silničních testů (počet mil na galon, počet válců...) vyrobených vozů v letech 1973-1974 z amerického časopisu Motor Trends . Podrobnější informace o datech (například o rozměrech) lze získat zadáním ?diamonds nebo ?mtcars .

Pro vizualizaci balíček poskytuje mnoho funkcí, z nichž pro nás nyní bude nejdůležitější qplot. Funkce ggplot vám dává výrazně větší kontrolu nad procesem. Cokoli, co lze provést pomocí qplot, lze také provést pomocí ggplot. Podívejme se na to na jednoduchém příkladu:

> qplot(jasnost, data=diamanty, fill=cut, geom="bar")

Stejného efektu lze dosáhnout pomocí funkce ggplot:

> ggplot(diamanty, aes(jasnost, fill=cut)) + geom_bar()

Volání qplot však vypadá jednodušeji. Na Obr. 1 je vidět, jak je vykreslena závislost počtu diamantů s různou kvalitou brusu na čistotě.

Nyní nakreslete závislost počtu najetých kilometrů na jednotku paliva automobilů na jejich hmotnosti. Výsledný bodový graf (nebo bodový graf bodový diagram) prezentovány
na Obr. 2.

> qplot(wt, mpg, data=mtcars)

Můžete také přidat barevné zobrazení doby zrychlení čtvrt míle (qsec):

> qplot(wt, mpg, data=mtcars, color=qsec)

Při vizualizaci můžete také transformovat data:

> qplot(log(wt), mpg - 10, data=mtcars)

V některých případech se diskrétní barevné dělení jeví reprezentativnější než spojité. Chceme-li například barevně zobrazit informaci o počtu válců místo doby zrychlení, pak musíme uvést, že hodnota je diskrétní povahy (obr. 3):

> qplot(wt, mpg, data=mtcars, color=factor(cyl))

Velikost bodů můžete také změnit například pomocí size=3 . Pokud budete tisknout grafy na černobílé tiskárně, pak je lepší nepoužívat barvy, ale měnit tvar fixu v závislosti na faktoru. Toho lze dosáhnout nahrazením color=factor(cyl) tvarem=factor(cyl) .
Typ grafu se určuje pomocí parametru geom a v případě bodových grafů je hodnota tohoto parametru "body" .

Nyní řekněme, že chceme sestavit histogram počtu aut s odpovídající hodnotou válců:

> qplot(factor(cyl), data=mtcars, geom="bar") > qplot(factor(cyl), data=mtcars, geom="bar", color=factor(cyl)) > qplot(factor(cyl) , data=mtcars, geom="bar", fill=factor(cyl))

První volání jednoduše vykreslí tři histogramy pro různé hodnoty cylindru. Nutno říci, že první pokus o dobarvení histogramu nepovede k očekávanému výsledku – černé pruhy budou stále černé, ale budou mít pouze barevný obrys. Ale poslední volání qplot vytvoří krásný histogram, jak je znázorněno na obr. 4.

Tady bychom měli mít jasno. Faktem je, že současný objekt, který jsme postavili, není histogram v pravém slova smyslu. Histogram je obvykle podobným zobrazením pro spojitá data. V anglický jazyk sloupcový graf(to jsme právě udělali) a histogram- jedná se o dva různé pojmy (viz odpovídající články na Wikipedii). Zde budu s určitou tíhou používat slovo „histogram“ pro oba pojmy, protože věřím, že samotná povaha dat mluví sama za sebe.

Pokud se vrátíme k obr. 1, pak ggplot2 poskytuje několik užitečné možnosti v umístění grafu (výchozí hodnota je position="stack"):

> qplot(jasnost, data=kosočtverce, geom="bar", výplň=řez, pozice="úskok") > qplot(jasnost, data=kosočtverce, geom="bar", výplň=řez, poloha="výplň") > qplot(jasnost, data=diamanty, geom="bar", fill=cut, position="identity")

První z navrhovaných možností vytváří diagramy vedle sebe, jak je znázorněno na Obr. 5, druhý ukazuje podíly diamantů různé kvality brusu na celkovém počtu diamantů dané ryzosti (obr. 6).

Nyní se podívejme na příklad skutečného histogramu:

> qplot(karát, data=diamanty, geom="histogram", šířka pásma=0,1) > qplot(karát, data=diamanty, geom="histogram", šířka pásma=0,05)

Zde parametr šířky pásma pouze ukazuje, jak široký je pás v histogramu. Histogram ukazuje, kolik dat je v jakém rozsahu. Výsledky jsou uvedeny na Obr. 7 a 8.

Někdy, když potřebujeme vykreslit model (lineární nebo řekněme polynom), můžeme to udělat přímo v qplot a vidět výsledek. Například můžeme vynést mpg versus hmotnost wt přímo na bodový graf:

> qplot(wt, mpg, data=mtcars, geom=c("point", "smooth"))

Standardně se jako model použije lokální polynomiální regrese (method="loess"). Výsledek práce bude vypadat jako na obr. 9, kde tmavě šedý pruh představuje standardní chybu. Zobrazuje se standardně, můžete jej vypnout napsáním se=FALSE .

Pokud se chceme pokusit na tato data napasovat lineární model, pak to lze provést jednoduchým zadáním method=lm (obr. 10).

A nakonec, samozřejmě, musíme ukázat, jak vytvořit koláčové grafy:

>t<- ggplot(mtcars, aes(x=factor(1), fill=factor(cyl))) + geom_bar(width=1) >t + coord_polar(theta="y")

Zde použijeme flexibilnější funkci ggplot. Funguje to takto: nejprve sestrojíme graf znázorňující podíly automobilů s různým počtem válců na celkové hmotnosti (obr. 11), poté graf převedeme na polární souřadnice (obr. 12).

Místo závěru

Nyní můžeme pohodlně používat R. Co bude dál? Je jasné, že jsou zde uvedeny nejzákladnější možnosti ggplot2 a jsou diskutovány otázky související s vektorizací. Existuje několik dobrých knih o R, které stojí za zmínku, a rozhodně stojí za to je konzultovat častěji než služby korporace velmi vtíravé dobroty. Za prvé, toto je kniha Normana Matloffa (Norman Matloff) The Art of R Programming. Pokud již máte zkušenosti s programováním v R, pak se vám bude hodit The R Inferno od P. Burnse. Docela vhodná je i klasická kniha Software pro analýzu dat od Johna Chamberse.

Pokud mluvíme o vizualizaci v R, tzn dobrá kniha R Graphics Cookbook od W. Changa (Winston Chang). Příklady pro ggplot2 v tomto článku byly převzaty z Tutoriálu: ggplot2. Uvidíme se v dalším článku: Analýza dat a strojové učení v R!

Blog „R: Data Analysis and Visualization“ existuje již více než tři a půl roku. Před pár měsíci se zrodil nápad shrnout metodická poselství zde publikovaná za celou tu dobu do podoby e-knihy. Autorem myšlenky a následně spoluautorem knihy byl doktor biologických věd Vladimir Kirillovič Shitikov (). Jsme rádi, že vám výsledek můžeme představit jako novoroční dárek.


Toolkit" Statistická analýza a vizualizace dat pomocí R"je určeno především studentům, postgraduálním studentům, mladým i zavedeným vědcům, ale i profesionálním analytikům, kteří neměli žádné předchozí zkušenosti s prací s R. V souladu s tradicemi blogu jsme se snažili pokud možno vyvarovat zneužívání „rituálu ” frází charakteristických pro četné příručky o aplikované statistice, citující známé teorémy a prezentující víceúrovňové výpočtové vzorce, důraz byl kladen především na praktickou aplikaci – na to, aby čtenář vedený tím, co četl, mohl analyzovat jeho data a prezentovat výsledky kolegům.

  • Kapitola 1: Základní součásti statistického prostředí R
  • Kapitola 2: Popis jazyka R
  • Kapitola 3: Základní grafické funkce R
  • Kapitola 4: Popisná statistika a rozdělení rozložení
  • Kapitola 5: Klasické metody a kritéria statistiky
  • Kapitola 6: Lineární modely v analýze rozptylu
  • Kapitola 7: Regresní modely vztahů mezi kvantitativními proměnnými
  • Kapitola 8: Zobecněné, strukturální a jiné regresní modely
  • Kapitola 9: Prostorová analýza a tvorba kartogramů
K dispozici je také rozsáhlá bibliografie a seznam užitečných online zdrojů o R.

Oficiální Současná verze knihy ve formátu PDF (~11 MB) k dispozici pro stažení zdarma ze dvou stránek:

  • Úložiště GitHub: https://github.com/ranalytics/r-tutorials
  • Webové stránky Institutu ekologie povodí Volhy RAS: http://www.ievbras.ru/ecostat/Kiril/R/

Na stejných dvou zdrojích můžete najít skripty R kódu a datové sady potřebné k reprodukci příkladů probíraných v knize.

Budeme vděční za jakékoli vaše připomínky a návrhy týkající se této práce – pošlete je prosím e-mailem rtutorialsbook["dog"]gmail.com

Jak je uvedeno výše, kniha je distribuována zcela zdarma. Pokud to však považujete za užitečné a uznáte za vhodné poděkovat autorům za jejich práci, můžete pomocí následujícího tlačítka převést libovolnou částku (všechny transakce jsou prováděny bezpečně prostřednictvím elektronického platebního systému

"STATISTICKÁ ANALÝZA A VIZUALIZACE DAT POMOCÍ R travní kořeny ovocné listy Heidelberg - Londýn - Tolyatti 2014, ..."

-- [ Strana 1 ] --

S.E. Mastitsky, V.K. Šitikov

STATISTICKÁ ANALÝZA A

VIZUALIZACE DAT POMOCÍ R

tráva kořeny ovoce olistění

Heidelberg – Londýn – Tolyatti

2014, Sergey Eduardovič Mastitsky, Vladimir Kirillovič Shitikov

Web: http://r-analytics.blogspot.com

Toto dílo je šířeno pod licencí

Creative Commons Attribution – Nekomerční

použití – Za stejných podmínek 4.0 po celém světě.“ V rámci této licence můžete toto dílo volně kopírovat, šířit a upravovat za předpokladu, že uvedete přesné uvedení jeho autorů a zdroje. Pokud toto dílo upravíte nebo jej použijete ve svých vlastních dílech, můžete výsledek šířit pouze pod stejnou nebo podobnou licencí. Je zakázáno používat toto dílo pro komerční účely bez souhlasu autorů. Pro více informací o licenci navštivte www.creativecommons.com

Tuto knihu prosím citujte takto:

Mastitsky S.E., Shitikov V.K. (2014) Statistická analýza a vizualizace dat pomocí R.

– Elektronická kniha, přístupová adresa:

http://r-analytics.blogspot.com

PŘEDMLUVA 5

1. HLAVNÍ SLOŽKY STATISTICKÉHO PROSTŘEDÍ R 8


1.1. Historie vzniku a základní principy organizace 8 prostředí R

1.2. Pracovat s příkazová konzole rozhraní R 11

1.3. Práce s nabídkami R Commander 13

1.4. Objekty, balíčky, funkce, zařízení 17

2. POPIS JAZYKA R 23

2.1. R 23 datové typy

2.2. Vektory a matice 24

2.3. Faktory 29

2.4. Seznamy a tabulky 31

2.5. Import dat do R 37

2.6. Reprezentace data a času; časová řada 40

2.7. Organizace výpočtů: funkce, větve, smyčky 46

2.8. Vektorizované výpočty v R pomocí funkcí Apply-50

3. ZÁKLADNÍ GRAFICKÉ SCHOPNOSTI R 58

3.1. Scatterplots plot() a možnosti grafů 58 funkcí

3.2. Histogramy, funkce hustoty jádra a funkce cdplot() 66

3.3. Diagramy rozsahu 74

3.4. Koláčové a sloupcové grafy 77

3.5. Clevelandovy diagramy a jednorozměrné bodové grafy 84

4. POPISNÉ STATISTIKY A VHODNOST 97

ROZDĚLENÍ

–  –  –

PŘEDMLUVA

Jedním z hlavních nástrojů pro porozumění světu je zpracování dat, které člověk obdrží různé zdroje. Podstatou moderní statistické analýzy je interaktivní proces sestávající z průzkumu, vizualizace a interpretace příchozích informačních toků.

Historie posledních 50 let je také historií vývoje technologie analýzy dat.

Jeden z autorů rád vzpomíná na konec 60. let a na svůj první program pro výpočet párové korelace, který byl napsán kovovými kolíky na „operační pole“ 150 článků osobního počítače „Promin-2“ o hmotnosti více než 200 kg.

V dnešní době vysoce výkonné a cenově dostupné počítače software vám umožní implementovat celý cyklus procesu informačních technologií, který se obecně skládá z následujících kroků:

° přístup ke zpracovaným datům (jejich stažení z různých zdrojů a sestavení sady vzájemně souvisejících zdrojových tabulek);

° editace načtených ukazatelů (náhrada nebo odstranění chybějících hodnot, převod charakteristik do pohodlnější podoby);

° anotace dat (aby si zapamatovali, co která data představují);

° získání obecných informací o struktuře dat (výpočet deskriptivní statistiky za účelem charakterizace analyzovaných ukazatelů);

° grafická prezentace dat a výsledků výpočtů v přehledné, informativní formě (jeden obrázek někdy vydá za tisíc slov);

° modelování dat (nalézání závislostí a testování statistických hypotéz);

° prezentace výsledků (příprava tabulek a diagramů v přijatelné publikační kvalitě).

V prostředí, kde jsou uživateli k dispozici desítky aplikačních softwarových balíků, je problém volby (někdy tragický, vzpomeneme-li si na „Buridanova osla“) relevantní: jaký software pro analýzu dat by měl být preferován pro vaši praktickou práci? Zde se obvykle berou v úvahu specifika řešeného problému, efektivita nastavení algoritmů zpracování, náklady na nákup programů a také vkus a osobní preference analytika. Zároveň například šablona Statistica s mechanickou sadou tlačítek menu nemůže vždy uspokojit kreativního výzkumníka, který preferuje nezávislé řízení postupu. výpočetní proces. Komerční výpočetní systémy, které obsahují nástroje příkazového jazyka na vysoké úrovni, jako je Matlab, SPSS atd., vám umožňují kombinovat různé typy analýz, mít přístup k mezivýsledkům, ovládat styl zobrazení dat, přidávat vlastní rozšíření softwarových modulů a vypracování závěrečných zpráv v požadované podobě je bezplatné softwarové prostředí R, které je moderní a neustále se vyvíjející statistickou platformou obecný účel.



Dnes je R nesporným lídrem mezi volně distribuovanými statistickými analytickými systémy, o čemž svědčí například fakt, že R systém se v roce 2010 stal vítězem každoroční open source soutěže. softwarových produktů Bossie Awards v několika kategoriích. Přední světové univerzity, analytici z velkých společností a výzkumných center neustále používají R při provádění vědeckých a technických výpočtů a vytváření velkých informačních projektů. Široká výuka statistiky založená na balíčcích tohoto prostředí a plná podpora vědecké komunity vedly k tomu, že redukce R skriptů se postupně stává obecně přijímaným „standardem“ jak v časopiseckých publikacích, tak v neformální komunikaci mezi vědci kolem svět.

Hlavní překážkou pro rusky mluvící uživatele při zvládnutí R je samozřejmě to, že téměř veškerá dokumentace k tomuto prostředí existuje v angličtině. Teprve od roku 2008, díky úsilí A.V. Shipunova, E.M. Baldina, S.V. Petrová, I.S. Zaryadova, A.G. Bukhovets a další nadšenci, metodické příručky a knihy se objevily v ruštině (odkazy na ně najdete v seznamu literatury na konci této knihy; odkazy na vzdělávací zdroje, jejíž autoři reálně přispívají k propagaci R mezi rusky mluvícími uživateli).

Tato příručka shrnuje soubor metodických sdělení publikovaných jedním z autorů od roku 2011 na blogu „R: Data Analysis and Visualization“

(http://r-analytics.blogspot.com). Zdálo se nám vhodné předložit veškerý tento poněkud nesourodý materiál pro pohodlí čtenářů v koncentrované formě a pro úplnost prezentace rozšířit některé oddíly.

První tři kapitoly poskytují podrobné pokyny pro práci s interaktivními R komponentami, Detailní popis jazyk a zákl grafické schopnostiživotní prostředí.

Tato část knihy je docela přístupná pro začátečníky v programování, i když čtenáři, kteří již znají jazyk R, zde mohou najít zajímavé úryvky kódu nebo použít popisy grafických možností poskytnuté jako reference.

Následující kapitoly (4-8) poskytují popis běžných postupů pro zpracování dat a vytváření statistických modelů, který je ilustrován několika desítkami příkladů. Tyto zahrnují Stručný popis analytické algoritmy, hlavní získané výsledky a jejich možná interpretace. Snažili jsme se, pokud to bylo možné, vyhnout se zneužívání „rituálních“ frází typických pro četné příručky o aplikované statistice, citující známé teorémy a citování vícepatrových výpočtových vzorců. Důraz byl kladen především na praktickou aplikaci – aby čtenář vedený přečteným mohl analyzovat svá data a výsledky prezentovat kolegům.

Sekce této části jsou stavěny podle složitosti prezentovaného materiálu.

Kapitoly 4 a 5 jsou zaměřeny na čtenáře se zájmem o statistiku pouze v rámci úvodního vysokoškolského kurzu. Kapitoly 6 a 7 v rámci jednotné teorie obecných lineárních modelů představují variační a regresní analýzy a poskytují různé algoritmy pro studium a strukturální identifikaci modelů. Kapitola 8 je věnována některým moderním metodám pro konstrukci a analýzu zobecněných regresních modelů.

Protože prostorová analýza a zobrazení výsledků na geografických mapách a diagramech jsou neustálým zájmem výzkumníků, kapitola 9 poskytuje některé příklady takových vizualizačních technik.

Náš manuál je určen studentům, postgraduálním studentům i mladým a zavedeným vědcům, kteří chtějí zvládnout analýzu a vizualizaci dat pomocí prostředí R. Doufáme, že na konci čtení tohoto manuálu budete trochu rozumět tomu, jak R funguje. kde můžete získat další informace, stejně jako jak se vypořádat s jednoduchým a dostatečným složité úkoly analýza dat.

Soubory se skripty R kódu pro všechny kapitoly knihy, stejně jako potřebné zdrojové datové tabulky pro jejich provedení, jsou volně dostupné ke stažení z úložiště GitHub https://github.com/ranalytics/r-tutorials, stejně jako z webových stránek Ústavu ekologie povodí Volhy RAS odkaz http://www.ievbras.ru/ecostat/Kiril/R/Scripts.zip.

Je třeba poznamenat, že text v této příručce je uveden v autorském vydání, a proto i přes veškerou naši snahu existuje možnost, že může obsahovat překlepy, gramatické nepřesnosti a nešťastné fráze. Budeme Vám vděčni, čtenáři, za nahlášení těchto, ale i jiných zjištěných závad e-mailem [e-mail chráněný]. Budeme také vděčni za jakékoli další připomínky a návrhy, které můžete mít k této práci.

–  –  –

1. HLAVNÍ SLOŽKY STATISTICKÉHO PROSTŘEDÍ R

1.1. Historie vzniku a základní principy organizace prostředí R Systém statistické analýzy a vizualizace dat R se skládá z těchto hlavních částí:

° vysokoúrovňový programovací jazyk R, který umožňuje na jednom řádku realizovat různé operace s objekty, vektory, maticemi, seznamy atd.;

° velký soubor funkcí zpracování dat shromážděných v samostatných balíčcích;

° vyvinutý podpůrný systém, včetně aktualizace komponent prostředí, interaktivní nápovědy a různých vzdělávacích zdrojů určených jak pro počáteční studium R, tak pro následné konzultace o vznikajících potížích.

Začátek cesty se datuje do roku 1993, kdy dva mladí novozélandští vědci Ross Ihaka a Robert Gentleman oznámili svůj nový vývoj, který nazvali R. Za základ vzali programovací jazyk rozvinutého komerčního systému statistické zpracování S-PLUS data a vytvořili jeho bezplatnou, bezplatnou implementaci, která se od svého předchůdce liší snadno rozšiřitelnou modulární architekturou. Brzy tam bylo distribuovaný systémúložiště a distribuce balíčků pro R, známé pod zkratkou „CRAN“ (Comprehensive R Archive Network – http://cran.r-project.org), jehož hlavní myšlenkou je neustálé rozšiřování, kolektivní testování a rychlá distribuce aplikovaných nástrojů pro zpracování dat.

Ukázalo se, že takový produkt nepřetržitého a dobře koordinovaného úsilí mocné „kolektivní inteligence“ tisíců nezištných intelektuálních vývojářů se ukázal být mnohem efektivnější než komerční statistické programy, jejichž cena za licenci může být několik tisíc dolarů. Vzhledem k tomu, že jazyk R je oblíbeným jazykem profesionálních statistiků, všechny nejnovější pokroky ve statistické vědě jsou rychle dostupné uživatelům jazyka R po celém světě ve formě dalších knihoven. Žádný komerční statistický analytický systém se dnes nevyvíjí tak rychle. R má velkou armádu uživatelů, kteří informují autory dalších knihoven i samotný R systém o zjištěných chybách, které jsou promptně opraveny.

Výpočtový jazyk R, i když vyžaduje určité úsilí, pozoruhodné vyhledávací schopnosti a encyklopedickou paměť, umožňuje rychle provádět výpočty, které jsou ve své rozmanitosti prakticky „nevyčerpatelné jako atom“. K červenci 2014 napsali nadšenci z celého světa 6 739 dalších knihoven pro R, včetně 137 506 funkcí (viz

http://www.rdocumentation.org), které výrazně rozšiřují základní možnosti systému. Je velmi obtížné si představit jakoukoli třídu statistických metod, která již dnes není implementována ve formě R balíčků, včetně samozřejmě všech " pánská souprava": lineární a zobecněné lineární modely, nelineární regresní modely, experimentální design, analýza časových řad, klasické parametrické a neparametrické testy, Bayesovská statistika, shluková analýza a vyhlazovací metody. Pomocí výkonných vizualizačních nástrojů lze výsledky analýzy shrnout do podoby všech druhy grafů a tabulek Kromě tradiční statistiky obsahuje vyvinutá funkcionalita velkou sadu algoritmů pro numerickou matematiku, optimalizační metody, řešení diferenciálních rovnic, rozpoznávání vzorů atd. Genetici a sociologové, lingvisté a psychologové, chemici a lékaři a specialisté mohou objevit své vlastní specifické metody zpracování dat v balíčcích R na GIS a webových technologiích.

„Proprietární“ dokumentace pro R je velmi obsáhlá a není vždy dobře napsaná (v podivné tradici anglicky psané literatury se utrácí příliš mnoho slov k popisu triviálních pravd, zatímco důležité body jsou pokryty rychle). Kromě toho však přední světová nakladatelství (Springer, Cambridge University Press a Chapman & Hall / CRC) nebo prostě jednotlivé týmy nadšenců publikovaly obrovské množství knih popisujících různé aspekty analýzy dat v R (viz např. , seznam odkazů na webové stránce "Encyklopedie psychodiagnostiky", http://psylab.info/R:Literatura). Kromě toho existuje několik aktivních mezinárodních a ruských uživatelských fór R, kde může kdokoli požádat o pomoc s problémem. V bibliografii uvádíme několik stovek knih a internetových odkazů, kterým doporučujeme věnovat zvláštní pozornost při učení R.

Přímý trénink praktická práce v R sestává z a) zvládnutí konstrukcí jazyka R a seznámení se s vlastnostmi volání funkcí provádějících analýzu dat ab) osvojení dovedností v práci s programy, které implementují specifické metody analýzy a vizualizace dat.

Volba nástrojů uživatelského rozhraní R je kontroverzní a velmi závisí na vkusu uživatele. Dokonce ani autoritativní odborníci nemají shodu.

Někteří se domnívají, že neexistuje nic lepšího než standardní rozhraní konzole R Jiní se domnívají, že pro pohodlnou práci se vyplatí nainstalovat jedno z dostupných integrovaných vývojových prostředí (IDE) s bohatou sadou nabídek tlačítek. Skvělou volbou je například bezplatné integrované vývojové prostředí RStudio.

Níže se zaměříme na popis konzolové verze a práci s R Commanderem, ale dalšímu bádání čtenáře může pomoci recenze různých verzí IDE, prezentovaná v příloze knihy od Shipunova et al. (2014).

Jeden odborník na R, Joseph Rickert, se domnívá, že proces učení R lze rozdělit do následujících fází (více podrobností viz:

jeho článek na inside-r.org):

1. Seznamování obecné zásady kulturu komunity R a softwarové prostředí, ve kterém byl jazyk R vyvinut a funguje Navštivte hlavní a pomocné zdroje a osvojte si dobrou úvodní učebnici. Instalace R na počítač uživatele a spuštění prvních testovacích skriptů.

2. Čtěte data ze standardních souborů operačního systému a s jistotou používejte R funkce omezená sada postupy statistické analýzy známé uživateli.

3. Využití základních struktur jazyka R k psaní jednoduchých programů.

Psaní vlastní funkce. Seznámení s datovými strukturami, se kterými může R pracovat, a se složitějšími funkcemi jazyka. Práce s databázemi, webovými stránkami a externí zdroje data.

4. Psaní komplexní programy v jazyce R Samostatný vývoj a hluboké porozumění struktuře objektů tzv. S3- a S4-tříd.

5. Vývoj profesionální programy v jazyce R Samostatná tvorba dalších knihovních modulů pro R.

Většina průměrných uživatelů R se zastaví ve fázi 3, protože...

Do této doby nabyté znalosti zcela postačují k plnění statistických úkolů v profilu hlavní profesní činnosti.

Toto je přibližně rozsah našeho popisu jazyka R v rámci této příručky.

Instalace a konfigurace základního statistického prostředí R je poměrně jednoduchá. Od července 2014 je aktuální verze R 3.1.1 pro 32 a 64bitová Windows (k dispozici jsou i distribuce pro všechny ostatní běžné operační systémy). Distribuční sadu systému spolu se základní sadou 29 balíčků (54 MB) si můžete stáhnout zcela zdarma z hlavního webu projektu http://cran.r-project.org nebo ruského „zrcadla“ http://cran .gis-lab.info. Proces instalace systému ze stažené distribuce nezpůsobuje žádné potíže a nevyžaduje žádné zvláštní komentáře.

Pro usnadnění ukládání skriptů, zdrojových dat a výsledků výpočtů se vyplatí vybrat speciální pracovní adresář v počítači uživatele. Je velmi nežádoucí používat v názvu pracovního adresáře znaky azbuky.

Je vhodné umístit cestu k pracovnímu adresáři a některé další možnosti nastavení změnou v libovolném textovém editoru systémový soubor C:\Program Files\R\Retc\Rprofile.site (může mít jiné umístění ve vašem počítači). V níže uvedeném příkladu jsou upravené řádky označeny zeleně.

Kromě určení pracovního adresáře tyto řádky uvádějí odkaz na ruský zdroj pro stažení R balíčků a automatické spuštění R Commanderu.

Výpis souboru Rprofile.site # Vše, co následuje za symbolem komentáře "#", je prostředím ignorováno # options(papersize="a4") # options(editor="notepad") # options(pager="interní") # nastavit typ zobrazení referenční informace# options(help_type="text") options(help_type="html") # nastavení umístění místní knihovny #.Library.site - file.path(chartr("\\", "/", R.home()) , "site-library") # Při načítání prostředí spusťte nabídku R Commander # Přidejte znaky "#", pokud spuštění Rcmdr není potřeba local(( old - getOption("defaultPackages") options(defaultPackages = c(old, "Rcmdr) ") ) )) # Definujte zrcadlo CRAN local((r - getOption("repos") r["CRAN"] - "http://cran.gis-lab" options(repos=r))) # Definujte cesta k pracovnímu adresáři (jakémukoli jinému na vašem počítači) setwd("D:/R/Process/Resampling") Pokud jde o „dobrou úvodní učebnici“, každé z našich doporučení bude subjektivní. Za zmínku však stojí oficiálně uznávaný úvod do R od W. Venablese a D. Smithe (Venables, Smith, 2014) a kniha R. Kabakova (Kabaco, 2011), částečně i proto, že je k dispozici jejich ruský překlad. Všimněme si také tradiční „příručky pro figuríny“ (Meys, Vries, 2012) a příručky (Lam, 2010), napsané se záviděníhodnou holandskou pedantností. Z ruskojazyčných úvodních kurzů jsou nejúplnější knihy I. Zaryadova (2010a) a A. Šipunova et al. (2014).

1.2. Práce s konzolou příkazů rozhraní R Statistické prostředí R provádí jakoukoli sadu smysluplných instrukcí jazyka R obsažených v souboru skriptu nebo reprezentovaných jako sekvence příkazů vydaných z konzoly. Práce s konzolí se může zdát moderním uživatelům zvyklým na tlačítkové menu obtížná, protože je nutné pamatovat si syntaxi jednotlivých příkazů. Po získání určitých dovedností se však ukazuje, že mnoho procedur zpracování dat lze provádět rychleji a s menšími obtížemi než například ve stejném balíčku Statistica.

Konzole R je dialogové okno, do kterého uživatel zadává příkazy a vidí výsledky jejich provádění. Toto okno se objeví ihned po spuštění prostředí (například po kliknutí na zástupce R na ploše). Navíc standardní grafika uživatelské rozhraní R (RGui) obsahuje okno pro úpravu skriptu a vyskakovací okna s grafickými informacemi (obrázky, diagramy atd.)

V příkazovém režimu může R pracovat například jako běžná kalkulačka:

Napravo od symbolu výzvy může uživatel zadat libovolný aritmetický výraz, stisknout klávesu Enter a okamžitě získat výsledek.

Například ve druhém příkazu na obrázku výše jsme použili funkce faktoriál a sinus a také vestavěný p. Výsledky získané v textové podobě lze vybrat pomocí myši a zkopírovat přes schránku do libovolného textového souboru v operačním systému (například dokumentu aplikace Word).

Při práci s RGui doporučujeme ve všech případech vytvořit soubor pomocí skriptu (tj. sekvence příkazů jazyka R, které provádějí určité akce). Zpravidla se jedná o běžný textový soubor s libovolným názvem (ale pro jistotu je lepší s příponou *.r), který lze vytvářet a upravovat pomocí běžného editoru, jako je Poznámkový blok. Pokud tento soubor existuje, je nejlepší jej umístit do pracovního adresáře a poté po spuštění R a výběru položky nabídky "File Open Script" se obsah tohoto souboru objeví v okně "R Editor". Posloupnost příkazů skriptu můžete spustit z položky nabídky "Upravit spustit vše".

Můžete také myší vybrat smysluplný fragment z libovolného místa v připraveném skriptu (od názvu jedné proměnné až po celý obsah) a spustit tento blok ke spuštění. To lze provést se čtyřmi možné způsoby: z hlavní a kontextové nabídky pomocí kombinace kláves Ctrl+R nebo tlačítka na panelu nástrojů.

Na uvedeném obrázku byly provedeny následující akce:

° R-objekt gadm s údaji o územním členění Běloruské republiky byl stažen z bezplatného internetového zdroje Global Administrative Areas (GADM);

° Latinizované názvy měst jsou nahrazeny běžně používanými ekvivalenty;

° pomocí funkce spplot() balíku sp se v grafickém okně zobrazí administrativní mapa republiky, kterou lze pomocí nabídky zkopírovat do schránky nebo uložit jako standardní meta- nebo rastrový grafický soubor.

Na význam jednotlivých operátorů se podíváme podrobněji v dalších částech, zde si však všimneme, že výběrem ve skriptu a spuštěním kombinace symbolů Regions@data obdržíme v okně konzole celou datovou sadu pro objekt a příkaz složený z vybraných symbolů gadm, Regions @data$NAME_1 nám poskytne seznam názvů administrativních center před a po jeho úpravě.

R Editor tedy usnadňuje procházení skriptu, úpravu a spouštění libovolné kombinace příkazů a hledání a nahrazování konkrétních částí kódu. Výše zmíněný doplněk RStudio umožňuje dodatečně provádět zvýrazňování syntaxe kódu, automatické doplňování kódu, „zabalení“ sekvence příkazů do funkcí pro jejich následné použití, práci s dokumenty Sweave nebo TeX a další operace, které se budou hodit pokročilému uživateli. .

R má rozsáhlý vestavěný referenční materiál, ke kterému lze přistupovat přímo z RGui.

Zadáte-li příkaz help.start() z konzoly, otevře se ve vašem internetovém prohlížeči stránka, která umožní přístup ke všem zdrojům nápovědy: hlavní příručky, materiály autora, odpovědi na běžné otázky, seznamy změn, odkazy na nápovědu na jiných R objekty atd. .d.:

Nápovědu k jednotlivým funkcím lze získat pomocí následující příkazy:

° pomoc("foo") nebo? foo – nápověda k funkci foo (uvozovky jsou volitelné);

° help.search("foo") nebo ?? foo – vyhledá všechny soubory nápovědy obsahující foo;

° example("foo") – příklady použití funkce foo;

° RSiteSearch("foo") – vyhledávání odkazů v online příručkách a archivech pošty;

° apropos("foo", mode="funkce") – seznam všech funkcí s kombinací foo;

° vignette("foo") – seznam výukových programů na téma foo.

1.3. Práce s menu balíčku R Commander Pohodlným nástrojem pro zvládnutí výpočtů v R pro začínajícího uživatele je R Commander – nezávislý na platformě GUI ve stylu tlačítkového menu, implementovaného v balíčku Rcmdr. Umožňuje vám provádět velkou sadu postupů statistické analýzy, aniž byste se museli uchylovat k předběžnému zapamatování funkcí v příkazovém jazyce, ale nedobrovolně k tomu přispívá, protože zobrazuje všechny provedené instrukce ve speciálním okně.

Rcmdr můžete nainstalovat, stejně jako jakákoli jiná rozšíření, z nabídky konzoly R "Packages Install package", ale je lepší spustit příkaz:

install.packages("Rcmdr", dependencies=TRUE), kde povolení volby závislostí zajistí, že se nainstaluje celá sada dalších balíčků, které mohou být vyžadovány při zpracování dat prostřednictvím nabídky Rcmdr.

R Commander se spouští, když je balíček Rcmdr načten prostřednictvím nabídky "Packages Enable Package" nebo pomocí příkazu library(Rcmdr), pokud bylo z nějakého důvodu rozhodnuto analyzovat data výhradně pomocí R Commander, pak automaticky načíst tento grafický shell počínaje R, musíte upravit soubor Rprofile.site, jak je ukázáno v sekci 1.1.

Uvažujme o práci v R Commanderu na příkladu korelační analýzy údajů o úrovni infekce mlže Dreissena polymorpha s nálevníkem Conchophthirus acuminatus ve třech běloruských jezerech (Mastitsky S.E. // BioInvasions Records.

2012. V. 1. P 161–169). V tabulce s výchozími údaji, kterou si stáhneme z webu figshare, nás budou zajímat dvě proměnné: délka ulity měkkýše (ZMlength, mm) a počet nálevníků nalezených v měkkýšovi (CAnumber). Tento příklad bude podrobně probrán v kapitolách 4 a 5, takže se zde nebudeme podrobně zabývat smyslem analýzy, ale zaměříme se na techniku ​​práce s Rcmdr.

Dále definujeme režim načítání dat a adresu internetového odkazu ve vyskakovacích oknech. Je snadné vidět, že bychom mohli snadno stáhnout stejná data z místního textový soubor, sešity Excelu nebo databázové tabulky. Chcete-li se ujistit, že jsou naše data načtena správně (nebo je v případě potřeby upravit), klikněte na tlačítko „Zobrazit data“.

Okno pro definování organizace dat Fragment načtené tabulky

Ve druhé fázi v nabídce „Statistika“ vyberte „Test korelace“:

Vybereme dvojici korelovaných proměnných a ve Output Window získáme Pearsonův korelační koeficient (R = 0,467), dosaženou hladinu statistické významnosti (p-hodnota 2,2e-16) a 95% meze spolehlivosti.

–  –  –

Získané výsledky lze snadno zkopírovat z výstupního okna přes schránku.

Teď se dostaneme grafický obrázek korelační závislost. Vyberme bodový graf závislosti čísla CA na délce ZM a poskytněme mu diagramy hranových rozsahů, lineární trendovou linii pomocí metody nejmenších čtverců (zeleně), linii vyhlazenou pomocí lokální regresní metody (červeně), prezentovanou se spolehlivostí region (tečkovaná čára). Pro každé ze tří jezer (proměnná Lake) budou experimentální body reprezentovány různými symboly.

–  –  –

Graf zkopírovaný z grafického okna R Commanderu Jako ekvivalent všech kliknutí na tlačítko nabídky R Commanderu se v okně skriptu objeví instrukce jazyka R.

V našem případě vypadají takto:

Shellfish read.table("http://figshare.com/media/download/98923/97987", header=TRUE, sep="\t", na.strings="NA", dec=".", pruh. bílá=PRAVDA) cor.test(škeble$číslo CA, škeble$délka ZM, alternativní="dvoustranné", metoda="pearson") bodový graf(Číslo CA ~ ZMdélka | Jezero, reg.řádek=lm, hladký=PRAVDA, šíření= TRUE, boxplots="xy", span=0.5, ylab="Počet nálevníků", xlab="Délka skořepiny", by.groups=FALSE, data=Měkkýši) Samotný skript nebo výsledky výstupu (stejně jako obojí dohromady ) lze uložit do souborů a kdykoli opakovat. Stejného výsledku můžete dosáhnout i bez spuštění R Commanderu načtením uloženého souboru přes R konzolu.

Celkově lze říci, že aniž byste znali konstrukce jazyka R (nebo prostě nechtěli zatěžovat paměť jejich zapamatováním), pomocí Rcmdr můžete provádět zpracování dat pomocí téměř všech základních statistických metod. Představuje parametrické a neparametrické testy, metody pro prokládání různých spojitých a diskrétních rozdělení, analýzu vícerozměrných kontingenčních tabulek, jednorozměrnou a vícerozměrnou analýzu rozptylu, analýzu hlavních komponent a shlukování, různé formy zobecněných regresních modelů atd. Vyvinutý aparát pro analýzu a testování výsledných modelů si zaslouží pečlivé studium.

Podrobný popis technik pro práci s R Commanderem, stejně jako vlastnosti implementace algoritmů zpracování dat, lze nalézt v manuálech (Larson-Hall, 2009; Karp, 2014).

Stejně jako však znakový jazyk nemůže nahradit lidskou komunikaci v přirozeném jazyce, znalost jazyka R výrazně rozšiřuje možnosti uživatele a činí komunikaci s prostředím R příjemnou a vzrušující. A tady automatické generování Skriptování v R Commanderu může být pro čtenáře výborným způsobem, jak se seznámit s operátory jazyka R a naučit se specifika volání jednotlivých funkcí. Následující kapitoly manuálu budeme věnovat diskusi o postupech zpracování dat pouze na úrovni jazykových konstruktů.

1.4. Objekty, balíčky, funkce, zařízení Jazyk R patří do rodiny tzv. vysokoúrovňových objektově orientovaných programovacích jazyků. Pro laika je přísná definice pojmu „objekt“ dosti abstraktní. Pro jednoduchost však můžeme nazývat vše, co vzniklo při práci s R objekty.

Existují dva hlavní typy objektů:

1. Objekty určené k ukládání dat (" datové objekty") jsou jednotlivé proměnné, vektory, matice a pole, seznamy, faktory, datové tabulky;

2. Funkce („funkční objekty“) jsou pojmenované programy určené k vytváření nových objektů nebo k provádění určitých akcí s nimi.

Objekty prostředí R určené pro kolektivní a bezplatné použití, jsou zabaleny do balíčků spojených podobnými tématy nebo metodami zpracování dat. Existuje určitý rozdíl mezi pojmy balíček ("balíček") a knihovna ("knihovna"). Termín "knihovna" definuje adresář, který může obsahovat jeden nebo více balíčků. Pojem "balíček" se týká souboru funkcí, manuálových stránek HTML a příkladů datových objektů určených pro účely testování nebo školení.

Balíčky se instalují do konkrétního adresáře operačního systému nebo v odinstalované podobě mohou být uloženy a distribuovány v archivovaných souborech *.zip soubory Windows(verze balíčku musí odpovídat konkrétní verzi vašeho R).

Úplné informace o balíčku (verze, hlavní tematická oblast, autoři, data změn, licence, další funkčně související balíčky, kompletní seznam funkcí s uvedením jejich účelu atd.) lze získat příkazem

library(help=název_balíčku), například:

library(help=Matrix) Všechny balíčky R spadají do jedné ze tří kategorií: základní ("základ"), doporučené ("doporučené") a ostatní instalované uživatelem.

Jejich seznam můžete získat na konkrétním počítači zadáním příkazu library() nebo:

Installed.packages(priority = "base") installed.packages(priority = "recommended") # Získání úplný seznam packages packlist - rownames(installed.packages()) # Výstupní informace do schránky ve formátu Excel write.table(packlist,"clipboard",sep="\t", col.names=NA) Obvykle jsou součástí základní a doporučené balíčky do instalačního souboru R.

Samozřejmě není potřeba hned instalovat mnoho různých balíčků do zálohy.

Chcete-li nainstalovat balíček, jednoduše vyberte položku nabídky „Packages Install package(s)“ v příkazovém okně R Console nebo zadejte například příkaz:

install.packages(c("vegan", "xlsReadWrite", "auto"))

Balíčky lze stáhnout například z ruského „zrcadla“ http://cran.gis-lab.info, pro který je vhodné použít edici souboru Rprofile.site, jak je uvedeno v sekci 1.1.

Další možností instalace balíčků je přejít na webovou stránku http://cran.gis-lab.info/web/packages, vybrat požadovaný balíček jako soubor zip a stáhnout jej do vybrané složky v počítači.

V tomto případě si můžete prohlédnout všechny informace na balení, zejména popis funkcí, které jsou v něm obsaženy, a rozhodnout se, jak moc je potřebujete. Dále musíte spustit položku nabídky příkazu „Balíčky Instalovat balíčky z místních souborů zip“.

Když spustíte konzoli RGui, načtou se pouze některé základní balíčky. Chcete-li inicializovat jakýkoli jiný balíček, musíte před přímým použitím jeho funkcí zadat příkaz library (package_name).

Můžete určit, které balíčky jsou načteny v každém okamžiku relace, zadáním příkazu:

sessionInfo() R verze 2.13.2 (2011-09-30) Platforma: i386-pc-mingw32/i386 (32-bit)

–  –  –

další přiložené balíčky:

Vegan_2.0-2 permute_0.6-3

načteno prostřednictvím jmenného prostoru (a nepřipojeno):

Grid_2.13.2 lattice_0.19-33 tools_2.13.2 V následující tabulce uvádíme seznam (možná ne zcela úplný) balíčků, které byly použity ve skriptech uvedených v této knize:

R balíčky Účel "Basic" balíčky Základní konstrukce R base Kompilátor balíčků R kompilátor Sada tabulek s daty pro testování a demonstraci funkcí datové sady Základní grafické funkce grafika Ovladače grafických zařízení, barevné palety, fonty grDevices Funkce pro tvorbu grafických vrstev mřížka Objektově orientované programování komponenty (třídy, metody metody) Funkce pro práci s regresními splajny odlišné typy spline Základní funkce statistické analýzy statistik Metody statistických funkcí třídy S4 stats4 Komponenty uživatelského rozhraní (menu, výběrová pole atd.) tcltk Informační podpora, nástroje pro správu a dokumentaci Různé nástroje pro ladění, I/O, archivaci atd.

Utils "Doporučené" balíčky Funkce různých bootstrap a jackknife procedur boot Různé algoritmy pro nehierarchickou klasifikaci a rozpoznávací třídu Algoritmy pro dělení a hierarchické clustering cluster Analýza a ověřování kódů R codetools Čtení a zápis souborů v různých formátech (DBF, SPSS, DTA , Stata) cizí Funkce sloužící k optimalizaci vyhlazování jádra KernSmooth Grafické funkce pokročilé funkce (Sarkar, 2008) mřížka Sada datových a statistických funkcí (Venables, Ripley, 2002) MASS Maticové a vektorové operace Matice Zobecněné modely aditivních a smíšených efektů mgcv Lineární a nelineární modely smíšených efektů nlme Dopředné neuronové sítě nnet Klasifikace a regrese konstrukce stromy rpart Funkce krigingu a analýza prostorového rozložení bodů prostorová Analýza přežití (Coxův model atd.) Přežití Balíčky nainstalované během práce adegenet Algoritmy pro analýzu genetických vzdáleností rameno Analýza regresních modelů - příloha knihy (Gelman, Hill, 2007) car Postupy spojené s aplikovanou regresní analýzou corrplot Zobrazení korelačních matic v grafické podobě fitdistrplus Výběr parametrů statistických rozdělení FWDselect, Výběr souboru informativních proměnných v regresních modelech packfor gamair Soubory dat pro testování aditivních modelů geosféry Odhad geografických vzdáleností ggplot2 Pokročilý grafický balíček s vysokou funkčností DAAG Funkce analýzy dat a grafy pro knihu (Maindonald, Braun, 2010) Hmisc Sada funkcí Harrell HSAUR2 Doplněk ke knize (Everitt, Hothorn, 2010) ISwR Primární statistická analýza v R jpeg Práce s grafikou soubory jpeg lars Speciální typy regrese (LARS, Lasso atd.) lavaan Konfirmační analýza a modely strukturních rovnic lmodel2 Implementace regresních modelů typu I a II (MA, SMA, RMA) maptools Nástroje pro práci s zeměpisné mapy myši Postupy pro analýzu a doplnění chybějících hodnot momenty Funkce pro výpočet momentů vzorku nortest Kritéria pro testování hypotézy o normálním rozložení odlehlých hodnot Analýza odlehlých hodnot v datových pastech Analýza prostorových a časových řad v ekologii pls Regrese na hlavních složkách pwr Odhad statistická síla hypotéz přetváří Flexibilní transformace datových tabulek robustbase Robustní metody pro konstrukci regresních modelů rootSolve Nalezení kořenů funkce s několika proměnnými škály Výběr barevných škál sem Modely strukturních rovnic semPlot Vizualizace strukturních vztahů sm Odhad hustoty distribuce a metody vyhlazování sp Třídy a metody pro přístup k prostorovým datům spatstat Metody prostorové statistiky, výběr modelů spdep Prostorové závislosti: geostatistické hvězdářské metody a modelování Výstup informací o statistických modelech v různých formátech vcd Vizualizace kategoriálních dat Provádění výpočtů ekologie komunity (míry podobnosti, diverzity a vegan nesting, ordination a multivariate analysis) Pokud se pokusíme načíst balíček, který ještě není nainstalován v R, nebo se pokusíme použít funkce balíčku, který ještě nebyl načten, obdržíme systémové zprávy:

sem(model, data=PoliticalDemocracy) Chyba: nelze najít funkci "sem" library(lavaan) Chyba v knihovně(lavaan) : žádný balíček s názvem "lavaan" Následující funkce, kterou představil K. Cichini, bere jako vstup a seznam používaných uživatelů balíčků a zjistí, které z nich je třeba stáhnout a které je třeba předinstalovat. Pochopení skriptu vyžaduje znalost konstrukcí jazyka R popsaných v další části, ale čtenář, který má zájem, se k těmto příkazům může vrátit později.

instant_pkgs - function(pkgs) ( pkgs_miss - pkgs)] # Nainstalujte balíčky, které nejsou připraveny ke stažení:

if (length(pkgs_miss) 0) ( install.packages(pkgs_miss) ) # Stáhnout balíčky, které ještě nebyly staženy:

Attached - search() connected_pkgs - connected need_to_attach - pkgs if (length(need_to_attach) 0) (for (i in 1:length(need_to_attach)) required(need_to_attach[i], character.only = TRUE) ) # Příklad volání:

instant_pkgs(c("základní", "jpeg", "vegan"))

Seznam funkcí každého balíčku můžete získat například spuštěním příkazu:

ls(pos = "package:vegan") Poznámka: ls() je univerzální funkce pro výpis objektů v daném prostředí. Výše uvedený příkaz nainstaluje veganský balíček jako takové prostředí. Pokud tento příkaz zadáme bez parametrů, získáme seznam objektů vytvořených během aktuální relace.

Seznam argumentů pro příchozí parametry libovolné funkce v načteném balíčku můžete získat zadáním příkazu args().

Například při spuštění lineárního modelu získávajícího funkci lm(), kterou později široce používáme, se nastaví parametry:

Funkce Args(lm) (vzorec, data, podmnožina, váhy, na.action, metoda = "qr", model = TRUE, x = FALSE, y = FALSE, qr = TRUE, singulární.ok = TRUE, kontrasty = NULL, offset,...) Pokud zadáte příkaz sestávající pouze ze zkratky funkce (například výpočet mezikvartilového rozsahu IQR), můžete získat zdrojový text funkce v kódech jazyka R:

Funkce IQR (x, na.rm = FALSE) diff(quantile(as.numeric(x), c(0,25, 0,75), na.rm = na.rm, names = FALSE)) Pokročilý uživatel může toto změnit kód a „přesměrujte“ volání standardní funkce na vaši verzi.

Pokud se však chceme stejným způsobem podívat na kód funkce forecast(), která se používá k výpočtu predikovaných hodnot lineárního modelu, dostaneme:

prediktivní funkce (objekt,...) UseMethod("predict") V tomto případě je prediktivní() funkce "univerzální": v závislosti na tom, který modelový objekt je dodáván na její vstup (lm pro lineární regresi, glm pro Poisson nebo logistické regrese, lme pro model se smíšenými efekty atd.), je aktualizována vhodná metoda pro získání predikovaných hodnot.

Konkrétně se tato funkce používá k implementaci následujících metod:

metody("předvídat") předvídat.ar* předvídat.Arima* předpovídat.arima0* předpovídat.glm předpovídat.HoltWinters* předvídat.lm předpovídat.spraš* předvídat.mlm předpovídat.nls* předvídat.poly předvídat.ppr* předpovídat.prcomp* Predikce.princomp* Predikce.smooth.spline* Predikce.smooth.spline.fit* Predikce.StructTS* Neviditelné funkce jsou označeny hvězdičkou Tento příklad se týká myšlenek objektově orientovaného programování (OOP), které jsou základem rámce R For OOP v In Metoda ve stylu S3 je přísně vzato funkce, která je volána jinou generickou funkcí, jako je print(), plot() nebo Summary(), v závislosti na třídě objektu dodávaného na její vstup. V tomto případě je atribut class zodpovědný za „orientaci objektu“, která zajišťuje správné odeslání a volání požadované metody pro daný objekt. Takže „metodní funkce“ pro získání předpokládaných hodnot zobecněného lineárního modelu bude mít při vyhlazování pomocí splajnů volání předpovědi.glm() – predikce.smooth.spline() atd. Detailní informace Model S3 OOP najdete v sekci nápovědy S3Methods a pokročilejší model S4 najdete v sekci Metody.

Nakonec se podívejme na několik jednoduchých technik pro ukládání práce vytvořené během relace R:

° sink(file= jméno souboru) – výstup výsledků provádění následných příkazů v reálném čase do souboru se zadaným názvem; Chcete-li tento příkaz ukončit, musíte spustit příkaz sink() bez parametrů;

° save(file= název souboru, seznam objektů k uložení) – uloží zadané objekty do binárního souboru ve formátu XDR, se kterým lze pracovat na jakémkoli operačním systému;

° načíst(soubor= název souboru) – obnoví uložené objekty v aktuálním prostředí;

° save.image(file= název souboru) – uloží všechny objekty vytvořené během práce jako R-specifický soubor rda.

Příklad přenosu vygenerované tabulky s daty do schránky ve formátu kompatibilním se strukturou list Excelu, byl uveden výše v této části. Kapitola 6 poskytne příklad přenosu dat z objektu lineárního modelu do souboru aplikace Word.

Prostředí R dokáže generovat pixelové obrázky požadované kvality pro téměř jakékoli rozlišení displeje nebo tiskové zařízení a také ukládat výsledná grafická okna do souborů různých formátů. Pro každé grafické výstupní zařízení existuje funkce ovladače: úplný seznam ovladačů získáte zadáním příkazu help(Devices).

Mezi grafickými zařízeními jsou nejběžnější:

° windows() – grafické Okno Windows(obrazovka, tiskárna nebo metasoubor).

° png(), jpeg(), bmp(), tiff() – výstup do rastrového souboru příslušného formátu;

° pdf(),postscript() – výstup grafické informace PROTI PDF soubor nebo PostScript.

Po dokončení práce s výstupním zařízením byste měli deaktivovat jeho ovladač pomocí příkazu dev.off(). Je možné aktivovat několik grafických výstupních zařízení současně a přepínat mezi nimi: viz např. odpovídající část v knize Shipunova et al. (2012, s. 278).

1. POPIS JAZYKA R

2.1. Datové typy jazyka R Všechny datové objekty (a tedy i proměnné) v R lze rozdělit do následujících tříd (tj. typů objektů):

° numeric – objekty, které obsahují celá čísla (integer) a reálná čísla (double);

° logical – logické objekty, které nabývají pouze dvou hodnot: FALSE (zkráceně F) a TRUE (T);

° znak – znakové objekty (hodnoty proměnných jsou uvedeny ve dvojitých nebo jednoduchých uvozovkách).

V R můžete vytvářet názvy pro různé objekty (funkce nebo proměnné) v latince i azbuce, ale mějte na paměti, že a (cyrilice) a a (latinka) jsou dva různé objekty. Prostředí R navíc rozlišuje velká a malá písmena, tzn. malá a velká písmena se liší. Názvy proměnných (identifikátory) v R musí začínat písmenem (nebo tečkou) a skládat se z písmen, číslic, teček a podtržítek.

S pomocí týmu? název, můžete zkontrolovat, zda existuje proměnná nebo funkce se zadaným názvem.

Kontrola, zda proměnná patří do určité třídy, je kontrolována funkcemi is.numeric(název_objektu), is.integer(název), is.logicky(název), is.znak(název) a převedením objektu na jiný typ můžete použít funkce as.numeric (jméno), as.integer(name), as.logical(name), as.character(name).

V R je řada speciálních objektů:

° Inf – kladné nebo záporné nekonečno (obvykle výsledek dělení reálného čísla 0);

° NA – „chybějící hodnota“ (není k dispozici);

° NaN – „není číslo“.

Zda proměnná patří k některému z těchto speciálních typů, můžete zkontrolovat pomocí funkcí is.nite(jméno), is.na(jméno) a is.nan(jméno).

Výraz jazyka R je kombinací prvků, jako je operátor přiřazení, aritmetické nebo logické operátory, názvy objektů a názvy funkcí. Výsledek provedení výrazu se obvykle okamžitě zobrazí v příkazovém nebo grafickém okně. Když je však provedena operace přiřazení, výsledek se uloží do odpovídajícího objektu a nezobrazí se na obrazovce.

Jako operátor přiřazení v R můžete použít buď symbol „=“, nebo dvojici symbolů „-“ (přiřazení konkrétní hodnoty objektu vlevo) nebo „-“ (přiřazení hodnoty objektu na že jo). Za dobrý programovací styl se považuje použití „-“.

Výrazy jazyka R jsou uspořádány řádek po řádku ve skriptu. Na jeden řádek můžete zadat několik příkazů a oddělit je symbolem „;“. Jeden příkaz lze také umístit na dva (nebo více) řádky.

Objekty typu numeric mohou vytvářet výrazy pomocí tradičních aritmetické operace+ (sčítání), – (odčítání), * (násobení), / (dělení), ^ (umocňování), %/% (dělení celého čísla), %% (zbytek po dělení). Operace mají normální prioritu, tzn. Nejprve se provede umocňování, poté násobení nebo dělení, poté sčítání nebo odčítání. Výrazy mohou používat závorky a operace v nich mají nejvyšší prioritu.

Logické výrazy lze skládat pomocí následujících logických operátorů:

° "Rovno" == ° "Nerovná se" != ° "Menší než" ° "Větší než" ° "Menší než nebo rovno" = ° "Větší než nebo rovno" = ° "Logické AND" & ° "Logické NEBO" | ° "Logické NE" !

PODPORA, SLUŽBY AU TSOURCING SPRÁVA FONDŮ G&A OBLAST PŮSOBNOSTI SPOLEČNOSTI AMICORP GROUP 2. VYNIKNOUT Z DAVU w w w.am icor p. c om AMICORP GROUP OBLAST ČINNOSTI SPOLEČNOSTI OBSAH O SPOLEČNOSTI NÁŠ US MEADOWS Služby pro firemní klientelu Služby pro institucionální prodej Tvorba a správa...”

« Federální státní vzdělávací rozpočtová instituce vyššího odborného vzdělávání "Finanční univerzita pod vládou Ruské federace" Federation" Katedra "Marketingu" MODERNÍ SMĚRY MARKETINGU: TEORIE, METODIKA, PRAXE KOLEKTIVNÍ MONOGRAFIE Pod generální redakcí S.V. Karpova Moskva 2011 Recenzenti: N.S. Perekalina - doktor ekonomie, profesor, přednosta. Katedra marketingu "MATI" - Ruská státní technologická univerzita pojmenovaná po. K. E. Tsiolkovsky S.S. Solovjev..."

« Digitální newsletter Malko pro KAVÁRNU a ČAJOVÉ VZDĚLÁVÁNÍ: Ch. Redakce: Vesela Dabova Br.4. prosince 2011 Redakce: Otslabvane s tea Theodora Vasileva Gergana Ivanov Vydalo: ABB Kakvo se sluchva v těle ani při užívání neto na čajový nápoj a jak se sluchva oslabená Nay-sigurniyat a zdravý začátek pro namalyavana na thégloto e redovnata konzumace na šálek čaje. Existují různé názory na spolehlivost teorie, ale jen velmi málo faktů dokazuje, že každý šálek čaje je spojen s definovaným režimem na...“

« MEZINÁRODNÍ MEZIODBORNÁ VĚDECKÁ KONFERENCE RADIKÁLNÍ PROSTOR MEZI OBORY RCS 2015 KONFERENČNÍ KNIHA ABSTRAKTŮ REDAKCE Romana Bokovi Miljana Zekovi Slaana Milievi NOVI SAD / SRBSKO / 21.-23. ZÁŘÍ / 2015 Konference Radical Space In Between Disciplines Redakce knihy abstraktů: Romana Bokovi Miljana Zekovi Slaana Milievi ISBN: 978-86-7892-733-1 Layout: Maja Momirov Design obálky: Stefan Vuji Vydalo Ústav architektury a urbanismu Fakulty technických věd,...”

« STÁTNÍ UNIVERZITA ST PETERSBURG Fakulta geografie a geoekologie Katedra geomorfologie DIPLOMOVÁ PRÁCE (závěrečná kvalifikační práce) na adrese téma: „Geomorfologické rysy a paleoklima arktických jezer (na příkladu jezer v centrálním sektoru ruské Arktidy)“ Vyplnil: večerní studentka Elena Aleksandrovna Morozova Vědečtí školitelé: doktor geologických věd, Prof. Bolshiyanov Dmitry Yurievich Ph.D., senior učitel Savelyeva Larisa Anatolyevna Recenzent: Ph.D., vedoucí...”

« Myš Apacer M811 – laserová mini-SUV sada. http://news.kosht.com/computer/mouse/2009/11/26/mysh_apacer_m811. vyhledávací plugin pro denní ceny KOSHT.com pro Prohlížeč Firefox. Instalace One Click. Jeden kilobajt. Domů Novinky Ceny Oznámení Práce Fóra Společnosti Mobi Najít Najdi své novinky Všechny novinky KOSTA Počítače a komponenty Myši Počítače a komponenty Myši Všechny novinky KOSTA Nejlepší herní počítače On-line kalkulace na UltraPrice.by Mouse Apacer M811 – laserové mini-SUV [...»

« FEDERÁLNÍ AGENTURA PRO VZDĚLÁVÁNÍ STÁTNÍ VZDĚLÁVACÍ INSTITUCE VYSOKÉHO ODBORNÉHO VZDĚLÁVÁNÍ MOSKVA STÁTNÍ INDUSTRIAL UNIVERZITA (GOU MGIU) KATEDRA „INFORMAČNÍ SYSTÉMY A TECHNOLOGIE“ DIPLOMOVÁ PRÁCE v oboru „ Software a administrativa informační systémy» studentka Taťána Andrevna Čumaková na téma „Výpočet separovaných toků za špatně zefektivněným tělesem“ Vedoucí práce: Prof., doktor fyziky a matematiky. n. Aleksin Vladimir Adamovič..."

« R WIPO A/45/3 ORIGINÁL: English DATUM: 15. srpna 2008 SVĚTOVÁ ORGANIZACE PRO DUŠEVNÍ VLASTNICTVÍ ŽENEVSKÉ SHROMÁŽDĚNÍ ČLENSKÝCH STÁTŮ WIPO Forty pátá série jednání Ženeva, 22.-30. září 2008 PŘIJETÍ POZOROVATELŮ Memorandum Generální ředitel I. PŘIJETÍ MEZINÁRODNÍCH NEVLÁDNÍCH ORGANIZACÍ JAKO POZOROVATELŮ 1. Shromáždění přijala na svých předchozích zasedáních řadu zásad, které je třeba uplatňovat při odkazování na mezinárodní nevládní organizace...“

« 1 Oleg Sanajev. CESTA CESTUJÍCÍ SVĚT NA ČTYŘI LETY A NÁKLADY STO DOLARŮ S termíny cesty Jevgenije Aleksandroviče Gvozděva na jachtě Lena, uvedeno v názvu, vše je v pořádku - čtyři roky plus dva týdny: 7. července 1992 opustil přístav Machačkala, 19. července 1996 se vrátil. Ale s penězi je to jasná nadsázka, nebo spíše podhodnocení: čtyři roky samozřejmě nemůžete žít se sto dolary - protáhnete si nohy. Jenže Gvozdev měl na začátku své plavby k dispozici přesně tuto částku. A alespoň nohy...“

"Institut managementu, Research University Belgorod State National Research University TECHNOLOGIE TVORBY BEZPEČNOSTI ZAJIŠŤUJÍCÍ TVORBU PERSONÁLNÍ ZÁLOHY KANDIDÁTNÍ POOL STÁT PRO STÁTNÍ A KOMUNÁLNÍ A KOMUNÁLNÍ SLUŽBU Abstrakt: Shrnutí: Článek pojednává..."

« Lydia YANOVSKAYA POZNÁMKY O MIKHAILU BULGAKOVI MOSKVA "TEXT" MDT 821.161.1 BBK 84 (2Ros-Rus)6-44 Ya64 ISBN 978-5-7516-0660-2 ISBN 978-985-16-32977"Text", 2007 "BRAVO, BIS, PAWNSHOP!" "BRAVO, BIS, zastavárna!" Nevím, kde se dnes v Moskvě nachází redakce časopisu Yunost. Existuje ještě takový časopis? V polovině 70. let se tato nejmladší a nejhezčí redakce v Moskvě nacházela na Sadovaya-Triumfalnaja, vedle Majakovského náměstí, v malé, ale mimořádně útulné...

« Příloha 1 PŘIHLÁŠKY DO SOUTĚŽE 2013 Formulář „T“. Titulní strana přihlášky do Ruské humanitární nadace Název projektu Číslo projektu Typ projektu (a, c, d, e, f) Oblast znalostí(kód) RGNF klasifikátor kód GRNTI kód ​​(http://www.grnti.ru/) Prioritní směr rozvoje vědy, techniky a inženýrství v Ruská Federace, kritická technologie1 Příjmení, jméno, patronymie manažera kontaktní číslo projektový projektový manažer Úplný a krátký název organizace, jejímž prostřednictvím má být realizováno...“

« Zpráva FNI 8/2014 Provádění politik EU v oblasti klimatu a energetiky v Polsku: od evropeizace k polonizaci? Jon Birger Skjrseth Implementace klimatu EU a Energetická politika v Polsku: od evropeizace k polonizaci? Jon Birger Skjrseth [e-mail chráněný] Prosinec 2014 Copyright © Fridtjof Nansen Institute 2014 Název Implementace politiky EU v oblasti klimatu a energetiky v Polsku: Od evropeizace k polonizaci? Typ publikace a číslo Strany Zpráva FNI 8/2014 57 Autor ISBN 978-82-7613-683-8 Jon...”

« „Vědecké poznámky TOGU“ Ročník 6, č. 4, 2015 ISSN 2079-8490 Elektronická vědecká publikace „Vědecké poznámky TOGU“ 2015, ročník 6, č. 4, str. 173 – 178 Certifikát El No. FS 77-39676 ze dne 5. 5. 2010 http://pnu.edu.ru/ru/ejournal/about/ [e-mail chráněný] MDT 316,33 © 2015 I. A. Gareeva, doktor sociologie. Sciences, A. G. Kiseleva (Pacific State University, Chabarovsk) TVORBA SYSTÉMŮ SOCIÁLNÍHO POJIŠTĚNÍ Tento článek analyzuje formování systémů sociálního pojištění a jeho současný stav...“

« Program konference Chiang Mai, Thajsko listopad, 2015 APCBSS Asia-Pacific Conference on Business & Social Sciences Mezinárodní konference ICEI o vzdělávání Inovace APCLSE Asijsko-pacifická konference o biologických vědách a inženýrství APCBSS Asijsko-pacifická konference o podnikání a společenských vědách ISBN978-986-90263-0-7 Mezinárodní konference ICEI o inovacích ve vzdělávání ISBN 978-986-5654-33-7 APCLSE Asie-Pacifik Conference on Life Science and Engineering ISBN 978-986-90052-9-6 Obsah Obsah...“