Statistická analýza dat v Calcu

From LibreOffice Help
Jump to: navigation, search

Pomocí statistických nástrojů můžete v Calcu provést komplexní analýzu dat.

Pokud pracujete na komplexní statistické analýze nebo technicky zaměřené studii, můžete v Calcu využít nástroje statistické analýzy a ušetřit tím čas i omezit počet prováděných kroků. Poté, co pro určitou analýzu zadáte data a parametry, se použijí příslušné statistické nebo matematické funkce a ve výstupní tabulce se zobrazí výsledky.

Vzorkování

Vytvoří tabulku s daty vzorkovanými z jiné tabulky.

Choose Data - Statistics - Sampling

Vzorkování umožňuje vybrat data ze zdrojové tabulky a vyplnit jimi cílovou tabulku. Vzorkovat je možné náhodně nebo periodicky.

Note.png Vzorkování probíhá po řádcích. To znamená, že se vybere a do cílové tabulky zkopíruje celý řádek zdrojové tabulky.

Data

Vstupní oblast: Odkaz na analyzovanou oblast dat.

Výsledky do: Odkaz na levou horní buňku oblasti, v níž se mají zobrazit výsledky.

Metoda vzorkování

Náhodně: Ze zdrojové tabulky se náhodným způsobem vybere počet řádků rovný Velikosti vzorku.

Velikost vzorku: Počet řádků vzorkovaný ze zdrojové tabulky.

Periodicky: Vyberou se řádky v intervalech určených Periodou.

Perioda: Počet řádků, které se budou při vzorkování periodicky přeskakovat.

Příklad

V příkladu vzorkování bude použita následující tabulka zdrojových dat:

A B C
1 11 21 31
2 12 22 32
3 13 23 33
4 14 24 34
5 15 25 35
6 16 26 36
7 17 27 37
8 18 28 38
9 19 29 39

Výsledkem vzorkování s periodou 2 bude následující tabulka:

12 22 32
14 24 34
16 26 36
18 28 38

Popisná statistika

Vyplní v sešitu tabulku se základními statistickými vlastnostmi množiny dat.

Zvolte Data - Statistika - Popisná statistika

Analytický nástroj Popisná statistika vypočte pro data ze vstupní oblasti jednorozměrnou statistiku, zahrnující charakteristiky polohy a variability dat.

Note.png Více informací o popisné statistice naleznete v angličtině v v příslušném článku na Wikipedii.

Data

Vstupní oblast: Odkaz na analyzovanou oblast dat.

Výsledky do: Odkaz na levou horní buňku oblasti, v níž se mají zobrazit výsledky.

Seskupit podle

Vyberte, zda jsou vstupní data rozmístěna po sloupcích nebo řádcích.

Příklad

Jako příklad budou použita následující data

A B C
1 Matematika Fyzika Biologie
2 47 67 33
3 36 68 42
4 40 65 44
5 39 64 60
6 38 43
7 47 84 62
8 29 80 51
9 27 49 40
10 57 49 12
11 56 33 60
12 57
13 26

Následující tabulka zobrazuje výsledky popisné statistiky pro výše uvedený výběr dat.

Sloupec 1 Sloupec 2 Sloupec 3
Střední hodnota 41.9090909091 59.7 44.7
Standardní chyba 3.5610380138 5.3583786934 4.7680650629
Modus 47 49 60
Medián 40 64.5 43.5
Rozptyl 139.4909090909 287.1222222222 227.3444444444
Směrodatná odchylka 11.8106269559 16.944681237 15.0779456308
Špičatost -1.4621677981 -0.9415988746 1.418052719
Šikmost 0.0152409533 -0.2226426904 -0.9766803373
Oblast 31 51 50
Minimum 26 33 12
Maximum 57 84 62
Součet 461 597 447
Počet 11 10 10

Analýza rozptylu (ANOVA)

Provede pro danou množinu dat analýzu rozptylu (ANOVA).

Zvolte Data - Statistika - Analýza rozptylu (ANOVA)

ANOVA je zkratka slov ANalysis Of VAriance (analýza rozptylu). Tento nástroj provede analýzu rozptylu (ANOVA) pro danou množinu dat.

Note.png Více informací o analýze rozptylu naleznete v rozptylu příslušném článku na Wikipedii.

Data

Vstupní oblast: Odkaz na analyzovanou oblast dat.

Výsledky do: Odkaz na levou horní buňku oblasti, v níž se mají zobrazit výsledky.

Seskupit podle

Vyberte, zda jsou vstupní data rozmístěna po sloupcích nebo řádcích.

Typ

Vyberte, zda se jedná o jednofaktorovou nebo dvoufaktorovou analýzu rozptylu.

Parametry

Alfa: hladina významnosti testu.

Řádky na výběr: Určuje, kolik má výběr řádků.

Příklad

Jako příklad budou použita následující data

A B C
1 Matematika Fyzika Biologie
2 47 67 33
3 36 68 42
4 40 65 44
5 39 64 60
6 38 43
7 47 84 62
8 29 80 51
9 27 49 40
10 57 49 12
11 56 33 60
12 57
13 26

Následující tabulka zobrazuje výsledky analýzy rozptylu (ANOVA) pro výše uvedený výběr dat.

ANOVA - Jednofaktorová
Alfa 0.05
Skupiny Počet Součet Střední hodnota Rozptyl
Sloupec 1 11 461 41.9090909091 139.4909090909
Sloupec 2 10 597 59.7 287.1222222222
Sloupec 3 10 447 44.7 227.3444444444
Zdroj variability SS df MS F P-hodnota
Mezi skupinami 1876.5683284457 2 938.2841642229 4.3604117704 0.0224614952
Ve skupinách 6025.1090909091 28 215.1824675325
Celkem 7901.6774193548 30

Korelace

Vypočítá korelaci dvou množin číselných dat.

Zvolte Data - Statistika - Korelace

Korelační koeficient (hodnota mezi −1 a +1) udává, jak silně jsou na sobě závislé dvě veličiny. Hodnotu korelačního koeficientu pro dvě veličiny umožňuje nalézt funkce CORREL nebo nástroj ze statistické analýzy dat.

Korelační koeficient +1 znamená dokonalou pozitivní korelaci.

Korelační koeficient −1 znamená dokonalou negativní korelaci.

Note.png Více informací o statistické korelaci naleznete v příslušném článku na Wikipedii.

Data

Vstupní oblast: Odkaz na analyzovanou oblast dat.

Výsledky do: Odkaz na levou horní buňku oblasti, v níž se mají zobrazit výsledky.

Seskupit podle

Vyberte, zda jsou vstupní data rozmístěna po sloupcích nebo řádcích.

Příklad

Jako příklad budou použita následující data

A B C
1 Matematika Fyzika Biologie
2 47 67 33
3 36 68 42
4 40 65 44
5 39 64 60
6 38 43
7 47 84 62
8 29 80 51
9 27 49 40
10 57 49 12
11 56 33 60
12 57
13 26

Následující tabulka zobrazuje výsledky korelace pro výše uvedený výběr dat.

Korelace Sloupec 1 Sloupec 2 Sloupec 3
Sloupec 1 1
Sloupec 2 -0.4029254917 1
Sloupec 3 -0.2107642836 0.2309714048 1

Kovariance

Vypočítá kovarianci dvou množin číselných dat.

Zvolte Data - Statistika - Kovariance

Kovariance je míra toho, jak se dvě náhodné veličiny společně mění.

Note.png Více informací o statistické kovarianci naleznete v angličtině v příslušném článku na Wikipedii.

Data

Vstupní oblast: Odkaz na analyzovanou oblast dat.

Výsledky do: Odkaz na levou horní buňku oblasti, v níž se mají zobrazit výsledky.

Seskupit podle

Vyberte, zda jsou vstupní data rozmístěna po sloupcích nebo řádcích.

Příklad

Jako příklad budou použita následující data

A B C
1 Matematika Fyzika Biologie
2 47 67 33
3 36 68 42
4 40 65 44
5 39 64 60
6 38 43
7 47 84 62
8 29 80 51
9 27 49 40
10 57 49 12
11 56 33 60
12 57
13 26

Následující tabulka zobrazuje výsledky kovariance pro výše uvedený výběr dat.

Kovariance Sloupec 1 Sloupec 2 Sloupec 3
Sloupec 1 126.8099173554
Sloupec 2 -61.4444444444 258.41
Sloupec 3 -32 53.11 204.61

Exponenciální vyrovnávání

Vytvoří vyhlazené časové řady.

Zvolte Data - Statistika - Exponenciální vyrovnávání

Exponenciální vyhlazování je technika filtrování množiny dat, jejímž účelem je vytvořit vyhlazená data. Používá se v mnoha oblastech, například na burzách, v ekonomii nebo pro měření.

Note.png Více informací o exponenciálním vyrovnávání naleznete v angličtině v příslušném článku na Wikipedii.

Data

Vstupní oblast: Odkaz na analyzovanou oblast dat.

Výsledky do: Odkaz na levou horní buňku oblasti, v níž se mají zobrazit výsledky.

Seskupit podle

Vyberte, zda jsou vstupní data rozmístěna po sloupcích nebo řádcích.

Parametry

Vyrovnávací konstanta: Parametr mezi 0 a 1 představující v rovnici vyrovnávání koeficient tlumení alfa.

Příklad

Následující tabulka obsahuje dvě časové řady. První představuje jednotkový impuls v čase t=0, druhá jednotkový impuls v čase t=2.

A B
1 1 0
2 0 0
3 0 1
4 0 0
5 0 0
6 0 0
7 0 0
8 0 0
9 0 0
10 0 0
11 0 0
12 0 0
13 0 0

Výsledek vyrovnávání s vyrovnávací konstantou 0,5:

Alfa
0.5
Sloupec 1 Sloupec 2
1 0
1 0
0.5 0
0.25 0.5
0.125 0.25
0.0625 0.125
0.03125 0.0625
0.015625 0.03125
0.0078125 0.015625
0.00390625 0.0078125
0.001953125 0.00390625
0.0009765625 0.001953125
0.0004882813 0.0009765625
0.0002441406 0.0004882813

Klouzavý průměr

Vypočítá klouzavý průměr časové řady.

Zvolte Data - Statistika - Klouzavý průměr

Note.png Více informací o klouzavém průměru naleznete v příslušném článku na Wikipedii.

Data

Vstupní oblast: Odkaz na analyzovanou oblast dat.

Výsledky do: Odkaz na levou horní buňku oblasti, v níž se mají zobrazit výsledky.

Seskupit podle

Vyberte, zda jsou vstupní data rozmístěna po sloupcích nebo řádcích.

Parametry

Interval: Počet hodnot použitých pro výpočet klouzavého průměru.

Příklad

Následující tabulka obsahuje dvě časové řady. První představuje jednotkový impuls v čase t=0, druhá jednotkový impuls v čase t=2.

A B
1 1 0
2 0 0
3 0 1
4 0 0
5 0 0
6 0 0
7 0 0
8 0 0
9 0 0
10 0 0
11 0 0
12 0 0
13 0 0

Výsledný klouzavý průměr:

Sloupec 1 Sloupec 2
#N/A #N/A
0.3333333333 0.3333333333
0 0.3333333333
0 0.3333333333
0 0
0 0
0 0
0 0
0 0
0 0
0 0
0 0
#N/A #N/A

t-test

Vypočítá pro dva výběry dat t-test.

Zvolte Data - Statistika - t-test

t-test je takový statistický test, v němž má testovací statistika Studentovo t rozdělení.

Note.png Více informací o t-testu naleznete v příslušném článku na Wikipedii.

Data

Oblast proměnné 1: Odkaz na oblast první analyzované řady dat.

Oblast proměnné 2: Odkaz na oblast druhé analyzované řady dat.

Výsledky do: Odkaz na levou horní buňku oblasti, v níž se test zobrazí.

Seskupit podle

Vyberte, zda jsou vstupní data rozmístěna po sloupcích nebo řádcích.

Příklad

Následující tabulka obsahuje dvě množiny dat.

A B
1 28 19
2 26 13
3 31 12
4 23 5
5 20 34
6 27 31
7 28 31
8 14 12
9 4 24
10 0 23
11 2 19
12 8 10
13 9 33

Výsledky t-testu:

Následující tabulka zobrazuje t-test pro výše uvedené řady dat:

t-test
Alfa 0.05
Rozdíl středních hodnot v hypotéze 0
Proměnná 1 Proměnná 2
Střední hodnota 16.9230769231 20.4615384615
Rozptyl 125.0769230769 94.4358974359
Pozorování 13 13
Pearsonova korelace -0.0617539772
Pozorovaný rozdíl středních hodnot -3.5384615385
Rozptyl rozdílů 232.9358974359
df 12
t statistika -0.8359262137
P (T<=t) jednostranný 0.2097651442
t kritické jednostranný 1.7822875556
P (T<=t) dvoustranný 0.4195302884
t kritické dvoustranný 2.1788128297

F-test

Vypočítá pro dva výběry dat F-test.

Zvolte Data - Statistika - F-test

F-test je statistický test, v němž má testovací statistika za předpokladu platnosti nulové hypotézy F rozdělení.

Note.png Více informací o F-testu naleznete v angličtině v příslušném článku na Wikipedii.

Data

Oblast proměnné 1: Odkaz na oblast první analyzované řady dat.

Oblast proměnné 2: Odkaz na oblast druhé analyzované řady dat.

Výsledky do: Odkaz na levou horní buňku oblasti, v níž se test zobrazí.

Seskupit podle

Vyberte, zda jsou vstupní data rozmístěna po sloupcích nebo řádcích.

Příklad

Následující tabulka obsahuje dvě množiny dat.

A B
1 28 19
2 26 13
3 31 12
4 23 5
5 20 34
6 27 31
7 28 31
8 14 12
9 4 24
10 0 23
11 2 19
12 8 10
13 9 33

Výsledky F-testu:

Následující tabulka zobrazuje F-test pro výše uvedené řady dat:

F-test
Alfa 0.05
Proměnná 1 Proměnná 2
Střední hodnota 16.9230769231 20.4615384615
Rozptyl 125.0769230769 94.4358974359
Pozorování 13 13
df 12 12
F 1.3244637524
P (F<=f) pravostranný 0.3170614146
F kritické pravostranný 2.6866371125
P (F<=f) levostranný 0.6829385854
F kritické levostranný 0.3722125312
P dvoustranný 0.6341228293
F kritické dvoustranný 0.3051313549 3.277277094

z-test

Vypočítá pro dva výběry dat z-test.

Zvolte Data - Statistika - z-test

Note.png Více informací o z-testu naleznete v angličtině v příslušném článku na Wikipedii.

Data

Oblast proměnné 1: Odkaz na oblast první analyzované řady dat.

Oblast proměnné 2: Odkaz na oblast druhé analyzované řady dat.

Výsledky do: Odkaz na levou horní buňku oblasti, v níž se test zobrazí.

Seskupit podle

Vyberte, zda jsou vstupní data rozmístěna po sloupcích nebo řádcích.

Příklad

Následující tabulka obsahuje dvě množiny dat.

A B
1 28 19
2 26 13
3 31 12
4 23 5
5 20 34
6 27 31
7 28 31
8 14 12
9 4 24
10 0 23
11 2 19
12 8 10
13 9 33

Výsledky z-testu:

Následující tabulka zobrazuje z-test pro výše uvedené řady dat:

z-test
Alfa 0.05
Rozdíl středních hodnot v hypotéze 0
Proměnná 1 Proměnná 2
Známý rozptyl 0 0
Střední hodnota 16.9230769231 20.4615384615
Pozorování 13 13
Pozorovaný rozdíl středních hodnot -3.5384615385
z #DIV/0!
P (Z<=z) jednostranný #DIV/0!
z kritické jednostranný 1.644853627
P (Z<=z) dvoustranný #DIV/0!
z kritické dvoustranný 1.9599639845

Chí kvadrát test

Vypočítá pro výběr dat chí kvadrát test.

Zvolte Data - Statistika - Chí kvadrát test

Note.png Více informací o chí kvadrát testu naleznete v angličtině v příslušném článku na Wikipedii.

Data

Vstupní oblast: Odkaz na oblast analyzované řady dat.

Výsledky do: Odkaz na levou horní buňku oblasti, v níž se test zobrazí.

Seskupit podle

Vyberte, zda jsou vstupní data rozmístěna po sloupcích nebo řádcích.

Příklad

Následující tabulka obsahuje dvě množiny dat.

A B
1 28 19
2 26 13
3 31 12
4 23 5
5 20 34
6 27 31
7 28 31
8 14 12
9 4 24
10 0 23
11 2 19
12 8 10
13 9 33

Výsledky chí kvadrát testu:

Test nezávislosti (chí kvadrát)
Alfa 0.05
df 12
P-hodnota 2.32567054678584E-014
Testová statistika 91.6870055842
Kritická hodnota 21.0260698175

Related Topics

Regresní analýza