Adatelemzés a Calcban

From LibreOffice Help
Jump to: navigation, search

Az adatokon végzett statisztikai műveletek segítségével összetett adatelemzési feladatokat oldhat meg a Calcban.

Ha összetett statisztikai vagy mérnöki elemzési feladata van, időt és energiát takaríthat meg, ha a Calc adatelemzési funkcióit használja. Minden elemzéshez megadhatja a kiindulási adatokat és paramétereket, és az eszközkészlet a megfelelő statisztikai vagy mérnöki függvények használatával kiszámítja és megjeleníti az eredményt egy kimeneti táblázatban.

Mintavétel

Létrehoz egy táblázatot egy másik táblázatban levő adatokból vett mintákból.

Choose Data - Statistics - Sampling

A mintavétel a forrástáblázatból vett adatokból építi fel a céltáblázatot. A mintavétel lehet véletlenszerű vagy periodikus.

Note.png A mintavétel soronként történik. Ez azt jelenti, hogy a forrástáblázatból egy egész sor lesz átmásolva a céltáblázatba.

Adatok

Beviteli tartomány: hivatkozás az elemzendő adattartományra.

Eredmények: Hivatkozás az eredmények megjelenítésére használni kívánt tartomány bal felső cellájára.

Mintavételi mód

Véletlen: Pontosan Mintaméret számú sort választ ki véletlenszerűen a forrástáblázatból.

Mintaméret: A forrástáblázatból kiválasztott sorok száma.

Periodikus: A Periódus által meghatározott ütemben veszi mintát a sorokból.

Periódus: a mintavétel periódusa.

Példa

A következő táblázat adatai lesznek a mintavétel forrása:

A B C
1 11 21 31
2 12 22 32
3 13 23 33
4 14 24 34
5 15 25 35
6 16 26 36
7 17 27 37
8 18 28 38
9 19 29 39

A 2-es periódusértékkel végzett mintavétel a következő eredményre vezet:

12 22 32
14 24 34
16 26 36
18 28 38

Leíró statisztika

A munkafüzetben létrehoz egy táblázatot az adathalmaz fő statisztikai jellemzőivel.

Válassza az Adatok - Statisztika - Leíró statisztika menüparancsot

A Leíró statisztika elemzőeszköz a beviteli tartományban levő adatok univariáns statisztikáit jeleníti meg, információt adva az adatok centrális tendenciájáról és variabilitásáról.

Note.png A leíró statisztikával kapcsolatos további információkért olvassa el a Wikipédia cikkét.

Adatok

Beviteli tartomány: hivatkozás az elemzendő adattartományra.

Eredmények: Hivatkozás az eredmények megjelenítésére használni kívánt tartomány bal felső cellájára.

Csoportosítva

Válassza ki, hogy a bemenő adatok oszlopok vagy sorok szerint vannak-e rendezve.

Példa

A következő adatokat fogjuk használni példaként:

A B C
1 Matematika Fizika Biológia
2 47 67 33
3 36 68 42
4 40 65 44
5 39 64 60
6 38 43
7 47 84 62
8 29 80 51
9 27 49 40
10 57 49 12
11 56 33 60
12 57
13 26

A következő táblázatban a fenti példaadatok leíró statisztikái jelennek meg.

1. oszlop 2. oszlop 3. oszlop
Átlag 41.9090909091 59.7 44.7
Standard hiba 3.5610380138 5.3583786934 4.7680650629
Módusz 47 49 60
Medián 40 64.5 43.5
Szórásnégyzet 139.4909090909 287.1222222222 227.3444444444
Szórás 11.8106269559 16.944681237 15.0779456308
Kurtózis -1.4621677981 -0.9415988746 1.418052719
Ferdeség 0.0152409533 -0.2226426904 -0.9766803373
Tartomány 31 51 50
Minimum 26 33 12
Maximum 57 84 62
Összeg 461 597 447
Count 11 10 10

Varianciaanalízis (ANOVA)

Az adott adathalmaz varianciaanalízisét végzi el.

Válassza az Adatok - Statisztika - Varianciaanalízis (ANOVA) menüparancsot

Az ANOVA az ANalysis Of VAriance rövidítése - magyarul varianciaanalízis. Ez az eszköz az adott adathalmaz varianciaanalízisét állítja elő

Note.png A varianciaanalízissel kapcsolatos további információkért olvassa el a Wikipédia cikkét.

Adatok

Beviteli tartomány: hivatkozás az elemzendő adattartományra.

Eredmények: Hivatkozás az eredmények megjelenítésére használni kívánt tartomány bal felső cellájára.

Csoportosítva

Válassza ki, hogy a bemenő adatok oszlopok vagy sorok szerint vannak-e rendezve.

Típus

Választhat, hogy az analízis egytényezős vagy kéttényezős ANOVA legyen-e.

Paraméterek

Alfa: a próba szignifikanciaszintje.

Sorok száma mintánként: Megadja, hogy hány sorból áll egy minta.

Példa

A következő adatokat fogjuk használni példaként:

A B C
1 Matematika Fizika Biológia
2 47 67 33
3 36 68 42
4 40 65 44
5 39 64 60
6 38 43
7 47 84 62
8 29 80 51
9 27 49 40
10 57 49 12
11 56 33 60
12 57
13 26

A következő táblázatban látható a fenti mintaadatok varianciaanalízisének eredménye.

Variancianalízis - egytényezős
Alfa 0.05
Csoportok Count Összeg Átlag Szórásnégyzet
1. oszlop 11 461 41.9090909091 139.4909090909
2. oszlop 10 597 59.7 287.1222222222
3. oszlop 10 447 44.7 227.3444444444
Variancia forrása SS df MS F P-érték
Csoportok között 1876.5683284457 2 938.2841642229 4.3604117704 0.0224614952
Csoportokon belül 6025.1090909091 28 215.1824675325
Összesen 7901.6774193548 30

Korreláció

Kiszámítja két numerikus adathalmaz korrelációját.

Válassza az Adatok - Statisztika - Korreláció menüparancsot

A korrelációs együttható (-1 és 1 között érték) azt jelzi, hogy két változó hogyan viszonyul egymáshoz. Két változó közötti korrelációs együttható kiszámításához használhatja a KORREL munkalapfüggvényt, vagy az Adatok - Statisztika - Korreláció eszközt.

A +1-es korrelációs együttható teljes pozitív korrelációt jelez.

A -1-es korrelációs együttható teljes negatív korrelációt jelez.

Note.png A statisztikai korrelációval kapcsolatos további információkért olvassa el a Wikipédia cikkét

Adatok

Beviteli tartomány: hivatkozás az elemzendő adattartományra.

Eredmények: Hivatkozás az eredmények megjelenítésére használni kívánt tartomány bal felső cellájára.

Csoportosítva

Válassza ki, hogy a bemenő adatok oszlopok vagy sorok szerint vannak-e rendezve.

Példa

A következő adatokat fogjuk használni példaként:

A B C
1 Matematika Fizika Biológia
2 47 67 33
3 36 68 42
4 40 65 44
5 39 64 60
6 38 43
7 47 84 62
8 29 80 51
9 27 49 40
10 57 49 12
11 56 33 60
12 57
13 26

A következő táblázatban látható a fenti mintaadatok korrelációszámításának eredménye.

Korrelációk 1. oszlop 2. oszlop 3. oszlop
1. oszlop 1
2. oszlop -0.4029254917 1
3. oszlop -0.2107642836 0.2309714048 1

Kovariancia

Kiszámítja két numerikus adathalmaz között a kovarianciát.

Válassza az Adatok - Statisztika - Kovariancia menüparancsot

A kovariancia annak mértéke, hogy két véletlen változó hogyan változik együtt.

Note.png A statisztikai kovarianciával kapcsolatos további információkért olvassa el a Wikipédia cikkét.

Adatok

Beviteli tartomány: hivatkozás az elemzendő adattartományra.

Eredmények: Hivatkozás az eredmények megjelenítésére használni kívánt tartomány bal felső cellájára.

Csoportosítva

Válassza ki, hogy a bemenő adatok oszlopok vagy sorok szerint vannak-e rendezve.

Példa

A következő adatokat fogjuk használni példaként:

A B C
1 Matematika Fizika Biológia
2 47 67 33
3 36 68 42
4 40 65 44
5 39 64 60
6 38 43
7 47 84 62
8 29 80 51
9 27 49 40
10 57 49 12
11 56 33 60
12 57
13 26

A következő táblázatban látható a fenti mintaadatok kovarianciaszámításának eredménye.

Kovarianciák 1. oszlop 2. oszlop 3. oszlop
1. oszlop 126.8099173554
2. oszlop -61.4444444444 258.41
3. oszlop -32 53.11 204.61

Exponenciális simítás

Kisimított adatsort eredményez.

Válassza az Adatok - Statisztika - Exponenciális simítás menüparancsot

Az exponenciális simítás egy szűrési eljárás, amelyet adathalmazra alkalmazva simított eredményeket ad. Számos területen használják, például tőzsdéken, közgazdaságtanban és mintavételezéses mérésekkor.

Note.png Az exponenciális simítással kapcsolatos további információkért olvassa el a Wikipédia cikkét.

Adatok

Beviteli tartomány: hivatkozás az elemzendő adattartományra.

Eredmények: Hivatkozás az eredmények megjelenítésére használni kívánt tartomány bal felső cellájára.

Csoportosítva

Válassza ki, hogy a bemenő adatok oszlopok vagy sorok szerint vannak-e rendezve.

Paraméterek

Simítási tényező: Egy 0 és 1 közötti paraméter, amely a simítási egyenlet Alfa csillapítási tényezőjét adja meg.

Példa

A következő táblázatban két idősor található. Az egyik egy impulzusfüggvényt reprezentál t=0 időben, a másik egy impulzusfüggvényt reprezentál t=2 időben.

A B
1 1 0
2 0 0
3 0 1
4 0 0
5 0 0
6 0 0
7 0 0
8 0 0
9 0 0
10 0 0
11 0 0
12 0 0
13 0 0

Az eredményül kapott simított adatok 0,5-ös simítási tényezővel:

Alfa
0.5
1. oszlop 2. oszlop
1 0
1 0
0.5 0
0.25 0.5
0.125 0.25
0.0625 0.125
0.03125 0.0625
0.015625 0.03125
0.0078125 0.015625
0.00390625 0.0078125
0.001953125 0.00390625
0.0009765625 0.001953125
0.0004882813 0.0009765625
0.0002441406 0.0004882813

Mozgóátlag

Kiszámítja az idősor mozgóátlagát.

Válassza az Adatok - Statisztika - Mozgóátlag menüparancsot

Note.png A mozgóátlaggal kapcsolatos további információkért olvassa el a Wikipédia cikkét.

Adatok

Beviteli tartomány: hivatkozás az elemzendő adattartományra.

Eredmények: Hivatkozás az eredmények megjelenítésére használni kívánt tartomány bal felső cellájára.

Csoportosítva

Válassza ki, hogy a bemenő adatok oszlopok vagy sorok szerint vannak-e rendezve.

Paraméterek

Intervallum: A mozgóátlag számításánál figyelembe vett minták száma.

Példa

A következő táblázatban két idősor található. Az egyik egy impulzusfüggvényt reprezentál t=0 időben, a másik egy impulzusfüggvényt reprezentál t=2 időben.

A B
1 1 0
2 0 0
3 0 1
4 0 0
5 0 0
6 0 0
7 0 0
8 0 0
9 0 0
10 0 0
11 0 0
12 0 0
13 0 0

A mozgóátlag eredményei:

1. oszlop 2. oszlop
#HIÁNYZIK #HIÁNYZIK
0.3333333333 0.3333333333
0 0.3333333333
0 0.3333333333
0 0
0 0
0 0
0 0
0 0
0 0
0 0
0 0
#HIÁNYZIK #HIÁNYZIK

t-próba

Kiszámítja két adatmintára a t-próbát.

Válassza az Adatok - Statisztika - t-próba menüparancsot

T-próbának nevezünk bármely statisztikai hipotézisvizsgálatot, amely T-eloszlást követ.

Note.png A t-próbákkal kapcsolatos további információkért olvassa el a Wikipédia cikkét

Adatok

1. változó tartománya: hivatkozás az elemzendő első adatsorra.

2. változó tartománya: hivatkozás az elemzendő második adatsorra.

Eredmények: Hivatkozás az eredmények megjelenítésére használni kívánt tartomány bal felső cellájára.

Csoportosítva

Válassza ki, hogy a bemenő adatok oszlopok vagy sorok szerint vannak-e rendezve.

Példa

A következő táblázat két adathalmazt tartalmaz.

A B
1 28 19
2 26 13
3 31 12
4 23 5
5 20 34
6 27 31
7 28 31
8 14 12
9 4 24
10 0 23
11 2 19
12 8 10
13 9 33

T-próba eredménye:

A következő táblázatban a fenti adatsorokra vonatkozó t-próba eredménye látható:

t-próba
Alfa 0.05
Feltételezett átlagos különbség 0
1. változó 2. változó
Átlag 16.9230769231 20.4615384615
Szórásnégyzet 125.0769230769 94.4358974359
Megfigyelések 13 13
Pearson-korreláció -0.0617539772
Megfigyelt átlagos különbség -3.5384615385
Az eltérések szórása 232.9358974359
df 12
t stat -0.8359262137
P (T<=t) egyoldalas 0.2097651442
t kritikus egyoldalas 1.7822875556
P (T<=t) kétoldalas 0.4195302884
t kritikus kétoldalas 2.1788128297

F-próba

Kiszámítja két adatmintára az F-próbát.

Válassza az Adatok - Statisztika - F-próba menüparancsot

F-próbának nevezünk bármely statisztikai vizsgálatot, amely az F-eloszláson alapul a nullhipotézis alatt.

Note.png Az F-próbákkal kapcsolatos további információkért olvassa el a Wikipédia cikkét

Adatok

1. változó tartománya: hivatkozás az elemzendő első adatsorra.

2. változó tartománya: hivatkozás az elemzendő második adatsorra.

Eredmények: Hivatkozás az eredmények megjelenítésére használni kívánt tartomány bal felső cellájára.

Csoportosítva

Válassza ki, hogy a bemenő adatok oszlopok vagy sorok szerint vannak-e rendezve.

Példa

A következő táblázat két adathalmazt tartalmaz.

A B
1 28 19
2 26 13
3 31 12
4 23 5
5 20 34
6 27 31
7 28 31
8 14 12
9 4 24
10 0 23
11 2 19
12 8 10
13 9 33

Az F-próba eredménye:

A következő táblázatban a fenti adatsorokra vonatkozó F-próba eredménye látható:

F.PRÓBA
Alfa 0.05
1. változó 2. változó
Átlag 16.9230769231 20.4615384615
Szórásnégyzet 125.0769230769 94.4358974359
Megfigyelések 13 13
df 12 12
F 1.3244637524
P (F<=f) jobb oldalas 0.3170614146
F kritikus jobb oldalas 2.6866371125
P (F<=f) bal oldalas 0.6829385854
F Critical bal oldalas 0.3722125312
P kétoldalas 0.6341228293
F kritikus kétoldalas 0.3051313549 3.277277094

Z.PRÓB

Kiszámítja két adatmintára a z-próbát.

Válassza az Adatok - Statisztika - z-próba menüparancsot

Note.png A z-próbákkal kapcsolatos további információkért olvassa el a Wikipédia cikkét

Adatok

1. változó tartománya: hivatkozás az elemzendő első adatsorra.

2. változó tartománya: hivatkozás az elemzendő második adatsorra.

Eredmények: Hivatkozás az eredmények megjelenítésére használni kívánt tartomány bal felső cellájára.

Csoportosítva

Válassza ki, hogy a bemenő adatok oszlopok vagy sorok szerint vannak-e rendezve.

Példa

A következő táblázat két adathalmazt tartalmaz.

A B
1 28 19
2 26 13
3 31 12
4 23 5
5 20 34
6 27 31
7 28 31
8 14 12
9 4 24
10 0 23
11 2 19
12 8 10
13 9 33

Z-próba eredménye:

A következő táblázatban a fenti adatsorokra vonatkozó z-próba eredménye látható:

Z.PRÓB
Alfa 0.05
Feltételezett átlagos különbség 0
1. változó 2. változó
Ismert szórásnégyzet 0 0
Átlag 16.9230769231 20.4615384615
Megfigyelések 13 13
Megfigyelt átlagos különbség -3.5384615385
M #ZÉRÓOSZTÓ!
P (Z<=z) egyoldalas #ZÉRÓOSZTÓ!
z kritikus egyoldalas 1.644853627
P (Z<=z) kétoldalas #ZÉRÓOSZTÓ!
z kritikus kétoldalas 1.9599639845

Khi-négyzet próba

Kiszámítja egy adathalmaz Khi-négyzet próbáját.

Válassza az Adatok - Statisztika - Khi-négyzet próba menüparancsot

Note.png A khí-négyzet próbákkal kapcsolatos további információkért olvassa el a Wikipédia cikkét

Adatok

Beviteli tartomány: hivatkozás az elemzendő adatsorra.

Eredmények: Hivatkozás az eredmények megjelenítésére használni kívánt tartomány bal felső cellájára.

Csoportosítva

Válassza ki, hogy a bemenő adatok oszlopok vagy sorok szerint vannak-e rendezve.

Példa

A következő táblázat két adathalmazt tartalmaz.

A B
1 28 19
2 26 13
3 31 12
4 23 5
5 20 34
6 27 31
7 28 31
8 14 12
9 4 24
10 0 23
11 2 19
12 8 10
13 9 33

Khi-négyzet próba eredménye:

Függetlenségi próba (Khi-négyzet)
Alfa 0.05
df 12
P-érték 2.32567054678584E-014
Próbastatisztika 91.6870055842
Kritikus érték 21.0260698175

Related Topics

Regresszióanalízis