Datastatistik i Calc

From LibreOffice Help
Jump to: navigation, search

Brug datastatistik i Calc til at udføre kompliceret analyse af data

For at arbejde med komplicerede statistiske eller ingeniør-analyser, kan du spare arbejde og tid ved at bruge Calc Data Statistik. Du indtaster data og parametre for hver analyse, og værktøjerne bruger passende statistiske eller ingeniør-funktioner for at beregne eller vise resultatet i en resultat-tabel.

Stikprøveudtagning

Opret en tabel med prøver udtaget fra en anden tabel.

Choose Data - Statistics - Sampling

Prøveudtagning gør det muligt for dig at plukke data fra en kildetabel for at udfylde en måltabel. Prøveudtagningen kan være tilfældig eller efter et mønster.

Note.png Prøveudtagning sker rækkevis. Det betyder at de udtagne data vil vælge hele linjen fra kildetabellen og kopiere den ind i en linje i måltabellen.

Data

Inddataområde: Referencen til det dataområde som skal analyseres.

Resultater til: Referencen til den øverste venstre celle af det område, hvor resultatet skal vises.

Prøveudtagningsmetode

Tilfældig: Udtag præcis Prøvestørrelse linjer fra kildetabellen tilfældigt.

Prøvestørrelse: Antal linjer udtaget fra kildetabellen.

Periodisk: Udtager linjer med en afstand defineret af Periode.

Periode: antal linjer der periodisk skal udelades ved prøveudtagning.

Eksempel

Følgende data vil blive brugt som eksempel på kilde-datatabellen for prøveudtagning:

A B C
1 11 21 31
2 12 22 32
3 13 23 33
4 14 24 34
5 15 25 35
6 16 26 36
7 17 27 37
8 18 28 38
9 19 29 39

Prøveudtagning med en periode på 2 vil resultere i den følgende tabel:

12 22 32
14 24 34
16 26 36
18 28 38

Deskriptiv statistik

Udfyld en tabel i regnearket med datasættets vigtigste statistiske egenskaber.

Vælg Data - Statistik - Deskriptiv Statistik

Analyseværktøjet til deskriptiv statistik genererer en rapport af univariate statistikker for data i inddataområdet med oplysninger om den centrale tendens og variation af dine data.

Note.png Læs mere om Deskriptiv statistik i http://en.wikipedia.org/wiki/Descriptive_statistics"> i Wikipedia.artiklen.

Data

Inddataområde: Referencen til det dataområde som skal analyseres.

Resultater til: Referencen til den øverste venstre celle af det område, hvor resultatet skal vises.

Grupperet efter

Vælg om inddataområdet har layout som kolonner eller rækker.

Eksempel

Følgende data vil blive brugt som eksempel

A B C
1 Matematik Fysik Biologi
2 47 67 33
3 36 68 42
4 40 65 44
5 39 64 60
6 38 43
7 47 84 62
8 29 80 51
9 27 49 40
10 57 49 12
11 56 33 60
12 57
13 26

Den følgende tabel viser resultaterne af den deskriptive statistik for de eksempel-data, der er vist ovenfor.

Kolonne 1 Kolonne 2 Kolonne 3
Middelværdi 41.9090909091 59.7 44.7
Standardfejl 3.5610380138 5.3583786934 4.7680650629
Tilstand 47 49 60
Median 40 64.5 43.5
Varians 139.4909090909 287.1222222222 227.3444444444
Standardafvigelse 11.8106269559 16.944681237 15.0779456308
Kurtosis -1.4621677981 -0.9415988746 1.418052719
Skævhed 0.0152409533 -0.2226426904 -0.9766803373
Område 31 51 50
Minimum 26 33 12
Maksimum 57 84 62
Sum 461 597 447
Tæl 11 10 10

Analyse af varians (ANOVA)

Udfører analyse af variansen (ANOVA) af et datasæt

Vælg Data - Statistik - Analyse af varians (ANOVA)...

ANOVA er akronymet for ANalysis Of VAriance. Dette værktøj udfører variansanalysen (ANOVA) for et givet datasæt

Note.png Læs mere om ANOVA i Wikipedia-artiklen.

Data

Inddataområde: Referencen til det dataområde som skal analyseres.

Resultater til: Referencen til den øverste venstre celle af det område, hvor resultatet skal vises.

Grupperet efter

Vælg om inddataområdet har layout som kolonner eller rækker.

Type

Vælges hvis analysen er for enkeltfaktor eller for tofaktor ANOVA.

Parametre

Alfa: Signifikansniveauet af prøven.

Rækker per prøve: Definér hvor mange rækker en prøve har.

Eksempel

Følgende data vil blive brugt som eksempel

A B C
1 Matematik Fysik Biologi
2 47 67 33
3 36 68 42
4 40 65 44
5 39 64 60
6 38 43
7 47 84 62
8 29 80 51
9 27 49 40
10 57 49 12
11 56 33 60
12 57
13 26

Følgende tabel viser resultatet af Analyse af varians (ANOVA) for prøvedataene herover.

Anova - enkeltfaktor
Alfa 0.05
Grupper Tæl Sum Middelværdi Varians
Kolonne 1 11 461 41.9090909091 139.4909090909
Kolonne 2 10 597 59.7 287.1222222222
Kolonne 3 10 447 44.7 227.3444444444
Kilde for variation SS df MS F P-værdi
Mellem grupper 1876.5683284457 2 938.2841642229 4.3604117704 0.0224614952
Inde i grupper 6025.1090909091 28 215.1824675325
Total 7901.6774193548 30

Korrelation

Beregner korrelationen af to sæt af numeriske data.

Vælg Data - Statistik - Korrelation...

Korrelationskoefficienten (en værdi mellem -1 og +1) fortæller hvor stærkt to variable er relateret til hinanden. Du kan bruge funktionen KORRELATION eller Datastatistik til at finde korrelationskoefficienten mellem to variable.

En korrelationskoefficient på +1 indikerer en perfekt positiv korrelation.

En korrelationskoefficient på -1 indikerer en perfekt negativ korrelation.

Note.png For mere information om statistisk korrelation kan du læse i http://en.wikipedia.org/wiki/Correlation.

Data

Inddataområde: Referencen til det dataområde som skal analyseres.

Resultater til: Referencen til den øverste venstre celle af det område, hvor resultatet skal vises.

Grupperet efter

Vælg om inddataområdet har layout som kolonner eller rækker.

Eksempel

Følgende data vil blive brugt som eksempel

A B C
1 Matematik Fysik Biologi
2 47 67 33
3 36 68 42
4 40 65 44
5 39 64 60
6 38 43
7 47 84 62
8 29 80 51
9 27 49 40
10 57 49 12
11 56 33 60
12 57
13 26

Den følgende tabel viser resultaterne af korrelationen af data-eksemplet ovenfor.

Korrelationer Kolonne 1 Kolonne 2 Kolonne 3
Kolonne 1 1
Kolonne 2 -0.4029254917 1
Kolonne 3 -0.2107642836 0.2309714048 1

Kovarians

Beregner kovariansen for to mængder af numeriske data.

Menu Data - Statistik - Kovarians

Kovariansen er et udtryk for hvor meget to tilfældige (stokastiske) variable ændrer sig sammen.

Note.png For mere information om statistisk kovarians kan du læse i http://en.wikipedia.org/wiki/Covariance.

Data

Inddataområde: Referencen til det dataområde som skal analyseres.

Resultater til: Referencen til den øverste venstre celle af det område, hvor resultatet skal vises.

Grupperet efter

Vælg om inddataområdet har layout som kolonner eller rækker.

Eksempel

Følgende data vil blive brugt som eksempel

A B C
1 Matematik Fysik Biologi
2 47 67 33
3 36 68 42
4 40 65 44
5 39 64 60
6 38 43
7 47 84 62
8 29 80 51
9 27 49 40
10 57 49 12
11 56 33 60
12 57
13 26

Den følgende tabel viser resultaterne af kovariansen af dataeksemplet ovenfor.

Kovarianser Kolonne 1 Kolonne 2 Kolonne 3
Kolonne 1 126.8099173554
Kolonne 2 -61.4444444444 258.41
Kolonne 3 -32 53.11 204.61

Eksponentiel udjævning

Resulterer i en udjævnet dataserie

Vælg Data - Statistik - Eksponentiel udjævning

Eksponentiel udjævning er en filterteknik der, når den anvendes på et datasæt, giver udjævnede resultater. Benyttes i mange brancher som for eksempel på børser, økonomi og prøvemålinger.

Note.png Læs mere om eksponentiel udjævning i en.wikipedia.org/wiki/Exponential_smoothing>Wikipedia-artiklen.

Data

Inddataområde: Referencen til det dataområde som skal analyseres.

Resultater til: Referencen til den øverste venstre celle af det område, hvor resultatet skal vises.

Grupperet efter

Vælg om inddataområdet har layout som kolonner eller rækker.

Parametre

Udjævningsfaktor: En parameter mellem 0 og 1 der repræsenterer den dæmpende faktor Alfa i udjævningsligningen.

Eksempel

Følgende tabel har to serier med tid, en som repræsenterer en impulsfunktion ved tid t=0 og den anden en impulsfunktion ved tid t=2.

A B
1 1 0
2 0 0
3 0 1
4 0 0
5 0 0
6 0 0
7 0 0
8 0 0
9 0 0
10 0 0
11 0 0
12 0 0
13 0 0

Den resulterende udjævning ses nedenfor med udjævningsfaktor 0.5:

Alfa
0.5
Kolonne 1 Kolonne 2
1 0
1 0
0.5 0
0.25 0.5
0.125 0.25
0.0625 0.125
0.03125 0.0625
0.015625 0.03125
0.0078125 0.015625
0.00390625 0.0078125
0.001953125 0.00390625
0.0009765625 0.001953125
0.0004882813 0.0009765625
0.0002441406 0.0004882813

Rullende gennemsnit

Beregner det løbende gennemsnit for en tidsserie

Vælg Data - Statistik - Løbende gennemsnit

Note.png Læs mere om løbende varians i Wikipedia-artiklen.

Data

Inddataområde: Referencen til det dataområde som skal analyseres.

Resultater til: Referencen til den øverste venstre celle af det område, hvor resultatet skal vises.

Grupperet efter

Vælg om inddataområdet har layout som kolonner eller rækker.

Parametre

Interval: Antal prøver brugt i beregningen af det løbende gennemsnit.

Eksempel

Følgende tabel har to serier med tid, en som repræsenterer en impulsfunktion ved tid t=0 og den anden en impulsfunktion ved tid t=2.

A B
1 1 0
2 0 0
3 0 1
4 0 0
5 0 0
6 0 0
7 0 0
8 0 0
9 0 0
10 0 0
11 0 0
12 0 0
13 0 0

Resultater af det løbende gennemsnit:

Kolonne 1 Kolonne 2
#N/A #N/A
0.3333333333 0.3333333333
0 0.3333333333
0 0.3333333333
0 0
0 0
0 0
0 0
0 0
0 0
0 0
0 0
#N/A #N/A

t-test

Beregner t-testen af to dataprøver.

Vælg Data - Statistik - t-test

En t-test er enhver statistisk hypotesetest, der følger en t-fordeling.

Note.png Læs mere om t-test i Wikipedia-artiklen.

Data

Variabel 1 område: Reference til området med den første dataserie, der skal analyseres.

Variabel 2 område: Reference til området med den anden dataserie, der skal analyseres.

Resultater til: Reference til den øverste venstre celle i det område, hvor test skal vises.

Grupperet efter

Vælg om inddataområdet har layout som kolonner eller rækker.

Eksempel

Den følgende tabel har to datasæt.

A B
1 28 19
2 26 13
3 31 12
4 23 5
5 20 34
6 27 31
7 28 31
8 14 12
9 4 24
10 0 23
11 2 19
12 8 10
13 9 33

Resultater af en t-test:

Den følgende tabel viser t-testen for dataserien ovenfor:

t-test
Alfa 0.05
Den forventede middelforskel 0
Variabel 1 Variabel 2
Middelværdi 16.9230769231 20.4615384615
Varians 125.0769230769 94.4358974359
Observationer 13 13
Pearson-korrelation -0.0617539772
Observeret difference for middelværdi -3.5384615385
Variansen af forskellene 232.9358974359
df 12
t stat -0.8359262137
P (T<=t) en-halet 0.2097651442
t kritisk en-halet 1.7822875556
P (T<=t) to-halet 0.4195302884
t kritisk to-halet 2.1788128297

F-test

Beregner F-testen af to dataprøver.

Vælg Data - Statistik - F-test

En F-test er enhver statistisk test baseret på F-fordelingen under nul hypotesen.

Note.png Læs mere om F-test i Wikipedia-artiklen.

Data

Variabel 1 område: Reference til området med den første dataserie, der skal analyseres.

Variabel 2 område: Reference til området med den anden dataserie, der skal analyseres.

Resultater til: Reference til den øverste venstre celle i det område, hvor test skal vises.

Grupperet efter

Vælg om inddataområdet har layout som kolonner eller rækker.

Eksempel

Den følgende tabel har to datasæt.

A B
1 28 19
2 26 13
3 31 12
4 23 5
5 20 34
6 27 31
7 28 31
8 14 12
9 4 24
10 0 23
11 2 19
12 8 10
13 9 33

Resultater af F-test:

Den følgende tabel viser t-testen for dataserien ovenfor:

F-test
Alfa 0.05
Variabel 1 Variabel 2
Middelværdi 16.9230769231 20.4615384615
Varians 125.0769230769 94.4358974359
Observationer 13 13
df 12 12
F 1.3244637524
P (F<=f) højre-halet 0.3170614146
F kritisk højre-halet 2.6866371125
P (F<=f) venstre-halet 0.6829385854
F kritisk venstre-halet 0.3722125312
P to-halet 0.6341228293
F kritisk to-halet 0.3051313549 3.277277094

Z-test

Beregner z-testen af to dataprøver.

Vælg Data - Statistik - Z-test

Note.png Læs mere om Z-test i Wikipedia-artiklen.

Data

Variabel 1 område: Reference til området med den første dataserie, der skal analyseres.

Variabel 2 område: Reference til området med den anden dataserie, der skal analyseres.

Resultater til: Reference til den øverste venstre celle i det område, hvor test skal vises.

Grupperet efter

Vælg om inddataområdet har layout som kolonner eller rækker.

Eksempel

Den følgende tabel har to datasæt.

A B
1 28 19
2 26 13
3 31 12
4 23 5
5 20 34
6 27 31
7 28 31
8 14 12
9 4 24
10 0 23
11 2 19
12 8 10
13 9 33

Resultater af Z-test:

Den følgende tabel viser t-testen for dataserien ovenfor:

Z-test
Alfa 0.05
Den forventede middelforskel 0
Variabel 1 Variabel 2
Kendt varians 0 0
Middelværdi 16.9230769231 20.4615384615
Observationer 13 13
Observeret difference for middelværdi -3.5384615385
z #DIV/0!
P (Z<=z) en-sidet #DIV/0!
Z kritisk en-sidet 1.644853627
P (Z<=z) to-sidet #DIV/0!
Z kritisk to-sidet 1.9599639845

Chi-kvadrat-test

Beregner Chi-kvadratet for en stikprøve.

Menu Data - Statistik - Chi-kvadrat test

Note.png Læse mere om chi-kvadrat-test i Wikipedia.artiklen.

Data

Inddataområde: Referencen til det dataområde som skal analyseres.

Resultater til: Reference til den øverste venstre celle i det område, hvor test skal vises.

Grupperet efter

Vælg om inddataområdet har layout som kolonner eller rækker.

Eksempel

Den følgende tabel har to datasæt.

A B
1 28 19
2 26 13
3 31 12
4 23 5
5 20 34
6 27 31
7 28 31
8 14 12
9 4 24
10 0 23
11 2 19
12 8 10
13 9 33

Resultater af Chi-kvadrat test:

Kontrol af uafhængighed (Chi-kvadrat)
Alfa 0.05
df 12
P-værdi 2.32567054678584E-014
Test Statistik 91.6870055842
Kritisk Værdi 21.0260698175

Related Topics

Regressionsanalyse