Calc のデータ統計

From LibreOffice Help
Jump to: navigation, search

複雑なデータ分析を行うために、Calc のデータ統計機能を使うことができます。

To work on a complex statistical or engineering analysis, you can save steps and time by using Calc Data Statistics. You provide the data and parameters for each analysis, and the set of tools uses the appropriate statistical or engineering functions to calculate and display the results in an output table.

サンプリング

他のデータテーブルからサンプルデータテーブルを作成します。

Choose Data - Statistics - Sampling

Sampling allows you to pick data from a source table to fill a target table. The sampling can be random or in a periodic basis.

Note.png サンプリング機能は行方向に。 この意味は、サンプルデータはソーステーブルの全列に対して抽出され、 ターゲットテーブルの列方向にコピーされます。

データ

入力範囲: 分析対象のデータ範囲の参照です。

結果貼り付け先: 検定の結果表示の先頭のセルの参照です。

サンプリング方法

ランダム: サンプルサイズ 列のデータをランダムにソーステーブルから抽出します。

サンプルサイズ: ソーステーブルから抽出されるサンプルの数です。

周期変化: 周期列ごとに抽出します。

周期: サンプリング時に周期的にとばす列数です。

次のデータはサンプリングのためのソースデータの例として使います:

A B C
1 11 21 31
2 12 22 32
3 13 23 33
4 14 24 34
5 15 25 35
6 16 26 36
7 17 27 37
8 18 28 38
9 19 29 39

周期2 で抽出した結果は次のテーブルです。:

12 22 32
14 24 34
16 26 36
18 28 38

基本統計量

データセットの主要な統計量を集計表で出力します。

メニュー データ - 統計 - 基本統計量...

基本統計量は入力範囲で指定した一変量の、統計値のレポートを生成します。 出力される情報は、データの中心とばらつきの傾向です。

Note.png 共分散についてより情報が欲しい場合は、 http://en.wikipedia.org/wiki/Covarianceを参照してください。

データ

入力範囲: 分析対象のデータ範囲の参照です。

結果貼り付け先: 検定の結果表示の先頭のセルの参照です。

Grouped By

Select whether the input data has columns or rows layout.

The following data will be used as example

A B C
1 Maths Physics Biology
2 47 67 33
3 36 68 42
4 40 65 44
5 39 64 60
6 38 43
7 47 84 62
8 29 80 51
9 27 49 40
10 57 49 12
11 56 33 60
12 57
13 26

次のテーブルは、上のサンプルデータに対する基本統計量の集計結果です。

列 1 列 2 列 3
平均 41.9090909091 59.7 44.7
標準誤差 3.5610380138 5.3583786934 4.7680650629
最頻値 47 49 60
中央値 40 64.5 43.5
分散 139.4909090909 287.1222222222 227.3444444444
標準偏差 11.8106269559 16.944681237 15.0779456308
尖度 -1.4621677981 -0.9415988746 1.418052719
歪度 0.0152409533 -0.2226426904 -0.9766803373
範囲 31 51 50
最小値 26 33 12
最大値 57 84 62
合計 461 597 447
Count 11 10 10

分散分析 (ANOVA)

既知のデータセットより分散分析 (ANOVA)を行い結果を表示します。

メニュー データ - 統計 - 分散分析 (ANOVA)...

ANOVA is the acronym for ANalysis Of VAriance. This tool produces the analysis of variance of a given data set

Note.png 共分散についてより情報が欲しい場合は、 http://en.wikipedia.org/wiki/Covarianceを参照してください。

データ

入力範囲: 分析対象のデータ範囲の参照です。

結果貼り付け先: 検定の結果表示の先頭のセルの参照です。

Grouped By

Select whether the input data has columns or rows layout.

種類

一元配置二元配置 のどちらの分散分析を行うかを選択してください。

パラメーター

α: 検定の有意性の水準です。

Rows per sample: Define how many rows a sample has.

The following data will be used as example

A B C
1 Maths Physics Biology
2 47 67 33
3 36 68 42
4 40 65 44
5 39 64 60
6 38 43
7 47 84 62
8 29 80 51
9 27 49 40
10 57 49 12
11 56 33 60
12 57
13 26

上記のサンプルデータに対する分散分析 (ANOVA) の結果は次の表のようになります。

ANOVA - Single Factor
Alpha 0.05
グループ Count 合計 平均 分散
列 1 11 461 41.9090909091 139.4909090909
列 2 10 597 59.7 287.1222222222
列 3 10 447 44.7 227.3444444444
Source of Variation 平方和 自由度 平均平方 F P 値
グループ間 1876.5683284457 2 938.2841642229 4.3604117704 0.0224614952
グループ内 6025.1090909091 28 215.1824675325
合計 7901.6774193548 30

相関

2つの数値データ列の相関を計算します。

メニュー データ - 統計 - 相関...

The correlation coefficient (a value between -1 and +1) means how strongly two variables are related to each other. You can use the CORREL function or the Data Statistics to find the correlation coefficient between two variables.

相関係数が +1 の場合、完全に正の相関があると言えます。

相関係数が -1 の場合、完全に負の相関があると言えます。

Note.png より統計的相関に関する詳しい情報は、http://en.wikipedia.org/wiki/Correlationを参照してください。

データ

入力範囲: 分析対象のデータ範囲の参照です。

結果貼り付け先: 検定の結果表示の先頭のセルの参照です。

Grouped By

Select whether the input data has columns or rows layout.

The following data will be used as example

A B C
1 Maths Physics Biology
2 47 67 33
3 36 68 42
4 40 65 44
5 39 64 60
6 38 43
7 47 84 62
8 29 80 51
9 27 49 40
10 57 49 12
11 56 33 60
12 57
13 26

次の表は上のサンプルデータの相関行列です。

相関 列 1 列 2 列 3
列 1 1
列 2 -0.4029254917 1
列 3 -0.2107642836 0.2309714048 1

共分散

2変量の共分散を計算します。

メニュー データ - 統計 - 共分散...

The covariance is a measure of how much two random variables change together.

Note.png 共分散についてより情報が欲しい場合は、 http://en.wikipedia.org/wiki/Covarianceを参照してください。

データ

入力範囲: 分析対象のデータ範囲の参照です。

結果貼り付け先: 検定の結果表示の先頭のセルの参照です。

Grouped By

Select whether the input data has columns or rows layout.

The following data will be used as example

A B C
1 Maths Physics Biology
2 47 67 33
3 36 68 42
4 40 65 44
5 39 64 60
6 38 43
7 47 84 62
8 29 80 51
9 27 49 40
10 57 49 12
11 56 33 60
12 57
13 26

次のテーブルは、上記のサンプルデータの共分散行列です。

共分散 列 1 列 2 列 3
列 1 126.8099173554
列 2 -61.4444444444 258.41
列 3 -32 53.11 204.61

指数平滑

データ系列の平滑を返します。

メニュー データ - 統計 - 指数平滑...

Exponential smoothing is a filtering technique that when applied to a data set, produces smoothed results. It is employed in many domains such as stock market, economics and in sampled measurements.

Note.png 共分散についてより情報が欲しい場合は、 http://en.wikipedia.org/wiki/Covarianceを参照してください。

データ

入力範囲: 分析対象のデータ範囲の参照です。

結果貼り付け先: 検定の結果表示の先頭のセルの参照です。

Grouped By

Select whether the input data has columns or rows layout.

パラメーター

平滑化定数: このパラメータは、平滑式の補正係数αを表し、0 から 1の間を取ります。

The following table has two time series, one representing an impulse function at time t=0 and the other an impulse function at time t=2.

A B
1 1 0
2 0 0
3 0 1
4 0 0
5 0 0
6 0 0
7 0 0
8 0 0
9 0 0
10 0 0
11 0 0
12 0 0
13 0 0

以下は上記のデータを平滑化定数 0.5 で指数平滑を行った時の結果です:

Alpha
0.5
列 1 列 2
1 0
1 0
0.5 0
0.25 0.5
0.125 0.25
0.0625 0.125
0.03125 0.0625
0.015625 0.03125
0.0078125 0.015625
0.00390625 0.0078125
0.001953125 0.00390625
0.0009765625 0.001953125
0.0004882813 0.0009765625
0.0002441406 0.0004882813

移動平均

時系列データの移動平均を計算します。

メニュー データ - 統計 - 移動平均...

Note.png 共分散についてより情報が欲しい場合は、 http://en.wikipedia.org/wiki/Covarianceを参照してください。

データ

入力範囲: 分析対象のデータ範囲の参照です。

結果貼り付け先: 検定の結果表示の先頭のセルの参照です。

Grouped By

Select whether the input data has columns or rows layout.

パラメーター

Interval: The number of samples used in the moving average calculation.

The following table has two time series, one representing an impulse function at time t=0 and the other an impulse function at time t=2.

A B
1 1 0
2 0 0
3 0 1
4 0 0
5 0 0
6 0 0
7 0 0
8 0 0
9 0 0
10 0 0
11 0 0
12 0 0
13 0 0

Results of the moving average:

列 1 列 2
#N/A #N/A
0.3333333333 0.3333333333
0 0.3333333333
0 0.3333333333
0 0
0 0
0 0
0 0
0 0
0 0
0 0
0 0
#N/A #N/A

t 検定

Calculates the t-Test of two data samples.

メニュー データ - 統計 - t 検定...

A t-test is any statistical hypothesis test that follows a Student's t distribution.

Note.png より統計的相関に関する詳しい情報は、http://en.wikipedia.org/wiki/Correlationを参照してください。

データ

変数1の範囲: 1つ目のデータ系列の参照です。

変数2の範囲: 2 つ目のデータ系列の参照です。

結果貼り付け先: 検定の結果表示の先頭のセルの参照です。

Grouped By

Select whether the input data has columns or rows layout.

The following table has two data sets.

A B
1 28 19
2 26 13
3 31 12
4 23 5
5 20 34
6 27 31
7 28 31
8 14 12
9 4 24
10 0 23
11 2 19
12 8 10
13 9 33

Results for t-Test:

次の表は、上記のデータ系列に対しt 検定 を行った結果です。:

t 検定
Alpha 0.05
仮説平均差 0
変数 1 変数 2
平均 16.9230769231 20.4615384615
分散 125.0769230769 94.4358974359
Observations 13 13
ピアソン相関 -0.0617539772
Observed Mean Difference -3.5384615385
Variance of the Differences 232.9358974359
自由度 12
t Stat -0.8359262137
P (T<=t) one-tail 0.2097651442
t Critical one-tail 1.7822875556
P (T<=t) two-tail 0.4195302884
t Critical two-tail 2.1788128297

t 検定

Calculates the F-Test of two data samples.

メニュー データ - 統計 - F 検定...

A F-test is any statistical test based on the F-distribution under the null hypothesis.

Note.png より統計的相関に関する詳しい情報は、http://en.wikipedia.org/wiki/Correlationを参照してください。

データ

変数1の範囲: 1つ目のデータ系列の参照です。

変数2の範囲: 2 つ目のデータ系列の参照です。

結果貼り付け先: 検定の結果表示の先頭のセルの参照です。

Grouped By

Select whether the input data has columns or rows layout.

The following table has two data sets.

A B
1 28 19
2 26 13
3 31 12
4 23 5
5 20 34
6 27 31
7 28 31
8 14 12
9 4 24
10 0 23
11 2 19
12 8 10
13 9 33

Results for F-Test:

次の表は、上記のデータ系列に対しt 検定 を行った結果です。:

t 検定
Alpha 0.05
変数 1 変数 2
平均 16.9230769231 20.4615384615
分散 125.0769230769 94.4358974359
Observations 13 13
自由度 12 12
F 1.3244637524
P (F<=f) right-tail 0.3170614146
F Critical right-tail 2.6866371125
P (F<=f) left-tail 0.6829385854
F Critical left-tail 0.3722125312
P two-tail 0.6341228293
F Critical two-tail 0.3051313549 3.277277094

t 検定

Calculates the z-Test of two data samples.

メニュー データ - 統計 - F 検定...

Note.png より統計的相関に関する詳しい情報は、http://en.wikipedia.org/wiki/Correlationを参照してください。

データ

変数1の範囲: 1つ目のデータ系列の参照です。

変数2の範囲: 2 つ目のデータ系列の参照です。

結果貼り付け先: 検定の結果表示の先頭のセルの参照です。

Grouped By

Select whether the input data has columns or rows layout.

The following table has two data sets.

A B
1 28 19
2 26 13
3 31 12
4 23 5
5 20 34
6 27 31
7 28 31
8 14 12
9 4 24
10 0 23
11 2 19
12 8 10
13 9 33

Results for z-Test:

次の表は、上記のデータ系列に対しt 検定 を行った結果です。:

t 検定
Alpha 0.05
仮説平均差 0
変数 1 変数 2
Known Variance 0 0
平均 16.9230769231 20.4615384615
Observations 13 13
Observed Mean Difference -3.5384615385
z #DIV/0!
P (Z<=z) one-tail #DIV/0!
z Critical one-tail 1.644853627
P (Z<=z) two-tail #DIV/0!
z Critical two-tail 1.9599639845

Chi-square test

Calculates the Chi-square test of a data sample.

メニュー データ - 統計 - F 検定...

Note.png より統計的相関に関する詳しい情報は、http://en.wikipedia.org/wiki/Correlationを参照してください。

データ

入力範囲: 分析対象のデータ範囲の参照です。

結果貼り付け先: 検定の結果表示の先頭のセルの参照です。

Grouped By

Select whether the input data has columns or rows layout.

The following table has two data sets.

A B
1 28 19
2 26 13
3 31 12
4 23 5
5 20 34
6 27 31
7 28 31
8 14 12
9 4 24
10 0 23
11 2 19
12 8 10
13 9 33

Results for Chi-square Test:

Test of Independence (Chi-Square)
Alpha 0.05
自由度 12
P 値 2.32567054678584E-014
Test Statistic 91.6870055842
Critical Value 21.0260698175

Related Topics

Regression Analysis