Statistiques de données dans Calc

From LibreOffice Help
Jump to: navigation, search

Utilisez les statistiques de données dans Calc pour réaliser des analyses de données complexes

Pour travailler sur des statistiques complexes ou faire des analyses d'ingénierie, vous pouvez réduire les étapes et le temps de réalisation en utilisant les statistiques de données de Calc. Vous fournissez les données et les paramètres pour chaque analyse et le jeu d'outils utilise la fonction statistique ou d'ingénierie appropriée pour calculer et afficher le résultat dans une table de sortie.

Échantillonnage

Créez une table avec des données échantillonnées à partir d'une autre table.

Choose Data - Statistics - Sampling

L'échantillonnage permet de choisir des données à partir d'une table source afin de remplir une table cible. L'échantillonnage peut être aléatoire ou sur une base périodique.

Note.png L'échantillonnage se fait par lignes. Cela signifie que les données échantillonnées vont prendre toute la ligne de la table source et être copiées dans une ligne de la table cible.

Données

Plage de saisie : la référence de la plage de données à analyser.

Résultat à : la référence à la cellule en haut à gauche de la plage où le résultat doit être affiché.

Méthode d'échantillonnage

Aléatoire : prends exactement des lignes de la taille de l'échantillon de la table source de façon aléatoire.

Taille de l'échantillon : nombre de lignes échantillonnées à partir de la table source.

Périodique : prends des lignes suivant un rythme défini par période.

Période : le nombre de lignes à ignorer périodiquement lors de l'échantillonnage.

Exemple

Les données suivantes vont être utilisées comme exemple de table de données source pour l'échantillonnage :

A B C
1 11 21 31
2 12 22 32
3 13 23 33
4 14 24 34
5 15 25 35
6 16 26 36
7 17 27 37
8 18 28 38
9 19 29 39

L'échantillonnage avec une période de 2 a pour résultat la table suivante :

12 22 32
14 24 34
16 26 36
18 28 38

Statistiques descriptives

Remplir une table dans une feuille de calcul avec les propriétés statistiques principales d'un jeu de données.

Choisissez Données - Statistiques - Statistiques descriptives

L'outil d'analyse de statistiques descriptives génère un rapport de statistiques univariantes pour les données dans la plage de saisie, fournissant des informations pour la tendance centrale et la variabilité des données.

Note.png Pour plus d'informations sur les statistiques descriptives, référez-vous à l'article Wikipedia correspondant.

Données

Plage de saisie : la référence de la plage de données à analyser.

Résultat à : la référence à la cellule en haut à gauche de la plage où le résultat doit être affiché.

Grouper par

Sélectionnez si les données saisies sont disposées en colonnes ou en lignes.

Exemple

Les données suivantes vont être utilisées comme exemple

A B C
1 Mathématiques Physique Biologie
2 47 67 33
3 36 68 42
4 40 65 44
5 39 64 60
6 38 43
7 47 84 62
8 29 80 51
9 27 49 40
10 57 49 12
11 56 33 60
12 57
13 26

La table suivante affiche le résultat des statistiques descriptives de l'échantillon de données ci-dessus.

Colonne 1 Colonne 2 Colonne 3
Moyenne 41.9090909091 59.7 44.7
Erreur type 3.5610380138 5.3583786934 4.7680650629
Mode 47 49 60
Médiane 40 64.5 43.5
Variance 139.4909090909 287.1222222222 227.3444444444
Écart type 11.8106269559 16.944681237 15.0779456308
Kurtosis -1.4621677981 -0.9415988746 1.418052719
Asymétrie 0.0152409533 -0.2226426904 -0.9766803373
Plage 31 51 50
Minimum 26 33 12
Maximum 57 84 62
Somme 461 597 447
Nombre 11 10 10

Analyse de la variance (ANOVA)

Produit l'analyse de la variance (ANOVA) d'un jeu de données donné

Choisissez Données - Statistiques - Analyse de la variance (ANOVA)

ANOVA est l'acronyme de ANalysis Of VAriance. Cet outil produit l'analyse de la variance d'un jeu de données donné.

Note.png Pour plus d'information sur ANOVA, veuillez vous référer à l'article Wikipedia correspondant.

Données

Plage de saisie : la référence de la plage de données à analyser.

Résultat à : la référence à la cellule en haut à gauche de la plage où le résultat doit être affiché.

Grouper par

Sélectionnez si les données saisies sont disposées en colonnes ou en lignes.

Type

Sélectionnez si l'analyse est pour un facteur unique ou pour deux facteurs ANOVA.

Paramètres

Alpha : le niveau de précision du test.

Lignes par échantillon : définissez de combien de lignes l'échantillon est constitué.

Exemple

Les données suivantes vont être utilisées comme exemple

A B C
1 Mathématiques Physique Biologie
2 47 67 33
3 36 68 42
4 40 65 44
5 39 64 60
6 38 43
7 47 84 62
8 29 80 51
9 27 49 40
10 57 49 12
11 56 33 60
12 57
13 26

La table suivante affiche le résultat de l'analyse de la variance (ANOVA) de l'échantillon de données ci-dessus.

ANOVA - Facteur Unique
Alpha 0.05
Groupes Nombre Somme Moyenne Variance
Colonne 1 11 461 41.9090909091 139.4909090909
Colonne 2 10 597 59.7 287.1222222222
Colonne 3 10 447 44.7 227.3444444444
Source de la variation SS df MS F valeur-P
Entre les groupes 1876.5683284457 2 938.2841642229 4.3604117704 0.0224614952
À travers les groupes 6025.1090909091 28 215.1824675325
Total 7901.6774193548 30

Corrélation

Calcule la corrélation de deux jeux de données numériques.

Choisissez Données - Statistiques - Corrélation

Le coefficient de corrélation (une valeur entre -1 et +1) signifie la force avec laquelle deux variables sont relatives l'une à l'autre . Vous pouvez utiliser la fonction CORREL ou les statistiques de données pour trouver le coefficient de corrélation entre deux variables.

Un coefficient de corrélation de +1 indique une corrélation positive parfaite.

Un coefficient de corrélation de -1 indique une corrélation négative parfaite

Note.png Pour plus d'informations sur la corrélation statistique, veuillez vous référer à l'article Wikipedia correspondant.

Données

Plage de saisie : la référence de la plage de données à analyser.

Résultat à : la référence à la cellule en haut à gauche de la plage où le résultat doit être affiché.

Grouper par

Sélectionnez si les données saisies sont disposées en colonnes ou en lignes.

Exemple

Les données suivantes vont être utilisées comme exemple

A B C
1 Mathématiques Physique Biologie
2 47 67 33
3 36 68 42
4 40 65 44
5 39 64 60
6 38 43
7 47 84 62
8 29 80 51
9 27 49 40
10 57 49 12
11 56 33 60
12 57
13 26

La table suivant affiche le résultat de la corrélation de l'échantillon de données ci-dessus.

Corrélations Colonne 1 Colonne 2 Colonne 3
Colonne 1 1
Colonne 2 -0.4029254917 1
Colonne 3 -0.2107642836 0.2309714048 1

Covariance

Calcule la covariance de deux jeux de données numériques.

Choisissez Données - Statistiques - Covariance

La covariance est une mesure de la quantité dont deux variables aléatoires changent ensemble.

Note.png Pour plus d'informations sur la covariance statistiques, veuillez vous référer à l'article Wikipedia correspondant.

Données

Plage de saisie : la référence de la plage de données à analyser.

Résultat à : la référence à la cellule en haut à gauche de la plage où le résultat doit être affiché.

Grouper par

Sélectionnez si les données saisies sont disposées en colonnes ou en lignes.

Exemple

Les données suivantes vont être utilisées comme exemple

A B C
1 Mathématiques Physique Biologie
2 47 67 33
3 36 68 42
4 40 65 44
5 39 64 60
6 38 43
7 47 84 62
8 29 80 51
9 27 49 40
10 57 49 12
11 56 33 60
12 57
13 26

La table suivante affiche le résultat de la covariance de l'échantillon de données ci-dessus.

Covariances Colonne 1 Colonne 2 Colonne 3
Colonne 1 126.8099173554
Colonne 2 -61.4444444444 258.41
Colonne 3 -32 53.11 204.61

Lissage exponentiel

Résulte en une série de données lissées

Choisissez Données - Statistiques - Lissage exponentiel

Le lissage exponentiel est une technique de filtrage qui quand elle est appliquée à un ensemble de données, produit un résultat lissé. Il est employé dans plusieurs domaines tels que le marché boursier, l'économie et dans les mesures échantillonnées.

Note.png Pour plus d'informations sur le lissage exponentiel, veuillez vous référer à l'article Wikipedia correspondant.

Données

Plage de saisie : la référence de la plage de données à analyser.

Résultat à : la référence à la cellule en haut à gauche de la plage où le résultat doit être affiché.

Grouper par

Sélectionnez si les données saisies sont disposées en colonnes ou en lignes.

Paramètres

Facteur de lissage : un paramètre entre 0 et 1 qui représente le le facteur d'amortissement Alpha dans l'équation de lissage.

Exemple

La table suivante à deux séries de temps, une représentant une fonction d'impulsion au temps t=0 et l'autre une fonction d'impulsion au temps t=2.

A B
1 1 0
2 0 0
3 0 1
4 0 0
5 0 0
6 0 0
7 0 0
8 0 0
9 0 0
10 0 0
11 0 0
12 0 0
13 0 0

Le lissage résultant est ci-dessous avec un facteur de lissage de 0,5 :

Alpha
0.5
Colonne 1 Colonne 2
1 0
1 0
0.5 0
0.25 0.5
0.125 0.25
0.0625 0.125
0.03125 0.0625
0.015625 0.03125
0.0078125 0.015625
0.00390625 0.0078125
0.001953125 0.00390625
0.0009765625 0.001953125
0.0004882813 0.0009765625
0.0002441406 0.0004882813

Moyenne glissante

Calcule la moyenne glissante d'une série de temps

Choisissez Données - Statistiques - Moyenne glissante

Note.png Pour plus d'informations sur la moyenne glissante, veuillez vous référer à l'article Wikipedia correspondant.

Données

Plage de saisie : la référence de la plage de données à analyser.

Résultat à : la référence à la cellule en haut à gauche de la plage où le résultat doit être affiché.

Grouper par

Sélectionnez si les données saisies sont disposées en colonnes ou en lignes.

Paramètres

Intervalle : le nombre d'échantillons utilisés dans le calcul de la moyenne glissante.

Exemple

La table suivante à deux séries de temps, une représentant une fonction d'impulsion au temps t=0 et l'autre une fonction d'impulsion au temps t=2.

A B
1 1 0
2 0 0
3 0 1
4 0 0
5 0 0
6 0 0
7 0 0
8 0 0
9 0 0
10 0 0
11 0 0
12 0 0
13 0 0

Résultat de la moyenne glissante :

Colonne 1 Colonne 2
#N/D #N/D
0.3333333333 0.3333333333
0 0.3333333333
0 0.3333333333
0 0
0 0
0 0
0 0
0 0
0 0
0 0
0 0
#N/D #N/D

t-test

Calcule le TEST.STUDENT de deux jeux de données.

Choisissez Données - Statistiques - t-test

Un t-test correspond à n'importe que test d'hypothèse statistique qui suit une distribution Student.

Note.png Pour plus d'informations sur les t-tests, veuillez vous référer à l'article Wikipedia correspondant.

Données

Plage de variable 1 : la référence à la plage de la première série de donner à analyser.

Plage de variable 2 : la référence de la plage de la seconde série de données à analyser.

Résultat à : la référence à la cellule en haut à gauche de la plage où le test doit être affiché.

Grouper par

Sélectionnez si les données saisies sont disposées en colonnes ou en lignes.

Exemple

La table suivante a deux jeux de données.

A B
1 28 19
2 26 13
3 31 12
4 23 5
5 20 34
6 27 31
7 28 31
8 14 12
9 4 24
10 0 23
11 2 19
12 8 10
13 9 33

Résultat pour le t-test :

La table suivante affiche le t-Test de la série de données ci-dessus :

test-t
Alpha 0.05
Différence de moyenne supposée 0
Variable 1 Variable 2
Moyenne 16.9230769231 20.4615384615
Variance 125.0769230769 94.4358974359
Observations 13 13
Corrélation Pearson -0.0617539772
Différence moyenne observée -3.5384615385
Variance des différences 232.9358974359
df 12
t stat -0.8359262137
P (T<=t) unilatéral 0.2097651442
t critique unilatéral 1.7822875556
P (T<=t) bilatéral 0.4195302884
t critique bilatéral 2.1788128297

F-test

Calcule le test-T de deux jeux de données.

Choisissez Données - Statistiques - test-F

Un test-F correspond à n'importe quel test statistique basé sur la répartition F sous l'hypothèse nulle.

Note.png Pour plus d'informations sur les tests-F, veuillez vous référer à l'article correspondant sur Wikipedia.

Données

Plage de variable 1 : la référence de la plage de la première série de données à analyser.

Plage de variable 2 : la référence de la plage de la seconde série de données à analyser.

Résultat à : la référence à la cellule en haut à gauche de la plage où le test doit être affiché.

Grouper par

Sélectionnez si les données saisies sont disposées en colonnes ou en lignes.

Exemple

La table suivante a deux jeux de données.

A B
1 28 19
2 26 13
3 31 12
4 23 5
5 20 34
6 27 31
7 28 31
8 14 12
9 4 24
10 0 23
11 2 19
12 8 10
13 9 33

Résultat du test-F :

La table suivante affiche le Test-F de la série de données ci-dessus :

TEST.F
Alpha 0.05
Variable 1 Variable 2
Moyenne 16.9230769231 20.4615384615
Variance 125.0769230769 94.4358974359
Observations 13 13
df 12 12
F 1.3244637524
P (F<=f) latéral droite 0.3170614146
F critique latéral droite 2.6866371125
P (F <=f) latéral gauche 0.6829385854
F critique latéral gauche 0.3722125312
P bilatéral 0.6341228293
F critique bilatéral 0.3051313549 3.277277094

test-Z

Calcule le TEST.Z de deux jeux de données.

Choisissez Données - Statistiques - test-Z

Note.png For more information on Z-tests, refer to the corresponding Wikipedia article.

Données

Plage de variable 1 : la référence de la plage de la première série de données à analyser.

Plage de variable 2 : la référence de la plage de la seconde série de données à analyser.

Résultat à : la référence à la cellule en haut à gauche de la plage où le test doit être affiché.

Grouper par

Sélectionnez si les données saisies sont disposées en colonnes ou en lignes.

Exemple

La table suivante a deux jeux de données.

A B
1 28 19
2 26 13
3 31 12
4 23 5
5 20 34
6 27 31
7 28 31
8 14 12
9 4 24
10 0 23
11 2 19
12 8 10
13 9 33

Résultat du Test-z :

La table suivante affiche le Test-z de la série de données ci-dessus :

test-z
Alpha 0.05
Différence de moyenne supposée 0
Variable 1 Variable 2
Variance connue 0 0
Moyenne 16.9230769231 20.4615384615
Observations 13 13
Différence moyenne observée -3.5384615385
z #DIV/0!
P (Z<=z) unilatéral #DIV/0!
z critique unilatéral 1.644853627
P (Z<=z) bilatéral #DIV/0!
z critique bilatéral 1.9599639845

Test Khideux

Calcule le test Khideux d'un échantillon de données

Choisissez Données - Statistiques - Test Khideux

Note.png Pour plus d'informations sur le test Khideux, veuillez vous référer à l'article Wikipedia correspondant.

Données

Plage de saisie : la référence de la plage de la série de données à analyser.

Résultat à : la référence à la cellule en haut à gauche de la plage où le test doit être affiché.

Grouper par

Sélectionnez si les données saisies sont disposées en colonnes ou en lignes.

Exemple

La table suivante a deux jeux de données.

A B
1 28 19
2 26 13
3 31 12
4 23 5
5 20 34
6 27 31
7 28 31
8 14 12
9 4 24
10 0 23
11 2 19
12 8 10
13 9 33

Résultat du test Khideux :

Test d'indépendance (Khideux)
Alpha 0.05
df 12
valeur-P 2.32567054678584E-014
Statistique du test 91.6870055842
Valeur critique 21.0260698175

Related Topics

Analyse de régression