Статистики на данни в Calc

From LibreOffice Help
Jump to: navigation, search

С командите за статистики на данни в Calc можете да извършвате сложен анализ на данни.

При извършване на сложен статистически или инженерен анализ можете да си спестите стъпки и време с функционалността „Статистики на данни“ в Calc. Вие предоставяте данните и параметрите за всеки анализ, а инструментариумът използва подходящите статистически или инженерни функции, за да изчисли и покаже резултатите в резултатна таблица.

Извадка

Създава таблица с данни, които представляват извадка от друга таблица.

Choose Data - Statistics - Sampling

Командата за извадка ви позволява да извлечете данни от таблица източник, за да попълните таблица местоназначение. Извадката може да бъде случайна или периодична.

Note.png Извличането на извадка става по редове. Това значи, че избраните редове от таблицата източник ще бъдат копирани изцяло в редове на таблицата цел.

Данни

Входна област: обръщение към диапазона от данни за анализиране.

Резултати в: обръщение към горната лява клетка от областта, където да се покажат резултатите.

Начин на избиране

Случайно: избира по случаен начин толкова реда от таблицата източник, колкото е зададено в Размер на извадката.

Размер на извадката: брой на редовете, извличани от таблицата източник.

Периодично: извлича редове със стъпка, зададена в полето Период.

Период: брой на редовете, които да бъдат пропускани при извличането да данни.

Пример

Следните данни ще бъдат използвани като пример за таблица с начални данни за извадка:

A B C
1 11 21 31
2 12 22 32
3 13 23 33
4 14 24 34
5 15 25 35
6 16 26 36
7 17 27 37
8 18 28 38
9 19 29 39

Извличането с период 2 ще даде следната таблица:

12 22 32
14 24 34
16 26 36
18 28 38

Дескриптивна статистика

Попълва в листа таблица с главните статистически свойства на набора от данни.

Изберете Данни - Статистика - Дескриптивна статистика

Аналитичният инструмент „Дескриптивна статистика“ генерира справка от едномерни статистически мерки за данните във входната област, предоставяйки информация за централната тенденция и разсейването на данните.

Note.png За повече информация относно дескриптивната статистика вижте съответната статия в Уикипедия (статията е на английски).

Данни

Входна област: обръщение към диапазона от данни за анализиране.

Резултати в: обръщение към горната лява клетка от областта, където да се покажат резултатите.

Групиране по

Изберете дали началните данни са подредени в колони или редове.

Пример

Следните данни ще бъдат използвани като пример

A B C
1 Математика Физика Биология
2 47 67 33
3 36 68 42
4 40 65 44
5 39 64 60
6 38 43
7 47 84 62
8 29 80 51
9 27 49 40
10 57 49 12
11 56 33 60
12 57
13 26

Следната таблица показва резултатите от дескриптивната статистика на примерните данни по-горе.

Колона 1 Колона 2 Колона 3
Средно 41.9090909091 59.7 44.7
Стандартна грешка 3.5610380138 5.3583786934 4.7680650629
Мода 47 49 60
Медиана 40 64.5 43.5
Дисперсия 139.4909090909 287.1222222222 227.3444444444
Стандартно отклонение 11.8106269559 16.944681237 15.0779456308
Ексцес -1.4621677981 -0.9415988746 1.418052719
Асиметрия 0.0152409533 -0.2226426904 -0.9766803373
Диапазон 31 51 50
Минимум 26 33 12
Максимум 57 84 62
Сума 461 597 447
Брой 11 10 10

Дисперсионен анализ (ANOVA)

Извършва дисперсионен анализ (ANOVA) на дадена съвкупност от данни.

Изберете Данни - Статистика - Дисперсионен анализ (ANOVA)

ANOVA е съкращение от ANalysis Of VAriance (дисперсионен анализ). Този инструмент извършва дисперсионен анализ на дадена съвкупност от данни.

Note.png За повече информация относно ANOVA вижте http://en.wikipedia.org/wiki/ANOVA (на английски) или https://bg.wikipedia.org/wiki/Дисперсионен_анализ.

Данни

Входна област: обръщение към диапазона от данни за анализиране.

Резултати в: обръщение към горната лява клетка от областта, където да се покажат резултатите.

Групиране по

Изберете дали началните данни са подредени в колони или редове.

Type

Изберете дали дисперсионният анализ ANOVA е еднофакторен или двуфакторен.

Параметри

Алфа: нивото на значимост на теста.

Брой редове в извадка: определя колко реда съдържа извадката.

Пример

Следните данни ще бъдат използвани като пример

A B C
1 Математика Физика Биология
2 47 67 33
3 36 68 42
4 40 65 44
5 39 64 60
6 38 43
7 47 84 62
8 29 80 51
9 27 49 40
10 57 49 12
11 56 33 60
12 57
13 26

Следната таблица показва резултата от дисперсионния анализ (ANOVA) на горните примерни данни.

ANOVA - еднофакторен
Алфа 0.05
Групи Count Сума Средно Дисперсия
Колона 1 11 461 41.9090909091 139.4909090909
Колона 2 10 597 59.7 287.1222222222
Колона 3 10 447 44.7 227.3444444444
Източник на разсейване SS df MS F P-стойност
Между групите 1876.5683284457 2 938.2841642229 4.3604117704 0.0224614952
В групите 6025.1090909091 28 215.1824675325
Общо 7901.6774193548 30

Корелация

Изчислява корелацията на два набора от числови данни.

Изберете Данни - Статистика - Корелация

Коефициентът на корелация (стойност между -1 и +1) показва колко силно са свързани помежду си две променливи. Можете да използвате функцията CORREL или инструмента „Статистики на данни“, за да намерите коефициента на корелация между две променливи.

Коефициент на корелация +1 означава перфектна положителна корелация.

Коефициент на корелация -1 означава перфектна отрицателна корелация.

Note.png За повече информация относно статистическата корелация вижте http://en.wikipedia.org/wiki/Correlation (на английски) или http://bg.wikipedia.org/wiki/Корелационен_анализ

Данни

Входна област: обръщение към диапазона от данни за анализиране.

Резултати в: обръщение към горната лява клетка от областта, където да се покажат резултатите.

Групиране по

Изберете дали началните данни са подредени в колони или редове.

Пример

Следните данни ще бъдат използвани като пример

A B C
1 Математика Физика Биология
2 47 67 33
3 36 68 42
4 40 65 44
5 39 64 60
6 38 43
7 47 84 62
8 29 80 51
9 27 49 40
10 57 49 12
11 56 33 60
12 57
13 26

Следната таблица показва резултатите от корелацията на примерните данни по-горе.

Корелация Колона 1 Колона 2 Колона 3
Колона 1 1
Колона 2 -0.4029254917 1
Колона 3 -0.2107642836 0.2309714048 1

Ковариация

Изчислява ковариацията на два набора от числови данни.

Изберете Данни - Статистика - Ковариация

Ковариацията е измерител за това доколко две случайни променливи се изменят заедно.

Note.png За повече информация относно статистическата ковариация вижте съответната статия в Уикипедия (на английски).

Данни

Входна област: обръщение към диапазона от данни за анализиране.

Резултати в: обръщение към горната лява клетка от областта, където да се покажат резултатите.

Групиране по

Изберете дали началните данни са подредени в колони или редове.

Пример

Следните данни ще бъдат използвани като пример

A B C
1 Математика Физика Биология
2 47 67 33
3 36 68 42
4 40 65 44
5 39 64 60
6 38 43
7 47 84 62
8 29 80 51
9 27 49 40
10 57 49 12
11 56 33 60
12 57
13 26

Следната таблица показва резултатите от ковариацията на примерните данни по-горе.

Ковариация Колона 1 Колона 2 Колона 3
Колона 1 126.8099173554
Колона 2 -61.4444444444 258.41
Колона 3 -32 53.11 204.61

Експоненциално изглаждане

Дава като резултат изгладена поредица от данни.

Изберете Данни - Статистика - Експоненциално изглаждане

Експоненциалното изглаждане е техника за филтриране, с която може да се получи изгладена версия на съвкупност от данни. То се прилага в много области, например фондови борси и икономика, както и при дискретни измервания.

Note.png За повече информация относно експоненциалното изглаждане вижте съответната статия в Уикипедия (на английски).

Данни

Входна област: обръщение към диапазона от данни за анализиране.

Резултати в: обръщение към горната лява клетка от областта, където да се покажат резултатите.

Групиране по

Изберете дали началните данни са подредени в колони или редове.

Параметри

Коефициент на изглаждане: параметър между 0 и 1, който представлява коефициента на заглъхване алфа във формулата за изглаждане.

Пример

Следната таблица съдържа две поредици от стойности, едната представя импулсна функция във време t=0, а другата – импулсна функция във време t=2.

A B
1 1 0
2 0 0
3 0 1
4 0 0
5 0 0
6 0 0
7 0 0
8 0 0
9 0 0
10 0 0
11 0 0
12 0 0
13 0 0

Следват получените изгладени данни с коефициент на изглаждане 0,5:

Алфа
0.5
Колона 1 Колона 2
1 0
1 0
0.5 0
0.25 0.5
0.125 0.25
0.0625 0.125
0.03125 0.0625
0.015625 0.03125
0.0078125 0.015625
0.00390625 0.0078125
0.001953125 0.00390625
0.0009765625 0.001953125
0.0004882813 0.0009765625
0.0002441406 0.0004882813

Пълзяща средна стойност

Изчислява пълзяща средна стойност на данни във времето.

Изберете Данни - Статистика - Пълзяща средна стойност

Note.png За повече информация относно пълзящите средни стойности вижте http://en.wikipedia.org/wiki/Moving_average (на английски) или https://bg.wikipedia.org/wiki/Пълзяща_средна_стойност.

Данни

Входна област: обръщение към диапазона от данни за анализиране.

Резултати в: обръщение към горната лява клетка от областта, където да се покажат резултатите.

Групиране по

Изберете дали началните данни са подредени в колони или редове.

Параметри

Интервал: броят на измерванията, използвани в изчисляването на пълзящата средна стойност.

Пример

Следната таблица съдържа две поредици от стойности, едната представя импулсна функция във време t=0, а другата – импулсна функция във време t=2.

A B
1 1 0
2 0 0
3 0 1
4 0 0
5 0 0
6 0 0
7 0 0
8 0 0
9 0 0
10 0 0
11 0 0
12 0 0
13 0 0

Резултат от пълзящата средна стойност:

Колона 1 Колона 2
#N/A #N/A
0.3333333333 0.3333333333
0 0.3333333333
0 0.3333333333
0 0
0 0
0 0
0 0
0 0
0 0
0 0
0 0
#N/A #N/A

t-тест

Изчислява t-тест на два набора от данни.

Изберете Данни - Статистика - t-тест

t-тест е всеки тест на статистическа хипотеза, в който тестовата статистика следва t-разпределението на Стюдънт.

Note.png За повече информация относно t-тестовете вижте съответната статия в Уикипедия (на английски).

Данни

Диапазон на променлива 1: обръщение към първия диапазон от данни за анализиране.

Диапазон на променлива 2: обръщение към втория диапазон от данни за анализиране.

Резултати в: обръщение към горната лява клетка от областта, където да се покажат резултатите.

Групиране по

Изберете дали началните данни са подредени в колони или редове.

Пример

Следващата таблица съдържа два набора от данни.

A B
1 28 19
2 26 13
3 31 12
4 23 5
5 20 34
6 27 31
7 28 31
8 14 12
9 4 24
10 0 23
11 2 19
12 8 10
13 9 33

Резултати за t-тест:

Следната таблица показва резултата от t-тест за горните данни:

t-тест
Алфа 0.05
Хипотетична разлика на средните 0
Променлива 1 Променлива 2
Средно 16.9230769231 20.4615384615
Дисперсия 125.0769230769 94.4358974359
Наблюдения 13 13
Корелация на Пирсън -0.0617539772
Наблюдавана разлика на средните -3.5384615385
Дисперсия на разликите 232.9358974359
df 12
t-статистика -0.8359262137
P (T<=t) едностранно 0.2097651442
t критично едностранно 1.7822875556
P (T<=t) двустранно 0.4195302884
t критично двустранно 2.1788128297

F-тест

Изчислява F-тест на два набора от данни.

Изберете Данни - Статистика - F-тест

F-тест е всеки статистически тест, в който тестовата статистика има F-разпределение при нулевата хипотеза.

Note.png За повече информация относно F-тестовете вижте съответната статия в Уикипедия (на английски).

Данни

Диапазон на променлива 1: обръщение към първия диапазон от данни за анализиране.

Диапазон на променлива 2: обръщение към втория диапазон от данни за анализиране.

Резултати в: обръщение към горната лява клетка от областта, където да се покажат резултатите.

Групиране по

Изберете дали началните данни са подредени в колони или редове.

Пример

Следващата таблица съдържа два набора от данни.

A B
1 28 19
2 26 13
3 31 12
4 23 5
5 20 34
6 27 31
7 28 31
8 14 12
9 4 24
10 0 23
11 2 19
12 8 10
13 9 33

Резултати за F-тест:

Следната таблица показва резултата от F-тест за горните данни:

F-тест
Алфа 0.05
Променлива 1 Променлива 2
Средно 16.9230769231 20.4615384615
Дисперсия 125.0769230769 94.4358974359
Наблюдения 13 13
df 12 12
F 1.3244637524
P (F<=f) дясна страна 0.3170614146
F критично, дясна страна 2.6866371125
P (F<=f) лява страна 0.6829385854
F критично, лява страна 0.3722125312
P двустранно 0.6341228293
F критично двустранно 0.3051313549 3.277277094

Z-тест

Изчислява z-тест на два набора от данни.

Изберете Данни - Статистика - Z-тест

Note.png За повече информация относно Z-тестовете вижте съответната статия в Уикипедия (на английски).

Данни

Диапазон на променлива 1: обръщение към първия диапазон от данни за анализиране.

Диапазон на променлива 2: обръщение към втория диапазон от данни за анализиране.

Резултати в: обръщение към горната лява клетка от областта, където да се покажат резултатите.

Групиране по

Изберете дали началните данни са подредени в колони или редове.

Пример

Следващата таблица съдържа два набора от данни.

A B
1 28 19
2 26 13
3 31 12
4 23 5
5 20 34
6 27 31
7 28 31
8 14 12
9 4 24
10 0 23
11 2 19
12 8 10
13 9 33

Резултати за z-тест:

Следната таблица показва резултата от z-тест за горните данни:

z-тест
Алфа 0.05
Хипотетична разлика на средните 0
Променлива 1 Променлива 2
Известна дисперсия 0 0
Средно 16.9230769231 20.4615384615
Наблюдения 13 13
Наблюдавана разлика на средните -3.5384615385
z #DIV/0!
P (Z<=z) едностранно #DIV/0!
z критично едностранно 1.644853627
P (Z<=z) двустранно #DIV/0!
z критично двустранно 1.9599639845

χ²-тест

Изчислява χ²-тест за набор от данни.

Изберете Данни - Статистика - χ²-тест

Note.png За повече информация относно χ²-тестовете вижте съответната статия в Уикипедия (на английски).

Данни

Входна област: обръщение към областта с поредицата данни за анализиране.

Резултати в: обръщение към горната лява клетка от областта, където да се покажат резултатите.

Групиране по

Изберете дали началните данни са подредени в колони или редове.

Пример

Следващата таблица съдържа два набора от данни.

A B
1 28 19
2 26 13
3 31 12
4 23 5
5 20 34
6 27 31
7 28 31
8 14 12
9 4 24
10 0 23
11 2 19
12 8 10
13 9 33

Резултати за χ²-тест:

Тест за независимост (χ²)
Алфа 0.05
df 12
P-стойност 2.32567054678584E-014
Тестова статистика 91.6870055842
Критична стойност 21.0260698175

Related Topics

Регресионен анализ