Статистика
From Wikipedia, the free encyclopedia
Статистика је област математике која се бави сакупљањем, анализом, интерпретацијом, објашњавањем и презентацијом података.[1][2] Она се примењује у широком спектру академских дисциплина, од физике до економије и социологије.
Неке од популарних дефиниција су:
- Меријам-Вебстеров речник наводи да је статистика „грана математике која се бави сакупљањем, анализом, интерпретацијом, и презентацијом масе нумеричких података.“[3]
- Статистичар Сер Артур Лион Боули је дефинисао статистику као „нумеричку изјаву чињеница у било којој објасти испитивања постављених у међусобну релацију.“[4]
Математички методи статистике су потекли из теорије вероватноће, из времена дописивања Пјера Ферма и Блеза Паскала (1654). Кристијан Хајгенс (1657) је дао прво познато научно третирање ове теме. Јакоб Бернули у делу (постхумно, 1713) и Абрам д Моавр у делу Доктрина шанси (1718) су статистику посматрали као грану математике[5] У модерно доба, рад Колмогорова је био битан за формулисање основног модела теорије вероватноће који се користи у основи статистике.
Основна подела статистике је на дескриптивну и инференцијалну..[6] Дескриптивна статистика бави се мерама централне тенденције (аритметичка средина, медијана и мод), мерама варијабилитета (распон, стандардна девијација, варијанца, интерквартилни распон, семиинтерквартилни распон и просечно одступање), као и графичким и табеларним приказивањем основних статистичких вредности. С друге стране, инференцијална статистика се односи на проверавање постављених хипотеза (нултих и афирмативних/алтернативних), уз помоћ статистичких тестова, коефицијената и њихове значајности (т-тест, анализа варијанце, хи-квадрат тест, коефицијенти асоцијације и корелације, дискриминациона анализа, Ман-Витнијев тест, Тест знака ...). У статистичком жаргону, дескриптивна статистика се назива статистиком са малим с, а инференцијална статистиком са великим С, јер је основни циљ дескриптивне статистике да понуди податке који се даље могу обрађивати уз помоћ техника инференцијалне статистике.[7]
Друга подела се односи на технике које се користе у статистици. Сагласно томе, разликује се параметријска и непараметријска статистика.[8] У случају параметријске статистике, прорачуни се темеље на нормалној (Гаусовој) дистрибуцији, док се у случају непараметријске статистике спроводе тестови који не морају подразумевати нормалност дистрибуције података којима располажемо. Примери прве групе техника су: сложена анализа варијансе, Пирсонов продукат - коефицијент корелације, аритметичка средина, стандардна девијација ... Примери за другу групу техника су: Спирманов коефицијент корелације, хи-квадратни тест, Крускал-Валисов тест, медијана, модуо и сл.
Статистика је неодвојива од теорије вероватноће, која представља скуп математичких модела за описивање односа између остварених догађаја (исхода) и могућих догађаја. Најважнији концепт теорије вјероватноће који има широку примену у статистици је нормална расподела. Стандардна нормална расподела има аритметичку средину М = 0 и стандардну девијацију која износи СД = 1. Удаљеност неког резултата (податка) од аритметичке средине, у јединицама стандардне девијације, представља тзв. -вредност. Уколико је -вредност виша од нуле, резултат се налази изнад аритметичке средине. У супротном, дати резултат пада испод просека.
Како би се применила нека од статистичких техника/процедура, потребно је прво поставити адекватну хипотезу. Хипотезе могу бити нулте (где се не претпоставља разлика између две или више група испитаника или се не претпоставља да ће корелација између неколико варијабли бити статистички значајна). Такође, постоје и афирмативне хипотезе, којима се претпоставља нека статистички значајна разлика или повезаност.[9]
Примери за нулте хипотезе су:
- Нема статистички значајних сполних разлика у ставовима према еутаназији.
- Не очекује се статистички значајна корелација између телесне масе и интелигенције.
Примери за афирмативне хипотезе су:
- Постоје статистички значајне добне разлике у времену реакције на презентиране стимулусе.
- Постоји статистички значајна повезаност између алкохолизма и импотенције код мушкараца.