Статистическа значимост: определение, концепция, значимост, регресионни уравнения и проверка на хипотези. Какво е статистическа значимост при оптимизирането на реализациите

Статистическата валидност е от съществено значение в изчислителната практика на FCC. Беше отбелязано по-рано, че много проби могат да бъдат избрани от една и съща популация:

Ако те са избрани правилно, тогава техните средни показатели и показатели на генералната съвкупност се различават леко един от друг в големината на грешката на представителност, като се вземе предвид приетата надеждност;

Ако те са избрани от различни генерални съвкупности, разликата между тях се оказва значителна. Сравнението на извадките обикновено се разглежда в статистиката;

Ако те се различават незначително, маловажно, незначително, тоест действително принадлежат към една и съща генерална съвкупност, разликата между тях се нарича статистически ненадеждна.

статистически значим разликата в извадката е извадка, която се различава значително и фундаментално, т.е. принадлежи към различни генерални популации.

В FCC оценяването на статистическата значимост на разликите в извадката означава решаване на много практически проблеми. Например въвеждането на нови методи на обучение, програми, набори от упражнения, тестове, контролни упражнения е свързано с тяхната експериментална проверка, която трябва да покаже, че тестовата група е коренно различна от контролната група. Поради това се използват специални статистически методи, наречени критерии за статистическа значимост, за да се установи наличието или отсъствието на статистически значима разлика между извадките.

Всички критерии са разделени на две групи: параметрични и непараметрични. Параметричните критерии предвиждат задължителното наличие на нормален закон за разпределение, т.е. това се отнася до задължителното определяне на основните показатели на нормалния закон - средно аритметично и стандартно отклонение s. Параметричните критерии са най-точни и правилни. Непараметричните критерии се основават на ранговите (порядъчни) разлики между елементите на извадките.

Ето основните критерии за статистическа значимост, използвани в практиката на FCC: тест на Стюдънт и тест на Фишер.

Критерий на ученикана името на английския учен К. Госет (Студент е псевдоним), който открива този метод. t-тестът на Стюдънт е параметричен, използва се за сравняване на абсолютните показатели на извадките. Пробите могат да варират по размер.

Критерий на ученика се определя така.

1. Намираме критерия на Стюдънт t по следната формула:


където са средните аритметични на сравняваните проби; t 1 , t 2 - грешки в представителността, идентифицирани въз основа на показателите на сравняваните проби.

2. Практиката в FCC показва, че за спортна работа е достатъчно да се приеме достоверността на резултата P = 0,95.

За надеждност на изчислението: P = 0,95 (a = 0,05), с броя на степените на свобода

k \u003d n 1 + p 2 - 2 съгласно таблицата в Приложение 4, намираме стойността на граничната стойност на критерия ( т гр).

3. Въз основа на свойствата на нормалния закон за разпределение, критерият на Стюдънт сравнява t и t gr.

Правим изводи:

ако t t gr, тогава разликата между сравняваните проби е статистически значима;

ако t t gr, тогава разликата не е статистически значима.

За изследователите в областта на FCC оценката на статистическата значимост е първата стъпка в решаването на конкретен проблем: дали сравнените проби се различават фундаментално или не. Следващата стъпка е тази разлика да се оцени от педагогическа гледна точка, която се определя от условието на проблема.

Разгледайте приложението на критерия на Стюдънт върху конкретен пример.

Пример 2.14. Група от субекти в размер на 18 души беше оценена за сърдечна честота (bpm) преди x i и след y iзагрявки.

Оценете ефективността на загряването по отношение на сърдечната честота. Първоначалните данни и изчисленията са представени в табл. 2.30 и 2.31.

Таблица 2.30

Обработка на данни за сърдечната честота преди загряване


Грешките за двете групи съвпадат, тъй като размерите на извадките са равни (една и съща група се изследва при различни условия), а стандартните отклонения са s x = s y = 3 bpm. Нека да преминем към дефиницията на критерия на Стюдънт:

Задаваме надеждността на сметката: Р= 0,95.

Броят на степените на свобода k 1 \u003d n 1 + p 2 - 2 \u003d 18 + 18-2 \u003d 34. Според таблицата в Приложение 4 намираме т гр= 2,02.

Статистически извод. Тъй като t \u003d 11.62 и границата t gr \u003d 2.02, тогава 11.62\u003e 2.02, т.е. t > t gr, така че разликата между пробите е статистически значима.

педагогическо заключение. Установено е, че по отношение на сърдечната честота разликата между състоянието на групата преди и след загряването е статистически значима, т.е. значим, важен. Така че, според индикатора за пулса, можем да заключим, че загряването е ефективно.

Критерий на Фишере параметричен. Използва се при сравняване на скоростите на разсейване на пробите. Това, като правило, означава сравнение по отношение на стабилността на спортната работа или стабилността на функционалните и технически показатели в практиката на физическата култура и спорта. Пробите могат да бъдат с различни размери.

Критерият на Фишър е дефиниран в следната последователност.

1. Намерете критерия на Фишер F по формулата


където са дисперсиите на сравняваните проби.

Условията на критерия на Фишер предвиждат, че в числителя на формулата Е има голямо отклонение, т.е. F винаги е по-голямо от едно.

Задаваме надеждността на сметката: P = 0,95 - и определяме броя на степените на свобода за двете проби: k 1 = n 1 - 1, k 2 = n 2 - 1.

Според таблицата на Приложение 4 намираме граничната стойност на критерия F гр.

Сравнение на критерии F и F грни позволява да направим следните изводи:

ако F > F gr, тогава разликата между пробите е статистически значима;

ако Ф< F гр, то различие между выборками статически недо­стоверно.

Да вземем конкретен пример.

Пример 2.15. Нека анализираме две групи хандбалисти: x i (n 1= 16 души) и y i (n 2 = 18 души). Тези групи спортисти са изследвани за времето (s) за отблъскване при хвърляне на топката във вратата.

Степента на отблъскване еднаква ли е?

Първоначалните данни и основните изчисления са представени в табл. 2.32 и 2.33.

Таблица 2.32

Обработка на показателите за отблъскване на първа група хандбалисти


Нека дефинираме критерия на Фишер:





Според данните, представени в таблицата на Приложение 6, намираме Fgr: Fgr = 2,4

Нека обърнем внимание на факта, че в таблицата на Приложение 6 изброяването на броя на степените на свобода както на по-голямата, така и на по-малката дисперсия става по-грубо при приближаване до големи числа. И така, броят на степените на свобода на по-голяма дисперсия следва в този ред: 8, 9, 10, 11, 12, 14, 16, 20, 24 и т.н., а на по-малката - 28, 29, 30, 40, 50 и т.н. d.

Това се обяснява с факта, че с увеличаване на размера на извадката, разликите в F-теста намаляват и могат да се използват таблични стойности, които са близки до оригиналните данни. И така, в пример 2.15 =17 отсъства и можем да вземем най-близката до него стойност k = 16, от която получаваме Fgr = 2.4.

Статистически извод. Тъй като тестът на Фишер F= 2,5 > F= 2,4, пробите са статистически значими.

педагогическо заключение. Стойностите на времето за отблъскване (s) при хвърляне на топката във вратата на хандбалистите от двете групи се различават значително. Тези групи трябва да се разглеждат като различни.

Допълнителни изследвания трябва да покажат каква е причината за тази разлика.

Пример 2.20.(върху статистическата значимост на извадката ). Повишила ли се е квалификацията на футболиста, ако времето(ите) от подаване на сигнал до ритане на топката в началото на тренировката е x i , а в края е i .

Изходните данни и основните изчисления са дадени в табл. 2.40 и 2.41.

Таблица 2.40

Обработка на времеви индикатори от подаване на сигнал до удряне на топката в началото на тренировката


Нека определим разликата между групите показатели според критерия на Стюдънт:

С надеждност P \u003d 0,95 и степени на свобода k \u003d n 1 + n 2 - 2 \u003d 22 + 22 - 2 \u003d 42, съгласно таблицата в Приложение 4, намираме т гр= 2,02. Тъй като t = 8,3 > т гр= 2,02 - разликата е статистически значима.

Нека да определим разликата между групите показатели според критерия на Фишер:


Съгласно таблицата на Приложение 2, с надеждност P = 0,95 и степени на свобода k = 22-1 = 21, стойността на F gr = 21. Тъй като F = 1,53< F гр = = 2,1, различие в рассеивании исходных данных статистически недостоверно.

Статистически извод. Според средноаритметичното разликата между групите показатели е статистически значима. По отношение на дисперсията (разсейването) разликата между групите показатели не е статистически значима.

педагогическо заключение.Квалификациите на футболиста са се подобрили значително, но трябва да се обърне внимание на стабилността на неговите показания.

Подготовка за работа

Преди провеждането на тази лабораторна работа по дисциплината "Спортна метрология" всички ученици от учебната група трябва да формират работни екипи от по 3-4 ученика във всеки, за съвместно изпълнение на работната задача на всички лабораторни работи.

В подготовка за работа запознайте се със съответните раздели от препоръчаната литература (вижте раздел 6 от тези насоки) и бележки от лекции. Разучете раздели 1 и 2 за тази лабораторна работа, както и работната задача към нея (раздел 4).

Подгответе формуляр за отчетвърху стандартни листове хартия за писане А4 и поставете в нея необходимите за работа материали.

Докладът трябва да съдържа :

Заглавна страница, указваща катедрата (UK и TR), учебната група, фамилното име, собственото име, бащиното име на студента, номерът и името на лабораторната работа, датата на нейното завършване, както и фамилията, академичната степен, академичната титла и позиция на учителя, приемащ работата;

Обективен;

Формули с числени стойности, които обясняват междинните и крайните резултати от изчисленията;

Таблици с измерени и изчислени стойности;

Необходим графичен материал към задачата;

Кратки изводи за резултатите от всеки един от етапите на работното задание и като цяло за извършената работа.

Всички графики и таблици са начертани точно с помощта на инструменти за рисуване. Условните графични и буквени обозначения трябва да отговарят на GOSTs. Разрешено е съставянето на протокол с помощта на компютърна (компютърна) технология.

Работна задача

Преди извършване на всички измервания всеки член на екипа трябва да проучи правилата за използване на спортната игра Дартс, дадени в Приложение 7, които са необходими за извършване на следващите етапи на изследването.

I - ти етап на изследване„Изследването на резултатите от поразяването на целта на спортната игра Дартс от всеки член на бригадата за съответствие с нормалния закон за разпределение според критерия χ 2Пиърсън и трите сигма теста"

1. измери (тества) вашата (лична) скорост и координация на действията, чрез хвърляне на дартс 30-40 пъти по кръглата мишена на спортната игра Дартс.

2. Резултати от измервания (тестове) x i(в точки) подредете под формата на вариационна серия и въведете в таблица 4.1 (колони, извършете всички необходими изчисления, попълнете необходимите таблици и направете съответните заключения относно съответствието на полученото емпирично разпределение с нормалния закон за разпределение, по аналогия с подобни изчисления, таблици и заключения от пример 2.12, дадени в раздел 2 на това ръководство на страници 7-10.

Таблица 4.1

Съответствие на скоростта и координацията на действията на субектите с нормалния закон на разпределение

№ п / стр заоблени
Обща сума

II - ти етап на изследване

„Оценка на средните показатели на общата съвкупност от попадения в целта на спортната игра Дартс на всички ученици от образователната група въз основа на резултатите от измерванията на членове на една бригада“

Оценете средните показатели за скоростта и координацията на действията на всички ученици от учебната група (според списъка на учебната група на списанието на класа) въз основа на резултатите от удрянето на целта на спортната игра Дартс от всички членове на екип, получени на първия етап от изследването в тази лабораторна работа.

1. Документирайте резултатите от измерванията на скоростта и координацията на действията при хвърляне на дартс в кръгла мишена на спортната игра Дартс на всички членове на вашия отбор (2 - 4 души), които са селекция от резултати от измерване от общата популация (резултати от измерване на всички ученици от учебната група - например, 15 души), вписвайки ги във втора и трета колона таблици 4.2.

Таблица 4.2

Обработка на показатели за скорост и координация на действията

членове на бригадата

№ п / стр
Обща сума

Таблица 4.2 по-долу трябва да се разбере , съответстващ среден резултат (виж резултатите от изчисленията съгласно таблица 4.1) членове на вашия екип , получени на първия етап от изследването. Трябва да бъде отбелязано че, обикновено, в таблица 4.2 има изчислена средна стойност на резултатите от измерванията, получени от един член на екипа на първия етап от изследването , тъй като вероятността резултатите от измерванията на различни членове на екипа да съвпаднат е много малка. Тогава, обикновено стойности в колона таблици 4.2 за всеки от редовете - са равни на 1, а в реда „Общо » колони « », е написано броя на членовете на вашия екип.

2. Извършете всички необходими изчисления за попълване на таблица 4.2, както и други изчисления и изводи, подобни на изчисленията и изводите от пример 2.13, дадени във 2-ри раздел на тази методическа разработка на страници 13-14. Трябва да се има предвид при изчисляване на грешката на представителността "м" е необходимо да се използва формула 2.4, дадена на страница 13 от тази методическа разработка, тъй като извадката е малка (n, а броят на елементите на генералната съвкупност N е известен и е равен на броя на учениците в групата за изследване , съгласно описа на дневника на учебната група.

III - ти етап на изследване

Оценка на ефективността на загряването по отношение на "Скорост и координация на действията" от всеки член на екипа, използвайки критерия на ученика

Да се ​​​​оцени ефективността на загрявката за хвърляне на дартс в целта на спортната игра "Дартс", извършена на първия етап от изследването на тази лабораторна работа, от всеки член на екипа по отношение на "Скорост и координация на действията“, използвайки критерия на Стюдънт – параметричен критерий за статистическа достоверност на емпиричния закон на разпределение спрямо нормалния закон на разпределение.

… Обща сума

2. дисперсия и Северен Казахстан , резултатите от измерванията на показателя "Скорост и координация на действията" въз основа на резултатите от загрявката, дадени в таблица 4.3, (вижте подобни изчисления, дадени непосредствено след таблица 2.30 от пример 2.14 на страница 16 от тази методическа разработка).

3. Всеки член на работния екип измерете (тествайте) вашата (лична) скорост и координация на действията след загрявката,

… Обща сума

5. Извършете средни изчисления дисперсия и Северен Казахстан ,резултатите от измерванията на индикатора "Скорост и координация на действията" след загрявката, дадени в таблица 4.4, запишете общия резултат от измерванията въз основа на резултатите от загряването (виж подобни изчисления, дадени непосредствено след таблица 2.31 от пример 2.14 на страница 17 от тази методическа разработка).

6. Извършете всички необходими изчисления и изводи, подобни на изчисленията и изводите от пример 2.14, дадени във 2-ри раздел на тази методическа разработка на страници 16-17. Трябва да се има предвид при изчисляване на грешката на представителността "м" е необходимо да се използва формула 2.1, дадена на стр. 12 от тази методическа разработка, тъй като извадката е n, а броят на елементите на съвкупността N ( не е известен.

IV - ти етап на изследване

Оценка на еднаквостта (стабилността) на показателите "Скорост и координация на действията" на двама членове на екипа с помощта на критерия на Фишер

Оценете еднаквостта (стабилността) на показателите "Скорост и координация на действията" на двама членове на екипа, използвайки критерия на Фишер, според резултатите от измерването, получени на третия етап от изследването на тази лабораторна работа.

За да направите това, направете следното.

Използвайки данните от таблици 4.3 и 4.4, резултатите от изчисляването на дисперсиите за тези таблици, получени на третия етап от изследването, както и методологията за изчисляване и прилагане на критерия на Фишер за оценка на равномерността (стабилността) на спортните показатели, дадени в пример 2.15 на стр. 18-19 от тази методическа разработка, направете подходящи статистически и педагогически заключения.

V - ти етап на изследване

Оценка на групите показатели "Бързина и координация на действията" на един член на екипа преди и след загрявката

Помислете за типичен пример за прилагане на статистически методи в медицината. Създателите на лекарството предполагат, че той увеличава диурезата пропорционално на приетата доза. За да проверят това предположение, те дават на петима доброволци различни дози от лекарството.

Според резултатите от наблюденията се начертава графика на диурезата спрямо дозата (фиг. 1.2A). Зависимостта се вижда с просто око. Изследователите се поздравяват взаимно за откритието и света за новия диуретик.

Всъщност данните ни позволяват надеждно да заявим само, че зависимостта на диурезата от дозата е наблюдавана при тези петима доброволци. Фактът, че тази зависимост ще се прояви при всички хора, които ще приемат лекарството, не е нищо повече от предположение.
WJ

с

жени. Не може да се каже, че е безпочвен - иначе защо да експериментираме?

Но сега лекарството е на пазара. Все повече и повече хора го приемат с надеждата да увеличат диурезата си. И какво виждаме? Виждаме Фиг. 1.2B, което показва липсата на връзка между дозата на лекарството и диурезата. Черните кръгове представляват данни от оригиналното проучване. Статистиката има методи за оценка на вероятността да се получи такава „непредставителна“, освен това объркваща извадка. Оказва се, че при липса на връзка между диурезата и дозата на лекарството, получената "зависимост" би се наблюдавала в около 5 от 1000 експеримента. Така че в този случай изследователите просто нямаха късмет. Дори да приложат и най-съвършените статистически методи, това пак няма да ги спаси от грешка.

Този измислен, но съвсем не далеч от реалността пример, ние цитирахме не за да изтъкнем безполезността
статистика. Той говори за нещо друго, за вероятностния характер на нейните заключения. В резултат на прилагането на статистическия метод ние не получаваме крайната истина, а само оценка на вероятността на определено предположение. Освен това всеки статистически метод се основава на собствен математически модел и неговите резултати са правилни дотолкова, доколкото този модел отговаря на реалността.

Повече за НАДЕЖДНОСТТА И СТАТИСТИЧЕСКАТА ЗНАЧИМОСТ:

  1. Статистически значими разлики в показателите за качество на живот
  2. Статистически агрегат. Знаци на сметката. Концепцията за непрекъснати и селективни изследвания. Изисквания към статистическата съвкупност и използването на счетоводни и отчетни документи
  3. ЕСЕ. ИЗСЛЕДВАНЕ НА НАДЕЖДНОСТТА НА ОТЧИТАНИЯТА НА ТОНОМЕТЪРА ЗА ИЗМЕРВАНЕ НА ВЪТРЕШНОТО НАЛЯГАНЕ ПРЕЗ КЛЕПАЧА 2018, 2018

Тестването на хипотези се извършва с помощта на статистически анализ. Статистическата значимост се намира с помощта на P-стойността, която съответства на вероятността за дадено събитие при предположението, че дадено твърдение (нулева хипотеза) е вярно. Ако P-стойността е по-малка от дадено ниво на статистическа значимост (обикновено 0,05), експериментаторът може безопасно да заключи, че нулевата хипотеза е невярна и да премине към разглеждане на алтернативната хипотеза. Използвайки t-теста на Student, можете да изчислите P-стойността и да определите значимостта за два набора от данни.

стъпки

Част 1

Създаване на експеримент

    Дефинирайте своята хипотеза.Първата стъпка в оценката на статистическата значимост е да изберете въпроса, на който искате да получите отговор, и да формулирате хипотеза. Хипотезата е твърдение за експериментални данни, тяхното разпределение и свойства. За всеки експеримент има както нулева, така и алтернативна хипотеза. Най-общо казано, ще трябва да сравните два набора от данни, за да определите дали са подобни или различни.

    • Нулевата хипотеза (H 0) обикновено гласи, че няма разлика между двата набора от данни. Например: студентите, които четат материала преди час, не получават по-високи оценки.
    • Алтернативната хипотеза (H a) е противоположна на нулевата хипотеза и е твърдение, което трябва да бъде потвърдено с експериментални данни. Например: студентите, които четат материала преди час, получават по-високи оценки.
  1. Задайте нивото на значимост, за да определите колко разпределението на данните трябва да се различава от обичайното, за да се счита за значим резултат. Ниво на значимост (наричано още α (\displaystyle \alpha )-ниво) е прагът, който определяте за статистическа значимост. Ако P-стойността е по-малка или равна на нивото на значимост, данните се считат за статистически значими.

    • Като правило, нивото на значимост (стойност α (\displaystyle \alpha )) се приема равно на 0,05, в който случай вероятността за откриване на случайна разлика между различни набори от данни е само 5%.
    • Колкото по-високо е нивото на значимост (и съответно колкото по-малка е P-стойността), толкова по-надеждни са резултатите.
    • Ако искате по-надеждни резултати, намалете P-стойността до 0,01. Обикновено по-ниски P-стойности се използват в производството, когато е необходимо да се открият дефекти в продуктите. В този случай се изисква висока прецизност, за да се гарантира, че всички части работят според очакванията.
    • За повечето експерименти с хипотези е достатъчно ниво на значимост от 0,05.
  2. Решете кои критерии ще използвате:едностранно или двустранно. Едно от допусканията в t-теста на Student е, че данните са нормално разпределени. Нормалното разпределение е камбанообразна крива с максимален брой резултати в средата на кривата. t-тестът на Student е метод за валидиране на математически данни, който ви позволява да определите дали данните попадат извън нормалното разпределение (повече, по-малко или в „опашките“ на кривата).

    • Ако не сте сигурни дали данните са над или под контролната група, използвайте двустранен тест. Това ще ви позволи да определите значимостта и в двете посоки.
    • Ако знаете в каква посока данните може да изпаднат извън нормалното разпределение, използвайте едностранен тест. В горния пример очакваме оценките на учениците да се покачат, така че може да се използва едностранен тест.
  3. Определете размера на извадката, като използвате статистическа мощност.Статистическата мощност на едно изследване е вероятността даден размер на извадката да доведе до очаквания резултат. Обичайният праг на мощността (или β) е 80%. Анализът на мощността без никакви предварителни данни може да бъде труден, тъй като е необходима известна информация за очакваните средни стойности във всеки набор от данни и техните стандартни отклонения. Използвайте онлайн калкулатора за статистическа мощност, за да определите оптималния размер на извадката за вашите данни.

    • Обикновено изследователите провеждат малко пилотно проучване, за да предоставят данни за анализ на мощността и да определят размера на извадката, необходим за по-голямо и по-пълно проучване.
    • Ако нямате възможност да проведете пилотно проучване, опитайте се да оцените възможните средни стойности въз основа на литературните данни и резултатите на други хора. Това може да ви помогне да определите оптималния размер на извадката.

    Част 2

    Изчислете стандартното отклонение
    1. Запишете формулата за стандартното отклонение.Стандартното отклонение показва колко голямо е разпространението на данните. Тя ви позволява да заключите колко близки са данните, получени за определена проба. На пръв поглед формулата изглежда доста сложна, но обясненията по-долу ще ви помогнат да я разберете. Формулата е следната: s = √∑((x i – µ) 2 /(N – 1)).

      • s - стандартно отклонение;
      • знакът ∑ показва, че трябва да се добавят всички данни, получени в извадката;
      • x i съответства на i-та стойност, т.е. получен отделен резултат;
      • µ е средната стойност за тази група;
      • N е общият брой данни в извадката.
    2. Намерете средната стойност във всяка група.За да изчислите стандартното отклонение, първо трябва да намерите средната стойност за всяка група за изследване. Средната стойност се обозначава с гръцката буква µ (mu). За да намерите средната стойност, просто съберете всички получени стойности и ги разделете на количеството данни (размер на извадката).

      • Например, за да намерите средната оценка в група студенти, които учат материал преди час, помислете за малък набор от данни. За простота използваме набор от пет точки: 90, 91, 85, 83 и 94.
      • Нека съберем всички стойности заедно: 90 + 91 + 85 + 83 + 94 = 443.
      • Разделете сумата на броя на стойностите, N = 5: 443/5 = 88,6.
      • Така средната стойност за тази група е 88,6.
    3. Извадете всяка получена стойност от средната.Следващата стъпка е да се изчисли разликата (x i - µ). За да направите това, извадете всяка получена стойност от намерената средна стойност. В нашия пример трябва да намерим пет разлики:

      • (90 - 88,6), (91 - 88,6), (85 - 88,6), (83 - 88,6) и (94 - 88,6).
      • В резултат на това получаваме следните стойности: 1.4, 2.4, -3.6, -5.6 и 5.4.
    4. Квадратирайте всяка получена стойност и ги добавете заедно.Всяко от току-що намерените количества трябва да бъде повдигнато на квадрат. Тази стъпка ще премахне всички отрицателни стойности. Ако след тази стъпка все още имате отрицателни числа, значи сте забравили да ги повдигнете на квадрат.

      • За нашия пример получаваме 1,96, 5,76, 12,96, 31,36 и 29,16.
      • Събираме получените стойности: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
    5. Разделете на размера на извадката минус 1.Във формулата сумата е разделена на N - 1 поради факта, че не вземаме предвид генералната съвкупност, а вземаме извадка от всички ученици за оценка.

      • Извадете: N - 1 = 5 - 1 = 4
      • Разделете: 81,2/4 = 20,3
    6. Вземете корен квадратен.След като разделите сумата на размера на извадката минус едно, вземете корен квадратен от намерената стойност. Това е последната стъпка в изчисляването на стандартното отклонение. Има статистически програми, които след въвеждане на първоначалните данни извършват всички необходими изчисления.

      • В нашия пример стандартното отклонение на оценките на тези студенти, които са прочели материала преди час, е s = √20.3 = 4.51.

      Част 3

      Определете значимостта
      1. Изчислете дисперсията между двете групи данни.До тази стъпка разгледахме примера само за една група данни. Ако искате да сравните две групи, очевидно трябва да вземете данните и за двете групи. Изчислете стандартното отклонение за втората група от данни и след това намерете дисперсията между двете експериментални групи. Дисперсията се изчислява по следната формула: s d = √((s 1 /N 1) + (s 2 /N 2)).

Ако не действате, ще се побъркате. (Шота Руставели)

Основни термини и понятия на медицинската статистика

В тази статия представяме някои от ключовите понятия на статистиката, които са от значение в медицинските изследвания. Условията са разгледани по-подробно в съответните статии.

Вариация

Определение.Степента на дисперсия на данните (стойности на знака) в диапазона от стойности

Вероятност

Определение. Вероятността е степента, до която определено събитие може да се случи при определени условия.

Пример. Нека обясним дефиницията на термина в изречението „Вероятността за възстановяване при използване на лекарството Arimidex е 70%“. Събитието е „възстановяване на пациента“, условието „пациентът приема Arimidex“, степента на вероятност е 70% (грубо казано, от 100 души, приемащи Arimidex, 70 оздравяват).

Кумулативна вероятност

Определение.Кумулативната вероятност за оцеляване в момент t е същата като дела на пациентите, които са оцелели по това време.

Пример. Ако се каже, че кумулативната вероятност за оцеляване след петгодишен курс на лечение е 0,7, това означава, че от разглежданата група пациенти 70% от първоначалния брой са останали живи, а 30% са починали. С други думи, от всеки сто души 30 умират през първите 5 години.

Време за събитие

Определение.Време до събитие - това е времето, изразено в единици, изминало от някакъв начален момент до настъпването на дадено събитие.

Обяснение. Единиците за време в медицинските изследвания са дни, месеци и години.

Типични примери за начални времена:

    начало на проследяване на пациента

    хирургично лечение

Типични примери за разглеждани събития:

    прогресия на заболяването

    рецидив

    смърт на пациента

проба

Определение.Част от популация, получена чрез селекция.

Въз основа на резултатите от анализа на извадката се правят заключения за цялата съвкупност, които са валидни само ако подборът е случаен. Тъй като случайният подбор от съвкупност е практически невъзможен, човек трябва да се стреми да гарантира, че извадката е поне представителна за популацията.

Зависими и независими проби

Определение.Проби, в които обектите на изследване са набирани независимо един от друг. Алтернатива на независимите проби са зависимите (свързани, сдвоени) проби.

Хипотеза

Двустранни и едностранни хипотези

Нека първо обясним употребата на термина хипотеза в статистиката.

Целта на повечето изследвания е да се провери истинността на дадено твърдение. Целта на лекарствените тестове най-често е да се провери хипотезата, че едно лекарство е по-ефективно от друго (например Аримидекс е по-ефективен от Тамоксифен).

За да се предаде строгостта на изследването, твърдението, което се проверява, се изразява математически. Например, ако A е броят години, които ще живее пациент на Arimidex, а T е броят години, които ще живее пациент на тамоксифен, тогава хипотезата, която трябва да бъде тествана, може да бъде записана като A>T.

Определение.Една хипотеза се нарича двустранна, ако се състои в равенството на две количества.

Пример за двустранна хипотеза: A=T.

Определение. Една хипотеза се нарича едностранна (1-странна), ако се състои в неравенството на две величини.

Примери за едностранни хипотези:

Дихотомни (двоични) данни

Определение.Данни, изразени само с две валидни алтернативни стойности

Пример: Пациентът е "здрав" - "болен". Оток "е" - "няма".

Доверителен интервал

Определение.Доверителният интервал за някакво количество е диапазонът около стойността на количеството, което съдържа истинската стойност на това количество (с определено ниво на достоверност).

Пример. Нека изследваното количество е броят на пациентите на година. Средно техният брой е 500, а 95% доверителен интервал е (350, 900). Това означава, че най-вероятно (с вероятност от 95%) най-малко 350 и не повече от 900 души ще се свържат с клиниката през годината.

Обозначаване. Много често срещано съкращение е: 95% CI (95% CI) е доверителен интервал с ниво на достоверност от 95%.

Надеждност, статистическа значимост (P - ниво)

Определение.Статистическата значимост на даден резултат е мярка за доверие в неговата „истинност“.

Всяко изследване се основава само на част от обектите. Изследването на ефективността на лекарството не се извършва на базата на всички пациенти на планетата като цяло, а само на определена група пациенти (просто е невъзможно да се направи анализ на базата на всички пациенти).

Да приемем, че в резултат на анализа е направено някакво заключение (например, използването на Аримидекс като адекватна терапия е 2 пъти по-ефективно от Тамоксифен).

Въпросът, който трябва да се зададе е: „Доколко можете да вярвате на този резултат?“.

Представете си, че провеждаме проучване само на двама пациенти. Разбира се, в този случай резултатите трябва да се третират с безпокойство. Ако са изследвани голям брой пациенти (числовата стойност на "голям брой" зависи от ситуацията), тогава вече може да се вярва на направените заключения.

И така, степента на доверие се определя от стойността на p-нивото (p-стойност).

По-високото p-ниво съответства на по-ниско ниво на доверие в резултатите, получени от анализа на пробата. Например, p-ниво, равно на 0,05 (5%), показва, че заключението, направено по време на анализа на определена група, е само случайна характеристика на тези обекти с вероятност само 5%.

С други думи, с много висока вероятност (95%) заключението може да се разшири до всички обекти.

В много проучвания 5% се считат за приемлива p-стойност. Това означава, че ако например p=0,01, тогава резултатите могат да се вярват, но ако p=0,06, тогава това е невъзможно.

Проучване

проспективно проучванее изследване, при което проби се избират на базата на входен фактор и някакъв произтичащ фактор се анализира в пробите.

Ретроспективно изследванее изследване, при което проби се избират въз основа на получения фактор и някои входящи фактори се анализират в пробите.

Пример. Първоначалният фактор е бременна жена под/над 20 години. Резултатът е, че детето е по-леко/по-тежко от 2,5 kg. Анализираме дали теглото на детето зависи от възрастта на майката.

Ако вземем 2 проби, едната с майки на възраст под 20 години, другата с по-възрастни, и след това анализираме масата деца във всяка група, тогава това е проспективно изследване.

Ако съберем 2 проби, в едната - майки, които са родили деца под 2,5 кг, в другата - по-тежки, и след това анализираме възрастта на майките във всяка група, тогава това е ретроспективно изследване (естествено, такова изследване може да се извърши само когато експериментът е завършен, т.е. всички деца са родени).

Изход

Определение.Клинично значимо събитие, лабораторна стойност или признак, който представлява интерес за изследователя. В клиничните изпитвания резултатите служат като критерии за оценка на ефективността на терапевтична или профилактична интервенция.

Клинична епидемиология

Определение.Наука, която позволява прогнозиране на определен резултат за всеки отделен пациент въз основа на изследване на клиничния ход на заболяването в подобни случаи, като се използват строги научни методи за изследване на пациентите, за да се гарантира точността на прогнозите.

Кохорта

Определение.Група от участници в изследване, обединени от някакъв общ признак в момента на формирането си и изучавани в продължение на дълъг период от време.

контрол

Исторически контрол

Определение.Контролната група е формирана и изследвана в периода, предхождащ изследването.

Паралелен контрол

Определение.Контролната група, формирана едновременно с формирането на основната група.

Корелация

Определение.Статистическа връзка на два признака (количествена или поредна), показваща, че по-голямата стойност на един признак в определена част от случаите съответства на по-голяма - в случай на положителна (директна) корелация - стойността на друг признак или по-малка стойност - при отрицателна (обратна) корелация.

Пример. Установена е значителна корелация между нивото на тромбоцитите и левкоцитите в кръвта на пациента. Коефициентът на корелация е 0,76.

Съотношение на риска (CR)

Определение.Коефициентът на риск (коефициент на опасност) е съотношението на вероятността от определено („лошо“) събитие за първата група обекти към вероятността същото събитие да се случи за втората група обекти.

Пример. Ако непушачите имат 20% шанс да получат рак на белия дроб и 100% шанс да получат рак на белия дроб при пушачи, тогава CR ще бъде една пета. В този пример първата група обекти са непушачи, втората група са пушачи, а появата на рак на белия дроб се счита за "лошо" събитие.

Очевидно е, че:

1) ако КР=1, тогава вероятността събитието да се случи в групите е една и съща

2) ако КР>1, тогава събитието се случва по-често с обекти от първата група, отколкото от втората

3) ако CR<1, то событие чаще происходит с объектами из второй группы, чем из первой

Мета-анализ

Определение. ОТстатистически анализ, обобщаващ резултатите от няколко проучвания, изследващи един и същи проблем (обикновено ефективността на методите за лечение, профилактика, диагностика). Обединените проучвания осигуряват по-голяма извадка за анализ и по-голяма статистическа сила на обединените проучвания. Използва се за увеличаване на доказателствата или увереността в заключението относно ефективността на метода на изследване.

Метод на Каплан-Майер (Множество оценки на Каплан-Майер)

Този метод е изобретен от статистиците Е. Л. Каплан и Пол Майер.

Методът се използва за изчисляване на различни величини, свързани с времето на наблюдение на пациента. Примери за такива стойности:

    шанс за възстановяване в рамките на една година при употреба на лекарството

    шанс за рецидив след операция в рамките на три години след операцията

    кумулативна вероятност за оцеляване след пет години сред пациенти с рак на простатата след ампутация на орган

Нека обясним предимствата на използването на метода на Каплан-Майер.

Стойността на стойностите в "нормалния" анализ (без използване на метода на Каплан-Майер) се изчислява въз основа на разделянето на разглеждания интервал от време на интервали.

Например, ако изследваме вероятността от смърт на пациент в рамките на 5 години, тогава интервалът от време може да бъде разделен на 5 части (по-малко от 1 година, 1-2 години, 2-3 години, 3-4 години, 4- 5 години), така и 10 (по половин година) или друг брой интервали. Резултатите ще бъдат различни за различните дялове.

Изборът на най-подходящия дял не е лесна задача.

Оценките на стойностите на количествата, получени по метода на Каплан-Майер, не зависят от разделянето на времето за наблюдение на интервали, а зависят само от продължителността на живота на всеки отделен пациент.

Следователно за изследователя е по-лесно да извърши анализа и резултатите често се оказват по-качествени от резултатите от „обикновения“ анализ.

Кривата на Каплан-Майер е графика на кривата на оцеляване, получена с помощта на метода на Каплан-Майер.

модел Кокс

Този модел е изобретен от сър Дейвид Роксби Кокс (р. 1924 г.), известен английски статистик, автор на над 300 статии и книги.

Моделът на Кокс се използва в ситуации, при които количествата, изследвани в анализа на оцеляването, зависят от функциите на времето. Например, вероятността за повторение след t години (t=1,2,...) може да зависи от логаритъма на времето log(t).

Важно предимство на метода, предложен от Кокс, е приложимостта на този метод в голям брой ситуации (моделът не налага строги ограничения върху характера или формата на разпределението на вероятностите).

Въз основа на модела на Кокс може да се извърши анализ (наречен анализ на Кокс), който води до стойност на съотношението на риска и доверителен интервал за съотношението на риска.

Непараметрични методи на статистиката

Определение.Клас статистически методи, които се използват предимно за анализ на количествени данни с ненормално разпределение, както и за анализ на качествени данни.

Пример. За да идентифицираме значимостта на разликите в систоличното налягане на пациентите в зависимост от вида на лечението, ще използваме непараметричния тест на Mann-Whitney.

Характеристика (променлива)

Определение. ххарактеристики на обекта на изследване (наблюдение). Има качествени и количествени характеристики.

Рандомизиране

Определение.Метод за произволно разпределение на обектите на изследване в основните и контролните групи с помощта на специални средства (таблици или брояч на произволни числа, хвърляне на монета и други методи за произволно присвояване на групов номер на включено наблюдение). Рандомизирането минимизира разликите между групите по отношение на известни и неизвестни черти, които потенциално влияят върху изследвания резултат.

Риск

Атрибутивен- допълнителен риск от неблагоприятен изход (например заболяване) поради наличието на определена характеристика (рисков фактор) в обекта на изследване. Това е частта от риска от развитие на заболяване, която е свързана с този рисков фактор, обяснява се с него и може да бъде елиминирана, ако този рисков фактор бъде елиминиран.

Относителен риск- съотношението на риска от неблагоприятно състояние в една група към риска от това състояние в друга група. Използва се при проспективни и обсервационни проучвания, когато групите са формирани предварително и все още не е настъпило настъпването на изследваното състояние.

текущ изпит

Определение.Метод за проверка на стабилността, надеждността, производителността (валидността) на статистически модел чрез последователно изтриване на наблюдения и преизчисляване на модела. Колкото по-сходни са получените модели, толкова по-стабилен и надежден е моделът.

Събитие

Определение.Клиничният резултат, наблюдаван в проучването, като появата на усложнения, рецидив, възстановяване, смърт.

Стратификация

Определение. Мметод за вземане на проби, при който съвкупност от всички участници, които отговарят на критериите за включване за изследване, първо се разделят на групи (страти) въз основа на една или повече характеристики (обикновено пол, възраст), които потенциално влияят върху резултата, който се изследва, и след това от всеки от тези групи ( страта ), участниците се набират независимо в експерименталната и контролната група. Това позволява на изследователя да балансира важни характеристики между експерименталните и контролните групи.

Таблица за непредвидени обстоятелства

Определение.Таблица с абсолютни честоти (числа) на наблюденията, чиито колони съответстват на стойностите на една характеристика, а редовете на стойностите на друга характеристика (в случай на двумерна таблица за непредвидени обстоятелства). Стойностите на абсолютните честоти се намират в клетки в пресечната точка на редове и колони.

Нека дадем пример за таблица за непредвидени обстоятелства. Оперирани са аневризми при 194 пациенти. Известен индикатор за тежестта на отока при пациенти преди операция.

Оток \ Резултат

няма оток 20 6 26
умерено подуване 27 15 42
изразен оток 8 21 29
mj 55 42 194

Така от 26 пациенти без оток, 20 пациенти оцеляха след операцията, 6 пациенти починаха. От 42 пациенти с умерен оток оцеляват 27 пациенти, 15 умират и т.н.

Хи-квадрат тест за таблици за непредвидени обстоятелства

За да се определи значимостта (надеждността) на разликите в един знак в зависимост от друг (например резултатът от операция в зависимост от тежестта на отока), се използва хи-квадрат тест за таблици за непредвидени обстоятелства:


Шанс

Нека вероятността за някакво събитие е равна на p. Тогава вероятността събитието да не се случи е 1-p.

Например, ако вероятността пациентът да остане жив след пет години е 0,8 (80%), тогава вероятността той да умре през този период от време е 0,2 (20%).

Определение.Шансът е отношението на вероятността дадено събитие да се случи към вероятността събитието да не се случи.

Пример. В нашия пример (за пациента) шансът е 4, тъй като 0,8/0,2=4

Така вероятността за възстановяване е 4 пъти по-голяма от вероятността за смърт.

Тълкуване на стойността на величина.

1) Ако Шанс=1, тогава вероятността събитието да се случи е равна на вероятността събитието да не се случи;

2) ако Шанс >1, тогава вероятността събитието да се случи е по-голяма от вероятността събитието да не се случи;

3) ако Шанс<1, то вероятность наступления события меньше вероятности того, что событие не произойдёт.

отношение на шансовете

Определение.Коефициентът на шансове е съотношението на шансовете за първата група обекти към коефициента на шансовете за втората група обекти.

Пример. Да приемем, че и мъжете, и жените се подлагат на някакво лечение.

Вероятността пациент от мъжки пол да остане жив след пет години е 0,6 (60%); вероятността той да умре през този период от време е 0,4 (40%).

Подобни вероятности за жените са 0,8 и 0,2.

Коефициентът на шансове в този пример е

Тълкуване на стойността на величина.

1) Ако съотношението на шансовете е = 1, тогава шансът за първата група е равен на шанса за втората група

2) Ако съотношението на шансовете е >1, тогава шансът за първата група е по-голям от шанса за втората група

3) Ако съотношението на шансовете<1, то шанс для первой группы меньше шанса для второй группы

Във всяка научна и практическа ситуация на експеримент (проучване) изследователите не могат да изследват всички хора (генерална популация, популация), а само определена извадка. Например, дори ако изследваме сравнително малка група хора, като тези с определено заболяване, е много малко вероятно да имаме ресурсите или да имаме нужда да тестваме всеки пациент. Вместо това обикновено се тества извадка от населението, защото е по-удобно и отнема по-малко време. В такъв случай как да разберем, че резултатите, получени от извадката, представляват цялата група? Или, ако използваме професионална терминология, можем ли да сме сигурни, че нашето изследване правилно описва всичко население, извадката, от която използвахме?

За да се отговори на този въпрос, е необходимо да се определи статистическата значимост на резултатите от теста. Статистическа значимост (Значително ниво, съкратено сиг.),или /7-ниво на значимост (p ниво) -е вероятността даден резултат да представя правилно популацията, от която е изследвана пробата. Имайте предвид, че това е само вероятност- невъзможно е да се каже с абсолютна сигурност, че това изследване правилно описва цялата популация. В най-добрия случай може да се заключи само от нивото на значимост, че това е много вероятно. Така неизбежно възниква следният въпрос: какво трябва да бъде нивото на значимост, за да се приеме този резултат за правилна характеристика на съвкупността?

Например, при каква стойност на вероятността сте склонни да кажете, че такива шансове са достатъчни, за да поемете риск? Ако шансовете са 10 от 100 или 50 от 100? Но какво ще стане, ако тази вероятност е по-висока? Какво ще кажете за шансове като 90 от 100, 95 от 100 или 98 от 100? За ситуация, свързана с риск, този избор е доста проблематичен, тъй като зависи от личните характеристики на човек.

В психологията традиционно се смята, че шанс 95 или повече от 100 означава, че вероятността за правилността на резултатите е достатъчно висока, за да се обобщи за цялото население. Тази цифра е установена в процеса на научна и практическа дейност - няма закон, според който тя да бъде избрана като ориентир (и наистина в други науки понякога се избират други стойности на нивото на значимост).

В психологията тази вероятност се разглежда по малко необичаен начин. Вместо вероятността, че извадката представлява популация, вероятността, че извадката е не представляванаселение. С други думи, това е вероятността откритите връзки или разлики да са случайни и да не са свойство на популацията. По този начин, вместо да казват, че резултатите от дадено проучване са верни с вероятност 95 на 100, психолозите казват, че има 5 на 100 вероятност резултатите да са грешни (по същия начин 40 на 100 шансове в полза на коректността на резултатите означава 60 от 100 шанса в полза на тяхната грешност). Стойността на вероятността понякога се изразява като процент, но по-често се записва като десетична дроб. Например 10 шанса от 100 са представени като десетична дроб от 0,1; 5 от 100 се записва като 0,05; 1 на 100 - 0,01. При тази форма на запис граничната стойност е 0,05. За да се счита даден резултат за правилен, нивото му на значимост трябва да бъде По-долутова число (не забравяйте, че това е вероятността резултатът не правилноописва населението. За да премахнем терминологията, добавяме, че „вероятността за грешен резултат“ (което е по-правилно да се нарича ниво на значимост)обикновено се обозначава с латинската буква Р.Описанието на резултатите от експеримента обикновено включва обобщено заключение, като например „резултатите са значими на нивото на значимост (p) по-малко от 0,05 (т.е. по-малко от 5%).

По този начин нивото на значимост ( Р) показва вероятността резултатите непредставляват населението. По традиция в психологията се смята, че резултатите отразяват надеждно цялостната картина, ако стойността Рпо-малко от 0,05 (т.е. 5%). Това обаче е само вероятностно твърдение, а не безусловна гаранция. В някои случаи това заключение може да е невярно. Всъщност можем да изчислим колко често това може да се случи, ако погледнем величината на нивото на значимост. При ниво на значимост 0,05, в 5 от 100 случая резултатите вероятно са неправилни. 11a на пръв поглед изглежда, че това не е твърде често, но ако се замислите, тогава 5 шанса от 100 е същото като 1 от 20. С други думи, в един от всеки 20 случая резултатът ще се обърне да греша. Такива шансове не изглеждат особено благоприятни и изследователите трябва да внимават да се ангажират грешки от първи вид.Това е името на грешката, която възниква, когато изследователите си мислят, че са открили реални резултати, а всъщност такива няма. Противоположните грешки, състоящи се в това, че изследователите смятат, че не са открили резултат, но всъщност има такъв, се наричат грешки от втори вид.

Тези грешки възникват, защото не може да се изключи възможността за неправилен статистически анализ. Вероятността за грешка зависи от нивото на статистическа значимост на резултатите. Вече отбелязахме, че за да се счита резултатът за правилен, нивото на значимост трябва да е под 0,05. Разбира се, някои резултати са по-ниски и не е необичайно да се намерят резултати до 0,001 (стойност от 0,001 показва 1 на 1000 шанс да грешите). Колкото по-малка е стойността на p, толкова по-голяма е нашата увереност в правилността на резултатите.

В табл. 7.2 показва традиционното тълкуване на нивата на значимост относно възможността за статистически изводи и обосновка на решението за наличие на връзка (разлики).

Таблица 7.2

Традиционна интерпретация на нивата на значимост, използвани в психологията

Въз основа на опита от практическите изследвания се препоръчва, за да се избегнат грешки от първи и втори тип, когато се правят отговорни заключения, да се вземат решения за наличието на различия (връзки), като се фокусира върху нивото Р n знак.

Статистически тест(Статистически тест -това е инструмент за определяне на нивото на статистическа значимост. Това е правило за вземане на решения, което гарантира, че вярната хипотеза се приема, а невярната се отхвърля с голяма вероятност.

Статистическите критерии също така показват метода за изчисляване на определено число и самото това число. Всички критерии се използват с една основна цел: да се определи ниво на значимостданните, които анализират (т.е. вероятността данните да отразяват истинския ефект, който правилно представя популацията, от която е взета извадката).

Някои критерии могат да се използват само за нормално разпределени данни (и ако характеристиката се измерва в интервална скала) - тези критерии обикновено се наричат параметричен.С помощта на други критерии можете да анализирате данни с почти всеки закон за разпределение - те се наричат непараметрични.

Параметрични критерии - критерии, които включват параметри на разпределение във формулата за изчисление, т.е. средни стойности и дисперсии (t-тест на Стюдънт, F-тест на Фишер и др.).

Непараметрични критерии - критерии, които не включват параметри на разпределението във формулата за изчисляване на разпределенията и се основават на работни честоти или рангове (критерий QРозенбаум, критерий UМанна - Уитни

Например, когато казваме, че значимостта на разликите е определена чрез t-тест на Стюдънт, имаме предвид, че методът на t-теста на Стюдънт е използван за изчисляване на емпиричната стойност, която след това се сравнява с табличната (критична) стойност.

Според съотношението на емпиричните (ние изчислихме) и критичните стойности на критерия (таблица) можем да преценим дали нашата хипотеза е потвърдена или опровергана. В повечето случаи, за да разпознаем разликите като значими, е необходимо емпиричната стойност на критерия да надвишава критичната, въпреки че има критерии (например тестът на Ман-Уитни или тестът на знаците), при които трябва да се придържаме към обратното правило.

В някои случаи формулата за изчисление на критерия включва броя на наблюденията в извадката от изследването, означен като П. Използвайки специална таблица, ние определяме какво ниво на статистическа значимост на разликите съответства на дадена емпирична стойност. В повечето случаи една и съща емпирична стойност на критерия може да се окаже значителна или незначителна, в зависимост от броя на наблюденията в извадката от изследването ( П ) или от т.нар брой степени на свобода , което се означава като v (g>) или и двете df (понякога д).

знаейки Пили броя на степените на свобода, можем да определим критичните стойности на критерия с помощта на специални таблици (основните са дадени в Приложение 5) и да сравним получената емпирична стойност с тях. Обикновено се пише така: n = 22 критични стойности на критерия са tSt = 2.07" или "в v (д) = 2, критичните стойности на критерия на Стюдънт са = 4,30“ и т.нар.

Обикновено обаче предпочитание се дава на параметричните критерии и ние се придържаме към тази позиция. Те се считат за по-надеждни и могат да предоставят повече информация и по-задълбочен анализ. Що се отнася до сложността на математическите изчисления, при използване на компютърни програми тази сложност изчезва (но някои други изглеждат доста преодолими).

  • В този учебник не се занимаваме подробно със статистическия проблем
  • хипотези (нулева - R0 и алтернативна - Hj) и статистически решения, тъй като студентите по психология изучават това отделно в дисциплината "Математически методи в психологията". Освен това трябва да се отбележи, че при изготвянето на изследователски доклад (курсова или дипломна работа, публикация) статистически хипотези и статистически решения по правило не се дават. Обикновено, когато се описват резултатите, се посочва критерий, дават се необходимите описателни статистики (средни, сигма, коефициенти на корелация и др.), Емпирични стойности на критериите, степени на свобода и непременно нивото на р-значимост. След това се формулира значимо заключение във връзка с тестваната хипотеза, като се посочва (обикновено под формата на неравенство) постигнатото или непостигнато ниво на значимост.