Какво трябва да знаем?

Проверка на хипотези за средните за две свързани извадки с равни дисперсии t-тест
t-тест

Станчо Павлов

Обща постановка


    Понякога се налага да се изследват не две независими извадки а такива, при които резултатите са зависими. Такъв случай възниква при опит, при който се налага една и съща единица от извадката да бъде подложена на две различни въздействия.
    Например, ако се изследва влиянието на алкохола върху скоростта на реакцията е подходящо на няколко доброволци да се измери реакцията преди и след употреба на опиата. Логично е да се предположи, че времето на реакция, освен от основния (алкохола) зависи и от физиологични фактори - възрастта, поносимостта и други, така че измерванията в двата случая ще бъдат зависими (колерирани).
Такива извадки се наричат "свързани". Разбира се, броят на единиците от двете извадки е един и същ.
Предполага се, че двете генерални съвкупности имат еднакви дисперсии (условие за хомогенност).
    Нулевата хипотеза и нейната алтернатива се формулират по подобен начин, както и при независимите извадки: Нулева хипотеза и двустранна алтернатива-Hipo0
Това е двустраната алтернатива. Едностранните алтернативи са: Едностранни алтернативи-Alt1
    При големи стойности на обема на извадките, разпределението на средната разлика се доближава към нормалното разпределение Нормално разпределение-Norm1
    Да положим Разлики от две свързани извадки-di1 и да означим тази случайна величина с d. Оценката за нейната дисперсия, за конкретна извадка, е квадрата на извадковото стандартно отклонение: Оценка на дисперсията на извадката-Estim1
    Оценката на дисперсията Дисперсия на разликите в генералната съвкупност- Disp на средната разлика при различини извадки Средна разлика при различини извадки -Mid е Оценка на дисперсията на средните при различини извадки-Estim2.
    За проверка на нулевата хипотеза, за липса на разлика между средните на две две свързани извадки се използва t-статистиката
Статистика-Stat1
Броят на степените на свобода е равен на броя на наблюденията минус едно: ст.св. = n -1. t-статистиката се подчинява на t-разпределението с n -1 степени на свобода.
    Избираме ниво на значимост α, за проверка на двустранната нулева хипотеза и определяме критичната стойност tα/2; ст.св. = tα/2; n-1 .
Изчислената статистика се сравнява с тази критична стойност и ако е по-голяма от нея нулевата хипотеза се отхвърля.

Пример

    Извършен е опит за определяне на значимостта на забавянето на реакцията при употреба на алкохол. Опитът се състои в това, че изпитваният трябва да натисне бутон след подаване на звуков сигнал. Отчита се времето на реакция в стотни от секундата. Първоначално изпитанието е проведено в трезво състояние на доброволците. След седмица, същото изследване е проведено върху същитие доброволци но след приемането на 100 гр. концентрат. Резултатите са нанесени в долната таблица.
Таблица-Tbl
    Наблюдава се, че само при номера 5 и 6, времето за реакция в нетрезво състояние е по-малко от това в трезво. Като цяло разликите са отрицателни.
    Желаем, с ниво на значимост α=0,05, да отхвърлим двустранната нулева хипотеза
H0: Времената на реакция в двете състояния са равни.
Изчисляваме средната стойност на разликите и оценяваме тяхната дисперсия: Средната разлика и оценка на дисперсията на извадката-Exmpl1
Оценяваме и дисперсията на Средна разлика при различини извадки-Mid: Оценка на дисперсията на средната разлика- Exmpl2
Изчисляваме t-статистиката: Статистика-Stat2 Степените на свобода са n-1=10-1=9.
Необходимо е да се оцени статистическата значимост на разликите при ниво на значимост α = 0.05. t0,025; 9 = 2,26.
Понеже t-статистиката е по-голяма от намерената критична стойност можем да направим статистическия извод, че употребата на алкохол забавя значимо времето на реакция. В 97,5% от случаите то е по-голямо при употреба на 100 гр. концентриран алкохол. литература на Шаум. 1 . Красимир Калинов- практическа статистика за антрополози (t – тест стр.178) 2 .1kanji-g 100tests (t – тест page 8) Кирил Гатев- обща теория на статистиката и икономическата статистика 1989 наука и изкуство (t- тестстр. 173) 3 .Ru/Vainberg- o/z h (стр. 220) 4 . Stat for dummies chapter 15 [3] Дъглас Монтогомери Джордж Рунгер ; Приложна статистика и теория на вероятностите за инжинери Трето издание 2002г. Applied Statistics and Probability for Engineers Third Edition Douglas C. Montgomery Arizona State University George C. Runger Arizona State University Home D:\Stancho\Books\Math\Math1\Probability and statistics\Statistics\En\Readen Applied Statistics And Probability For Engineers - Montgomery Runger page 407 [4] В. И. Романовский Элементарной курс математической статистики ; Госпланиздат 1939 г. E:\Stancho\Books\Math\Probability_Statistics\Statistics\Ru\ Элементарный курс математической статистики (Романовский В.И.).djvu стр. 191     Нека обемът на извадката е n и той е по-малък от 30 : n < 30.

Литература


[1] Красимир Калинов- практическа статистика за антрополози (t – тест стр.178)
[2] Л.М.Бутнер , М.Е. Позин Математические методы в химической технике Издательство "Химия" 1968 г.
[3] к. т. н. инж. Емил С. Божанов к. т. н. инж. Иван Н. Вучков ; Статистически методи за моделиране и оптимизиране на многофакторни обекти ; Държавно издателство "Техника" 1973 стр. 162
[4] Проф. д-р ик.н. Кирил Гатев, Доц. к. ик. н. Асен Спасов, Доц. к. ик. н. Димитър Радилов ; Обща теория на статистиката и икономическата статистика Държавно издателство "Наука и изкуство", София 1989 г.
[5] Дъглас Монтогомери, Джордж Рунгер; Приложна статистика и теория на вероятностите за инжинери. Трето издание 2002 г. стр. 407.
[6]Дъглас Монтогомери Джордж Рунгер ; Приложна статистика и теория на вероятностите за инжинери Трето издание 2002г. стр. 354
[7] В. И. Романовский Элементарной курс математической статистики ; Госпланиздат 1939 г. стр. 191