Какво трябва да знаем?

Проверка на хипотези за средните на две извадки с равни но неизвестни дисперсии
t-тест

Станчо Павлов

Условия за прилагане на теста

    От една генералната съвкупност са направени две независими извадки с обеми n1 и n2 . Предполагаме, че извадките са малки и обемите им не надвишават 30.
Допускаме, че двете извадки са независими и имат равни дисперсии. Основно изискване на този тест е хомогенността на дисперсията, която предполага равенството на дисперсиите на двете извадки: Дисперсии-Disp1 . Това предположение се нарича още "еднородност" на дисперсията. За проверка на равенството на дисперсиите се прилага критерия на Фишер.     Много често, при статистически изследвания се използва и следната постановка за извършване на експиримент: От генералната съвкупност се извършва случайна извадка с обем n1 + n2. Тази извадка се разделя на 2 групи, наричани експериментална и контролна. Първата се подлага на въздействие – предмет на изледването. Друг случай е извадките да са от 2 различни генерални съвкупности с равни дисперсии. И в двата случая се проверява значимостта на разликата между двете средни стойности на генералните съвкупности. Нека Средно-Mid1 и Средно-Mid2 са извадковите средни.
    Издига се нулевата хипотеза за стойността на разликата между математичаските очаквания на случайните величини от двете генерални съвкупности Разлика на математическо очакване-DExp1 Нулевата хипотеза е за липса на разлики между двете математически очаквания. Тя и нейната алтернатива се формулират така:
Нулева хипотеза-Hipo0

    Случайната величина Разлика на извадковите средни-dMid1 , при нарастването на обемите n1 и n2 е нормално разпределена Нормално разпределение-NDist, като Дисперсия на разликата-DDiff1 , където σ2 е дисперсията на генералната съвкупност, от която са извлечени двете извадки. Но в повечето случаи от практиката σ2 е неизвестна величина. Дисперсия на разликата-DDiff2 може да се оцени чрез оценката Оценка на дисперсията-DispEst1 получена чрез обединяване на двете извадки , но по-добре е да се използва друга оценка на дисперсията - наричана съвместната (обощена, претеглена) оценка на дисперсията на популацията и изразяваща се чрез формулата:
Претеглена оценка на дисперсията-EstimD1
Може и да се приложат по-удобните формули:
Претеглена оценка на дисперсията-EstimD2
    При относително малки обеми се използва, че Разлика на извадковите средни-dMid1 има t разпределение с n1+ n2 -2 степени на свобода. Тестова статистика е Статистика-Stat1
При избраното ниво на значимост и степените на свобода ст.св. = n1+ n2 -2 се определя критичната стойност tα/2; ст.св. .
Абсолютната стойност на изчислената статистика се сравнява с тази критична стойност и ако е по-голяма от нея нулевата хипотеза се отхвърля.

Пример

    Извършен е опит за различна обработка на почвата при оризови насаждения.     Първата група е без обработка. При втората група, преди засаждането е използван фосфорен тор а по време на растежа почвата е обработвана с азотен тор. При третата група почвата е обрабатвана преди засаждането с двата вида тор и не е обработвана по време на растежа. Групите са означени, условно с A , B и C и резултатите са показани в таблицата в центнери на хектар:
Таблица-Tbl1
    Изчисляваме средните стойности за трите групи:
Извадкови средни-Mids1
    Необходимо е да се оцени значимостта на различията с ниво на значимост α = 0.05 между групите A и B и между A и C.
    Изчисляваме опитните дисперсии за трите групи. Квадрати на извадковите стандартни отклонения-EstimD3 След това определяме претеглената оценка на дисперсията за групите A и B .
Съвместна оценка на дисперсията-EstimD2_1
    Извадковото стандартно отклонение е Извадково стандартно отклонение--EstimD2_2
    Изчисляваме статистиката по формулата: Статистика-Stat2.     Степените на свобода са 7+3-2=8, а критичната стойност е t0,025; 8 = 2,306 .
    Понеже изчислената статитика е по-голяма от критичната стойност отхвърляме нулевата хипотеза за равенство на средните тойности в групите A и B.
    Подобно постъпваме и за групите A и C. Съвместна оценка на дисперсията и извадковото стандартно отклонение-EstimD4.
    Изчисляваме статистиката по формулата:         Статистика -Stat3     Степените на свобода са 7+4-1=10 t0,025; 9 =2.262. Понеже критичната стойност е по-голяма от изчислената статистика, нулевата хипотеза, за равенството на двете генерални средни, не може да бъде отхвърлена. Литература 1 . Красимир Калинов- практическа статистика за антрополози (t – тест стр.178) 2 .1kanji-g 100tests (t – тест page 8) Кирил Гатев- обща теория на статистиката и икономическата статистика 1989 наука и изкуство (t- тестстр. 173) 3 .Ru/Vainberg- o/z h (стр. 220) 4 . Stat for dummies chapter 15 [3] Дъглас Монтогомери Джордж Рунгер ; Приложна статистика и теория на вероятностите за инжинери Трето издание 2002г. Applied Statistics and Probability for Engineers Third Edition Douglas C. Montgomery Arizona State University George C. Runger Arizona State University Home D:\Stancho\Books\Math\Math1\Probability and statistics\Statistics\En\Readen Applied Statistics And Probability For Engineers - Montgomery Runger page 396 [4] В. И. Романовский Элементарной курс математической статистики ; Госпланиздат 1939 г. E:\Stancho\Books\Math\Probability_Statistics\Statistics\Ru\ Элементарный курс математической статистики (Романовский В.И.).djvu стр. 191 --> Home UP

Литература

[1] Л.М.Бутнер , М.Е. Позин Математические методы в химической технике Издательство "Химия" 1968 г.
[2] к. т. н. инж. Емил С. Божанов к. т. н. инж. Иван Н. Вучков ; Статистически методи за моделиране и оптимизиране на многофакторни обекти ; Държавно издателство "Техника" 1973 стр. 162
[3] Проф. д-р ик.н. Кирил Гатев, Доц. к. ик. н. Асен Спасов, Доц. к. ик. н. Димитър Радилов ; Обща теория на статистиката и икономическата статистика Държавно издателство "Наука и изкуство", София 1989 г.
[4] Дъглас Монтогомери, Джордж Рунгер; Приложна статистика и теория на вероятностите за инжинери. Трето издание 2002 г. стр. 362.