Какво трябва да знаем?

χ2 - тест за съгласието или тест на Пирсън

Станчо Павлов и Аднан Шараф

Обща постановка

    Издигаме нулевата хипотеза H0 , че наблюдаваните честоти се подчиняват на теоретичен модел, основан на определен закон на разпределение на случайна величина.
Таблица-Table1
    Статистиката се определя по формулата: Статистика-Formula1 с n-1-p степени на свобода, където p е броят на изчислените параметри на теоретичното разпределение.
Хи-квадрат и критичните стойности-ChiSqDistr
Разпределението хи-квадрат
    Желаем да подложим нулевата хипотеза H0 на проверка при ниво на значимост α=0,1 . В зависимост от стойнотта на статистиката χ 2 , хипотеза H0 може да се приеме, или отхвърли:       Обикновено се разглежда едностранния вариант на теста!

Пример 1

    Един и същ вид детайл се обработва по четири различни начина. Издигаме нулевата хипотеза, че относителната честота на брака не зависи от начина на обработка.
Желаем да я подложим на проверка при ниво на значимост α=0,1.

Таблица-Exmp1Tbl1
Изчисляваме общия брой обработки и общия брак:

Таблица-Exmp1Tbl2

    Поради хипотезата за равномерност на разпределението вероятността едно изделие да бъде бракувано е
Вероятност за брак-Exmp1Frm0
    Изчисляваме теоретичните честоти по формулата:
Теоретични честоти-Exmp1Frm1 :
Теоретични честоти-Exmp1Frm2
    И теоретичния брак за всеки вид обработка при изпълнение на нулевата хипотеза за равномерност на разпределението:

Теоретични честоти-Exmp1Tbl3
    χ 2 - статистиката е:
Статистика-Exmp1Frm3
    Степените на свобода са 4-1=3. Критичната стойност е: Критична стойност-Exmp1CrVal1.
    Понеже статистиката е по малка от критичната стойност, нулевата хипотеза не може да бъде отхвърлена. Това ни показва, че и четирите начини на обработка могат да се считат за еднакво лоши.
    Да припомним, че p-стойността е лицето под кривата на разпределението, вдясно от изчислената статистика 0,77. При нас тя е 0,86.
    При прилагането на теста на съгласието, трябва да се отбележи, че ако теоретичната честота е твърде малка, статистиката не отразява достатъчно точно отклоненията на наблюдаваните от теоретичните честоти. Затова се приема изискването теоретичните честоти да бъдат по-големи от предварително уточнена минимална стойност (2, 3 или 5) . Ако теоретичната честота за определен интервал на случайната величина е по-малка от нея интервалът се обединява с eдин от съседните. Тук ще считаме, че минималната теоретична честота е 3. Така е в следващия

Пример 2

Изследвани са 60 промишлени изделия за определен период от време на работа. Броят на отказите през този период са показани в долната таблица:
Пример 2-Exmp2Tbl1
Издигаме нулевата хипотеза, че разпределението на броя на отказите се подчинява на Поасоново разпределение с параметър равен на средния брой откази. В нашия случай той е k=(0.32+15.1+2.9+3.4)/60 = 0,75. Вероятностите за Поасоновото разпределение се изчисляват по формулата: Вероятности-Exmp2Frm1
Редно е p3 да се замени с вероятността за 3 и повече брака:
Вероятности-Exmp2Frm2
Определяме теоретичните честоти по формулите:
Теоретични честоти-Exmp2Frm2_1
Теоретични честоти-Exmp2Frm3

Така достигаме до таблицата:
Теоретични честоти--Exmp2Tbl2
Последната теоретичната честота е по-малка от 3, затова я обединяваме с предходната.
Теоретични честоти-Exmp2Tbl3
Определяме статистиката по формулата:
Статистика-Exmp2Frm4
Степените на свобода са броят на наблюденията минус едно, и още минус броят на изчислените параметри p. В вашия случай този брой е p = 1. Степените на свобода са 3-1-p = 3-1-1 = 1. Желаем да проверим нулевата хипотеза при ниво на значимост α=0,05. Критичната стойност е Критична стойност-Exmp2CrVal1.
Понеже статитиката е наляво от критичната стойност то нулевата хипотеза не може да бъде отхвърлена.
    Освен приетото вече условие минималната теоретична честота да е по-голяма от три се въвежда още едно-теоретичните честоти да бъдат приблизително равни. Особено това важи за непрекъснатите разпределения. Такъв е случая с

Пример 3

    Производител желае да провери хипотезата, че определен показател от неговата продукция се подчинява на нормалния закон на разпределение при ниво на значимост α = 0,05. Направена е извадка с обем n=100. Изчислените средна стойност и стандартното отклонение на извадката са Средна стойност и стандартно отклонение на извадката-Exmp3Frm1
Графика на нормалното разпределение и 12,5%-ните квантили-Exmp3Gr1
    Производителят е решил да разгледа k=8 интервала на стойностите на случайната величина.     За да се удовлетвори изискването за равенство на теоретичните честоти, лицето под графиката на стандартното нормално разпределение трябва да се раздели на k = 8 равни части.     Това са квантилите през 12,5%. За дясната част от нулевата стойност те са 0,32 ; 0.675 и 1,15 .     Най-левият интервал е Най-левият интервал-Exmp3Frm2     Следващият е Следващият интервал Exmp3Frm3     Така се определят всички интервали:
Интервалите-Exmp3Frm4

    Замествайки средната стойност и стандартното отклонение получаваме интервалите:
(-∞ ; 4,95) , (4,95 ; 4,99) , (4,99 ; 5,01) , (5,01 ; 5,04) , (5,04 ; 5,07) , (5,07 ; 5,09) , (5,09 ; 5,13) и (5,13 ; +∞),
които разбира се, са симетрични относно средната стойност Средна стойност-Exmp3Frm5. Теоретичните честоти за всички интервали са равни на n.1/k = 100/8 = 12,5.
    Интервалите, опитните и теоретичните честоти са нанесени в таблицата:
Опитни и теоретични честоти в интервалите-Exmp3Tbl1
    χ2 - статистиката е:
Статистика- Exmp3Frm6
    Степените на свобода са броят на наблюденията минус едно минус броят на изчислените параметри p.   В вашия случай този брой е p = 2. Степените на свобода са 8-2-1=5. Критичната стойност е Критична стойност-Exmp3CrVal1.
    Изводът е че нулевата хипотеза не може да бъде отхвърлена, понеже изчислената статистика е по-малка от критичната стойност.

Литература

[1] к. т. н. инж. Емил С. Божанов к. т. н. инж. Иван Н. Вучков ; Статистически методи за моделиране и оптимизиране на многофакторни обекти ; Държавно издателство "Техника" 1973 стр. 162
[2] Проф. д-р ик.н. Кирил Гатев, Доц. к. ик. н. Асен Спасов, Доц. к. ик. н. Димитър Радилов ; Обща теория на статистиката и икономическата статистика Държавно издателство "Наука и изкуство", София 1989 г.
[3] Дъглас Монтогомери, Джордж Рунгер; Приложна статистика и теория на вероятностите за инжинери. Трето издание 2002 г. стр. 370.