Какво трябва да знаем?

Тест на Левене за равенство на дисперсиите

Станчо Павлов

Нулева хипотеза и нейната алтернатива

    Този тест е предложен от Левене(Levene) през 1960г. Равенството на дисперсиите се нарича още хомогенност. От k генерални съвкупности са извлечени k извадки с обеми nj , j=1...k. Желаем да проверим хипотезата, че генералните съвкупности имат равни дисперсии. Описваният критерий е по-малко чувствителен към нормалността на генералните съвкупности. Ако имаме силни аргументи, че те са нормално разпределени е по-добре да подложим данните на теста на Барлет (Barlett).
    Нулевата хипотеза е: Нулева хипотеза-Hipo0 Нейната алтернатива се формулира така:
"H1: Има поне две генерални съвкупности с различни дисперсии":
Алтернативна хипотеза-Alt
    Условията за прилагане на теста са:
        1. Извадките от генералните съвкупности са независими.
        2. Генералните съвкупности са приблизително нормално разпределени, но това както казахме не се изисква непременно.

Описание на теста

    Наблюденията от извадките се подреждат в колони, като под тях се нанасят средните стойности. Броят на колоните е k а броят на наблюденията във всяка колона е nj . Общият брой наблюдения е сумата на всички nj , j = 1..k: За всяко наблюдение от една колона се определят абсолютните стойности на разликите между него и средната стойност на колоната: Абсолютни разлики-ABSDiff Началните данните се заменят с тези абсолютни разлики. Определят се отново средните по колони. За j-тата колона това средно се означава с Средното в j-тата колона-Midj , където j се изменя от 1 до k. Средното за всички разлики означаваме с Общо средно-Mid1.
    Статистиката се задава с формулата:
Статистика-Stat1.
Числителят във втория множител се нарича също "отклонение на средните по групи" а знаменателя-"общо отклонение". Ще ги означаваме с S1 и S2:
Помощни означения-Hlp1
Тогава стистиката се изразява така: Статистика-Stat2.     Тя има F-разпределение с k-1 и N-k степени на свобода.
    При дадено ниво на значимост α, от таблица на F-разпределението определяме критичната стойност fα k-1 ; N-k . Изчислената статитика се сравнява с определената критична стойност, и ако е по-малка от нея не можем да отхвърлим нулевата хипотеза за хомогенност на генералните съвкупности.

Пример

    Желаем да проверим хипотезата за хомогенност на две групи, съдържащи по 6 налюдения: n1 = n2=6. Общия брой наблюдения е N=12. Извадките са от различни генерални съвкупности. Въпреки, че групите имат равни обеми, извършените наблюдения са независими. Проверката за нормалност на разпределенията не е направена, защото считаме че при този тест тя не е необходима. Освен данните в таблицата, нанасяме извадковите средни и дисперсии:
Таблица-Tbl1
Ето я и хистограмата:
Хистограма-Hist
В бяло са честотите на група А а в зелено-тези на В
    Въпросът, който си поставяме, е дали наблюдаваната разлика в извадковите дисперсии е значима и поради това можем да считаме и че дисперсиите на генералните съвкупности също се различават.
    За да приложим теста на Левене съставяме нова таблица, състояща се от абсолютните разлики на стойностите на първата таблица със съответните средни на колоните:
Абсолютни разлики-ABSDiff.
    В новата таблица отново определяме средните и дисперсиите по колони. Заедно с това изчисляваме и общото средно от 12-те наблюдения:
Таблица-Tbl2
Получените средни стойности означаваме с Средните по двете колони -Mid12. Общото средно е Общо средно-Mid1. Използваме последните два реда за да изчислим девиацията по групи - S1: Помощно означение-Hlp2
    Изчисляването на общата девиация е по трудно. От числото в съответната колона трябва да се извади нейното средно и получената разлика да се повдигне на квадрат. Така се получава таблицата:
Таблица-Tbl3
Сумата на получените квадрати е S2=5,426.
Статистиката е равна на: Статистика-Stat3
    Формулираме нулевата хипотеза и нейната алтернатива: Нулева и алтернативна хипотеза- Hipo0Alt Надяваме се да отхвърлим H0 при ниво на значимост α = 0,05. От таблицата на критичните стойности за F-разпределението намираме f0,05 ; 2-1 ; 12-2 = f0,05 ; 1 ; 10 = 4,96 . Понеже изчислената статистика е по-малка от тази стойност, нямаме основание да отхвърлим нулевата хипотеза, което не значи, че генералните съвкупности имат равни дисперсии.
    p-стойността на намерената статистика е 0,32.