Какво трябва да знаем?

Разпределения свързани с линейната регресия
Станчо Павлов


    При регресионния модел се предполага, че наблюдаваните стойности yi i = 1...N са случайни величини, за чиято средна стойност E(yi ) е изпълнено равенството: E( yi )=β01xi .
Стойностите на независимия фактор (регресора) xi i = 1...N не са случайни величини а константи.
При наблюдавани, конкретни стойности на случайните yi се определят изчислените коефициети β0 и β1 -калпаче. Те също са случайни величини. За средните стойности и дисперсиите им са в сила равенствата:
ED1-Cредни стойности и дисперсии на коефициентите на линейната регресия     ?

    Нека отново да подчертаем, че σ2 е теоретичната дисперсия на грешките εi, за която предполагаме, че е N(0, σ2 ) разпределена.
Ние не знаем стойността на σ2 . Най-многото, на което можем да разчитаме е нейната статистическа оценка.
Да означим оценката на sig_sig_hat-сигма и сигма-калпаче
MSE-средно на отклоненията

Тя се използва за определяне на изчислените стандартни отклонения, означени със "ст. гр.":
StErrors-Стандартни грешки на коефициентите на регресията
Използва се и означението "se", което идва от английското "standard error", вместо българското "ст. гр.".
  1. Сумата SSR има една степен на свобода: DivRegr-Девиация, породена от регресията
  2. Сумата SSTotal-Пърна сума от квадратите има N-1 степени на свобода.
  3. За връзката между χ2 и F- разпределенията знаем свойството: Chi_F-Връзката между хи-квадрат и F- разпределенията.

От тези три факта правим извада , че FStat-Получаване на F -статистиката.

От твърденията:
  1. AB1hat_B1 - Стандартно нормално разпределение
  2. Сума от квадратите на независими нормално разпределени случайни величини с едни и същи параметри, за която степените на свобода са n е χ2- разпределена случайна величина с n степени на свобода.
  3. Сумата от квадратите на грешките ASSE-Сума от квадратите на грешките има N-2 степени на свобода и нейните събираеми са с разпределение N(0, σ2 ). Тогава ACh1- Хи-квадрат разпределение с N-2 степени на свобода.
  4. ASigmaHat-Сигма-калпаче
  5. Ако X1 е стандартно, нормално разпределена случайна величине а X2 има χ2 (хи квадрат) разпределение с n степени на свобода и двете случайни величини са независими, то ATDistr1- t разпределение с n степени на свобода:
    AProp1-Връзка между стандартно нормално, хи-квадрат и t разпределения
От тези факти следва твърдението:
ATDistr2- t разпределение с N-2 степени на свобода.
С подобни разсъждения се доказва, че
ATDistr3- t разпределение с N-2 степени на свобода.


Литература:
  1. Проф. д-р ик.н. Кирил Гатев, Доц. к. ик. н. Асен Спасов, Доц. к. ик. н. Димитър Радилов Обща теория на статистиката и икономическата статистика; изд. "Наука и изкуство"
  2. Дъглас Монтогомери и Джордж Рунгер ; Приложна статитика и теория на вероятностите за инжинери; изд. "Джон Уили и синове"


Какво ще научим?