Корреляционный и регрессионный анализ
Значимость коэффициента корреляции при уровне значимости 0.05
- Смекалка!
По страницу работаем!

    Система нормальных уравнений для нахождения параметров линейной парной регрессии имеет вид:
Система нормальных уравнений_System.JPG
Для оценки типичности параметров уравнения регрессии используется t – критерий Стьюдента. При этом вычисляются значения t- критерия: Дисперсия фактора X обозначается через σx: Дисперсия фактора X_SigmaSQRx.JPG
Общая дисперсия результативного признака Общая дисперсия_SigmaSQRy.JPG отображающая общее влияние всех факторов.
Остаточная дисперсия: Остаточная дисперсия_SigmaSQRr.JPG
Факторная дисперсия: Факторная дисперсия_SigmaSQRyHat.JPG
Для оценки типичности параметров уравнения регрессии используется t-критерий Стьюдента.
При этом вычисляются значения t- критерия: для параметра β0: Значения t-критерия_t_beta0.JPG и для параметра β1: Значения t-критерия_t_beta1.JPG
Полученные по формулам статистики сравниваются с критическим , который получают по таблице Стьюдента с учетом принятого уровня значимостии числа степеней свободы .
Полученные при анализе корреляционной связи параметры уравнения регрессии признаются типичными, если t фактическое больше t критического: Критерий_t_crit.JPG
Соотношение между факторной и общей дисперсиями характеризует меру тесноты связи между признаками x и y: Коеффициент определености_CoeffDetermin.JPG
Показатель R2 называется индексом детерминации (причинности) .
Он выражает долю факторной дисперсии, т.е. характеризует, какая часть общей вариации результативного признака y объясняется изменением факторного признака x.
На основе етой формулы определяется индекс корреляции R:       Коеффициент определености1_CoeffDetermin1.JPG
Нулевая гипотеза H0 заключается в отсутствии линейной корреляционной связи между исследуемыми переменными в генеральной совокупности: H0 : ρ = 0.
Альтернативной гипотезой H0 : ρ = 0 является H1 : ρ ≠ = 0 .
Проверка нулевой гипотезы осуществляется в зависимости от объема выборки.
      1. Большой объем выборки N ≥ 100.
Проверка нулевой гипотезы осуществлямой с критерия Стьюдента заключается в вычислении величины Критерий Стьюдента_t_0.JPG которая сравнивается с критическими значениями tα/2 ; N-2 для выбранного уровня значимости α степеней свободы N-2. Если значение t попадает в область допустимых значений нулевая гипотеза H0 не отвергается. Считается,что в этом случае линейная связь между рассматриваемыми переменными отсутствует.
      Выборочный коэффициент линейной корреляции Rˆ Пирсона значимо отличается от нуля, если эмпирическое значение t попадает в критическую область критерия.
Для значимого коэффициента корреляции рассчитывается доверительный интервал, который с вероятностью P = 1 − α содержит неизвестный генеральный коэффициент корреляции ρ.
Границы доверительного интервала находятся по формуле:
Доверительный интервал_Intrvl.JPG

      2. Ограниченный объем выборки N ≤ 100.
Для проверки гипотезы об отсутствии корреляции между исследуемыми величинами используется преобразо- вание Фишера.
Впервые надо вычислить скорректированный коэффициент по формуле:
Скорректированный коэффициент_RCorr.JPG

Проверка нулевой гипотезы заключается в вычислении значения z-преобразование Фишера_ZTransf.JPG
Ето преобразование называется z - преобразование Фишера и сопоставления его с критическим где z1−α/2 квантили нормированного распределения.
Если эмпирическое значение u попадает в область допустимых значений нулевая гипотеза не отвергается.
Считается,что линейной корреляционной связи между рассматриваемыми величинами нет.
Корреляция считается значимой, если эмпирическое значение u попадает в критическую область.
Границы доверительного интервала для генерального коэффициента корреляции при ограниченном объеме выборки определяются через переменение обратного z - преобразования: Обратное z - преобразования_InverseZ_Tr.JPG

В програме мы, переменяем первый метод!
Число колон