Главная

Популярная публикация

Научная публикация

Случайная публикация

Обратная связь

ТОР 5 статей:

Методические подходы к анализу финансового состояния предприятия

Проблема периодизации русской литературы ХХ века. Краткая характеристика второй половины ХХ века

Ценовые и неценовые факторы

Характеристика шлифовальных кругов и ее маркировка

Служебные части речи. Предлог. Союз. Частицы

КАТЕГОРИИ:






Методические указания. Модуль Ш. Статистические методы изучения связей




Модуль Ш. Статистические методы изучения связей

Цель изучения модуля Ш: практическоеусвоение методов взаимосвязи признаков со статистической зависимостью – дисперсионного и корреляционно-регрессионного анализа.

Вопросы:

1. Сущность дисперсионного анализа

2. Модели дисперсионного анализа

3. Последовательность проведения дисперсионного анализа

4. Сущность корреляционно-регрессионного анализа

5. Модели корреляционно-регрессионного анализа

6. Показатели тесноты связи признаков

7. Проверка статистических гипотез относительно существенности показателей регрессионной и корреляционной связи признаков

Методические указания

Дисперсионный анализ применяется для проверки статистических гипотез относительно средних величин в нескольких генеральных совокупностях.

При проверке гипотез методом дисперсионного анализа используется критерий F-распределения, который представляет собой отношение дисперсий двух выборок, сделанных из одной нормально распределенной генеральной совокупности: где S1 2 S2 2

Если нулевая гипотеза основана на предположении, что все выборки взяты из нормально распределенных генеральных совокупностей с равными средними величинами (H0 : ), критическая область критерия определяется как Fфакт Fα. Это означает, что если Fфакт Fα, от нулевой гипотезы о равенстве средних величин в генеральных совокупностях следует отказаться. Если же Fфакт Fα, нулевая гипотеза должна быть принята.

Дисперсионный анализ следует проводить по этапам:

1) Сформулировать статистические гипотезы (нулевую и альтернативную),

2) Рассчитать фактическое значение критерия Fфакт, для чего

а) определить общий объем вариации изучаемого признака (W общ) и разложить его на составляющие части – вариацию между выборками (Wмежгрупп) и вариацию внутри выборок (остаточную -W остаточн.),

б) определить число степеней свободы для всех объемов вариации (V I),

в) рассчитать дисперсии (S i 2) по каждому источнику вариации, как отношение объемов вариации (W) к соответствующему числу степеней свободы (V),

г)рассчитать фактическое значение критерия Фишера по формуле

где S2межг. S2 остаточ

3) Определить по таблицам теоретическое значение критерия F

4) Сопоставить фактическое значение критерия (Fфакт) с теоретическим (Fтеорет) и сделать вывод о принятии или отвержении от нулевой гипотезы.

В ходе дисперсионного анализа необходимо учитывать особенности формирования выборок.

Выборки могут быть сформированы по одному, двум и большему числу признаков (однофакторный, двухфакторный и т.д. дисперсионный комплексы). Различают выборки со случайным формированием единиц совокупности (независимые выборки) и с неслучайным формированием (зависимые выборки). Независимые выборки могут быть сформированы как с равной, так и неравной численностью. Формирование зависимых выборок предопределяет их равную численность.

Следует различать также выборки, сформированные по качественному признаку (сорт, вид удобрений, способ обработки и т.п.) и выборки, сформированные с учетом градаций количественных признаков (дозы удобрений, затраты кормов на 1 голову скота и т.п.)

Если выборки сформированы по качественному признаку, а также по количественному признаку, градации которого представляют все интересующие исследователя уровни, на основе результатов дисперсионного анализа могут быть проверены статистические гипотезы относительно достоверности различий средних величин всех попарных сочетаний выборок.

При этом, если выборки равночисленны (n1 = n2=…nm), для попарного сравнения применяется критерий Q-Тьюки. В случае неравночисленных выборок необходимо применять метод контрастов с критерием Ψ-Шеффе.

Корреляционно-регрессионный анализ применяется для определения количественных характеристик корреляционной связи, проявляющейся в среднем по достаточно большому числу наблюдений. С этой целью, прежде всего, связь между переменными должна быть выражена посредством математического уравнения соответствующего вида, называемого уравнением корреляционной связи или уравнением регрессии. Например, линейная связь между двумя переменными (парная связь) выражается уравнением: , между несколькими переменными (множественная связь) - и т.д.

В уравнениях регрессии - зависимая переменная, - независимые переменные, - параметры уравнения. Параметр - начало отсчета. В уравнении линейной парной связи параметр называется коэффициентом полной регрессии; он показывает, на сколько единиц в среднем изменится значение зависимой переменной при изменении независимой на единицу. В уравнениях линейной множественной связи параметры называются коэффициентами чистой регрессии; каждый из них показывает, на сколько единиц в среднем изменится значение зависимой переменной при изменении соответствующей независимой переменной на единицу при условии, что другие независимые переменные, включенные в уравнение, не изменяются.

Следует помнить, что вопрос об установлении вида уравнения является одним из наиболее сложных в корреляционном анализе. При парных связях он может быть решен посредством графиков путем нанесения фактических значений зависимой переменной при соответствующих значениях независимой переменной на корреляционное поле. При достаточно большом числе единиц наблюдения определенное представление о виде уравнения дает построение рядов распределения по двум признакам, или так называемых корреляционных таблиц.

После установления вида уравнения необходимо исчислить показатели корреляционной связи. В частности, следует решить уравнение регрессии, то есть найти значения его параметров.

При этом параметры уравнения должны быть определены способом наименьших квадратов, в соответствии с которым сумма квадратов отклонений фактических значений зависимой переменной от значений, определенных по уравнению, должна быть минимальной: . Поэтому для определения параметров решают систему нормальных уравнений. Число нормальных уравнений в системе равно числу параметров уравнения регрессии. Так, для парной линейной связи система нормальных уравнений имеет вид:

После определения параметров уравнения должна быть дана количественная характеристика тесноты связи между переменными, включенными в уравнение. При парной линейной зависимости тесноту связи характеризуют коэффициентом детерминации (r 2) и коэффициентом корреляции (r), при множественной - соответственно, коэффициентом множественной детерминации (R 2) и коэффициентом множественной корреляции (R).

Коэффициент детерминации может быть исчислен по следующей основной формуле: r 2 (R 2)= ., где вос. - дисперсия воспроизведенная, характеризующая колеблемость зависимой переменной под влиянием независимых переменных, включенных в уравнение регрессии; о - общая дисперсия зависимой переменной.

Следует помнить, что коэффициент детерминации показывает, какая доля общей вариации зависимой переменной обусловлена влиянием изучаемых независимых переменных; его величина заключена в пределах от 0 до 1. Соответственно и коэффициент корреляции, представляющий собой корень квадратный из коэффициента детерминации r (R) = изменяется от 0 до 1. Знаки "+" и " - " при коэффициенте парной связи означает направление связи; "+" - связь прямая, "-" - связь обратная. Равенство коэффициентов нулю означает, что связь между переменными отсутствует, равенство коэффициентов единице означает, что между переменными существует функциональная зависимость. Анализ градаций коэффициента корреляции по шкале Чеддока позволяет дать характеристику тесноты связи:

r До 0,3 0,31-,050 0,51-,70 0,71-0,90 0,91-0,99
связь Практически отсутствует слабая средняя Сильная (тесная) Очень сильная

 

В практических расчетах для определения коэффициентов детерминации и корреляции используют ряд рабочих формул.

Когда корреляционный анализ проводится по данным выборочного наблюдения, возникает необходимость в проверке статистических гипотез относительно показателей корреляционной связи и в статистической оценке показателей связи в генеральных совокупностях.






Не нашли, что искали? Воспользуйтесь поиском:

vikidalka.ru - 2015-2024 год. Все права принадлежат их авторам! Нарушение авторских прав | Нарушение персональных данных