Главная

Популярная публикация

Научная публикация

Случайная публикация

Обратная связь

ТОР 5 статей:

Методические подходы к анализу финансового состояния предприятия

Проблема периодизации русской литературы ХХ века. Краткая характеристика второй половины ХХ века

Ценовые и неценовые факторы

Характеристика шлифовальных кругов и ее маркировка

Служебные части речи. Предлог. Союз. Частицы

КАТЕГОРИИ:






Расчет коэффициентов парной корреляции




Цель занятия – привить обучающимся практические навыки в расчетах коэффициентов парной корреляции для проведения исследований наличия линейной связи между двумя случайными величинами (СВ).

Задачи занятия:

1. Ознакомить обучающихся с основами корреляционного и регрессионного анализа, а также с методикой расчета коэффициентов парной корреляции.

2. Научить обучающихся самостоятельно проводить расчет коэффициентов парной корреляции с использованием персонального компьютера.

Теоретическая часть [2, 7, 16]

При анализе результатов экспериментальных данных по надежности часто приходится рассматривать распределение не только одной случайной величины (наработки на отказ), но и влияние на эту случайную величину другой случайной величины, т.е. приходится устанавливать, есть ли и какая взаимная связь двух случайных величин.

Если каждому значению хi соответствует определенное (может быть не одно) значение уi, то связь функциональная. Между случайными величинами кроме функциональной может существовать и стохастическая связь.

При стохастической связи одна из случайных величин реагирует на изменение другой или других случайных величин изменениями параметров закона распределения.

При оценке стохастической связи между двумя или несколькими случайными величинами определяют форму связи (криволинейная или прямолинейная) и силу или тесноту связи. Форма связи определяется регрессионным анализом, а теснота связи (степень взаимодействия) между случайными величинами – корреляционным анализом.

Стохастическую зависимость Y от X описывают условным математическим ожиданием (МОЖ).

¥

`Y(x) = M [ Y / X = x] = ò y¦ (y / x) dy. (2.5)

- ¥

В механической аналогии распределения, если единичная масса распределена на плоскости хоу с плотностью ¦ (х, у), `Y(x) есть ордината центра тяжести массы, распределенной на прямой Х = х.

Зависимость (2.5) дает наилучшее предсказание величины Y(x) по значению Х = х. Эта зависимость является линией регрессии. При исследовании линии зависимости (2.5) определяют форму связи случайных величин. Таким образом, регрессия Y по Х определяет изменение МОЖ Y при изменении Х.

Форма связи исследуемых величин зависит от физической сущности явления и может иметь вид прямой линии, параболы и т.д. Определение формы линии регрессии, соответствующей реальной форме зависимости, составляет принципиальный момент в изучении корреляции и регрессии. Глубокое знание исследуемых явлений, влияющих на отказы, зависимостей между этими влияниями способствует правильному выбору линии регрессии. Совершенно неправильно считать, что найденное (2.5) регрессионное уравнение (т.е. некоторая функциональная форма) будет наилучшим только потому, что оно дает хорошее приближение, хотя нисколько не соответствует реальным физическим или техническим связям. В любой регрессионной задаче в первую очередь следует рассматривать физически обоснованную конкретную функциональную форму независимо от того, была ли она получена с помощью аналитических выводов или благодаря какому-нибудь иному предварительному знанию свойств переменных. Вполне возможно, что для аппроксимации исследуемой функции понадобятся другие функциональные связи, даже если уже опробованные давали хорошее приближение.

Тесноту связи между случайными величинами при линейной корреляции оценивают корреляционным моментом (ковариацией) kxy и коэффициентом корреляции rxy.

Корреляционный момент представляет собой МОЖ произведения отклонений х и у от их МОЖ.

kxy = M [(x – Mx) (y – My)]. (2.6)

Так как kxy зависит от единиц измерения при изменении масштаба, то сам по себе он не может служить показателем связи. Поэтому рассматривают и связь нормированных отклонений

(x – Mx) / sx и (y – My) / sy,

в результате чего получают коэффициент корреляции

rxy = kxy / sx sy. (2.7)

Коэффициент корреляции может находиться в пределах

-1 £ rxy £ 1.

Чем ближе к нулю ½ rxy½, тем слабее линейная связь между величинами, чем ½ rxy½ ближе к единице, тем связь сильнее. При ½ rxy½ = 0 или близком к нулю линейная корреляционная связь отсутствует. При ½ rxy½ = 1 или близком к единице статистическая линейная связь становится функциональной.

Для проверки значимости коэффициента парной корреляции нужно сравнить его значение с табличным критическим значением r, приведенным в табл. 2.3 [7]. Если рассчитанное значение коэффициента корреляции больше или равно табличному, то есть основания полагать что между СВ существует линейная связь. Для использования табл. 2.3 необходимо знать число степеней свободы f = n – 2 и выбрать предельный уровень значимости α (доверительная вероятность), например равный 0,05.

Таблица 2.3

Критические значения коэффициента парной корреляции при α=0,05

Число степеней свободы f Критическое значение r Число степеней свободы f Критическое значение r Число степеней свободы f Критическое значение r
  0,997   0,602   0,486
  0,95   0,576   0,444
  0,878   0,553   0,433
  0,811   0,532   0,423
  0,754   0,514   0,349
  0,707   0,497   0,273
  0,666   0,482   0,217
  0,632   0,468   0,195

Отсутствие линейной корреляционной связи не означает, что отсутствуют и другие формы связи. Криволинейная связь в этом случае может существовать и даже быть функциональной.

При криволинейной корреляционной связи теснота связи характеризуется корреляционным отношением rxy

Ö`1 - rxy = Ö`M {[ Y - `Y(x)]} / sy = s[Y - `Y(x)] / s. (2.8)

Из (2.8) следует, что -1£ rxy £ 1.

Преимущество корреляционного отношения перед коэффициентом корреляции состоит в том, что коэффициент корреляции оценивает тесноту связи лишь с линейной зависимости, а корреляционное отношение служит мерой тесноты связи любой формы, в том числе и линейной. Однако корреляционное отношение не позволяет определить конкретный вид кривой (гипербола, парабола, экспонента), наилучшего приближения экспериментальных данных.

Порядок корреляционного (регрессионного) анализа следующий:

1) для определения вида функции регрессии строят точки [x;`Y(x)] и по их расположению делают предварительное заключение о примерном виде функции регрессии, при окончательном решении принимают во внимание особенности, вытекающие из физической сущности решаемой задачи;

2) в зависимости от вида функции регрессии используют формулы (2.6) или (2.8) для определения тесноты связи;

3) неизвестные параметры уравнения регрессии ищут методом наименьших квадратов (возможно также применение метода максимального правдоподобия);

4) полученные параметры подставляют в уравнение выбранного вида функции регрессии и получают искомое уравнение регрессии.

Такими методами по результатам эксплуатации оценена надежность грузовых автомобилей ЗИЛ-130 и КамАЗ-5320.

Параметр потока отказов и неисправностей w, 1/100км, для автомобиля ЗИЛ-130:

w = -0,66 + 0,39b + 0,29g + 0,12kпр - 13·10l-4 + 16,8¦ + 65·10i-4 + 0,27П;

для автомобиля КамАЗ-5320:

w = -0,68 + 0,4b + 0,12g + 0,08kпр + 7·10l-4 + 23,2¦ + 12·10i-3 + 0,19П,

где b- коэффициент использования пробега, характеризующий коэффициент использования рабочего времени;

g - коэффициент использования грузоподъемности;

kпр - коэффициент использования прицепов;

l – длина ездки с грузом, км (при l³ 100км принято l= 100км);

¦ - коэффициент сопротивления качению;

i – среднее значение уклона дороги, %;

П – коэффициент помехонасыщенности маршрута.

Диапазоны изменения факторов:

Значение фактора……….b a k пр l ¦ i П

минимальное 0,45 0,75 0 15 0,014 3 1

максимальное 0,9 1,2 1,3 100 0,08 32 2

Значения w получены при коэффициенте множественной корреляции соответственно r = 0,89 и r = 0,93.

В нормативной документации на ремонт в качестве одного из показателей ремонтопригодности принята удельная трудоемкость

текущего ремонта Т ×10-3 человеко-часов. По результатам обработки статистики получено для автомобиля ЗИЛ-130:

Т = 1,84 + 36,3¦ + 25·10i-3 + 0,94П;

Для автомобиля КамАЗ-5320:

Т = 3,1 + 68¦ + 0,057i + 0,96П.

В качестве основного показателя долговечности в нормативной документации принят ресурс автомобиля до капитального ремонта Lкр тыс. км. Для автомобиля ЗИЛ-130 получено

Lкр = 398 - 1645¦ - 1,17i – 43,7П.

По приведенным регрессионным зависимостям подсчитаны значения параметра w потока отказов и неисправностей, трудоемкости Т текущего ремонта и ресурса Lкр автомобилей до капитального ремонта при средних значениях эксплуатационных факторов для автомобилей ЗИЛ-130 и КамАЗ-5320:

Автомобиль w Т Lкр

ЗИЛ-130 1,33 5,88 213

КамАЗ-5320 1,4 9,24 -

Методика проведения занятия

1. Обучающиеся самостоятельно изучают теоретическую часть.

2. Под руководством преподавателя обучающиеся рассчитывают коэффициенты парной корреляции по исходным данным, гипотетически полученным при выполнении лабораторной работы №1 и приведенным в табл. 2.4.

Таблица 2.4

Значения измеренных диагностических параметров

y i u n1 n2 n3 n4 n5 n6 n7 n8 n9 n10
y1u 13,2 12,8   12,5 11,5 12,8 12,9 13,1 13,3 12,4
y2u 10,5   10,4 10,6 9,5 9,8     9,7 11,1
y3u 0,11 0,08 0,6 0,22 0,15 0,1 0,12   0,25 0,09
y4u 15,5     13,5 12,5   11,5 13,9 12,6  
y5u                    
y6u                    
y7u                    
y8u                    

В табл. 2.4 ni соответствуют номерам измерений следующих диагностических параметров y i u:

y1u – напряжение аккумуляторной батареи без нагрузки (при включенных потребителях), В;

y2u – напряжение аккумуляторной батареи под нагрузкой (работа стартера без заводки автомобиля), В;

y3u – переходное сопротивление контактов прерывателя, В;

y4u – напряжение на контактах «Б» и «Ш» реле-регулятора, В;

y5u – минимально устойчивая частота вращения коленчатого вала двигателя (КВД), мин-1;

y6u – угол замкнутого состояния контактов прерывателя при 1000 мин-1;

y7u - угол замкнутого состояния контактов прерывателя при максимальных оборотах двигателя, мин-1;

y8u – падение частоты вращения КВД при отсоединении шланга принудительной вентиляции двигателя, мин-1.

Термин «корреляция» был введен в науку выдающимся английским естествоиспытателем Френсисом Гальтоном в 1886 г. Однако точную формулу для подсчета коэффициента корреляции разработал его ученик Карл Пирсон. В общем случае расчетные формулы будут иметь следующий вид:

yi u = yi u / n;

Для расчетов используем программу PEARSON EXEL и персональный компьютер. Последовательность расчета коэффициентов корреляции между диагностическими параметрами y1u и y4u показана на рис. 2.1…2.3.

Рассчитанный коэффициент корреляции Пирсона получился равным: r1,4 = 0,364999. Его значение может лежать в пределах [-1;+1]. Для проверки значимости коэффициента парной корреляции его величину необходимо сравнить с критическим значением r (см. табл. 2.3). Найдем число степеней свободы f = n – 2; n - число наблюдений (в нашем случае n= 10) => f = 8 получаем критическое значение r = 0,632. Критическое значение r = 0,632 больше рассчитанного коэффициента корреляции

 

Рис. 2.1. Ввод исходных данных

Рис. 2.2. Формирование массивов

Рис. 2.3. Результат расчета

Пирсона, r = 0,36499 следовательно эти величины между собой линейно независимы. Если бы мы получили расчетное значение коэффициента корреляции со знаком «-» это бы говорило о том, что СВ находятся в обратной связи, т.е. при увеличении одной вторая бы уменьшалась. В конце занятия обучающиеся индивидуально сообщают преподавателю о полученных результатах, представляя расчеты и делая вывод о наличии или отсутствии линейной связи между всеми рассмотренными диагностическими параметрами.

Вопросы для самостоятельной работы

1. Что такое стохастическая связь между СВ?

2. Что такое функциональная связь между СВ?

3. От чего зависит форма связи?

4. Для чего используется корреляционный анализ?

5. Для чего используется регрессионный анализ?

6. В каких пределах изменяется коэффициент корреляции?

7. О чем говорит знак «-», полученный при расчете коэффициента корреляции?

8. Каким образом поступают в случае установления криволинейной корреляционной связи между СВ?

9. Что такое число степеней свободы и как оно определяется?

10. Что такое предельный уровень значимости?

11. Чем ограничивается диапазон использования регрессионных зависимостей?






Не нашли, что искали? Воспользуйтесь поиском:

vikidalka.ru - 2015-2024 год. Все права принадлежат их авторам! Нарушение авторских прав | Нарушение персональных данных