ТОР 5 статей: Методические подходы к анализу финансового состояния предприятия Проблема периодизации русской литературы ХХ века. Краткая характеристика второй половины ХХ века Характеристика шлифовальных кругов и ее маркировка Служебные части речи. Предлог. Союз. Частицы КАТЕГОРИИ:
|
Основные определенияПодавляющее большинство формул, используемых в технических дисциплинах, относятся к так называемым "парным" зависимостям типа . Задача обработки данных заключается в аналитическом представлении искомой функциональной зависимости, т. е. в подборе формулы, описывающей результаты эксперимента. Особенность задачи состоит в том, что наличие случайных ошибок измерения (или как говорят наличия “шума“ в эксперименте), при описании результатов, не должно включать все опытные значения. Другими словами, график искомой функции не должен проходить через все точки (соединять их), а должен по возможности сглаживать “шум" – плавная линия (в нашем случае прямая) должна проходить в области расположения точек. Регрессионный анализ дает возможность получить математическую модель объекта исследования - уравнение, аналитическое представление функциональной зависимости одной величины y от другой величины x. Линейный регрессионный анализ, при помощи метода наименьших квадратов (МНК), состоит в том, что, зная положение экспериментальных точек на плоскости, нужно так провести линию регрессии, чтобы сумма квадратов отклонений вдоль выбранной оси координат от этих точек до проведенной линии регрессии была бы минимальной. Для проведения регрессионного анализа по МНК предъявляется следующее требование: уравнение должно быть линейным по параметрам или допускать возможность линеаризации - спрямления. В этом случае получим уравнение прямой регрессии в декартовых координатах - У = b0(yх) + b1(yх) Х. Также иногда применяют обратную регрессию - Х = b0(xy) + b1(xy) У где: b0 (yх) - свободный член уравнения регрессии; геометрически он представляет собой расстояние от начала координат до точки пересечения линии прямой регрессии с ординатой (это отрезок, отсекаемый на ординате линией регрессии); (yх) – У относительно Х или У от Х. Для обратной регрессии b0 (xy) - это отрезок на абсциссе, отсекаемый этой прямой; (xy) - Х относительно У или Х от У. b1(yх) – угловой коэффициент уравнения прямой регрессии - тангенс угла наклона линии прямой регрессии к оси абсцисс, b1(xy) - угловой коэффициент уравнения обратной регрессии - тангенс угла наклона линии обратной регрессии к оси ординат. Корреляционный анализ изучает усредненный закон поведения каждой из величин в зависимости от значений другой величины, а также меру зависимости (тесноту взаимосвязи) между рассматриваемыми величинами. Корреляция между величинами x и y называется линейной, если обе функции регрессии (y от x и x от y) линейны. Угловые коэффициенты этих прямых выражаются через коэффициент корреляции, который также служит мерой линейной зависимости между величинами. Мера зависимости между величинами характеризуется коэффициентом корреляции (для прямых) или корреляционным отношением (для нелинейных зависимостей - кривых). Коэффициент корреляции представляет собой безразмерную величину, значение и знак которой характеризуют направление и величину подобной взаимосвязи между y и x. Значения коэффициента корреляции могут изменяться от -1 до +1, включая 0. Коэффициент корреляции, равный +1 или -1, указывает на наличие строгой функциональной (детерминированной, ортогональной) взаимосвязи. 0 - говорит об отсутствии какой бы то не было взаимосвязи. Коэффициент корреляции, отличный от 1, указывает на случайную (стохастическую) взаимосвязь. Знак коэффициента указывает на направление взаимосвязи между двумя переменными. Этот знак (+ или -) соответствует знаку углового коэффициента b1(yх).
Ур1 = b0 (ух)+ b1 (ух)X = 3,73 + 0,53х1,5 = 4,53; Y1 = У1 эк - У1 р = 5,0 – 4,53 = 0,47; Y12 = 0,2209; У2р = 3,73 + 0,53 х 4,0 = 5,85; Y2 = У2 эк - У2 р = 4,5 – 5,85 = -1,35; Y22 = 1,8225 и т.д. =0,2209+1,8225+0,3844+0,8836+1,5876+0,0009+ +2,0736+1,8225= 8,796. 8. Вычисляем остаточную дисперсию, характеризующую ошибку предсказания результатов опытов по уравнению прямой регрессии = 9. Определяем общую дисперсию: = 10. Проверяем адекватность (статистическую значимость) уравнения регрессии по F-критерию Фишера (табл. 2 Приложения). Адекватность уравнения характеризует его способность предсказывать результаты последующих опытов. ,
5,28/1,47 = 3,59 < 4,207.
где , - число степеней свободы. Табличное значение критерия Фишера (4,207) определено при 5%-ном уровне значимости.
6. Наносим линию прямой регрессии на график (рис.2), указываем на графике величины коэффициентов прямой регрессии.
Рис.2. Линии прямой (1), обратной (2) и ортогональной (3) регрессии по методу наименьших квадратов 7. Определяем расчетные значения по уравнению прямой регрессии - расчетные значения должны находиться на линии регрессии. Вычисляем отклонения между экспериментальными и расчетными величинами, а также квадраты этих отклонений и заполняем таблицу 2
Абсолютное значение коэффициента (без учета знака) характеризует силу или тесноту взаимосвязи. Уравнение прямой линии может быть получено различными способами: методом Асковица, методом группировки /14/, методом средних /3,7,11/, методом наименьших квадратов (МНК) и т.д. Выполним обработку условных экспериментальных данных несколькими методами, начиная с простейшего.
Метод группировок
Этот метод является наиболее простым. Для применения этого метода необходимо знать хотя бы одну точку прямой, так как определяется только угловой коэффициент. Построение прямой производится очень быстро. Если задан ряд экспериментальных точек с координатами Х и Y, то угловой коэффициент прямой, принадлежащей этим точкам, можно вычислить по формуле где Х и Y – координаты m точек, сгруппированных в одной части графика, а Х’ и Y’ – координаты m точек, сгруппированных в другой части графика. Если интервалы между значениями Х примерно одинаковы, то имеющиеся данные необходимо разделить на три примерно равные группы и использовать группу точек с координатами Х и Y, находящихся в верхней части графика, и группу точек с координатами Х’ и Y’, находящихся в нижней части графика, исключив среднюю группу точек. В этом случае нарушается общее практическое правило статистического анализа: «Статистический критерий оказывается наиболее эффективным при использовании всех данных».
Например, имеем 8 пар измерений, n = 8: Y: 9,0; 11,0; 9,0; 9,5; 6,5; 7,0; 4,5; 5,0. Х: 12,5; 11,0; 10,0; 8,5; 7,0; 5,0; 4,0; 1,5.
Эти исходные данные и результаты статистической обработки сводим в таблицу 2. В таблице 2 приведены результаты статистической обработки этих данных и другими методами. Для контрольной работы надо приготовить таблицу для 10 точек. Наносим точки на график – рис.1. Делим массив данных на три примерно равные группы: выделяем по три точки в верхней и нижней части графика (первые три и последние три пары значений), две точки в средней части не используем.
Рис. 1. Линии регрессии по методу группировок (1) и методу средних (2)
3. Проверяем правильность вычислений 2072 – 1212/8 = 99,22 + 36,97 + 2×52,84; 241,87 = 241,87. b1 (ух) = Qху / Qх = 52,84/99,22 = 0,53; b0 (ух) = - b1 (ух) = 7,69 – 0,53×7,44 = 3,73 = 1,008/0,122 = ; 8,2 = 8,2. 4. Проверяем статистическую значимость коэффициентов регрессии по критерию Стъюдента = = 3,73 > 2,447, = = 4,34 > 2,447. Если расчетные значения больше табличных , то коэффициенты регрессии статистически значимы. Если расчетное значение меньше табличного, коэффициент исключается из формулы. Табличное значение критерия определяем из табл. 1 Приложения при заданном уровне значимости (5%) и числе степеней свободы f=n-2. Для нашего случая расчетные значения обоих коэффициентов регрессии больше табличных значений – коэффициенты регрессии статистически значимы. 5. Записываем уравнение прямой регрессии с учетом статистической значимости коэффициентов. Ур = b0 (ух)+ b1 (ух)X = 3,73 + 0,53 Х.
Прямая регрессия 1. Вычисляем коэффициенты уравнения линии прямой регрессии: = = = = 2. Определяем промежуточные величины для проверки значимости коэффициентов регрессии и оценки адекватности уравнения: = 541,75 – (59,52/8) = 99,22; = 509,75 – (61,52/8) = 36,97; = 510,25 – (59,5х61,5)/8 = 52,84; = 36,97 – 0,53х52,84 = 8,96; = = 1,22; = = 1,22 / = 0,122. 1. Определяем угловой коэффициент уравнения прямой регрессии b1(yх) = = [(9,0+11,0+9,0) – (7,0+4,5+5,0)] / [(12,5+11,0+10,0) – (5,0+4,0+1,5)] = (29,0-16,5)/(33,5-10,5) = 12,5/23 = 0,543. Прямая должна проходить по опорной точке, расположенной в центре массива данных и имеющей координаты: Х ср = /n = 59,5/8 = 7,44 и Yср = /n = 61,5/8 = 7,69. В уравнение прямой У = b0(yх) + b1(yх) Х подставляем рассчитанные значения Х ср и Yср, получим 7,69 = b0(yх) + 0,54х 7,44. 2. Определяем свободный член уравнения прямой регрессии b0(yх) = Yср - b1(yх) Х ср = 7,69 - 0,54х 7,44 = 3,67. Получили искомое уравнение прямой регрессии Ур = b0(yх) + b1(yх) Х = 3,67 + 0,54 Х. 3. Определяем расчетные значения YP, абсолютные отклонения экспериментальных значений от расчетных ΔY, а также квадраты этих отклонений ΔY² и сводим их в таблицу 2: У1 р= 3,67 + 0,54 х1 = 3,67 + 0,54 х 1,5 = 4,48. Y1 = У1 эк - У1 р =5,0 – 4,48 = 0,52; Y²1 = 0,2704. У2 р= 3,67 + 0,54 Х2 = 3,65 + 0,54 х 4,0 = 5,83. Y2 = 4,5 – 5,83 = - 1,33; Y²2 = 1,7689 и т.д. При методе группировок линия прямой регрессии совпадает с линией обратной регрессии. Уравнение обратной регрессии для той же линии Хр = b0(xy) + b1(xy) У
4. Определяем угловой коэффициент уравнения обратной регрессии b1(ху) = 23,0/12,5 = 1,84 или b1(ху ) = 1,0/ b1(ух) =1,0/0,543= 1,84. 5. Определяем свободный член уравнения прямой регрессии b0 (ху) = Х ср - b1 (ху) уср = 7,44 – 1,84 х 7,69 = - 6,71. 6. Определяем расчетные значения Хр, абсолютные отклонения экспериментальных значений от расчетных ΔX, а также квадраты этих отклонений ΔX² и сводим их в таблицу 2: Хр = b0 (ху) + b1 (ху) у = - 6,71 + 1,84 У. Х1р = b0 (ху) + b1 (ху) у1 = - 6,71 + 1,84 х 5,0 = 2,49. X1 = 1,5 – 2,49 = - 0,99; X12 = 0,9801. Х2р = b0 (ху) + b1 (ху) у2 = - 6,71 + 1,84 х 4,5 = 1,57. X2 = 4,0 – 1,57 = 2,43; X22 = 5,9049 и т.д. 7. Наносим линию на рис.1 и обозначаем коэффициенты уравнений регрессии. Таблица 2 Исходные данные и результаты статистической обработки этих данных различными методами
Не нашли, что искали? Воспользуйтесь поиском:
|