ТОР 5 статей: Методические подходы к анализу финансового состояния предприятия Проблема периодизации русской литературы ХХ века. Краткая характеристика второй половины ХХ века Характеристика шлифовальных кругов и ее маркировка Служебные части речи. Предлог. Союз. Частицы КАТЕГОРИИ:
|
Краткие теоретические сведения. В различных практических задачах часто возникает необходимость обобщить полученную в процессе исследования информацию с целью построения аналитическихВ различных практических задачах часто возникает необходимость обобщить полученную в процессе исследования информацию с целью построения аналитических зависимостей, пригодных для использования в имитационных и прогнозных моделях, в выявлении закономерностей. Все процессы и явления, в той или иной степени взаимосвязаны друг с другом. С помощью статистических методов можно установить зависимость и дать ей количественную характеристику. Простейшей формой связи является линейная зависимость. Далее будем рассматривать взаимосвязь двух признаков Х и Y. На практике для самых разнообразных явлений массового характера имеет место стохастическая зависимость, т.е. признаки Х и Y связаны между собой, но эта взаимосвязь между переменными не однозначна, а подвержена случайным изменениям, т.е. при определенном значении признака Х признак Y принимает заранее не предсказуемое значение. Это объясняется тем, что кроме признака Х на изменчивость Y влияет много других, не учтенных связей. Стохастическую зависимость можно изучать методами корреляционного и регрессионного анализа. Корреляционная связь определяет наличие и форму связи, тесноту этой связи, устанавливает и анализирует зависимость между значениями одной переменной и соответствующими ей среднегрупповыми значениями другой. Для выяснения вида зависимости между х и
Рисунок 6.1а Рисунок 6.1б Рисунок 6.1в Замечание. При построении диаграммы масштаб на осях координат следует выбирать так, чтобы размахи варьирования обоих переменных: Если точки диаграммы рассеяния сосредоточены возле некоторой прямой, т.е. можно предположить, что корреляционная связь между признаками Х и Y является линейной (рис.6.1а, б), то эту зависимость можно характеризовать функцией регрессии
где Определение числовой оценки тесноты линейной корреляционной связи между признаками Х и Y осуществляется при помощи так называемого выборочного коэффициента корреляции Вначале исследуется каждый признак Х и Y в отдельности, а именно, находят соответствующие признакам Х и Y средние выборочные Если число выборочных данных невелико и частоты
соответственно для вычисления
Для вычисления выборочных стандандартных отклонений, используя формулы (5.9) и (5.6) и, учитывая, что
Следующий этап статистического исследования - это установление зависимости между Х и Y. В общей постановке эта задача неразрешима, т.к. одному значению признака Х может соответствовать целый спектр значений признака Y. Поэтому поставим более узкую задачу. Определим корреляционную зависимость между признаками Х и Y, при которой происходит изменение среднего значения одного из признаков при изменении значений другого признака. Пусть
где
Выборочный коэффициент корреляции является величиной безразмерной и его значение находится в пределах от -1 до +1, т.е.
Выборочный коэффициент корреляции характеризует линейную связь между признаками Х и Y: Если Если Если Если Пусть корреляционная зависимость между признаками Х и Y является линейной, тогда уравнение регрессии
Выборочное уравнение линейной регрессии используется при статистических исследованиях для вычисления предполагаемых средних значений одного из признаков, когда известно значение другого. Вопросы для самоконтроля 1. Дайте определение поля корреляции и опишите методы его построения. 2. Что определяет корреляционная зависимость? 3. Что характеризует выборочный коэффициент корреляции? 4. Опишите алгоритм определения выборочного коэффициента линейной корреляции. 5. Когда имеет смысл строить уравнение линейной регрессии? 6. Как произвести расчет коэффициентов линейного уравнения регрессии с использованием коэффициента корреляции? Пример 6.1 При изучении химического состава плодов черники было обследовано десять образцов ягод и получены следующие данные о содержании сухих веществ Х (%) и органических кислот Y (%) в исследуемых образцах:
Выполнить следующую статистическую обработку данных: Выполнить следующую статистическую обработку данных: 1) построить диаграмму рассеяния; 2) полагая, что между признаками 3) найти выборочное уравнение линейной регрессии. Используя полученное уравнение, оценить ожидаемое среднее значение признака 4) построить линию регрессии на том же рисунке, на котором построена диаграмма рассеяния. Решение: 1) Построим диаграмму рассеяния (рис.6.1)
Рисунок 6.1 2) По расположению точек на диаграмме, можно говорить о наличии убывающей линейной корреляционной зависимости. Определим выборочный коэффициент корреляции Вычислим выборочные характеристики для признаков Х и Y:
Используя полученные результаты, вычислим выборочные средние и выборочные стандартные отклонения признаков X и Y:
=
Вычислим выборочный коэффициент корреляции по формуле (6.6):
Выборочный коэффициент корреляции положителен и близок к 1. Следовательно, между признаками 3) Найдем выборочное уравнение линейной регрессии, используя формулу (6.7).
Итак, уравнение линейной регрессии имеет вид:
3) Используя полученное уравнение, оценим ожидаемое среднее значение признака Следовательно, ожидаемое среднее значение процентного содержания органических кислот в плодах черники, когда содержание сухих веществ равно 14,7%, близко к 1,22%. 4)Построим прямую линию регрессии на рисунке 6.1. Для этого определим координаты двух любых точек этой прямой:
Найдем координаты двух точек этой прямой: при при
Не нашли, что искали? Воспользуйтесь поиском:
|