Главная

Популярная публикация

Научная публикация

Случайная публикация

Обратная связь

ТОР 5 статей:

Методические подходы к анализу финансового состояния предприятия

Проблема периодизации русской литературы ХХ века. Краткая характеристика второй половины ХХ века

Ценовые и неценовые факторы

Характеристика шлифовальных кругов и ее маркировка

Служебные части речи. Предлог. Союз. Частицы

КАТЕГОРИИ:






Раздел 2. Использование регрессионного анализа для получения математических моделей




К задачам регрессионного анализа относятся:

  • определение формы зависимости между признаками;
  • оценка параметров уравнения регрессии и статистической зна­чимости как уравнения в целом, так и его параметров;
  • прогнозирование значений результативного признака;
  • содержательное аналитическое описание исследуемых явлений, выявление причинно-следственных связей между ними.

Исходными данными в регрессионном анализе служат эмпи­рические значения (хi, уi), i = 1, 2,..., n, где уi – значение результата при значении фактора хi.

Парная регрессионная модельможет быть представлена в виде:

, ()

где e – некоторая случайная величина, отражающая как влияние фак­торов, не включенных в уравнение регрессии, так и изменчивость опи­сываемых явлений, а также ошибки измерений.

Модель () называют также простой регрессией.Она описы­вает изменение среднего значения результирующего признака У в зависимости от вариации фактора X. Регрессионный анализ на­правлен на исследование односторонней зависимости результатив­ного признака У от факторного признака X.

Включение в регрессионную модель случайной составляющей обусловлено следующими причинами:

· любая модель представляет собой упрощение описываемых явлений;

· ограниченный характер исходной статистической информации;

· недостаточная изученность исследуемых процессов;

· неоднозначность выбора функциональной зависимости;

· сложные зависимости между факторами;

· ошибки измерений;

· человеческий фактор (и в исследуемых явлениях, и в модели­ровании) и др.

Укажем на следующие названия, используемые различными авторами:

у – результат, отклик, зависимая переменная, выходной параметр;

х – фактор, независимая переменная, входной фактор;

e – отклонение, остаток, ошибка, случайная со­ставляющая.

Подставляя в (8.1) эмпирические данные, получаем

. ()

Коэффициент корреляции. Связь между признаками может «располагаться» в диапазоне от независимости до функциональной зависимости. Чем «ближе» корреляционная зависимость к некоторой функ­циональной зависимости, тем теснее связь между исследуемыми признаками.

Корреляционные связи – это не полные связи, т.е. можно ска­зать, что У не на все 100% зависит от X. А на какую же величину вариация У определяется колебаниями X? Определить это и выразить количественно в статистике помогают различные показатели, выявляющие тесноту корреляционной связи.

Для правильного определения тесноты корреляционной связи необходимо, прежде всего, установить между признаками наличие причинной зависимости. Эта задача решается путем каче­ственного Х и У, материального анализа исследуемых процессов и явле­ний.

Теснота линейной корреляционной связи между факторны­ми и результативными признаками может исчисляться с помо­щью линейного коэффициента корреляции rух. На его ос­нове исчисляют коэффициент детерминации, равный квадрату коэффициента корреляции . Коэффициент детерминации показывает, какую долю общей дисперсии результативного при­знака составляет дисперсия, обусловленная влиянием изучаемо­го фактора. Например, если для корреляционной связи между производительностью оборудования и энерговооруженностью r = 0,8, то = 0,64, или 64%, то данная зависимость на 64 % объясняет вариацию урожайности количеством выпавших осадков. Величина 1 – r2 является коэффициентом остаточной детерминации и характери­зует долю вариации за счет неучтенных факторов. В данном при­мере 1 – r2 = 0,36 означает, что на долю остальных факторов, влияющих на производительность, приходится 36% вариации резуль­тативного признака.

Коэффициент корреляции определяется по формуле:

,

где хi – значение признака-фактора Х (независимой переменной);

yj – значение коррелируемого с фактором X признака У;

n число пар сопоставляемых значений признаков;

и выборочные дисперсии признаков Х и У соответственно.

Если вынести за скобки sх и sу, как величины постоянные для данных рядов, то получим следующую формулу линейного коэффициента корреляции:

/

Данную формулу можно преобразовать в такую:

. ()

Примечание. В представленных ниже задачах необходимо: а) построить эмпирические линии регрессии; б) оценить тесноту связи между переменными с помощью коэффициента корреляции; проверить значимость коэффициента корреляции; г) на уровне значимости 0,05 проверить гипотезу о линейной корреляционной зависимости между переменными X и Y.

Задание 4. Найти коэффициент корреляции между производительностью труда Y (тыс. руб.) и энерговооруженностью труда X (кВт) (в расчете на одного работающего) для 14 предприятий региона по следующим данным:

xi 2,8 2,2 3,0 3,5 3,2 3,7 4,0 4,8 6,0 5,4 5,2 5,4 6,0 9,0
yi 6,7 6,9 7,2 7,3 8,4 8,8 9,1 9,8 10,6 10,7 11,1 11,8 12,1 12,4

 

Задание 5. Распределение 50 гастрономических магазинов по уровню издержек обращения X (%) и годовому объему товарооборота Y (млн. руб.) представлено в таблице:

y x 0,5-2,0 2,0-3,5 3,5-5,0 5,0-6,5 6,5-8,0 Итого
4-6 - - -      
6-8 -          
8-10         -  
10-12       - -  
12-14   - - - -  
Итого            

Необходимо: а) построить эмпирическую линию регрессии; б) выровнять полученную зависимость по прямой и гиперболе; в) оценить тесноту связи между переменными.

Задание 6. Р аспределение 60-ти предприятий приборостроительной промышленности по энерговооруженности труда Y (кВт*час) и фондовооруженности X (млн. руб.) дано в таблице.

Х Y 0-4,5 4,5-9,0 9,0-13,5 13,5-18,0 18,0-25,5 Итого:
0-1,4     - - -  
1,4-2,8     - - -  
2,8-4,2       - -  
4,2-5,6 -       -  
5,6-7,0 - -        
7,0-8,4 - - -      
Итого:            

Необходимо: а) построить эмпирическую линию регрессии; б) оценить тесноту связи между переменными.

Задание 7. Имеются следующие данные по выработке литья под давлением (при получении пластмассовых деталей) на одного работающего Х1 (т), браке литья под давлением Х2 (%) и себестоимости одной тонны литья Y (руб) по 25 предприятиям.

  Х1 Х2 Y   X1 X2 Y   X1 X2 Y
  14,6 4,2     25,3 0,9       9,3  
  13,5 6,7       1,3       3,3  
  21,5 5,5       1,8       3,5  
  17,4 7,7       3,3          
  44,8 1,2     75,8 3,4     22,6 5,2  
    2,2     27,6 1,1     33,4 2,3  
  20,1 8,4     88,4 0,1     19,7 2,7  
    1,4     16,6 4,1          
  22,3 4,2     33,4 2,3          

Найти уравнение множественной регрессии.

Задание 8. В таблице даны измерения веса выпускаемого кондитерского изделия. Мин значение допуска 20, максимально 40. Построить распределение. Оценить его характеристики.

                   
                   
                   
                   
                   
                   
                   
                   
                   
                   

Задание 9. При измерении веса шоколадных батончиков с номинальным весом 50 гр получены следующие значения. Допустимые отклонения от номинала 10%. Построить распределение. Оценить его характеристики.






Не нашли, что искали? Воспользуйтесь поиском:

vikidalka.ru - 2015-2024 год. Все права принадлежат их авторам! Нарушение авторских прав | Нарушение персональных данных