Главная

Популярная публикация

Научная публикация

Случайная публикация

Обратная связь

ТОР 5 статей:

Методические подходы к анализу финансового состояния предприятия

Проблема периодизации русской литературы ХХ века. Краткая характеристика второй половины ХХ века

Ценовые и неценовые факторы

Характеристика шлифовальных кругов и ее маркировка

Служебные части речи. Предлог. Союз. Частицы

КАТЕГОРИИ:






Доверительный интервал для функции регрессии




С вероятностью (1 – a) можно утверждать, что уравнение регрессии для средних значений (математических ожиданий) зависимой переменной М х(Y) будет находиться в интервале:

,

 

где (4)

– стандартная ошибка предсказываемого среднего значения Y при заданном значении Х0, которая характеризует ошибку положения линии регрессии,

– стандартная ошибка остатков (модели),

– табличное значение t-статистики Стьюдента при уровне значимости a и – числе степеней свободы v = (n – 2).

Из формулы (4) видно, что величина стандартной ошибки sp, а, следовательно, и величина доверительного интервала, достигает минимума при и возрастает по мере удаления Х от в любом направлении (рис. 3).

Таким образом, прогноз значений зависимой переменной Y по уравнению регрессии оправдан, если значение Х0 объясняющей переменной Х не выходит за диапазон ее значений по выборке (причем тем более точный, чем ближе Х0 к ).

Рис.3.

доверительный интервал для индивидуальных значений зависимой переменной. Построенная доверительная область для М х(Y) (см. рис.1) определяет местоположение модельной линии регрессии (т.е. условного математического ожидания), но не отдельных возможных значений зависимой переменной, которые отклоняются от средней. Поэтому при определении доверительного интервала для индивидуальных значений зависимой переменной необходимо учитывать еще один источник вариации – рассеяние вокруг линии регрессии на величину случайной ошибки e, дисперсия которой оценивается как остаточная дисперсия на одну степень свободы. Поэтому ошибка предсказываемого индивидуального значения Y должна включать не только стандартную ошибку , но и случайную ошибку . В результате средняя ошибка прогнозируемого индивидуального значения Y при Х = Х0 равна:

то есть, . (5)

 

а соответствующий доверительный интервал для прогнозов индивидуальных значений будет определяться по формуле:

 

Пример 1.

По 12 предприятиям концерна изучается зависимость прибыли Y (тыс. грн.) от выработки продукции на одного работника Х (единиц). Методом наименьших квадратов получено следующее уравнение регрессии:
,

которое позволяет считать, что с увеличение выработки на одну единицу прибыль возрастает в среднем на 0,92 тыс. грн.

Выполним прогноз прибыли. Если примем прогнозное значение выработки Х0=92, то точечный прогноз прибыли составит:
(тыс. грн.)

 

Чтобы получить интервальный прогноз, найдем стандартную ошибку предсказываемого по линии регрессии значения прибыли:

,

 

.

 

Прогноз линии регрессии в интервале составит:

,

.

Таким образом, с вероятностью 0,95 можно утверждать, что среднее значение прибыли для генеральной совокупности при выработке, равной 92 ед., будет находиться в интервале от 152,5 тыс. грн. до 170,7 тыс.грн.

Интервал достаточно широк, что объясняется, прежде всего, малым числом наблюдений.

найдем стандартную ошибку предсказываемого индивидуального значения прибыли:

(тыс.грн.).

 

,

,

.

Таким образом, с вероятностью 0,95 при выработке, равной 92 ед., получим индивидуальное значение прибыли, не менее чем 132,2 тыс. грн. и не более чем 191 тыс.грн.

Для многофакторной регрессионной модели формулы (4) – (5) принимают соответственно вид:

стандартная ошибка прогноза:

 

, (4¢)

 

. (5¢)

 

 

Доверительный интервал для прогнозных значений:

· условного математического ожидания

 

,

· индивидуальных значений зависимой переменной:

 

,

 

где v = n – (p + 1) – число степеней свободы;

 

X0 – матрица ожидаемых значений объясняющих переменных, т.е. предполагается, что объясняющие переменные Х1, Х2, …, Хр приняли значения, задаваемые вектором: Х¢0 = (1 Х10 Х20 … Хр0);

t1 - a – критическое (табличное) значение t-критерия при п – (р + 1) степенях свободы.

 

Пример 2. По данным о величине сменной добычи угля на одного рабочего У (т), мощности пласта Х1 (м) и уровне механизации работ Х2 (%) на 10 шахтах построена модель множественной регрессии:

ЛИНЕЙН    
0,367041 0,853933 -3,53933
0,242948 0,220504 1,906581
0,811619 0,950908 #Н/Д
15,07941   #Н/Д
27,27041 6,329588 #Н/Д

 

, (т)

которая показывает, что при увеличении только мощности пласта Х1 (при неизменном Х2) на 1 м добыча угля на одного рабочего возрастет в среднем на 0,854 т, а при увеличении только уровня механизации работ Х2 (при неизменном Х1) – в среднем на 0,367 т.

Требуется оценить сменную добычу угля на одного рабочего для шахт с мощностью пласта 8 м и уровнем механизации работ 6%; найти 95%-ные доверительные интервалы для индивидуального и среднего значений сменной добычи угля на 1 рабочего для таких же шахт.

Решение.

При построении прогноза сменной производительности труда принимаются следующие значения объясняющих переменных: мощность пласта Х1 = 8 м; уровень механизации работ Х2 = 6%, т.е. .

Точечный прогноз:

.

Интервальный прогноз:

1) среднего значения сменной добычи угля на 1 рабочего для таких же шахт, т.е. Mx(Y):

 

,

 

 

.

Итак, с вероятностью 0,95 сменная добыча угля на одного рабочего для шахт с мощностью пласта 8 м и уровнем механизации работ 6% находится в пределах от 4,52 до 6,46 т.

2) для индивидуального значения Y0* при .

 

(т)

 

.

Таким образом, с вероятностью 0,95 индивидуальное значение сменной добычи угля на одного рабочего в шахте с мощностью пласта 8 м и уровнем механизации работ 6% находится в пределах от 3,05 до 7,93 т.

 






Не нашли, что искали? Воспользуйтесь поиском:

vikidalka.ru - 2015-2024 год. Все права принадлежат их авторам! Нарушение авторских прав | Нарушение персональных данных