Главная

Популярная публикация

Научная публикация

Случайная публикация

Обратная связь

ТОР 5 статей:

Методические подходы к анализу финансового состояния предприятия

Проблема периодизации русской литературы ХХ века. Краткая характеристика второй половины ХХ века

Ценовые и неценовые факторы

Характеристика шлифовальных кругов и ее маркировка

Служебные части речи. Предлог. Союз. Частицы

КАТЕГОРИИ:






Определение оценок параметров уравнения регрессии с помощью




метода наименьших квадратов (МНК)

 

Для статистической проверки взаимосвязи между зависимой и независимой переменными необходимо найти значения b0 , b1 и e в выражении (9). Метод оценивания должен быть таким, чтобы это были наилучшие, линейные, несмещенные оценки (BLUE – Best, Linear, Unbiased Estimator).

Понятие наилучшие относится к требованию для оценок параметров быть наиболее эффективными, т.е., чтобы дисперсии оценок параметров были как можно меньше. Это достигается таким выбором значений b0 и b1, которые минимизируют сумму квадратов значений e2.

Термин линейные просто повторяет, что связь линейна.

Требование несмещенные означает, что ожидаемые (математическое ожидание) значения оценок параметров модели совпадают с истинными значениями параметров.

Метод, используемый чаще других для нахождения оценок параметров уравнения регрессии и известный как метод наименьших квадратов (МНК), дает наилучшие линейные несмещенные оценки. Он называется так потому, что при расчете коэффициентов прямой линии, которая наиболее соответствует фактическим данным, с помощью этого метода стараются найти линию, минимизирующую сумму квадратов отклонений (расхождений) модельных значений Y (рассчитанных по уравнению прямой) от фактических наблюдений.

Истинные значения параметров b0 и b1 вычислить невозможно, поскольку обычно в распоряжении исследователя находится ограниченное число наблюдений, поэтому неизвестные параметры регрессии подлежат оцениванию по определенной процедуре. Оценки параметров будем обозначать через b0 и b1 соответственно. Тогда уравнение парной регрессии, по которому можно рассчитать ожидаемое значение Y, может быть представлено так:

 

(10)

 

Следовательно, для каждого значения X i существует фактическое значение Y i, но при использовании выражения (10) появляется также оценочное значение . Разности между Y i и – это остатки еi. Найденная с помощью МНК линия регрессии представляет собой прямую, минимизирующую сумму квадратов еi, т.е. минимизирует

.

 

Для обоснованного применения МНК необходимо, чтобы были выполнены следующие требования (основные предпосылки):

1) значение возмущения еi нормально распределено со средней, равной нулю, и постоянной дисперсией s2, что часто записывается как еi ~ N(0, s2),

2) значения возмущения попарно независимы, т.е. ковариация в парах значений возмущения равна нулю (Cov eiej = 0);

3) независимая (объясняющая) переменная не связана корреляционной зависимостью с возмущением.

 

Первая предпосылка указывает, что существует только один главный фактор (Х), определяющий величину Y, присутствует также множество второстепенных факторов, некоторые из которых оказывают прямое воздействие на величину Y, а другие – обратное. В случае множества прямых и обратных влияний значение остатка будет нормально распределено. Допущение о постоянной дисперсии значения возмущения означает, что как бы ни была велика или мала величина независимой переменной Х, разброс значений е постоянен. При этом говорят, что значение возмущения обладает свойством гомоскедастичности. Если же дисперсия остатка непостоянна, то возмущения определяются как гетероскедастичные.

Вторая предпосылка (о независимости значений е друг от друга) определяет тот факт, что второстепенные факторы или факторы, которые послужили причиной ошибки для одной из величин Y, не приводят автоматически к ошибкам для всех наблюдений Y. Эта предпосылка приобретает большое значение прежде всего в том случае, когда исходные данные представлены временными рядами. Когда значения е зависимы, говорят об автокоррелированности возмущения.

Третья предпосылка находит свое выражение в том, что переменная Х объясняет изменение переменной Y, но мы не можем утверждать обратное, т.е. переменная Y не объясняет переменную Х. Итак, предполагается односторонняя зависимость Y от Х.

 






Не нашли, что искали? Воспользуйтесь поиском:

vikidalka.ru - 2015-2024 год. Все права принадлежат их авторам! Нарушение авторских прав | Нарушение персональных данных