ТОР 5 статей: Методические подходы к анализу финансового состояния предприятия Проблема периодизации русской литературы ХХ века. Краткая характеристика второй половины ХХ века Характеристика шлифовальных кругов и ее маркировка Служебные части речи. Предлог. Союз. Частицы КАТЕГОРИИ:
|
Т а б л и ц а 2 - Интервальный статистический ряд
здесь Перечень наблюдаемых значений СВ X (или интервалов наблюдаемых значений) и соответствующих им относительных частот На втором этапе исследования находят точечные и интервальные оценки числовых характеристик ГС, а также оценки параметров её функции распределения. Точечной оценкой некоторого неизвестного параметра
Приведём примеры точечных оценок. Точечной оценкой величины ГС
Точечными оценками для Точечными оценками для генеральной дисперсии DГ, характеризующей разброс ГС вокруг математического ожидания (
Величины S 2 и S 12 существенно различаются только при малых n (n < 30), далее они практически совпадают. Для характеристики рассеивания ГС вокруг своего математического ожидания рассматривают наряду с DГ среднее квадратическое отклонение В качестве оценок для Среди оценок, характеризующих один и тот же параметр Желательно, также, чтобы точность оценки при увеличении объёма выборки увеличивалась. Оценка Оценка Пример 5. Для оценки Для оценки DГ применяются S 2 и S 12. Обе эти оценки состоятельны, а S 12 кроме того и несмещенная (поэтому она и предпочтительнее). Наряду с точечными оценками числовых характеристик ГС в статистике рассматриваются точечные оценки неизвестных параметров гипотетических функций распределения. Эти оценки находятся с помощью метода моментов или метода максимального правдоподобия /2, 3/. Рассмотрим некоторые распределения и укажем оценки для их параметров. 1) Нормальное распределение. Функция распределения имеет вид
Плотность распределения
Здесь два параметра распределения – В качестве оценки для
График плотности нормального распределения имеет вид
Рисунок 1
2) Равномерное распределение.
где График плотности равномерного распределения имеет вид
0 a b x Рисунок 2
3) Показательное распределение.
График плотности показательного распределения имеет вид
Рисунок 3
Наряду с точечными оценками в математической статистике часто рассматривают интервальные оценки. Точечной называют оценку, которая определяется для данной реализации выборки одним числом. Все оценки, рассмотренные выше, точечные. При выборках малого объёма точечные оценки могут значительно отличаться от оцениваемых параметров, т.е. приводить к грубым ошибкам. В связи с этим во многих случаях более удобно пользоваться интервальными оценками. Пусть
Перепишем неравенство в виде
Получим, что неизвестный параметр
Интервальной называют оценку, которая определяется двумя числами - концами интервала. Величина d называется точностью оценки. Необходимо четко понимать, что неравенство (4) выполняется не в обычном (детерминированном) смысле, а в вероятностном. Статистические методы не позволяют утверждать, что это неравенство выполняется всегда, можно только говорить о вероятности его выполнения. Вероятность выполнения неравенства (4) называется доверительной вероятностью (надежностью). Обычно вероятность оценки задается заранее, её выбирают близкой к единице. Наиболее часто полагают g = 0,95; 0,99; 0,999. Доверительным интервалом называется интервал, накрывающий неизвестный параметр Рассмотрим несколько примеров. Пример 6. Доверительный интервал для математического ожидания СВ X, распределённой по нормальному закону, при известном
здесь
где Пример7. Доверительный интервал для математического ожидания
здесь S 1 - оценка среднеквадратичного отклонения, величина tγ, n- 1 при заданных n и γ находится по специальным таблицам, построенным с помощью статистики Стьюдента. В руководстве /3/ это таблица ПРИЛОЖЕНИЕ 3. Пример 7. Доверительный интервал для оценки среднего квадратического отклонения σΓ СВ Х, распределенной по нормальному закону, имеет вид (S1(1-q); S1(1+q)), (8) где q = qg,n находится по таблицам, построенным с помощью статистики χ 2. В / 3 / это таблица ПРИЛОЖЕНИЕ 4. На третьем этапе статистических исследований обычно выдвигают и проверяют гипотезы о виде и параметрах распределения. Для выдвижения подобных гипотез часто статистические ряды представляют графиками и диаграммами. Наиболее распространенными графиками являются гистограмма, полигони эмпирическая функция распределения (кумулята). Полигон и эмпирическая функция распределения применяются для изображения как дискретных, так и интервальных статистических рядов, гистограмма служит для изображения только интервальных рядов. Существует два вида гистограмм – гистограмма частот и гистограмма относительных частот. Более удобно использовать гистограмму относительных частот – аналог графика плотности вероятностей. Гистограммойотносительных частот называется ступенчатая фигура,состоящая из прямоугольников, основаниями которых служат частичныеинтервалы длинойh, а высоты равны отношению Гистограмма частот отличается от гистограммы относительных частот только тем, что высоты прямоугольников равны В теории вероятностей функцию распределения СВ x определяют как вероятность того, что значение случайной величины x окажется меньше аргумента функции x F(x) = P(x < x) (9) Для дискретных СВ выражении (9) можно записать в виде
Следовательно, функция распределения может быть введена как сумма вероятностей значений СВ X.меньших аргумента функции x (лежащихна оси ОХ левее аргумента функции). В математической статистике аналогом вероятности является относительная частота, поэтому эмпирическую функцию распределения для дискретных СВ X естественно определить следующим образом
Аналогично вводится понятие эмпирической функции распределения для непрерывной СВ. Для этого сначала преобразовывают интервальный статистический ряд в сгруппированный статистический ряд,заменяякаждый i -ый интервал его серединой. Затем для получившегося сгруппированного статистического ряда вводят F*(x) по формуле (10). После того, как по виду гистограммы, полигона или эмпирической функции распределения выдвинута гипотеза о виде распределения, приступают к ее проверке с помощью статистических критериев значимости. Чаще всего для проверки гипотезы о виде распределения применяют критерий Пирсона (критерий χ 2) или критерий Колмогорова (см. /3,4/). Проверяемую гипотезу называют основной и обозначают Н 0. Наряду с основной рассматривают конкурирующую или альтернативную гипотезу, ее обозначают Н 1 или Н а. Если в процессе статистического доказательства основную гипотезу отвергают, то принимается альтернативная. При статистической проверке гипотез возникают ошибки первого и второго рода. Их появление связано с тем, что выборка недостаточно точно представляет генеральную совокупность (ГС), особенно это характерно для выборок малого объема. Может случиться так, что для ГС справедлива гипотеза Н 0, но по результатам исследования мы ее отвергаем. В этом случае совершается ошибка 1го рода. Если для ГС справедлива альтернативная гипотеза На, а по реализации выборки (выбранной неудачно) мы принимаем гипотезу Н 0, то совершается ошибка второго рода. Ошибки 1го и 2го рода тесно связаны между собой, при уменьшении вероятности ошибки 1го рода возрастает вероятность ошибки 2го рода и наоборот. Подробно динамику ошибок 1го и 2го рода можно посмотреть в /1, 5/. Одновременно уменьшение вероятностей ошибок 1го и 2го родов можно обеспечить увеличением объема выборки. К сожалению, избавиться от них вообще невозможно, за единственным исключением. Оставим этот вопрос об исключении на самостоятельную работу. Вероятность ошибки первого рода называется уровнем значимости и обозначается a. При практических исследованиях величинуa. берут близкой к нулю. Обычно ее выбирают равной 0,05, 0,01, 0,001 и т.д., в зависимости от ожидаемых суммарных последствий ошибок первого и второго рода. Рассмотрим подробно алгоритм применения критерия χ 2. Пусть СВ Х имеет гипотетическую функцию распределения F(x). Пусть из ГС извлечена выборка объема n. Требуется на основе имеющейся информации проверить гипотезу о том, что F(x) хорошо представляет данную выборку. Разобьем весь диапазон полученных результатов на k частичных интервалов равной длины, и пусть в i -том частичном интервале оказалось m i значений выборки (Smi = n). Составим интервальный статистический ряд распределения частот Т а б л и ц а 3 - Интервальный статистический ряд распределения частот
где t0 = x min, tk = x max. Далее делаем следующее 1) На основании гипотетической функции F(x) найдем вероятности pi попадания СВ Х в частичные интервалы (разряды) Di.
где i = 1,2,…, k. 2) Умножим подученные вероятности pi на объем выборки n и получим теоретические частоты npi, т.е. частоты, которые следует ожидать, если нулевая гипотеза справедлива. 3) Оценим отклонение теоретических частот от эмпирических с помощью статистики c2 (предложенной Пирсоном)
Чем ближе значение c2набл к нулю, тем вероятнее, что гипотеза Н 0 справедлива. 4) По таблицекритических точек распределения c2 при заданном уровне значимости a и числе степеней свободы n находим c2табл. Число степеней свободы n определяется формулой n = k – r – 1, где k - число интервалов, r - число параметров гипотетической функции распределения F(x). 5) Если c2набл < c2табл, то гипотеза H 0 (основная гипотеза) принимается, если c2набл ³ c2табл, то нулевую гипотезу отвергают. Заметим, что объем выборки должен быть достаточно велик (n ³ 50), каждый разряд должен содержатьне менее 5-8 значений выборки. Алгоритм проверки гипотезы Н 0 с помощью других статистических критериев аналогичен, только вместо (11) применяют другие статистики.
Не нашли, что искали? Воспользуйтесь поиском:
|