ТОР 5 статей: Методические подходы к анализу финансового состояния предприятия Проблема периодизации русской литературы ХХ века. Краткая характеристика второй половины ХХ века Характеристика шлифовальных кругов и ее маркировка Служебные части речи. Предлог. Союз. Частицы КАТЕГОРИИ:
|
ГРУППИРОВКА СТАТИСТИЧЕСКИХ ДАННЫХ
В результате проведения статистического наблюдения получают данные о признаках каждой обследованной единицы статистической совокупности. Однако эти массивы данных собирают не для того, чтобы получить характеристики каждого отдельного элемента совокупности, а для того, чтобы получить характеристики совокупности в целом. Для этого необходимо обобщить и систематизировать сведения, полученные в ходе статистического наблюдения. В статистической практике этот этап статистического исследования называют группировкой. Группировка представляет собой разбиение совокупности на группы, однородные по какому-либо признаку. Группировка основывается на группировочном признаке и интервале, который представляет собой промежуток между минимальным и максимальным значением признака в группе. Интервалы могут быть равными и неравными, открытыми и закрытыми. Под закрытым интервалом понимают интервал, имеющий как нижнюю, так и верхнюю границу, например (100;200)). Под открытым интервалом понимают интервал, одна из границ которого равна (например, свыше 500). При определении числа групп и величины интервалов следует иметь в виду, что число объектов в выделенных группах должно быть достаточным, чтобы характеристики, рассчитанные для отдельных групп, были статистически достоверными.
Рекомендации по выбору числа групп k приведены в таблице
Число групп также можно определить по формуле Наличие равных интервалов облегчает вычисление различных статистических характеристик. Величина интервала вычисляется по формуле , где x max − максимальное значение признака в исследуемой совокупности; x min − минимальное значение признака в исследуемой совокупности. Затем определяются границы каждого интервала: для первого интервала: от x min до x min +D; для второго интервала: от x min+D до x min +2D; …………. для k -го интервала: от x min+(k -1)D до x max.
Существуют 4 типа группировок: типологическая, структурная, аналитическая и комбинационная. Типологическая группировка служит для исследования распределения совокупности по какому-либо одному качественному признаку (цвет, тип упаковки товара и т.п.). Структурная группировка служит для исследования распределения совокупности по одному количественному признаку. Ее результаты представляются в виде таблицы
Аналитическая группировка служит для выявления зависимости между признаками. При этом выделяют признак-фактор и признак-результат. Группировка осуществляется по признаку-фактору. В каждой группе рассчитывается среднее значение признака-результата. Анализируя изменение средних значений признака-результата от группы к группе, можно сделать вывод о наличии или отсутствии взаимосвязи между признаками. Различие групповых средних позволяет утверждать, что признаки взаимозависимы. Если изменение величины признака-фактора в определенном направлении вызывает изменение признака-результата в том же направлении, то говорят, что связь положительная, а в противном случае − отрицательная. Результаты аналитической группировки представляются в виде таблицы
Проследить зависимость между признаками можно также на основе комбинационной группировки, которая осуществляется одновременно по двум признакам.
Здесь ni j− количество случаев совместного появления i-й градации признака-фактора (i = 1,…,k) и j-й градации признака-результата (j = 1,…,m). Если наибольшие числа каждой строки и каждого столбца располагаются вдоль "главной диагонали" таблицы, то можно сделать вывод, что связь положительная и близкая к линейной. Если наибольшие числа располагаются вдоль другой диагонали таблицы, то можно сделать вывод, что связь отрицательная и близкая к линейной. Если числа во всех клетках примерно одинаковые, то связи между признаками нет.
Пример 1. Собраны данные о численности работников на 30 предприятиях сферы торговли.
Провести структурную группировку этих предприятий по признаку численности работников. В данной ситуации признак принимает ограниченное число целых значений. Поэтому нет необходимости вводить интервалы, а просто подсчитать количество предприятий, где число работников равно 10, 11, 12 и т.д. Например, только одно предприятие имеет 10 работников, а 11 работников имеется на 3-х предприятиях. Результаты таких расчетов приведены в таблице
Пример 2. Имеются данные о средней недельной заработной плате на 30 предприятиях (тыс. руб.)
Заметим, что максимальная заработная плата (xmax) равна 11,8 т.р., а минимальная (xmin) равна 5,6 т.р. В соответствии с приведенными выше рекомендациями выберем число групп (k) равным 5. Тогда Рассчитаем границы всех интервалов. Для первого интервала: от 5,6 до 5,6+1,24=6,84 Для второго интервала: от 6,84 до 6,84+1,24=8,08 Для третьего интервала: от 8,08 до 8,08+1,24=9,32 Для четвертого интервала: от 9,32 до 9,32+1,24=10,56 Для пятого интервала: от 10,56 до 10,56+1,24=11,8 В первый интервал (от 5,6 до 6,84) попадают предприятия с номерами 3, 6, 7, 8, 12, 16, 22 (всего 7 предприятий). Проделывая аналогичные расчеты для других интервалов, окончательно получим результаты, приведенные в таблице.
Пример 3. В таблице приведены данные о численности работников и объемах выпуска продукции на 1 человека по 16 предприятиям.
Выполним аналитическую группировку, считая число работников признаком - фактором, а объем выпуска продукции – признаком - результатом. Зададим число групп (k), равным 3. Заметим, что Тогда
Рассчитаем границы интервалов. Для первого интервала: от 365 до 365+3072=3437 Для второго интервала: от 3437 до 3437+3072=6509 Для третьего интервала: от 6509 до 6509+3072=9581 Заметим, что в первый интервал попадут предприятия с номерами 1, 2, 3, 4, 5, 9, 10, 11, 12, 13, 14 (всего 11 предприятий). Рассчитаем по этим предприятиям среднее значение признака - результата
Во второй интервал попадут предприятия с номерами 8, 15, 16 (всего 3 предприятия). Среднее значение признака – результата для этих предприятий составит
В третий интервал попадут предприятия с номерами 6 и 7. Среднее значение признака – результата для этих предприятий составит
Полученные результаты расчетов сведены в таблицу аналитической группировки
Анализ полученных результатов показывает, что среднее значение объема выпуска продукции на 1 человека устойчиво растет от группы к группе, а следовательно между количеством работников и объемом выпуска продукции на 1 человека имеется положительная связь. Для проведения комбинационной группировки рассчитаем интервалы для признака – результата. Зададим число групп (m), равным 3. Заметим, что , . Тогда Рассчитаем границы интервалов. Для первого интервала: от 31,8 до 31,8+22,1=53,9 Для второго интервала: от 53,9 до 53,9+22,1=76,0 Для третьего интервала: от 76,0 до 98,0
Результаты комбинационной группировки представлены в таблице
Из данной таблицы видно, что наибольшие значения каждого столбца и каждой строки лежат на главной диагонали. Поэтому можно сделать вывод о положительной связи между численностью работников предприятия и объемом выпуска продукции на 1 работника.
Задание 1 В табл. 1 приведены 5 показателей деятельности 30 торговых предприятий. В соответствии с номером варианта выберите номера 2-х показателей
На основании имеющихся данных выполнить: 1. Структурную группировку по второму показателям, приняв число групп, равным 5. 2. Аналитическую группировку, считая первый показатель признаком-фактором, а второй – признаком-результатом, при числе групп, равном 5 3. Комбинационную группировку при числе групп по обоим признакам, равным 3.
Т а б л и ц а 1. Показатели деятельности торговых предприятий за год Не нашли, что искали? Воспользуйтесь поиском:
|