Распределение совокупности на группы, однородные в том или ином отношении, связано с такими действиями, как систематиза­ция, типология, классификация, группировка. Традиционно такое распределение выполняют по следующей схеме: из множества признаков, описывающих явление, выбирают группировочные, а затем совокупность делят на группы и подгруппы в соответствии со значениями этих признаков.

В каждом конкретном исследовании решаются три вопроса:

1) что взять за основу группировки;

2) сколько групп, позиций необходимо выделить;

3) как разделить группы.

Основой группировки может быть любой атрибутивный или ко­личественный признак, имеющий градации.

Промежуток изменений (область существования) признака статистической совокупности

(R=хmах - xmin)

принято называть размахом вариации. Совокупность значений признака статисти­ческой совокупности, принадлежащих отдельному промежутку, принято называть группой Ориентировочно оптимальное коли­чество групп определяется формулой, рекомендованной амери­канским статистиком Стерджессом:

K=1+3.322LgN

где К - число групп (интервалов); N - объем статистической со­вокупности.

Формула Стерджесса пригодна при условии, что рас­пределение единиц совокупности по данному признаку приближа­ется к нормальному, и при этом применяются равные интервалы в группах. Чтобы получить группы, адекватные действительности, необходимо руководствоваться сущностью изучаемого явления (процесса).

Интервалы представляют собой каркас группировки. На прак­тике их образовывают, придерживаясь трех формальных при­нципов: равности интервалов, кратности интервалов, равности частот. Количество групп и величина интервала связаны между собой: чем больше образовано групп, тем меньше ин­тервал, и наоборот. Количество групп зависит от числа единиц обследуемого объекта и степени колеблемости группировочного признака.

Интервалы могут быть равные и неравные . Неравные интер­валы используются, если диапазон вариации признака слишком широкий и распределение значений неравномерно. Формируются они на основе принципа кратности, когда ширина каждого последу­ющего интервала в к раз больше (меньше) предыдущего. Равные интервалы целесообразно применять в тех случаях, когда вариа­ция проявляется в сравнительно узких границах и распределение является практически равномерным. Для группировок с равными интервалами величина интервала

Сравнимость статистических группировок. Вторичная группировка

Иногда возникает необходимость проведения вторичных группировок - образования новых групп на основе ранее осу­ществленной группировки. Такая необходимость может возник­нуть, если имеющиеся группировки не удовлетворяют требова­ниям проводимого анализа (несопоставимы из-за разного числа выделенных групп или неодинаковых границ интервалов). Полу­чение новых групп на основе имеющихся возможно двумя спосо­бами перегруппировки: объединением первоначальных интерва­лов (путем их укрупнения) и долевой перегруппировки (на основе закрепления за каждой группой определенной доли единиц сово­купности).

Пример:

Таблица 2 – Распределение сотрудников предприятия ив уровню дохода

Произведем перегруппировку данных, образовав новые труппы с интервалами до5, 5-10,10-20,20-30, свыше 30 тыс. руб. В первую новую группу войдет полностью первая группа сотрудников и часть второй группы. Чтобы образовать группу до 5 тыс. руб., необходимо от интервала группы взять 1,0 тыс. руб. Величина интервала этой группы составляет 6,0 тыс. руб. Следовательно, необходимо взять от нее 1/6 (1,0:6,0) часть. Аналогичную же часть надо взять от числа работников, т.е. . В первой группе число работающих: 16+3=20 человек. Вторую новую группу образуют работающие второй группы за вычетом отнесенных к первой, то есть 20-3=17-чел. Во вновь образованную третью группу войдут все со­трудники третьей группы и часть сотрудников, четвертой. Для определения этой части от интервала 18-30 (ширина интервала равна 12) нужно добавить к предыдущему 2,0 (чтобы верхняя граница интервала была равна 2,0 тыс. руб.). Следовательно, необходимо, взять часть интервала, равную . В этой группе 74 человека, значит надо взять 74х(1:6)=12 чел. В новую третью группу войдут 44+12 = 56 чел. Во вновь образованную четвертую группу войдут 74-12= 62 чел., оставшихся от прежней четвертой группы. Пятую вновь образованную группу составят работающие пятой и шестой прежних групп: 37+9 = 46 чел. В результате получим следующие новые группы:

Таблица 3 – Новая группировка

4 Закрепление знаний _______

1 В чем заключается процесс группировки

2 Перечислите и охарактеризуйте основные виды группировок

3 Интервал. Виды и формула

4 Формула Стерджесса

5 Перегруппировка

5 Выдача домашнего задания ______

Повторить пройденный материал

Подведение итогов занятия


План занятия №(7) 4

по учебной дисциплине «Статистика»

Группа Дата
Э2-1
Зм2-5

Тема занятия Проведение сводки статистических данных. Группировка и перегруппировка данных

Метод группировок.

Тип занятия урок совершенствования знаний

Вид занятия урок-практическая работа №1

Дидактические цели

Образовательные

знают понятие группировки, виды, цели и задачи, порядок проведения группировки, умеют проводить группировку, перегруппировку статистических данных

Развивающие

классифицируют различные виды группировок, формулируют выводы по результатам проведенной группировки

Воспитывающие

содействуют формированию профессиональной культуры.

Межпредметные связи:

Обеспечивающие дисциплины: АФХД

Обеспечиваемые дисциплины: математика

Методы обучения: практического обучения

Методическое обеспечение занятия: раздаточный материал

Литература:

1 Н.В. Толстик Статистика

2 Е.М. Ефимова Статистика

ХОД УЧЕБНОГО ЗАНЯТИЯ

Организационный момент

Работа с журналом, рапортичкой, проверка готовности группы к уроку

Изучение нового материала

1 Группировка - это процесс образования однородных групп на основе расчленения статистической совокупности на части или объединения изучаемых единиц в частные совокупности по существенным для них признакам.

Признаки, по которым производится распределение единиц наблюдаемой совокупности на группы, называютсягруппировочными признаками.

Классификация группировок:

Структурная группировка характеризует состав однород­ной совокупности по определенным признакам. Например, состав населения региона по месту проживания, по размеру среднедушевого дохода, группировка хозяйств по объему выпущенной продук­ции, структура депозитов по срокам их привлечения.

Типологическая группировка - это распределение качес­твенно неоднородных совокупностей на классы, социально-эко­номические типы, однородные группы. Примером может служить группировка сек­торов экономики, хозяйствующих субъектов по формам собственности: государственная, федеральная, муниципальная, частная, смешанная.

Аналитические группировки предназначены для выявления зависимости между признаками.

Основой группировки может быть любой атрибутивный или ко­личественный признак.

Совокупность значений признака статисти­ческой совокупности, принадлежащих отдельному промежутку, принято называть группой. Ориентировочно оптимальное коли­чество групп определяется формулой, рекомендованной амери­канским статистиком Стерджессом:

K=1+3.322LgN (1)

где К - число групп (интервалов);

N - объем статистической со­вокупности.

Интервалы представляют собой каркас группировки. Количество групп и величина интервала связаны между собой: чем больше образовано групп, тем меньше ин­тервал, и наоборот. Количество групп зависит от числа единиц обследуемого объекта и степени колеблемости группировочного признака.

Интервалы групп могут быть закрытыми (когда указана ниж­няя и верхняя границы) и открытыми (когда указана только одна граница - верхняя или нижняя).

где х min , max – минимальное и максимальное значение признака

n – число групп

h – щаг интервала

Задача 1

Произведите группировку 30 магазинов одного из регионов РФ на 1.01.05, применяя метод группировок.

Таблица 1 – Исходные данные

Среднесписочная численность, чел. Товарооборот, млн. руб.

Решение :

Вкачестве группировочного признака выбираем товарооборот.

Теперь необходимо образовать 4 группы с равными интервалами. Величина интервала определяется по формуле:

где h - шаг интервала

n - число групп

Обозначим границы групп:

2100-7350 – 1-ая группа (2100+5250)

7350-12600 – 2-я группа (7350+5250)

12600-17850 – 3-ая группа (17850+5250)

17850-23100 – 4-ая группа (17850+5250)

После того, как определено число групп и группировочный признак, необходимо определить показатели, которые характеризуют группы и их величины. Показатели разноситься по группам и подсчитываются итоги.

Таблица 2 – Группировка магазинов по величине товарооборота

Таблица 3 – Группировка магазинов по величине товарооборота (% к итогу)

Вывод : из таблицы 3 видно, что преобладает группа с товарооборотом в интервале 2100-7350 – 60%.

Провести группировку коммерческих банков одного из регионов РФ на 1.01.06

Таблица 4 – Исходные данные

Номер банка Капитал Рабочие активы Уставный капитал
207,7 2,48 1,14
200,3 2,40 1,10
190,2 2,28 1,05
323,0 3,88 1,88
247,1 2,96 1,36
177,7 2,12 0,97
242,5 2,90 1,33
182,9 2,18 0,99
315,6 3,78 1,73
183,2 2,20 1,01
320,2 3,84 1,76
207,3 2,48 1,14
181,0 2,17 0,99
172,4 2,06 0,94
234,3 2,81 1,29
189,5 2,27 1,04
187,7 2,24 1,03
166,9 1,99 0,91
157,7 1,88 0,86
168,3 2,02 0,93
224,4 2,69 1,23
166,5 1,99 0,91
198,5 2,38 1,09
240,4 2,88 1,32
229,3 2,75 1,26
175,2 2,10 0,96
156,8 1,87 0,86
160,1 1,92 0,88
178,7 2,14 0,98
171,6 2,05 0,94

Решение:

В качестве группировочного признака возьмем капитал банка.

Образуем четыре группы банков с разными интервалами. Величину интервала определяем по формуле:

где h - шаг интервала

х max , x min – минимальное и максимальное значение группировочного признака

n - число групп

Теперь обозначим границы групп:

1 – я группа 156,0-197,8
2 – я группа 1297,8-239,6
3 – я группа 239,6-281,4
4 – я группа 281,4-323,2

После того, как определен группировочный признак – капитал, шаг интервала и образованы группы, мы определим показатели, которые характеризуют группы и их величины по каждой группе.

Таблица 5 –– Группировка коммерческих банков по величине капитала

Группы банков по величине капитала Число банков Капитал Активы Работающие активы
156,0-197,8 2699,5 35,48 16,25
197,8-239,6 1501,8 17,99 8,25
239,6-281,4 730,0 8,74 4,01
281,4-323,2 958,8 11,5 5,37
Итого 6157,1 73,71 33,88

Структурная группировка коммерческих банков будет иметь вид:

Таблица 6 – Группировка коммерческих банков по величине каритала (% к итогу)

Группы банков по величине капитала Число банков, % к итогу Капитал,% к итогу Активы, % к итогу Работающие активы, % к итогу
156,0-197,8 56,7 48,2 48,1 48,0
197,8-239,6 23,3 24,4 24,4 24,3
239,6-281,4 10,0 11,9 11,9 11,8
281,4-323,2 10,0 15,5 15,6 15,9
Итого

Вывод:

Из таблицы 6 видно, что в основном преобладают мелкие банки – 56,7 %, на их долю приходится 48,2% капитала. Крупные и средние банки занимают по 10%, доля их капитала составила 15,5 и 11,9 % соответственно.

Закрепление знаний

1 В чем состоит значение метода группировок в анализе статистических данных?

2 Что представляет собой группировка?

3 Виды группировок

4 Охарактеризуйте каждый вид группировки

5 Понятие интервала

6 Виды интервалов

7 Формула интервала

4 Выдача домашнего задания

Записать в тетрадь примеры количественных и качественных признаков, которые могут быть положены в основание группировки для предприятия (3-5 примеров)

Доделать практическую работу

Аналитическая группировка

Аналитические – такие группировки, которые применяются для исследования взаимосвязей между явлениями. Для проведения аналитической группировки нужно определить факторный и результативный признак.

Факторные – это те признаки, которые оказывают влияние на другие связанные с ними признаки.

Результативные – это признаки, которые изменяются под влиянием факторных.

Аналитические группировки позволяют изучить многообразие связей и зависимостей между варьирующими признаками. Чтобы исследовать взаимосвязь между признаками, производится группировка единиц совокупности по факторному признаку. В каждой группе вычисляется среднее значение результативного признака. Изменение признака от группы к группе под влиянием факторного будет говорить о наличии или отсутствии связи между факторами.


Группировки, построенные за один и тот же период времени, но для разных регионов или, наоборот, для одного региона, но за два разных периода, могут оказаться несопоставимыми из-за различного числа групп или неодинаковости границ интервалов. Для того, чтобы привести такие группировки к сопоставимому виду (это позволяет провести их сравнительный анализ), используется метод вторичной группировки.

Вторичная группировка – операция по образованию новых групп на основе ранее осуществленной группировки.

Применяют два способа образования новых групп. Первым, наиболее простым и распространенным способом является объединение первоначальных интервалов. Он используется в случае перехода от мелких к более крупным интервалам и когда границы новых и старых интервалов совпадают. Второй способ получил название долевой перегруппировки и состоит в образовании новых групп на основе закрепления за каждой группой определенной доли единиц совокупности. Этот способ употребляется, когда необходимо в ходе перегруппировки данных определить, какая часть (доля) единиц совокупности перейдет из старых групп в новые.

Рассмотрим первый способ проведения вторичной группировки.

Пример1 Пусть даны две группировки кредитов по сроку выдачи за ноябрь и декабрь (таблица 3.1, таблица 3.2).

Таблица 3.1руппировка кредитов коммерческих банков по сроку выдачи, ноябрь 2011 г. (данные условные)



Таблица 3.2 – Группировка кредитов коммерческих банков по сроку выдачи, декабрь 2011г. (данные условные)

Для удобства сравнения группировки ноябрьских и декабрьских кредитов произведем вторичную группировку ноябрьских кредитов, приняв за основу группировку декабрьских кредитов. Составим таблицу 3.3.

Таблица 3.3 – Группировка кредитов коммерческих банков по сроку выдачи, ноябрь-декабрь 2011 г. (данные условные)

Теперь можно сравнить группировки ноябрьских и декабрьских кредитов. Доля заключенных договоров по краткосрочным кредитам снизилась почти на 11 процентных пунктов, доля среднесрочных кредитов осталась без изменения, а количество долгосрочных кредитов в анализируемом периоде значительно выросло. Несмотря на эти изменения, в декабре так же, как и в ноябре, в структуре суммы выданных кредитов преобладающую долю занимали краткосрочные кредиты, затем следовали среднесрочные, а на последнем месте – долгосрочные кредиты. Для решения данного примера использовали метод объединения первоначальных интервалов.

Пример2 Имеются данные о структуре колхозов по числу дворов. Исходные данные не позволяют произвести сравнительный анализ структуры, так как в разных районах имеется разное число групп.

Структура колхозов по числу дворов

1 район 2 район
№ группы Уд. вес колхозов, % № группы Группы колхозов по числу дворов Уд. вес колхозов, %
До 100 4,3 До 50 1,0
100-200 18,3 50-70 1,0
200-300 19,5 70-100 2,0
300-500 28,2 100-150 10,0
свыше 500 29,7 150-250 18,0
250-400 21,0
400-500 23,0
свыше 500 24,0
ИТОГО 100,0 100,0

Проведем вторичную группировку колхозов второго района, приняв за основу группировку первого района, используя метод долевой перегруппировки (таблица 3.5).Таблица 3.5 – Вторичная группировка

Поясним расчеты. В первую, вновь образованную группу колхозов второго района с числом дворов до 100 войдут первые три группы колхозов, удельный вес которых равен 4% (1+1+2).Теперь надо образовать вторую группу колхозов с числом дворов от 100 до 200. В нее входит четвертая группа колхозов с числом дворов от 100 до 150, составляющая 10% общего числа колхозов, а также часть пятой группы, из которой должны перейти 50 дворов. Для определения числа колхозов, которые надо взять из пятой группы во вновь образованную, условно принимается, что оно должно быть пропорционально удельному весу отобранных дворов. Удельный вес 50 дворов в пятой группе равен: , или 50%.

Следовательно, в новую группу надо взять половину колхозов из пятой группы: .

Таким образом, удельный вес колхозов новой группы с числом дворов 100–200 составит 19% (10+9).

При формировании группы колхозов с числом дворов 200 – 300 видно, что в нее войдет часть пятой группы с удельным весом колхозов 9% и часть шестой группы, из которой надо добавить в третью группу 50 дворов, пропорционально которым должно быть отобрано из этой группы 7% колхозов: .Тогда группа колхозов с числом дворов 200–300 составит 16% (9+7).

Аналогично производится расчет при образовании других групп. Если наряду с удельными весами имеются абсолютные значения показателей по группам, то все расчеты показателей по вновь образованным группам ведутся в тех же соотношениях, что и численность распределения единиц. Таким образом, сравнивая оба района по числу дворов в колхозах, видно, что во втором районе оно было более дифференцировано, чем в первом районе.

Вопрос 10. Вторичная группировка, методы ее проведения.

Группировка - это расчленение изучаемой статистической совокупности на части по одному или нескольким группировочным признакам. Правильно проведенная группировка в значительной мере обеспечивает достоверность всего статистического исследования.

Первичная группировка производится на основе сортировки первичных исходных данных.

Группировки, построенные за один и тот же период времени, но для разных регионов или, наоборот, для одного региона, но за два разных периода времени, могут оказаться несопоставимыми из-за различного числа выделенных групп или неодинаковости границ интервалов. В таком случае необходима перегруппировка данных с помощью вторичной группировки.

Вторичная группировка - операция по образованию новых групп на основе ранее осуществленной группировки.

Применяют два способа образования новых групп.

1. наиболее простой и распространенный способ - изменение (чаще укрупнение) первоначальных интервалов.

2. Д олевая перегруппировка - способ состоит в образовании новых групп на основе закрепления за каждой группой определенной доли единиц совокупности.

Пример. Необходимо провести перегруппировку данных, образовав новые группы с интервалами до 500, 500 - 1000,1000 - 2000, 2000 - 3000, свыше 3000 руб. по данным о распределении контрактов строительной фирмы по величине прибыли.

Таблица. Распределение контрактов строительной фирмы по величине прибыли¹

В первую новую группу войдет полностью 1-я группа контрактов и часть 2-й группы. Чтобы образовать группу до 500 тыс. руб., необходимо от интервала 2-й группы взять 100 тыс. руб. Величина интервала этой группы составит 600 тыс. руб. Следовательно, необходимо взять от нее 1/6 (100: 600).Аналогичную же часть во вновь образуемую новую группу надо взять и от числа контрактов, т. е. 20 1/6 - 3 контракта. Тогда в 1-й группе будет контрактов 16 + 3 = 19 контрактов. Вторую новую группу образуют контракты 2-й группы за вычетом отнесенных к 1-й, т. е, 20 - 3 = 17 ед. Во вновь образованную третью группу войдут все контракты 3-й группы и часть контрактов 4-й. Для определения этой части от интервала 1800 -3000 (ширина интервала равна 1200 тыс. руб.) нужно добавить к предыдущему 200 тыс. руб. (чтобы верхняя граница интервала была равна 2000 руб.). Следовательно, необходимо взять часть интервала, равную 200:1200, т. е. 1/6. В этой группе 74 контракта, значит, надо взять 74 ¦ (1: 6) = 12 ед. В третью новую группу войдет: 44 Н-12 - 56 контрактов. Во вновь образованную четвертую группу войдет: 74 - 12 =62 контракта, оставшихся от прежней 4-й группы. Пятую, вновь образованную группу составят контракты 5-й и б-й прежних групп: 37 + 9 = 46 контрактов. Техника перегруппировки показана в таблице.

При анализе и сопоставлении нескольких группировок, например по нескольким цехам, предприятиям и т.д., может возникнуть ситуация когда исходные группировки несопоставимы из-за различного числа групп или разной величины используемых интервалов. Чтобы такие группировки привести в сопоставимый вид, т.е. либо к одному числу групп, либо к одной величине интервала, используется метод вторичной группировки. Метод вторичной группировки – это метод образования новых групп на основании имеющихся по заданным требованиям группировки. Для проведения вторичной группировки используются 2 способа: 1) объединение первоначальных групп, 2) долевая перегруппировка.

Приведение нескольких несопоставимых группировок в сопоставимой вид осуществляется в три этапа. На первом этапе осуществляется анализ исходных группировок на предмет выявления условий несопоставимости исходных группировок. На втором этапе выбирается способ приведения исходных группировок в сопоставимый вид. На третьем этапе осуществляется вторичная перегруппировка исходных группировок и анализ полученных результатов. При необходимости осуществляется повторная перегруппировка. Рассмотрим способы вторичной перегруппировки.

1 способ Статистическое наблюдение о распределении рабочих предприятия по стажу работы в 2000 году дало следующие результаты (табл.2.7).

Таблица 2.7

В 2002 году была проведено повторное статистическое наблюдение, которое дало следующие результаты (табл.2.8). Оценить изменения в распределении рабочих по стажу за 2 года непосредственно по данным обеих таблиц невозможно. Анализ обеих таблиц показывает, что они несовместны из-за разного числа групп и разной величины интервала.

Таблица 2.8

Чтобы привести данные обеих таблиц к сопоставимому виду можно в таблице 2.7 объединить как 1 и 2 группы, так и 3 и 4 группы. Это даст возможность оценить изменения в распределении рабочих по стажу, которые произошли на предприятии за два года. Результаты перегруппировки данных статистического наблюдения за 2000год (табл.2.7) приведены в таблице 2.9.

Таблица 2.9

Сравнивая данные за 2002 год (табл.2.8) с перегруппированными данными за 2000 год (табл.2.9) можно сделать вывод: за два года уменьшилось число рабочих со стажем до 6 лет, т.е. молодых, и увеличилось число рабочих с большим стажем.

2 способ Пусть статистическое наблюдение в 2002 году дало такие результаты (табл.2.10). Сравнивая данные за 2000 год (табл.2.9) и данные за 2002 год (табл. 2.7) можно сделать вывод о их несовместности из-за разного числа групп и разной величины интервала. Анализ показывает, что применение 1 способа приведения данных к сопоставимому виду невозможно. Поэтому используем 2 способ для перегруппировки данных за 2000 год (табл.2.7) таким образом, чтобы они соответствовали группировке данных за 2002 год (табл.2.10)

Таблица 2.10

Применение второго способа предполагает равномерное распределение частот внутри каждой группы. Это является непременным условием использования второго способа. Для перегруппировки данных за 2000 год (табл.2.7)сделаем следующие расчеты. Так в новую первую группу (1-4) (табл.2.10) войдут все данные старой первой группы (1-3) (табл.22.7) и данные о количестве рабочих, имеющих стаж 4 года из старой второй группы. Число рабочих, имеющих стаж 4 года, равен 3 (9/3=3, так как в старой второй группе было 9 рабочих, а интервал равен 3). Таким образом, новая первая группа (1-4) будет включать 18 рабочих (18=15+3)Вторая новая группа (5-8) будет включать 6 рабочих, имеющих стаж 5, 6 лет (из старой второй группы 6=9/3·2) и 18 рабочих, имеющих стаж 7, 8 лет (из старой третьей группы 18=27/3·2) Таким образом, новая вторая группа (5-8) будет включать 24 рабочих (24=6+18). В новую третью группу (9-12) войдут рабочие, имеющие стаж 9 лет (9=27/3) и все 9 рабочих из старой четвертой группы (10-12). Таким образом, в новой третьей группе (9-12) будет 18 рабочих (18=9+9). Перегруппированные данные за 2000год и данные за 2002 год сведем в одну таблицу(2.11), что позволит осуществить сравнительный анализ.

Таблица 2.11

Анализ распределения рабочих предприятия по стажу (табл.2.11) показывает, что в 2002 году число рабочих с большим стажем (от 9 до 12 лет) увеличилось, а с меньшим стажем (от 1 до 8 лет) – уменьшилось. Таким образом, перегруппировка данных позволила привести данные в сопоставимый вид, провести анализ и сделать необходимые выводы.

Контрольные вопросы и задания

1.Что такое статистическое наблюдение? Какие условия должны быть реализованы при проведении статистического наблюдения (смотрите определение)?

2. По каким признакам можно классифицировать статистические наблюдения? Приведите примеры статистического наблюдения.

3. Какие ошибки возникают при проведении статистических наблюдений и какие методы контроля могут быть использованы?

4. Определите в каком примере дана простая, а в каком сложная сводка. Пример 1. В понедельник в ткацком цехе работало 200 работниц. Пример 2. В понедельник в ткацком цехе на участке №1 работало 40 работниц, на участке №2 – 60 работниц, а всего работало 100 работниц.

5. Какие группировки используются при обработке статистической информации? Чем они разнятся между собой?

6. В отделе главного технолога работает 15 человек, а в отделе маркетинга и сбыта 10 человек. В каком случае коллективы отделов являются однородными совокупностями, а в каком случае –неоднородными совокупностями.

7. Ежедневная реализация ткани артикула А в магазине Ткани в октябре месяце характеризовалась следующими данными (в метрах): 4, 11, 8, 14, 10, 19, 12, 11, 3, 6, 21, 9, 9, 5, 10, 13, 15, 7, 10, 13, 16, 12, 8, 11, 14, 15, 17. Осуществить группировку данных, используя равные интервалы.

8. Перегруппировать результаты группировки данных из пункта 7 в следующие группы: (3-9), (9-15), 15-21).

Тема № 3 СТАТИСТИЧЕСКИЕ РЯДЫ РАСПРЕДЕЛЕНИЯ, ТАБЛИЦЫ, ГРАФИКА

3.1 Статистические ряды распределения – понятие, виды, формы представления

Одной из форм представления данных статистического наблюдения является статистический ряд распределения. Статистический ряд распределения – это упорядоченное расположение единиц совокупности на группы по группировочному признаку. С помощью статистических рядов распределения возможно изучение структуры и границ изменения совокупности, оценка однородности и определение закономерности развития единицсовокупности. По виду статистические ряды распределения подразделяются на атрибутивные, вариационные и временные ряды.

Атрибутивные и вариационные ряды состоят из двух элементов: варианты и частоты (частости или плотности). Варианта () – это конкретное значение признака, которое он принимает в ряду распределения. Частота () – это абсолютное число, показывающее, сколько раз (как часто) встречается в совокупности то или иное значение признака (варианта) или сколько единиц совокупности обладают тем или иным значением признака (вариантой). Частость () – это относительная величина, определяющая долю отдельных вариант в общем объеме совокупности (). Частость может быть выражена либо в долях, в этом случае объем совокупности равен единице (), либо в процентах, этом случае объем совокупности равен 100% (). В целом частость рассчитывается следующим образом

где - объем совокупности.

Плотность () - это относительная величина, показывающая, сколько единиц совокупности (в абсолютной или относительной форме) приходится на единицу длины интервала группы (). Плотность может быть абсолютной или относительной. Абсолюная плотность равна

Относительная плотность равна

При расчете относительной плотности используется частость, выраженная в долях.

Атрибутивный ряд – это ряд, построенный на основе качественного признака совокупности. Данные ряды строятся с помощью типологической группировки и могут быть выражены в виде таблицы. Например, распределение рабочих предприятия по тарифным разрядам (табл.3.1).

Таблица 3.1

В приведенном примере (табл.3.1) совокупностью являются все рабочие предприятия. Объем совокупности равен 250 человекам. Единицей совокупности является один рабочий. В качестве признака единицы совокупности выбран тарифный разряд. Признак имеет несколько конкретных значений – вариант (1 разряд, 2 разряд, 3 разряд, 4 разряд, 5 разряд). В таблице значения признака приведены в графе 2, значения частот в графе 3, значение частости в графе 4.

Вариационный ряд – это ряд, построенный на основе количественного признака совокупности. Данные ряды строятся, в основном, с помощью структурной группировки и могут быть выражены в виде таблицы. Вариационные ряды бывают двух типов: дискретные вариационный ряды и интервальные. Дискретный вариационный ряд – это ряд, в котором значения признака (варианты) представлены дискретными величинами . Интервальный вариационный ряд – это ряд, в котором значения признака выражены в виде интервалов . На основе данных о ежедневном обороте 34 индивидуальных предпринимателей, приведенных на стр. , построим вариационный интервальный ряд (табл.3.2)

Таблица 3.2

В графе 3 приведена частота – количество предпринимателей, однодневный оборот которых попадает в определенный интервал (гр.2). В графе 4 рассчитана частость в процентах по формуле 3.1. Так частость для первой группы (3,1 – 3,9) будет равна

Аналогичным образом рассчитывается частость и для других групп. В графе 5 приведена частость в долях. Она может быть получена либо путем расчета

либо путем преобразования процентов в доли . При расчетах данные в десятичной форме нужно показывать с точность до 3 знаков после запятой. Это повышает точность расчетов и получение соответствующих итоговых данных. Так сумма частостей в процентах должна быть равна 100%, а в долях – равна 1.

В графе 6 таблицы 3.2 приведены значения абсолютной плотности. Расчет выполнен по формуле 3.2. Так для первой группы абсолютная плотность будет равна

Если частота () взята из графы 3, то величина интервала () определена как разность между верхней границей (3,9) и нижней границей (3,1) интервала первой группы, т.о. . Аналогичным образом рассчитывается абсолютная плотность для других групп. После выполнения расчетов необходимо дать им экономическую интерпретацию. Так, например, абсолютная плотность первой группы говорит о том, что на каждую тысячу руб. оборота в первой группе приходится 5 предпринимателей.

В графе 7 таблицы 3.2 приведены значения относительной плотности. Расчет выполнен по формуле 3.3. Так для первой группы относительная плотность будет равна

Аналогичным образом рассчитываются относительная плотность и для других групп. Относительная плотность первой группы говорит о том, что доля предпринимателей, приходящих на каждую тысячу оборота в первой группе, равна 0,147.

В графе 2 табл.3.3 представлен оборот в виде интервалов, а в графе 3 представлен оборот в виде дискретных величин. Для первой группы дискретная величина рассчитана следующим образом

Аналогичным образом рассчитывается оборот в виде дискретной величины и для других групп.

Часто при анализе вариационных рядов возникает потребность в понимании изменения объема совокупности при изменении (в основном в порядке возрастания) значений признака. Для этого используются такие понятия как накопленные частоты или накопленные частости. Накопленные частоты ( ) – это сумма частот сначала ряда до определенного значения признака включительно. Накопленные частости – это сумма частостей от начала ряда до определенного значения признака включительно. Рассмотрим нахождение значений этих показателей по данным табл. 3.4 В графе 6 табл. 3.4 приведены накопленные частоты. В первой группе (гр.1) 4 предпринимателя (гр.4) имели оборот от 3,1 до 3,9 тыс. руб. (гр.2) или средний оборот 3,5 тыс. руб. (гр.3). Поскольку эта первая группа, постольку и накопленная частота т.е. количество предпринимателей будет равно 4 (гр.6). Во второй группе количество предпринимателей, имеющих оборот от 3,9 до 4,7 тыс. руб. или средний оборот в 4,3 тыс руб. равно 5 чел. Отсюда накопленная частота, т.е. количество предпринимателей, имеющих оборот от 3,1 до 4,7 тыс руб. или в среднем от и менее 4, 3 тыс. руб., будет равна 9=4+5. Для третьей группы накопленная частота будет равна 16=4+5+7 и т.д. Аналогичным образом рассчитывается и накопленная частость.


Группировки, построенные за один и тот же период времени, но для разных объектов или, наоборот, для одного объекта, но за два разных периода времени могут оказаться несопоставимыми из-за различного числа выделенных групп или неодинаковости границ интервалов.
Вторичная группировка, или перегруппировка сгруппированных данных применяется для лучшей характеристики изучаемого явления (в случае, когда первоначальная группировка не позволяет четко выявить характер распределения единиц совокупности), либо для приведения к сопоставимому виду группировок с целью проведения сравнительного анализа.
Вторичная группировка - операция по образованию новых групп на основе ранее осуществленной группировки.
Применяют два способа образования новых групп. Первым, наиболее простым и распространенным способом является изменение (чаще укрупнение) первоначальных интервалов. Второй способ получил название долевой перегруппировки и состоит в образовании новых групп на основе закрепления за каждой группой определенной доли единиц совокупности. Проиллюстрируем методику вторичной группировки на следующем примере.
Пример:
Распределение сотрудников предприятия по уровню дохода

Произведем перегруппировку данных, образовав новые группы с интервалами до 5, 5-10, 10-20, 20-30, свыше 30 тыс. руб.
В первую новую группу войдет полностью первая группа сотрудников и часть второй группы. Чтобы образовать группу до 5 тыс. руб., необходимо от интервала второй группы взять 1,0 тыс. руб. Величина интервала этой группы составляет 6,0 тыс. руб. Следовательно, необходимо взять от нее 1/6 (1,0:6,0) часть. Аналогичную же часть во вновь образуемую первую группу надо взять и от численности работающих, то есть
20 х1 = 3 чел. Тогда в первой группе будет работающих: 16+3 = 19 чел.
6
Вторую новую группу образуют работающие второй группы за вычетом отнесенных к первой, то есть 20-3 = 17 чел. Во вновь образованную третью группу войдут все сотрудники третьей группы и часть сотрудников четвертой. Для определения этой части от интервала 18-30 (ширина интервала равна 12) нужно добавить к предыдущему 2,0 (чтобы верхняя граница интервала была равна 2,0 тыс. руб.). Следовательно, необходимо взять часть интервала, равную . В этой группе 74 человека, значит надо взять 74х(1:6) = 12 чел. В новую третью группу войдут 44+12 = 56 чел. Во вновь образованную четвертую группу войдут 74-12 = 62 чел., оставшихся от прежней четвертой группы. Пятую вновь образованную группу составят работающие пятой и шестой прежних групп: 37+9 = 46 чел.
В результате получим следующие новые группы:

Еще по теме Сравнимость статистических группировок. Вторичная группировка:

  1. 1.3. Статистическое наблюдение и сводка. Группировка материалов статистического наблюдения.
  2. 10.2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ И УЧЕТ В ОРГАНИЗАЦИЯХ РАЗЛИЧНЫХ ОТРАСЛЕЙ. ИНФОРМАЦИОННО-АНАЛИТИЧЕСКИЕ ВОЗМОЖНОСТИ СТАТИСТИЧЕСКОЙ ОТЧЕТНОСТИ