LINEBURG


<< Пред. стр.

страница 5
(всего 32)

ОГЛАВЛЕНИЕ

След. стр. >>

возможной вариации






Номера единиц совокупности
Значения признака
xi
Отклонения от средней
xi -x?
Модули отклонений
|xi - x?|
Квадраты отклонений
(хi - х?)2
1
2
3



n
х?п
0
0



0
х?(п - 1)
-x?
-x?


-x?
х?(п - 1)
х?
х?



х?
х?2(п - 1)2
х?2
х?2



х?2
Итого
х?п
0 (нуль)
2х?(п - 1)
х?2[(п - 1)2+(n-1)]

Исходя из выражений, стоящих в итоговой строке табл. 5.8, получаем следующие максимально возможные значения показателей вариации.
Средний модуль отклонений, или среднее линейное отклонение:


Среднее квадратическое отклонение:


Относительное модульное (линейное) отклонение:


Коэффициент вариации:



Что касается квартального расстояния, то система с максимально возможной вариацией обладает вырожденной структурой распределения признака, в которой не существуют («не работают») характеристики структуры: медиана, квартили и им подобные.
Исходя из полученных формул максимально возможных значений основных показателей вариации, прежде всего следует вывод о зависимости этих значений от объема совокупности п. Эта зависимость обобщена в табл. 5.9.
Наиболее узкие пределы изменения и слабую зависимость от численности совокупности обнаруживают средний модуль и относительное линейное отклонение. Напротив, среднее квадратическое отклонение и коэффициент вариации сильно зависят от численности единиц совокупности. Эту зависимость следует учитывать при сравнении силы интенсивности вариации в совокупностях разной численности. Если в совокупности шести предприятий коэффициент вариации объема продукции составил 0,58, а в совокупности из 20 предприятий он составил 0,72, то справедливо ли делать вывод о большей неравномерности объема продукции во второй совокупности? Ведь в первой, меньшей, он составил 0,58 : 2,24 = 25,9% максимально возможного, т.е. предельного, уровня концентрации производства в одном предприятии из шести, а во второй, большей совокупности, наблюдаемый коэффициент вариации составил только 0,72 : 4,36 = 16,5% максимально возможного.
Таблица 5.9
Предельные значения показателей вариации объемного признака при разных численностях совокупности

Численность совокупностей
Максимальные значения показателей






R
с
б
m
у
v
2

2
х?
1
х?
1
4

4
1,5 х?
1,5
1,73 х?
1,73
б

6
1,67 х?
1,67
2,24 х?
2,24
10
10х
10
1,80 х?
1,80
3 х?
3.00
20
20x
20
1,90 х?
1,90
4,36 х?
4,36
50
50х
50
1,96 х?
1,96
7 х?
7,00
100
100х
100
1,98 х?
1,98
9,95 х?
9,95
?
?
?
2 х?
2
?
?

Имеет практическое значение и такой показатель, как отношение фактического среднего модуляотклонений к предельно возможному. Так, для совокупности шести предприятий это соотношение составило: 0,47 : 1,67 = 0,281, или 28,1%. Интерпретация полученного показателя такова: для перехода от наблюдаемого распределения объема продукции между предприятиями, к равномерному распределению потребовалось бы перераспределить
, или 23,4% общего объема продукции в совокупности. Если степень фактической концентрации производства (фактическая величина у или v) составляет некоторую долю предельного значения при монополизации производства на одном предприятии, то отношение фактического показателя к предельному может характеризовать степень концентрации (или монополизации) производства.
Отношения фактических значений показателей вариации или изменения структуры к предельно возможным используются также при анализе структурных сдвигов (см. главу 11).


Рекомендуемая литература к главе 5

1. Джини К. Средние величины. - М.: Статистика, 1970.
2. Кривенкова Л. Н., Юзбашев М. М. Область существования показателей вариации и ее применение // Вестник статистики. - 1991. - №6. - С. 66-70.
3. Пасхавер И. С. Средние величины в статистике. - М.: Статистика. 1979.
4. Шураков В. В., Дайитбегов Д. М. и др. Автоматизированное рабочее место статистической обработки данных (Глава 4. Предварительная статистическая обработка данных). - М.: Финансы и статистика, 1990.































Глава 6
ГРУППИРОВКА

6.1. Значение и сущность группировки

Русский статистик Д. П. Журавский (1810 - 1856) очень точно определил статистику как «счет по категориям». Действительно, среди бесконечного разнообразия явлений мы, как правило, улавливаем наличие некоторого конечного числа групп или типов.
Лицо каждого человека неповторимо, и все-таки можно классифицировать лица по типам (скуластое, продолговатое, круглое и т.д.); предприятия образуют группы по формам собственности, характеру производимой продукции, размерам (крупные, средние, мелкие), финансовому положению; государства делятся на группы по уровню экономического развития и т.д. Примеры можно продолжить, но ясно, что какую бы совокупность мы не изучали, она всегда подразделяется на группы. Это обусловлено такими объективными свойствами явлений, как вариация, наличие частных совокупностей (см. гл. 1).
Группировка - это распределение единиц по группам в соответствии со следующим принципом: различия между единицами, отнесенными к одной группе, должны быть меньше, чем между единицами, отнесенными к разным группам.
Группировка лежит в основе всей дальнейшей работы с собранной информацией. На основе группировки рассчитываются сводные показатели по группам, появляется возможность их сравнения, анализа причин различий между группами, изучения взаимосвязей между признаками. Если рассчитать сводные показатели только в целом по совокупности, то мы не сможем уловить ее структуры, роли отдельных групп, их специфики.
Однородность (гомогенность) данных является исходным условием их статистического описания и анализа - вычисления и интерпретации обобщающих показателей, построения уравнения регрессии, измерения корреляции (см. гл. 8), статистического умозаключения (см. гл. 7)..
Таким образом, значение группировки состоит в том, что этот метод обеспечивает обобщение данных, представление их в компактном, обозримом виде. Кроме того, группировка создает основу для последующей сводки и анализа данных.
Для изучения структурных изменений в экономике государственная статистика использует группировку хозяйственных субъектов по формам собственности и организационно-правовым формам, представленную в табл. 6.1.
Сводные показатели для отдельных групп являются типичными и устойчивыми, если, во-первых, группировка проведена правильно, во-вторых, группы имеют достаточную численность. Первое условие связано с тем, что деление на группы далеко не всегда очевидно. Выполнение второго условия необходимо, так как при достаточно большом числе единиц (не менее 5 единиц в группе) в сводных показателях взаимопогашаются случайные характеристики и проявляются закономерные, типичные.
Для решения задачи группировки нужно установить правила отнесения каждой единицы к той или иной группе.
В эти правила входят определения тех характеристик (признаков), по которым будет проводиться группировка (так называемых группированных признаков), и их значений, отделяющих одну группу от другой (интервалов группировки).
Группировка называется простой (монотетической), если для ее построения используется один группировочный признак. Если группировка проводится по нескольким признакам, она называется сложной (политетической). Обычно такая группировка проводится как комбинационная, т.е. группы, выделенные по одному признаку, подразделяются на подгруппы по другому признаку. Казалось бы, этот метод выделения групп должен быть лучше простой группировки - ведь трудно ожидать, что различия между группами можно уловить лишь на основе одного признака. Однако комбинация признаков приводит к дроблению совокупности в геометрической прогрессии: число групп будет равно произведению числа группировочных признаков (l) на число выделенных категорий по каждому из них (т): k = l• т. Данные становятся труднообозримыми, группы включают малое число единиц, групповые показатели становятся ненадежными.
Альтернативой является проведение многомерных группировок или многомерных классификаций (см. п. 6.3).
Остановимся на определении интервалов группировочных признаков. Используются интервалы открытые и закрытые. В первом случае указываются верхняя и нижняя границы интервала. Например, группы предприятий по численности работников, человек: 200 - 600, 600 - 1000, 1000 - 2000. Такая запись предполагает, что единица, у которой значение признака совпадает с верхней границей интервала, относится к следующей группе, т.е. интервал читается как «от - до».
Иногда границы закрытых интервалов предполагают включение единиц с нижней и верхней границами. Например, группировка населения по возрасту, лет: 0-4,5-9,10-14,15-19,20-24, 25-29 и т.д. Интервал называется открытым, если указана либо только верхняя, либо только нижняя граница: до 200 человек или 2000 человек и более.
Закрытые интервалы подразделяются травные и неравные. Как указывалось в гл. 5, величина равного интервала находится по формуле


Неравные интервалы могут определяться как равнонстолненные. При этом совокупность разделяется на группы равного объема с числом единиц в каждой j-й группе: пj = п: т, где п - общее число единиц; т - число групп. Данные ранжируются, отсчитывается число единиц, составляющих первую группу n1, затем - вторую п2 и т.д. Границы интервалов будут соответствовать фактическим значениям признака в каждой группе.
Таблица 6.1
Организационно-правовые формы и формы собственности
хозяйственных субъектов Российской Федерации


Бывает, что число групп заранее неизвестно и определяется опытным путем на основе перебора вариантов группировки, выявления такого варианта, который наилучшим образом позволяет увидеть различия между группами.
При определении числа групп следует обращать внимание на то, чтобы в одну группу не попало бы свыше половины всех единиц совокупности и в средних группах было больше единиц, чем в крайних.
Если группировочный признак неколичественный, или количественный дискретный с малым числом значений, то группировка данных производится путем подсчета числа единиц с данным значением признака. Примером такой группировки является табл. 6.2.
Таблица 6.2
Группировка станкостроительных заводов по числу
производимых типов станков

Число типов станков

Число заводов
1

19
2

10
3

7
4

3
5 и более

1

Очевидно, что метод группировок тесно связан с представлением данных в виде групповых или комбинационных таблиц, а также с графическим представлением структуры совокупности ее частей и соотношений между ними.

6.2. Виды группировок

Группировка производится с целью установления статистических связей и закономерностей, построения описания объекта, выявления структуры изучаемой совокупности. Различия в целевом назначении группировки выражаются в существующей в отечественной статистике классификации группировок: типологические, структурные, аналитические.
Типологическая группировка служит для выделения социально-экономических типов. Этот вид группировок в значительной степени определяется представлениями экспертов о том, какие типы могут встретиться в изучаемой совокупности. Чтобы пояснить особенность этой группировки, остановимся на последовательности действий для ее проведения:
1) называются те типы явлений, которые могут быть выделены;
2) выбираются группировочные признаки, формирующие описание типов;
3) устанавливаются границы интервалов;
4) группировка оформляется в таблицу, выделенные группы (на основе комбинации группировочных признаков) объединяются в намеченные типы, и определяется численность каждого из них.
Рассмотрим пример. Поставлена задача выделить типы акционерных компаний с высокими, средними и низкими дивидендами и установить распространенность каждого типа в данном регионе.
Показатель выплаты дивидендов характеризует долю прибыли на акцию или долю чистого дохода, выплачиваемого как дивиденды.


Этот коэффициент зависит от структуры акционерного капитала фирмы, длительности существования фирмы и перспектив ее роста. Обычно молодые, быстрорастущие компании выплачивают низкие дивиденды, если вообще их выплачивают; тогда как зрелые компании стремятся дать более высокие дивиденды. Структура капитала и выплата дивидендов зависят от отраслевой принадлежности фирмы. Поэтому при классификации фирм по уровню выплаты дивидендов мы должны использовать в качестве группировочных признаков, во-первых, отрасль (подотрасль), во-вторых, показатель выплаты дивидендов.
Первый группировочный признак выполняет роль характеристики условий, второй непосредственно характеризует тип фирмы. Границы интервалов для второго группировочного признака могут изменяться при переходе от одной отрасли к другой, так как то, что для одной отрасли может рассматриваться как высокий уровень выплаты, для другой может оцениваться иначе.
Изменение границ интервалов группировочного признака при выделении одних и тех же типов в разных условиях называется специализацией интервалов группировочного признака.
Иногда условия формирования типов приводят к различиям в их описании, в самом круге признаков. Например, выделение крупных, средних, мелких предприятий в разных отраслях должно производиться по разным характеристикам: в энергоемких отраслях - по потреблению электроэнергии; в сырьеемких - по величине товарно-материальных запасов; в трудоемких — по численности рабочих; в капиталоемких - по стоимости оборудования. Изменение круга группировочных признаков при выделении одних и тех же типов в разных условиях называется специализацией группировочных признаков.
Вернемся к нашему примеру. Предположим, что мы располагаем данными 15 фирм, представляющих три подотрасли промышленности. Проведем их группировку с учетом двух выше названных признаков (табл. 6.3).
В табл. 6.3 (гр. В) для краткости использованы условные обозначения типов компаний: н - компании с низким показателем выплаты дивидендов, с - средним, в - высоким показателем выплаты.
Таблица 6.3
Группировка акционерных компаний п-гс района по уровню
выплаты дивидендов за 19_ г.

Подотрасль промышленности
Показатель выплаты дивидендов,%
Тип компании
Число
компаний
А
Б
В
Г
Производство детских игрушек
до 30
30-50
50 и выше
н
с
в
-
1
4
Производство животного масла
до 20
20 - 40
40 и выше
н
с
в
1
2
-
Производство хлопчатобумажных тканей
до 10
10 - 30
30 и выше
Н
с
в
2
4
1

Использование специализации интервалов как бы уравнивает наши оценки компаний в разных отраслях, что позволяет объединить выделенные группы в три типа независимо от отрасли (табл. 6.4). Это последний шаг типологической группировки.
Как видим, этот метод группировки позволяет избавиться от чрезмерного дробления совокупности, но он слишком субъективен: эксперт определяет, какие типы должны быть выделены, по каким признакам, какими должны быть границы интервалов. К тому же число группировочных признаков ограничено двумя-тремя. Однако, если объект исследования хорошо изучен, если имеется развитая теория, то этот метод может дать хорошо интерпретируемые результаты.
Таблица 6.4
Распределение акционерных компаний л-го района по уровню
выплаты дивидендов в 19 г.
Тип
компаний
Число компаний


абсолютное
в процентах к итогу
н
3
20,0
с
7
46,7
в
5
33.3
Итого
15
100,0

В любом случае правильность проведения типологической группировки требует проверки. С этой целью рассчитываются сводные показатели' по группам (средние, относительные величины); если различие между группами статистически незначимо (по /-критерию Стьюдента или F-критерию, или критерию /2 и т.д., см. гл. 7), то схема группировки должна быть пересмотрена - схожие группы могут быть объединены, изменены границы интервалов и т. д.
Таблица 6-5
Распределение населения Российской Федерации по
среднедушевому денежному доходу*
(%)

Среднедушевой денежный доход в месяц,
тыс. руб.
1995
1996
400 и менее
47,4
25,3
400,1 - 600,0
22,3
22,4
600,1 - 800,0
12.6
16,9
800,1 - 1000,0
7,1
11,5
1000,1 - 1200,0
4,0
7,6
1200,1 - 1600,0
3,9
8,4
1600,1 -2000,0
1.5
3,9
Свыше 2000,0
1,2
4,0
Всего
100
100
*Источник. Российский статистический ежегодник. 1977. – М.: Госкомстат России, 1997. – С. 139.




Структурная группировка характеризует структуру совокупности по какому-либо одному признаку. Пример такой группировки представлен в табл. 6.5.
Если для типологической группировки чаще используются открытые и неравные ин-тервалы, то для структурной группировки более характерны закрытые равные интервалы. Структурная группировка позволяет изучать интенсивность вариации группировочного признака (см. гл. 5). На основе структурной группировки можно изучать динамику структуры совокупности.
Если известны структурные характеристики совокупности в одном и другом периодах: wi0 и wi1 – доли i-й группы в период «0» и в период «1», то можно рассчитать показатель среднего абсолютного изменения структуры:

где k — число групп.

Другой сводный показатель абсолютных структурных сдвигов строи гся на основе формулы среднего квадратического отклонения:


Если показатели структуры выразить не в долях, а в процентах, то, так же как и первый показатель, квадратичный коэффициент абсолютных структурных сдвигов оценивает на сколько процентных пунктов в среднем различаются удельные веса отдельных групп сравниваемых структур. При отсутствии структурных сдвигов оба эти показателя равны нулю; их величина тем больше, чем значительнее абсолютные изменения удельных весов групп. Квадратичный коэффициент более чутко реагирует на структурные изменения. Существуют и другие показатели для измерения структурных сдвигов (см., например, индекс структуры в гл. 10). При сравнениях предполагается, что число групп в одном и другом периодах остается одним и тем же. По данным табл. 6.5,
процентных пункта.
Деление группировок на типологические и структурные достаточно условие. Если задать, например, границы среднедушевого дохода, соответствующие определенным типам благосостояния, то можно с полным правом назвать группировку типологической.
Аналитическая группировка характеризует взаимосвязь между двумя и более признаками, из которых один рассматривается как результат, другой (другие) — как фактор (факторы).
Пример однофакторной аналитической группировки представлен в табл. 6.6.
В данном примере оборачиваемость в днях - фактор, обозначенный х, прибыль - результат - у. Очевидно, что при одном и том же сроке оборота предприятия могут иметь разную прибыль. Чтобы установить связь между признаками, данные группируются по признаку-фактору. Затем по каждой группе рассчитывается среднее значение результата. По обобщенным данным гораздо легче увидеть, есть связь между признаками или нет, прямая связь или обратная, линейная или нелинейная. Эти выводы делаются через сопоставление изменений средних значений результата по группам с изменениями фактора. Чтобы эти изменения были сравнимыми, следует проводить группировку с равными интервалами или рассчитывать изменения результата наединицу изменений фактора.
Таблица 6.6
Характеристика зависимости прибыли малых предприятий от
оборачиваемости оборотных средств за 19_ г.

Продолжитель-ность оборота средств в днях
Число малых предприятий
Середина интервала, дни
Средняя прибыль, млн руб.
Изменение средней прибыли, млн руб.
х
nj

<< Пред. стр.

страница 5
(всего 32)

ОГЛАВЛЕНИЕ

След. стр. >>

Copyright © Design by: Sunlight webdesign