LINEBURG


<< Пред. стр.

страница 6
(всего 32)

ОГЛАВЛЕНИЕ

След. стр. >>

xj’
y?j
y?j - y?j-1
20 - 30
6
25
14,57
-
31 -50
8
40
12,95
- 1,62
51 - 80
6
65
7,40
- 5.55
Итого
20
43
11,77
?

В примере средняя прибыль изменяется от группы к группе, следовательно, связь между оборачиваемостью и прибылью существует, причем обратная: чем медленнее оборачиваются оборотные средства, тем меньше прибыль.
Рассчитаем, насколько снижается прибыль при замедлении оборачиваемости от 40-50 до 51-70 дней и при замедлении оборачиваемости от 51-70 до 71-101 дня:


Полученные значения показывают величину снижения прибыли при замедлении оборачиваемости на 1 день. Такие показатели называются показателями силы связи. Различие в их значениях свидетельствует, что сила влияния оборачиваемости на прибыль не является постоянной - она возрастает при сроках оборачиваемости свыше 50 дней, т.е. связь признаков нелинейная.
В случае линейной связи важным показателем является характеристика средней силы связи:

где y?m, y?l - средние значения результативного признака в последней и первой группах соответственно; х'm, x’l - середины интервалов (или средние значения) факторного признака в последней и первой группах. В случае прямой связи byx > 0, обратной – byx < 0. По данным табл. 6.5



Для нелинейной связи показатель средней силы связи не имеет значения (или имеет ограниченное значение).
По аналитической группировке можно измерить связь с помощью еще одного показателя: эмпирического корреляционного отношения. Этот, показатель обозначается греческой буквой h (эта). Он основан на правиле разложения дисперсии, согласно которому общая дисперсия s2 равна сумме внутригрупповой и межгрупповой дисперсий.
Дисперсия результативного признака внутри группы при относительном постоянстве признака-фактора возникает за счет других факторов (не связанных с изучаемым). Эта дисперсия называется остаточной (та колеблемость, которая осталась при закреплении изучаемого фактора х). Она определяется по формуле:

где уij - значение признака у для i-й единицы в j-й группе;
у?j - среднее значение признака у ву-й группе;
nj - число единиц ву-й группе;
j = 1, 2, 3, ..., т.

Внутригрупповые дисперсии, рассчитанные для отдельных групп, объединяются в средней величине внутригрупповой дисперсии:


Межгрупповая дисперсия относится на счет изучаемого фактора (и факторов, связанных с ним), поэтому эта дисперсия называется факторной. Она определяется по формуле


Правило сложения дисперсий может быть записано:


или


Эмпирическое корреляционное отношение измеряет, какую часть общей колеблемости результативного признака вызывает изучаемый фактор. Соответственно оно рассчитывается как отношение факторной дисперсии к общей дисперсии результативного признака:




Этот показатель принимает значения в интервале [0,1]: чем ближе к 1, тем теснее связь, и наоборот.
По данным табл. 6.6 этот показатель равен h = 0,881, связь тесная.
Для изучения влияния нескольких факторов на результат проводится многофакторная аналитическая группировка. Она строится как комбинационная группировка по признакам-факторам, и для каждой подгруппы рассчитывается среднее значение результативного признака.
Обратимся к рассмотренному выше примеру, который дополним вторым фактором формирования прибыли - величиной запаса оборотных средств (г); по этому фактору выделены три группы (табл. 6.7).










Таблица 6.7
Характеристика зависимости прибыли малых предприятий от
величины запаса и оборачиваемости оборотных средств за 19_ г.

Средний запас оборотных средств, млн руб.
Оборачиваемость в днях
Число предприятий
Средняя прибыль, млн руб.
Колеблемость прибыли по группам
zk
xj
njk
yjk
(y?jk - y?)2•njk
55-85


20 - 30
31 - 50
51 -80
1
2
1
11,00
10,85
7,05
0,5929
1,6928
22,2784
85 - 115


20-30
31 -50
51 -80
2
4
2
11,85
11,90
5,75
0,0128
0,0676
72,4808
115- 145

20-30
31 -50
51-80
3
2
3
17,60
17,00
8,62
101,9667
54,7058
29,7675
Итого
X
20
11,77
283,5653

Эта группировка позволяет проследить колеблемость прибыли под влиянием двух факторов. Конечно, уверенность нашего заключения е, том, что прибыль изменяется от группы к группе именно за счет изменений запаса оборотных средств и скорости их обращения, зависит от того, насколько обеспечено погашение влияния прочих факторов, т.е. от числа единиц в подгруппах (Ид). В данном примере наполненность групп недостаточна для того, чтобы выявить «чистое» влияние изучаемых факторов.
При njk > 5 многjфакторная аналитическая группировка позволяет измерить силу связи между результатом и одним из факторов при постоянстве второго фактора, т.е. получить так называемые частные (или чистые) показатели силы связи.
По данным табл. 6.7 рассчитаны показатели силы связи между прибылью и оборачиваемостью при закреплении уровня запасов оборотных средств. Таких показателей три (по числу групп по фактору z):



Точно так же могут быть вычислены показатели силы связи между прибылью и запасом оборотных средств при закреплении оборачиваемости:


Чистое влияние первого фактора (обратное) возрастает при увеличении уровня закрепленного фактора (величины запасов оборотных средств), а второго - снижается.
Можно рассчитать и показатель множественной тесноты связи -совокупное эмпирическое корреляционное отношение. Для трех признаков, как в нашем примере, его формула следующая: .

Так же как и показатель парной связи, hxyz принимает значение в интервале [0,1]. В числителе подкоренного выражения находится факторная дисперсия результативного признака:


Можно с некоторыми оговорками заключить, что на 92% (0,962) вариация прибыли в этой совокупности предприятий определяется вариацией изучаемых факторов.
Многофакторная аналитическая группировка — очень гибкий прием изучения связей. Она позволяет уловить влияние факторов на результат с изменением условий (закреплением прочих факторов на разных уровнях).
Однако при всех отмеченных плюсах этот метод имеет огромный минус - дробление совокупности, в результате чего выделяются подгруппы с малым числом единиц. В этом случае средние значения результативного признака неустойчивы, не достигается погашение прочих факторов, соответственно, ненадежными становятся и показатели связи. Но если совокупность большого объема и распределение признаков-факторов не являются крайне асимметричными, этот метод, как никакой другой, позволяет получить много информации об отношениях между переменными.
В какой-то мере избежать дробления данных и при этом получить «чистые» характеристики связей между переменными позволяет применение метода стандартизации распределений в комбинационной таблице. Если в группах по одной переменной, скажем, по г в табл. 6.7, распределение по другой переменной х принять стандартным и на его основе рассчитать групповые средние величины результативного признака, то они будут отличаться за счет принадлежности к разным группам по признаку z при элиминировании признака х. В качестве стандартного применяется распределение в целом по совокупности. Так, по данным табл. 6.7 стандартное распределение по х следующее:
x1 - 6 ед., х2 - 8 ед., х3 - 6 ед. или в относительном выражении: 0,3; 0,4; 0,3. Тогда средняя прибыль при заданном значении переменной z при стандартизации распределения по переменнбй х равна:
в первой группе:

во второй группе:

в третьей группе:

На основе полученных стандартизованных средних можно рассчитать показатели «чистой» связи между величиной прибыли и средним запасом оборотных средств. Попробуйте сделать такой расчет. Стандартизация распределения по переменной z, расчет стандартизованных средних результативного признака и показателей «чистой» связи между у и х при элиминировании z проводится аналогично. Заметим, что рассмотренные приемы анализа не входят пока в ППП для ЭВМ. Возможно, это сделает кто-то из вас.

6.3. МНОГОМЕРНЫЕ ГРУППИРОВКИ

Мы убедились, как трудно выбрать какой-то один признак в качестве основания группировки. Еще труднее проводить группировку по нескольким признакам. Комбинация двух признаков позволяет сохранить обозримость таблицы, но комбинация трех или четырех признаков дает совершенно неудовлетворительный результат: ведь даже при выделении трех категорий по каждому из груп-пировочных признаков мы получим 9 или 12 подгрупп. Равномерность распределения единиц по группам в принципе невозможна. Вот и получаются группы, в которые входят 1-2 наблюдения. Сохранить сложность описания групп и вместе с тем преодолеть недостатки комбинационной группировки позволяют методы многомерных группировок. Часто их называют методами многомерной классификации.
Эти методы получили распространение благодаря использованию |ЭВМ и пакетов прикладных программ. Цель этих методов — классификация данных, иначе говоря, группировка на основе множества |Признаков. Такие задачи широко распространены в науках о приро-|де и обществе, в практической деятельности по управлению массо-^Яыми процессами. Например, выделение типов предприятий по Ижнансовому положению, по экономической эффективности деятельности производится на основе множества признаков: выделение и изучение типов людей по степени их пригодности к определенной профессии (профпригодность); диагностика болезней на основании множества объективных признаков (симптомов) и т. д.
Простейшим вариантом многомерной классификации является группировка на основе многомерных средних.
Многомерной средней называется средняя величина нескольких признаков для одной единицы совокупности. Поскольку нельзя рассчитать среднюю величину абсолютных значений разных признаков выраженных в разных единицах измерения, то многомерная средняя вычисляется из относительных величин, как правило, - из отношений значений признаков для единицы совокупности к средним значениям этих признаков:


где p?j - многомерная средняя для i-единицы;
хij - значение признака х, для г-единицы;
хj - среднее значение признака xi,
k - число признаков;
j - номер признака;
i - номер единицы совокупности.
Рассмотрим использование многомерных средних на примере сельскохозяйственных предприятий Всеволожского района Ленинградской области за 1995 г. (табл. 6.8). По каждому предприятию приведены четыре признака:
• среднемесячная оплата труда работника, руб., x1;
• валовой доход на 1 га сельхозугодий, тыс. руб./га, х2;
• среднегодовая стоимость основных производственных фондов на 1 га сельхозугодий, млн руб./га, x3;
• отношение дебиторской задолженности к кредиторской задолженности, %, x4.
Эти признаки можно считать однородными, так как большая их величина положительно характеризует экономику предприятия. Предпочтительнее обобщать в многомерной средней признаки либо «положительные», либо «отрицательные» (чем больше, тем хуже).
Многомерные средние, приведенные в последней графе табл. 6.8, обобщают четыре признака.. При этом значимость признаков для оценки предприятия полагается одинаковой, что, конечно, спорно. Можно .усложнить методику, приписав признакам, на основе экспертнои оценки, разные веса, и вычислить взвешенные многомерные средние.






Таблица 6.8
Характеристики предприятий Всеволожского района Ленинградской области в 1995 г.



Предприятия
Значения признаков



В % к средней



Многомер-ная средняя, %


х1

х2

х3

х4

х1

х2

х3

х4

«Ручьи»
597
390
20,6
72
148
199
106
107
140
«Бугры»
353
96
12,1
30
88
49
62
45
61
«Пригородное»
403
84
20,6
26
100
43
106
39
72
«Авлога»
231
71
15,1
74
57
36
78
110
70
«Всеволожское»
330
114
14,8
159
82
58
76
237
113
«Выборгское»
540
235
24,0
26
134
120
184
39
104
«Приневское»
372
461
33,2
85
93
235
171
127
156
«Шеглово»
393
113
15,0
62
98
58
77
92
81
Средние величины
402
196
19,4
67
100
100
100
100
100
Средние квадратические отклонения
109
142
6,4
41
-
-
-
-
-

Судя по полученным оценкам, предприятия делятся на группы с многомерными средними ниже 100% (четыре предприятия), несколько выше 100% (два предприятия) и резко превышающие 100% (два предприятия).
При большом 'объеме совокупности для выделения групп на основе многомерной средней необходимо установить интервалы значений многомерной средней;

Затем следует провести группировку единиц: определить их количество в каждой группе и постараться указать, в чем состоят качественные различия между группами.
Более обоснованным методом многомерной классификации является кластерный анализ. Само название метода происходит от того же корня, что и слово «класс», «классификация». Английское слово the cluster имеет значения: группа, пучок, куст, т. е. объединений каких-то однородных явлений. В данном контексте оно близко к математическому понятию «множества», причем, как и множество, кластер может содержать только одно явление, но не может в отличие от множества быть пустым.
Каждая единица совокупности в кластерном анализе рассматривается как точка в заданном признаковом пространстве. Значение каждого из признаков у данной единицы служит ее координатой в этом «пространстве» по аналогии с координатами точки в нашем реальном трехмерном пространстве. Таким образом, признаковое пространство - это область варьирования всех признаков совокупности изучаемых явлений. Если мы уподобим это пространство обычному пространству, имеющему евклидову метрику, то тем самым мы получим возможность измерять «расстояния» между точками признакового пространства. Эти расстояния называют евклидовыми. Их вычисляют по тем же правилам, как и в обычной евклидовой геометрии. На плоскости, т.е. в двухмерном пространстве, расстояние между точками А и В равно корню квадратному из суммы квадратов разностей координат этих точек по оси абсцисс и по оси ординат - на основании теоремы Пифагора (рис. 6.1).


Рис. 6.1. Евклидово расстояние


В многомерном признаковом пространстве расстояние между точками р и q с k координатами, т. е. индивидуальными значениями k признаков, определяется так:


Совершенно очевидно, что нельзя суммировать квадраты отклонений одной точки от другой в абсолютных значениях разнокачествен-ных признаков. Необходимо сначала выразить различия между единицами совокупности по каждому признаку в каком-то относитель,но безразмерном показателе. В качестве такого показателя часто применяют «нормированную разность», т. е. величину:


По данным табл. 6.8 среднее квадратическое отклонение признака х, равно 109. Разделив все попарные разности значений этого признака на 109, получим матрицу нормированных разностей D1 (табл. 6.9). Очевидно эта матрица размером п?п симметрична.
Таблица 6.9

Матрица нормированных разностей между предприятиями по
среднемесячной оплате труда (D1)

Предприятия
«Ручьи»
«Бугры»
«Пригородное»
«Авлога»
«Все-волож-ское»
«Вы-борг-ское»
«При-нев-ское»
«Щег-лово»
«Ручьи»
0







«Бугры»
2,239
0






«Пригородное»
1,780
0,459
0





«Авлога»
3,358
1,119
1,578
0




«Всеволожское»
2,450
0,211
0,670

<< Пред. стр.

страница 6
(всего 32)

ОГЛАВЛЕНИЕ

След. стр. >>

Copyright © Design by: Sunlight webdesign