LINEBURG


<< Пред. стр.

страница 13
(всего 32)

ОГЛАВЛЕНИЕ

След. стр. >>

(7.33)

т. е. произведение итогов по столбцу и строке, деленное на общий объем данных.
Если подставить выражение п?ij в формулу (7.32), то получим
(7.34)

Используя эту формулу, мы можем находить эмпирические значения критерия c2 без промежуточного вычисления теоретических частот в явном виде.
Очевидно, что для определения эмпирического значения критерия c2 нет необходимости рассчитывать все s теоретических частот в каждой строке, а достаточно найти лишь s - 1 значение частоты в r - 1 строке, так как оставшиеся частоты могут быть получены как разности между маргинальными суммами эмпирических частот и суммами известных теоретических частот, т. е. значения теоретических частот в последних строке и столбце таблицы всегда полностью детерминированы. Поэтому число степеней свободы для r ґ s таблицы сопряженности равно:
d.f.= (r - 1) (s -1). (7.35)
Заметим, что для таблицы 2ґ2 число степеней свободы равно 1.
В таблице распределения статистики c2d.f.a приведены значения этой величины для различных уровней значимости при различных числах степеней свободы (см. приложение, табл. 4). Например, на уровне a = 0,01 для d.f. = 1 мы находим c2 = 10,827. Это означает, что равное или большее значение этой величины c2 может встретиться только один раз из тысячи при условии, что все сделанные допущения (нуль-гипотеза) справедливы. Другими словами, если выполняется предложение об отсутствии взаимосвязи между переменными, то крайне маловероятно (Р < 0,001), что наблюдаемые и ожидаемые частоты будут отличаться настолько, что фактическая величина c2 будет равной или большей 10,827. Если же c2ф і c2d.f.a, то гипотеза Н0 на данном уровне значимости а может быть отвергнута.
Вероятность того, что, отвергая нулевую гипотезу, мы совершаем ошибку (первого рода), которая численно равна уровню значимости о., задаваемому при проверке гипотезы.
Интерпретация c2 теста зачастую усложняется, когда в таблице сопряженности имеются ячейки с нулевыми значениями наблюдаемых частот. Дело в том, что если пара (хi, хj) значений переменных не наблюдалась в выборке, то это может означать, что объем выборки не столь велик, чтобы зафиксировать такую редкую комбинацию, либо что данная комбинация невозможна по каким-то объективным причинам. В последнем случае действительное число степеней свободы анализируемой системы меньше числа степеней свободы таблицы сопряженности, на основании которого произведена оценка уровня значимости c2 теста.
Корректировка применения c2 теста возможна лишь в том случае, если эмпирические данные, наполняющие таблицу сопряженности, есть результаты независимой случайной выборки относительно большого объема п. Последнее требование вызвано тем, что выборочное распределение c2 аппроксимирует табличное распределение статистики c2 только при больших п. Естественно, возникает вопрос о том, насколько велико должно быть п, чтобы иметь возможность использовать данный тест. Ответ на этот вопрос зависит от числа ячеек и величин маргинальных сумм. Вообще говоря, чем меньше число ячеек и чем более близки между собой по величине маргиналы, тем меньше может быть п. Существует, однако, практическое число, позволяющее оценить снизу по п диапазон возможного применения критерия c2 : если в данной таблице сопряженности любая из теоретических ожидаемых частот п?ij в ячейке (i, j) не больше 5, то рекомендуется произвести, если это возможно, модификацию таблицы либо воспользоваться другим критерием.
В общем случае корректировка таблицы размера r ґ s затруднительна. Практика показала, что если число ячеек велико, а ожидаемые частоты, равные или меньше пяти, встречаются лишь в одной-двух ячейках, то проведение корректировки нецелесообразно; во всех иных случаях разумной альтернативой является объединение категорий (градаций) с тем, чтобы элиминировать подобные ячейки. Естественно, такое объединение должно быть таким, чтобы получаемая в результате комбинация не была содержательно бессмысленной.
Пример. Согласно опросу 157 предпринимателей, работающих в приватизированных кафе и ресторанах, относительно оценки возможностей деятельности при разных формах собственности получены следующие данные (табл. 7.7).
Таблица 7.7
Исходные данные

Формы собственности
Оценка в возможностей деятельности






крайне неблагоприятно
неблагоприятно
трудно сказать
благоприятно
исключительно благоприятно
итого
Один владелец
18
16
5
13
5
57
Товарищество
4
4
10
11
11
40
Товарищество с офаниченной ответственностью
10
15
8
23
4
60
Итого
32
35
23
47
20
157

Испытаем гипотезу о независимости переменных Н0 : пij = n?ij, где пij - генеральные частоты, оценками которых выступают выборочные частоты пij. Теоретические частоты, рассчитанные в соответствии с нуль-гипотезой как представлены в табл. 7.8.
Таблица 7.8
Теоретические частоты


Формы
собственности
Оценка возможностей деятельности







крайне неблагоприятно
неблагоприятно
трудно сказать
благоприятно
исключительно благоприятно
итого
Один владелец
11,6
12,7
8,3
17,1
7,3
57
Товарищество
8,2
8,9
5,9
11,9
5,1
40
Товарищество с ограниченной ответственностью
12,2
13,4
8,8
18,0
7,6
60
Итого
32
35
23
47
20
157

Таким было бы распределение ответов о возможностях деятельности, если бы формы собственности никак не сказывались. Задавая уровень значимости a = 0,05, наводим по табл. 4 приложения критическое значение критерия c22 a, df при числе степеней свободы d.f. = (3 - 1)(5-1) = 8. Отсюда c22 a, df = 15,51.
Различия между фактическими и теоретическими клеточными частностями обобщаются в величине c2:


Так как c2факт > c2крит, Н0 отклоняется, т.е. форма собственности небезразлична для деятельности кафе и ресторанов. Таким образом, наблюдаемое значение c2 является значимым на 5%-ном уровне значимости, и нулевая гипотеза может быть отвергнута в пользу альтернативной.
Итак, мы рассмотрели один из возможных способов ответа на вопрос: существует ли связь между двумя переменными? Для этого мы выдвинули нулевую гипотезу, что такой связи нет, а затем рассмотрели способ статистического испытания этой гипотезы. Мы можем оценить величину риска в принятии предположения о существовании связи. Но означает ли это, что данная связь существенна с точки зрения ее силы? Вовсе не обязательно. Вопрос о силе или степени, тесноте зависимости — это иной вопрос, отличный от вопроса о существовании взаимосвязи.
В социально-экономических исследованиях, как правило, установление факта наличия связи между переменными не самоцель. Установив наличие связи, исследователь должен измерить ее силу (тесноту) с тем, чтобы иметь возможность сравнивать взаимосвязи между различными характеристиками, выделять наиболее сильные из них (см. гл. 8).

7.11. Проверка гипотезы о средних величинах

Основные гипотезы о средних величинах следующие: гипотезы о значении генеральной средней (при известной генеральной дисперсии или при неизвестной генеральной дисперсии); гипотезы о равенстве генеральных средних нормально распределенных сово-купностей (при известных генеральных дисперсиях, при неизвестных равных генеральных дисперсиях, при неизвестных неравных генеральных дисперсиях).
Первая задача чаще всего решается при неизвестной генеральной дисперсии. Испытуемая гипотеза Н0 : m = m0, альтернативная гипотеза Н1: m ? m0. Испытание гипотезы проводят с помощью t- критерия. При большом числе наблюдений критическое значение критерия определяется по таблице интеграла вероятностей, при малом - по таблице распределения Стьюдента с заданным уровнем значимости и числом степеней свободы, п — 1.
Если испытуемая гипотеза Н0: m = а, то фактическое значение критерия представляет отношение оцениваемой разности к средней возможной ошибке выборочной средней.
, (7.36)

где - при большой выборке;
- при малой выборке.

Если tфакт > tкрит , Н0 не отклоняется, если tфакт < tкрит , H0 отклоняется.
Рассмотрим пример.Часовая выработка забойщика при добыче угля в шахте по норме составляет 400 кг. Фактическая выработка соответствовала норме. При переходе в новый забой условия работы забойщиков усложнились. Для проверки обоснованности нормы в новых условиях был проведен учет работы 9 забойщиков: их средняя часовая выработка составила 388 кг с дисперсией, равной s2 = 171.
Выдвигается гипотеза о том, что норму выработки пересматривать не нужно, т.е. Н0 : m = 400 кг. Проверим эту гипотезу на 5%-нюм уровне значимости. Критическое значение t-критерия определяется по таблице распределения Стьюдента при доверительной вероятности 0,95 (1 - 0,05) и числе степеней свободы d.f. =- n - 1 = 8. Критическое значение составит tкрит = 2,3. Фактические значения t-критерия вычисляются по формуле (7.36):
.
Поскольку tфакт > tкрит Н0 отклоняется. Норма выработки в новых условиях должна быть пересмотрена, так как производительность труда стала существенно ниже нормативной.
В рассмотренном примере различие между фактическим и таб-˜ личным значениями /-критерия невелико, поэтому вывод недостаточно надежен. Надежность вывода вообще понижается, если нет уверенности в нормальном распределении генеральной совокупности.
Гипотеза о равенстве средних может рассматриваться как гипотеза о связи, если сопоставляются средние величины, обусловленные действием какого-либо фактора. Например, сравнивается средняя заработная плата рабочих двух специальностей. Нулевая гипотеза состоит в том, что специальность рабочего не влияет на заработок. Если окажется, что tфакт > tкрит, нулевую гипотезу отклоняют и делают вывод о том, что специальность оказывает влияние на заработную плату.
Рассмотрим решение этой задачи при условии, что генеральные дисперсии неизвестны, но принимаются равными. При сравнении средних величин выдвигается гипотеза, что обе выборки принадлежат одной и той же генеральной совокупности со средней m и дисперсией s2.
При неизвестной генеральной дисперсии формула t-критерия имеет вид:
. (7.37)

Поскольку s21 и s22 рассматриваются как выборочные оценки общей дисперсии s2, то формула (7.37) может быть записана так:
, (7.38)

где x?1, x?2 - выборочные средние; s2 - выборочная оценка общей дисперсии;
. (7.39)

Гипотеза H0 отклоняется, если
Рассмотрим пример. Для проверки устойчивости цен на яблоки в летний период на двух рынках города проведено выборочное обследование: на первом рынке по данным 15 продавцов определена средняя цена, равная 2 тыс. руб./кг. при среднем квадратическом отклонении s2 = 0,5 тыс. руб.; на втором рынке обследовано 17 продавцов, средняя цена оказалась равной 2,5 тыс. руб./кг, s2 = 0,4 тыс. руб.
Н0 : m = m0, Н1: m ? m0.

.

При a = 0,05 и d.f. = 30, tкрит = 2,042, tфакт > tкрит , H0 отклоняется, т. е. различия в ценах на двух рынках нельзя объяснить лишь случайностями выборки.
Проверка той же нулевой гипотезы при односторонней критической области будет проводиться на следующих условиях определения: tкрит : 1 - 2a и d.f. = n1 + n2 -2. Следовательно, если Н1 : m1 = m2 (2a = 0,1, d.f. = 30), так что H0 опять-таки отклоняется.
Случай проверки гипотезы о средних величинах при неизвестных дисперсиях, равенство которых не предполагается, здесь не рассматривается ввиду его недостаточной теоретической разработанности [6 Афифи А„ Эйзен С. Статистический анализ. Подход с использованием ЭВМ/Пер, с англ.; Под ред. Г. П. Башарина. - М.: Мир, 1982.]
.

7.12. Основы дисперсионного анализа

Может быть поставлена задача сравнения двух выборочных дисперсий. Для ее решения применяется критерий, названный в честь английского статистика Рональда Фишера (1890 - 1968) F- критерием. Этот критерий представляет собой отношение выборочных дисперсий s21 и s22, которые рассматриваются как оценки одной и той же генеральной дисперсии s2:
.

Испытуемая гипотеза является нулевой гипотезой Н0 : s21 = s22 = s2, альтернативная гипотеза Н1 : s21 ? s22 ? s2 .
F-критерий строится так, что в числителе стоит бо?льшая дисперсия. Fmin = 1, Fmax ® Ґ . Критические значения критерия F берутся из таблиц F-распределения. F-распределение зависит от уровня значимости и от числа степеней свободы сравниваемых дисперсий d.f.1 и d.f.2 (cм. приложение, табл. 3).
В дисперсионном анализе общая вариация подразделяется на составляющие и производится сравнение этих составляющих. Испытуемая гипотеза состоит в том, что если данные каждой группы представляют случайную выборку из нормально распределенной генеральной совокупности, то величины всех частных дисперсий должны быть пропорциональны своим степеням свободы и каждую из них можно рассматривать как оценку генеральной дисперсии.
Дисперсионный анализ часто применяется совместно с аналитической группировкой (см. гл. 6). В этом случае данные подразделяются на группы по значениям признака-фактора, вычисляются значения средних величин результативного признака в группах, считается, что различия в их значениях определяются различиями в значениях фактора. Задача состоит в оценке существенности различий между средними значениями результативного признака в группах. Итак, испытуемая гипотеза может быть записана как гипотеза о средних величинах Н0 : m1 = m2 =m3 =… Как было показано в предыдущем параграфе, когда выделяются две группы, эта задача решается с помощью t-критерия. Если же число сравниваемых групп больше двух, то существенность различий между группами доказывается с помощью дисперсионного анализа, на основе F-критерия. Заметим, что результаты дисперсионного анализа, так же как и выводы о характере связи, значения показателей ее силы и тесноты, зависят от числа групп, выделенных по признаку-фактору.
В случае выделения групп по одному фактору мы имеем так называемый однофакторный дисперсионный комплекс. Разложение дисперсии при этом производится в соответствии с правилом сложения дисперсий (см. гл. б):

,

где уij - значение результативного признака у i-й единицы в j-й группе;
i - номер единицы, i = 1, .... п.;
j - номер группы;
пj- численность у-й группы;
yj - средняя величина результативного признака в у-й группе;
у? — общая средняя результативного признака.

Если обозначить суммы квадратов отклонений буквой D, получим равенство:
Dобщ = Dфакт +Dост (7.41)

На основе разложения дисперсии (7.41) в соответствии с гипотезой отсутствия различий между группами могут быть получены три оценки генеральной дисперсии, пропорциональные степени свободы: на основе общей вариации, межгрупповой (факторной) и внутригрупповой (остаточной). Число степеней'свободы равно:
для общей вариации
для межгрупповой вариации ;
для внутригрупповой вариации
Как и суммы квадратов отклонений, числа степеней свободы связаны между собой равенством:

или
п - 1 = (m - 1) + (п - т). (7.42)

Деление сумм квадратов отклонений на соответствующее число степеней свободы дает три оценки генеральной дисперсии s2 .
,

, (7.43)

.

Поскольку Dфакт измеряет вариацию результативного признака, связанную с изменением фактора, по которому произведена группировка, a Dост - вариацию, связанную с изменением всех прочих факторов, сравнение этих величин, рассчитанных на одну степень свободы, дает возможность оценить существенность влияния признака-фактора на результативный признак с помощью F-критерия:
.

Эта запись предполагает, что s2факт > s2ост. Как правило, мы получаем именно такое соотношение. Если F факт > Fтабл (a., d.f.1, d.f.2), можно утверждать, что нуль-гипотеза не соответствует фактическим данным, влияние признака-фактора является существенным или, иначе говоря, статистически значимым.
Рассмотренные этапы однофакторного дисперсионного анализа представлены в табл. 7.9.
Таблица 7.9
Схема однофакторного дисперсионного анализа

Источник вариации
Сумма квадратов отклонений
D
Число степеней свободы
d.f.
Средний квадрат отклонений
s2=D:d.f.
F-критерий
Между группами



m-1

s21





Внутри групп



n-m

s22

Общая



n-1

s2


По данным табл. 6.6 проверим гипотезу Н0 : m 1= m2 ..., т. е. предположим, что оборачиваемость средств никак не влияет на прибыль.

Dфакт = 172,76, d.f.факт =3-1=2, s21 = 86,38;
Dост – Dобщ - Dфакт = 224,4 - 172.76 = 51,64;
d.f.ост = 20 - 3=17; s22 = 3,03.

Тогда F = 28,5. Критическое значение F-критерия из табл. 3 приложения F(a=0,05, d.f.1=2, d.f.2=17) = 3,59. Таким образом Fфакт > Fкрит следовательно, Н0 отклоняется. Действительно, скорость оборота средств является очень важным фактором формирования прибыли, на это указывало и значение эмпирического корреляционного отношения h = 0,881.
Рассмотрим двухфакторный дисперсионный анализ, основой проведения которого служит комбинационная группировка по двум факторам х и z, с последующим разложением дисперсии результативного признака у:

(7.44)

где i - номер единицы в j-й группе по признаку х и k-й по признаку z;
j = 1?,т?,
k =I?р?, у?jk - среднее значение признака у? в группе, образованной ком-бинацией j-го значения признака х и k-го значения признака z;
у?j - среднее значение признака у в j-й группе по признаку х;
y?k - среднее значение признака у в k-й группе по признаку z;
у? - общая средняя признака y в целом по выборке;
пjk - число единиц в группе, образованной комбинацией j-го значения признака х и k-го значения признака z;
пj - число единиц в j-й группе по признаку х,
пk - число единиц в k-й группе по признаку z;
т Р т р
п- общее число единиц,

Равенство (7.44) можно записать так:
Dобщ = Dx + Dz + Dxz + Dост (7.45)

где Dч - вариация у под влиянием фактора x;
Dz - вариация у под влиянием фактора z;
Dxz - вариация у, обусловленная взаимодействием факторов х и z;
Dост - вариация у под влиянием прочих факторов.

Первые три слагаемые составляют вариацию признака у, вызванную изучаемыми факторами, поэтому равенство (7.45) можно записать в виде:
Dобщ = Dфакт +Dост (7.46)
где
Dфакт = Dх + Dz + Dxz. (7.47)

Величина Dфакт может быть рассчитана не через составляющие, а непосредственно как
(7.48)

Однако при неравенстве численностей подгрупп пjk и групп пj и пk равенство нарушается (за счет взвешивания при неравных весах).
Поэтому рассчитываются невзвешенные величины:
;

; (7.49)

;

.

Затем на основе сравнения взвешенной (7.48) и невзвешенной величин факторной дисперсии находят поправочный коэффициент:
(7.50)

Этот коэффициент используется для корректировки невзвешенных сумм квадратов отклонений , на основе которых проводят расчет F-критериев:
(7.50)

Число степеней свободы для каждой суммы квадратов отклонений составляет:
d.f.x=m- 1; d.f.z = p - 1; d.f.xz = (m-1)(p -1) = mp - т - р + 1,
в целом
d.f.факт = d.f.x + d.f.z + d.f.xz = mp-1;

(7.51)

В двухфакторном дисперсионном анализе испытуемые гипотезы формулируются следующим образом:
1. Н0 : m1• = m2. =…mm
2. Н0 : m1• = m2. =…mp
3. Н0 : m1• = m2. =…mmp

Вся процедура двухфакторного дисперсионного анализа обобщается в табл. 7.10.
Таблица 7.10
Схема двухфакторного дисперсионного анализа

Источник вариации
Сумма квадратов отклонений
D
Число степеней. свободы
d. f.
Средний квадрат отклонений s2 = D/d.f.
F-критерий
Факторы х и z
Dўфакт•K
mp - 1
s2факт

Фактор х
Dўx•K
m - 1
s2x

Фактор z
Dўz•K
p - 1
s2z

Взаимодействие факторов х и z
(Dўфакт- Dўx-
- Dўz)•K
mp – p-m+1
s2xz

Остаточная
Dобщ - Dўфакт•K
n - mp
s2ост

Общая
Dобщ
n - 1
s2


Решение о первой гипотезе принимается на основе сравнения
с .

Если Fфакт > Fкрит, то Н0 отклоняется.

Вторая гипотеза испытывается на основе сравнения
c

Третья - на основе сравнения
c

Во всех случаях, если Fфакт > Fкрит, Н0 отклоняется. На основе F-критерия принимаются решения о форме уравнения регрессии, о статистической значимости той или иной объясняющей переменной при построении многофакторного уравнения регрессии (см. гл. 8) и др.
Рассмотренные направления проверки статистических гипотез охватывают лишь важнейшие из них. Процедура испытания статистических гипотез применяется для определения того, случайно или нет полученное значение коэффициента корреляции, коэффициента вариации и т. д., случайны или нет различия в значениях показателей (медиан, коэффициентов корреляции, регрессии и т.д.) в разных совокупностях. Во всех случаях результатом является вероятностное суждение, которое составляет сущность анализа данных в разнообразных сферах: в медицине, биологии, технике, политике, спорте, экономике, психологии и социологии.

7.13. Примеры применения выборочного метода
и проверки статистических гипотез

Потребность в использовании выборочного метода, выработке вероятностных суждений в современной отечественной практике непрерывно расширяется. В государственной статистике основными направлениями использования выборочного метода традиционно являются бюджетные обследования семей, выборочные переписи населения, контрольные обходы и проверки после проведения сплошных обследований.
Создание единого государственного регистра предприятий и организаций (ЕГРПО), в котором фиксируются все хозяйствующие субъекты на территории Российской Федерации всех форм собственности, открывает возможность проведения разнообразных выборочных обследований в области экономики.
В области социальных исследований для государственной статистики главным является бюджетное обследование, которое охватывает примерно 48 тыс. домохозяйств. Оно основано на многоступенчатом отборе. Общий объем выборки распределяется по сферам занятости (для работающих) и территориям. Затем для работающих производится отбор предприятий в пределах каждой отрасли в отобранной территории. Если, например, нужно отобрать 100 рабочих, занятых в определенной отрасли, для обследования семейных бюджетов так, чтобы на каждом отобранном предприятии было не менее 20 бюджетов, включающих рабочих с разным уровнем заработной платы, то, значит, должно быть отобрано 100 :20 =5 предприятий. Отбор предприятий проводят по списку, в котором предприятия располагаются в порядке убывания средней заработной платы рабочих, указываются общее число рабочих, их суммарная заработная плата. Шаг отбора определяется делением общего числа рабочих на предприятиях данной отрасли на- число отбираемых предприятий. Если всего на предприятиях данной отрасли в области занято 30525 человек, то шаг отбора равен 30 525 : 5 = 6105. По данным кумулятивной численности рабочих с данным шагом отбора производится отбор предприятий, которые затем проверяются на репрезентативность по показателю средней месячной заработной платы. Следующая стадия связана с отбором рабочих на выбранных предприятиях: среди 20 бюджетов должны быть пропорционально представлены бюджеты семей малоквалифицированных и высококвалифицированных рабочих, а среди этих категорий отбор проводится механически по спискам рабочих, составленным в порядке убывания среднемесячной заработной платы. Выборочная совокупность при бюджетных обследованиях включает и семьи неработающих (пенсионеров, студентов, инвалидов) и одиночек.
Задачей статистики в области бюджетных обследований является обеспечение представительства всех социальных групп и учет всех источников дохода. Наиболее общим показателем уровня благосостояния населения являются денежные доходы, поступающие в семью в виде заработной платы, премий, единовременных выплат, гонораров, предпринимательского дохода или дохода от собственности, компенсационных выплат и дотаций. В совокупные доходы семьи включаются также натуральная оплата труда, доходы, полученные от реализации и потребления продукции личного подсобного хозяйства (садового участка, коллективного огорода). Для характеристики обеспеченности семей следует учитывать их накопления, а также валютные поступления. Возрастает значение анализа личного потребления.
Большое значение имеет применение выборочного метода на промышленных предприятиях для статистического контроля качества продукции и использования внутрисменного времени рабочих.
Контроль качества продукции проводится для готовой продукции и в процессе ее изготовления. Выборочный контроль качества готовой продукции осуществляется так: отбирается на пробу некоторое число изделий и оценивается качество каждого из них. По доле дефектных изделий среди отобранных судят о качестве всей партии изделий. Если доля брака не превышает некоторого допустимого предела, то вся партия принимается без сплошного контроля. Если же доля брака больше допустимого предела, то проводится сплошная проверка всех остальных изделий в партии, конечно, если она не связана с уничтожением или порчей изделий.
При проведении контроля на стадии производства продукции машиностроения металлообработки основное внимание уделяется контролю положения центра настройки станков и вариации размеров деталей, обработанных на металлорежущем оборудовании.
Для изучения структуры рабочего времени разных категорий работников, особенно рабочих, а также для характеристики использования машин и оборудования используется метод моментных наблюдений. Этот метод состоит в регистрации вида затрат времени в определенные, заранее выбранные моменты. Заранее составляется список всех возможных состояний или видов затрат времени. Подсчитывается доля отметок о каждом состоянии, и оценивается доверительный интервал доли времени, затраченного на тот или иной вид работы. Отбор моментов выборки может быть проведен либо по схеме механической выборки — через равные промежутки времени, либо по схеме случайной выборки с использованием таблицы случайных чисел. Необходимая численность моментов наблюдения рассчитывается как

.

Если принять доверительную вероятность равной 0,954 и допустимую ошибку 0,005, т.е. 0,5%, то = 40 000 наблюдений.
При продолжительности наблюдений 10 дней и охвате наблюдением 100 рабочих, в день должно проводиться 40 наблюдений за каждым рабочим. Если продолжительность смены составляет 8 ч, то интервал между обходами должен составлять 12 мин. [(8 ч • 60 мин.) : 40 наблюдений]. За начальный момент времени можно принять момент начала смены плюс пол-интервала: 7 ч 30 мин. + 6 мин. =7 ч 36 мин., тогда второй обход будет проводиться в 7 ч 48 мин. и т.д. По итогам моментного наблюдения рассчитываются доверительные интервалы для каждого i-го вида потерь рабочего времени:

Результаты наблюдений используются для анализа потерь рабочего времени, статистической оценки напряженности труда рабочих.
Выборочный метод используется в аудиторской практике при проверке бухгалтерских документов. При этом решаются две задачи: 1) дать оценку количества документов в данной фирме (предприятии, объединении, и т. д.), в оформлении которых не соблюдались принятые правила; 2) оценить правильность указанных в документах сумм денежных средств. Первую задачу решают с помощью так называемой атрибутивной выборки, вторую - с помощью монетарной выборки. В первой выборке единицей отбора является учетный документ, во второй - денежная единица.
При организации атрибутивной выборки в качестве генеральной совокупности выступает вся совокупность расчетных документов фирмы за проверяемый период. Обычно она предварительно разбивается на однородные массивы: по характеру документов, по центрам ответственности, по географическому признаку, по временной последовательности, по интенсивности запросов на данный вид информации и т.д. Каждому документу присваивается числовая метка, и по таблице случайных чисел проводится отбор номеров в количестве, соответствующем объему выборки. Можно провести и механический отбор с шагом отбора, равным N : п , где N - объем генеральной совокупности, п - объем выборки. Обычно начинают отбор не с первого документа, а отступив полшага.
Объем атрибутивной выборки находится из соотношения:


Коэффициент надежности определяется по таблице распределения Пуассона, поскольку появление ошибки в оформлении расчетных документов относится к классу редких событий. При этом предполагаемая средняя частота ошибок закрепляется на определенном уровне, например 1; 1,5 или 2.
Если фактическая частота несоответствий в оформлении документов меньше максимально допустимой, то вычисляют коэффициент надежности как произведение объема выборки на величину фактической частоты несоответствий, после чего по таблице распределения Пуассона определяют вероятность, соответствующую рассчитанной величине коэффициента надежности, чтобы убедиться, что доверительная вероятность результатов выборки достаточно высока.
Если фактически выявленная частота несоответствия принятым - правилам превышает максимально допустимую величину, то обязательно проводят монетарную выборку.
При монетарной выборке генеральной совокупностью является сумма денежных средств, зафиксированных во всех проверяемых документах. В качестве единицы отбора выступает денежная единица (1 руб.), а единицей наблюдения является расчетный документ. Требуемая точность результатов задается как допустимая относительная сумма ошибки. Объем монетарной выборки рассчитывается как


Например, если аудитор исходит из 1%-ного риска (при односторонней критической области — опасения, что суммарная ошибка будет не больше принятой величины), т. е. при 98%-ной доверительной вероятности наличия суммарной ошибки 50 000 руб. при объеме генеральной совокупности, равном 60 млн/ руб., то объем выборки
денежные единицы
Определяется шаг отбора, равный N : п = 60 000 000 : 2772 = = 21645 руб. Все расчетные документы, в которых зафиксирована сумма, равная или превышающая величину шага отбора, обязательно попадут в выборку. Начало, отбора устанавливается произвольно.
Рассмотрим в качестве примера записи по счету «Расчеты с покупателями» (табл. 7.11).
Таблица 7.11

<< Пред. стр.

страница 13
(всего 32)

ОГЛАВЛЕНИЕ

След. стр. >>

Copyright © Design by: Sunlight webdesign