LINEBURG


<< Пред. стр.

страница 12
(всего 15)

ОГЛАВЛЕНИЕ

След. стр. >>

500т
.445/


400"
Ф •

#
300"



200-"



J 26, Н— ч
+
100 100 по
95 105
115
,98.4., ind J 12.9.,
Рис. 4.1.1. Сильная прямая связь' между Объемом реализации и Индексом потреби­
тельских расходов (г = 0 816).

Проверка значимости линейного коэффициента корреляции. Для
оценки значимости коэффициента корреляции применяется f-критерий
Стьюдента. При этом фактическое значение этого критерия определяет­
ся по формуле:

(4.1.2)
-(и-2).
'набл
!-/••



Вычисленное по этой формуле значение гнабл сравнивается с крити­
ческим значением f-критерия, которое берется из таблицы значений /
Стьюдента с учетом заданного уровня значимости (а = 0,05) и числа
степеней свободы (л - 2).
Если гмабл > tKp, то полученное значение коэффициента корреляции
признается значимым (т.е. нулевая гипотеза, утверждающая равенство

При построении диаграммы использованы данные примера 4.2.1 (см с 109).
96
нулю коэффициента корреляции, отвергается). Таким образом делается
вывод о том, что между исследуемыми переменными есть тесная стати­
стическая взаимосвязь.
В модель включают те факторы, связь которых с зависимой пере­
менной наиболее сильная.
В качестве критерия мультиколлинеарности может быть принято
соблюдение следующих неравенств:
r
yx, > rx,xit » r >r
x,Xk > rx,Xk <
yxk 0-°-
Если приведенные неравенства (или хотя бы одно из них) не вы­
полняются, то в модель включают тот фактор, который наиболее тесно
связан с Y.
Мулътжоллинеарностъ. Одним из условий регрессионной модели
является предположение о линейной независимости объясняющих пере­
менных, т.е. решение задачи возможно лишь тогда, когда столбцы и
строки матрицы исходных данных линейно независимы. Для экономиче­
ских показателей это условие выполняется не всегда. Линейная или
близкая к ней связь между факторами называется мультиколлинеарно-
стъю и приводит к линейной зависимости нормальных уравнений, что
делает вычисление параметров либо невозможным, либо затрудняет со­
держательную интерпретацию параметров модели. Мультиколлинеар-
ность может возникать в силу разных причин. Например, несколько не­
зависимых переменных могут иметь общий временной тренд, относи­
тельно которого они совершают малые колебания. В частности, так мо­
жет случиться, когда значения одной независимой переменной являются
лагированными значениями другой. Считают явление мультиколлинеар­
ности в исходных данных установленным, если коэффициент парной
корреляции между двумя переменными больше 0.8. Чтобы избавиться от
мультиколлинеарности, в модель включают лишь один из линейно свя­
занных между собой факторов, причем тот, который в большей степени
связан с зависимой переменной.
На третьей, заключительной стадии производят окончательный отбор
факторов путем анализа значимости вектора оценок параметров уравнений
множественной регрессии с использованием критерия Стьюдента (к - ко­
личество факторов, включенных в модель после исключения незначимых
факторов, к = т, если включены все анализируемые факторы).
97
Выбор вида модели и оценка ее параметров

Для отображения зависимости переменных могут использоваться
показательная, параболическая и многие другие функции. Однако в
практической работе наибольшее распространение получили модели
линейной взаимосвязи, т.е. когда факторы входят в модель линейно.
Линейная модель множественной регрессии имеет вид:
Y,=a0 + щх,1 + а2х,2 + ... + атхт + е,. (4.1.3)
Анализ уравнения (4.1.3) и методика определения параметров стано­
вятся более наглядными, а расчетные процедуры существенно упрощают­
ся, если воспользоваться матричной формой записи уравнения (4.1.4):
Y = Xa + e. (4.1.4)
Здесь Y - вектор зависимой переменной размерности rcxl, пред­
ставляющий собой п наблюдений значений у„ X - матрица независимых
переменных, элементы которой суть п х т наблюдения значений т неза­
висимых переменных Х\, Х2, Хъ, ..., Х,„, размерность матрицы X равна
п хт\ а - подлежащий оцениванию вектор неизвестных параметров
размерности т х 1; е - вектор случайных отклонений (возмущений) раз­
мерности п х 1. Таким образом,
"ос 0 "
˜У\
а,
Уг , х= , <х =

.°V
Уп.
Уравнение (4.1.4) содержит значения неизвестных параметров
а ь а2, ..., ат. Эти величины оцениваются на основе выборочных наблюде­
ний, поэтому полученные расчетные показатели не являются истинными, а
представляют собой лишь их статистические оценки. Модель линейной рег­
рессии, в которой вместо истинных значений параметров подставлены их
оценки (а именно такие регрессии и применяются на практике), имеет вид
Y=Xa + e = Y+e, (4.1.5)
где а - вектор оценок параметров; е - вектор «оцененных» отклонений рег­
рессии, остатки регрессии е = у-Ха; Y - оценка значений К, равная Ха.
98
Для оценивания неизвестного вектора параметров а воспользуемся
методом наименьших квадратов (МНК). Формула для вычисления пара­
метров регрессионного уравнения имеет вид:

a = (X1Xy]XTY. (4.1.6)
Рассмотрим случай зависимости переменной Y от одного фактора
X. Мы хотим подобрать уравнение
Y = ао + а\ • х .
Используя (4.1 .6), можно получить следующие выражения для вы-
числения О] и а0:
—^(х-х)-(у-у) —^(х-х)-(у-у)
1
^ - ТЛ2 о?
^Х(*-х)2 °*
_ 1<(х-х)-(у-у) _ COV(x,y) _ a
= Ъy. у — . (4-1.7)
Y(x-x)2 x
VAR(x) ' о.

aQ=y-avx. (4.1.8)
Проверка качества модели

Качество модели оценивается стандартным для математических
моделей образом: по адекватности и точности на основе анализа остат­
ков регрессии е. Расчетные значения получаются путем подстановки в
модель фактических значений всех включенных факторов.
Анализ остатков. Анализ остатков позволяет получить представле­
ние, насколько хорошо подобрана сама модель и насколько правильно
выбран метод оценки коэффициентов. Согласно общим предположени­
ям регрессионного анализа, остатки должны вести себя как независимые
(в действительности почти независимые), одинаково распределенные
случайные величины. В классических методах регрессионного анализа
предполагается также нормальный закон распределения остатков.
Независимость остатков проверяется с помощью критерия Дарби-
на-Уогсона [2J.

99
Исследование остатков полезно начинать с изучения их графика.
Он может показать наличие какой-то зависимости, не учтенной в моде­
ли. Скажем, при подборе простой линейной зависимости между Y и X
график остатков может показать необходимость перехода к нелинейной
модели (квадратичной, полиномиальной, экспоненциальной) или вклю­
чения в модель периодических компонент.
Выбросы. График остатков (см. далее рис. 4.2.5) хорошо показывает
и резко отклоняющиеся от модели наблюдения - выбросы. Подобным
аномальным наблюдениям надо уделять особо пристальное внимание,
так как их присутствие может грубо искажать значения оценок. Устра­
нение эффектов выбросов может проводиться либо с помощью удаления
этих точек из анализируемых данных (эта процедура называется цензу­
рированием), либо с помощью применения методов оценивания пара­
метров, устойчивых к подобным грубым отклонениям.
Кроме рассмотренных выше характеристик, целесообразно исполь­
зовать коэффициент множественной корреляции (индекс корреляции) R,
а также характеристики существенности модели в целом и отдельных ее
коэффициентов:



где Sg - сумма квадратов уровней остаточной компоненты;
S2y - сумма квадратов отклонений уровней исходного ряда от его
среднего значения.
Данный коэффициент является универсальным, так как отражает
тесноту связи и точность модели, а также может использоваться при лю­
бой форме связи переменных. При построении однофакторной корреля­
ционной модели коэффициент множественной корреляции равен коэф­
фициенту парной корреляции.
Коэффициент множественной корреляции (индекс корреляции),
возведенный в квадрат (/?"), называется коэффициентом детерминации.


R2=\- S*c>2 Xfr-зо' (4.1.Ю)
2 2
l(yt-yt) К*-JO
100
Он показывает долю вариации результативного признака, находя­
щегося под воздействием изучаемых факторов, т.е. определяет, какая
доля вариации признака Y учтена в модели и обусловлена влиянием на
него факторов.
В многофакторной регрессии добавление дополнительных объяс­
няющих переменных увеличивает коэффициент детерминации. Следова­
тельно, коэффициент детерминации должен быть скорректирован с уче­
том числа независимых переменных. Скорректированный R˜, или R2,
рассчитывается так:
Г = 1-о-я 2 )-^-,
п-к-1
где п - число наблюдения; к - число независимых переменных.
В качестве меры точности применяют несмещенную оценку дис­
персии остаточной компоненты, которая представляет собой отношение
суммы квадратов уровней остаточной компоненты к величине (п-к- 1),
где к - количество факторов, включенных в модель. Квадратный корень
из этой величины (Sf) называется стандартной ошибкой оценки.
Для проверки значимости модели регрессии используется F-значение,
вычисляемое как отношение дисперсии исходного ряда и несмещенной
дисперсии остаточной компоненты. Если расчетное значение с Vi = (п - 1)
и Vi = (« - к - 1) степенями свободы больше табличного при заданном
уровне значимости, то модель считается значимой:

R2/
F= =-& . (4.1.11)
2
(l-R )(n-k-\)
Если существует к независимых переменных, то будет к + 1 коэф­
фициентов регрессии (включая постоянную), отсюда число степеней
свободы составит п˜(к+ 1) или п-к-].
Целесообразно проанализировать также значимость отдельных ко­
эффициентов регрессии. Это осуществляется по r-статистике путем про­
верки гипотезы о равенстве нулю j-ro параметра уравнения (кроме сво­
бодного члена):
taj=aj/Saj, (4.1.12)

101
где Sai - это стандартное (среднее квадратическое) отклонение коэффи­
циента уравнения регрессии а,-.

Величина Saj представляет собой квадратный корень из произведе­
ния несмещенной оценки дисперсии Se и j-ro диагонального элемента
матрицы, обратной матрице системы нормальных уравнений.

Sa,=Se-Jb.., (4.1.13)
2
5 > ( 0ч , -1
т
где Se=J,— , bjj -диагональный элемент матрицы (X X) .
I П. ˜˜˜ К ˜˜˜ I

Если расчетное значение f-критерия с (п - к - 1) степенями свободы
превосходит его табличное значение при заданном уровне значимости,
коэффициент регрессии считается значимым. В противном случае фак­
тор, соответствующий этому коэффициенту, следует исключить из мо­
дели (при этом ее качество не ухудшится).

Оценка влияния отдельных факторов на основе модели на
зависимую переменную (коэффициенты эластичности
и р-коэффициенты)

Важную роль при оценке влияния факторов играют коэффициенты
регрессионной модели. Однако непосредственно с их помощью нельзя
сопоставить факторы по степени их влияния на зависимую переменную
из-за различия единиц измерения и разной степени колеблемости. Для
устранения таких различий при интерпретации применяются средние
частные коэффициенты эластичности Э(/) и ^-коэффициенты /?(/), ко­
торые рассчитываются соответственно по формулам:
3(j) = a(j)Xcp/Ycp; (4.1.14)
№) = aU)-Sx,fSy, (4.1.15)

где 5V/ - среднее квадратическое отклонение фактора/
Коэффициент эластичности показывает, на сколько процентов из­
меняется зависимая переменная при изменении факторау на 1%. Однако
он не учитывает степень колеблемости факторов.
102
Бета-коэффициент показывает, на какую часть величины среднего
квадратического отклонения S, изменится зависимая переменная У с из­
менением соответствующей независимой переменной X, на величину
своего среднего квадратического отклонения при фиксированном на по­
стоянном уровне значении остальных независимых переменных.
Указанные коэффициенты позволяют проранжировать факторы по
степени влияния факторов на зависимую переменную.
Долю влияния фактора в суммарном влиянии всех факторов можно
оценить по величине дельта-коэффициентов А(/):
Д ( ; ) = Г > У РО-)/Л 2 ,
где гу - коэффициент парной корреляции между фактором у (/' = 1, ..., т)
и зависимой переменной.

Использование многофакторных моделей
для анализа и прогнозирования развития экономических систем

Одна из важнейших целей моделирования заключается в прогнози­
ровании поведения исследуемого объекта. Обычно термин «прогнозиро­
вание» используется в тех ситуациях, когда требуется предсказать со­
стояние системы в будущем. Для регрессионных моделей он имеет, од­
нако, более широкое значение. Как уже отмечалось, данные могут не
иметь временной структуры, но и в этих случаях вполне может возник­
нуть задача оценить значение зависимой переменной для некоторого на­
бора независимых, объясняющих переменных, которых нет в исходных
наблюдениях. Именно в этом смысле - как построение оценки зависимой
переменной - и следует понимать прогнозирование в эконометрике.
Проблема прогнозирования имеет много различных аспектов.
Можно различать точечное и интервальное прогнозирование. В первом
случае оценка - это конкретное число, во втором - интервал, в котором
истинное значение переменной находится с заданным уровнем доверия.
Кроме того, для временных рядов при нахождении прогноза существен­
но наличие или отсутствие корреляции по времени между ошибками.
При использовании построенной модели для прогнозирования де­
лается предположение о сохранении в период прогнозирования сущест­
вовавших ранее взаимосвязей переменных.

103
Для прогнозирования зависимой переменной на / шагов вперед не­
обходимо знать прогнозные значения всех входящих в нее факторов. Их
оценки могут быть получены на основе временных экстраполяционных
моделей или заданы пользователем. Эти оценки подставляются в мо­
дель, и получаются прогнозные оценки.
Построение точечных и интервальных прогнозов на основе регрес­
сионной модели. Какие факторы влияют на ширину доверительного ин­
тервала? Для того, чтобы определить область возможных значений ре­
зультативного показателя, при рассчитанных значениях факторов следу­
ет учитывать два возможных источника ошибок: рассеивание наблюде­
ний относительно линии регрессии и ошибки, обусловленные математи­
ческим аппаратом построения самой линии регрессии. Ошибки первого
рода измеряются с помощью характеристик точности, в частности, вели­
чиной Sy. Ошибки второго рода обусловлены фиксацией численного
значения коэффициентов регрессии, в то время как они в действительно­
сти являются случайными, нормально распределенными.
Для линейной модели доверительный интервал рассчитывается
следующим образом. Оценивается величина отклонения от линии рег­
рессии (обозначим ее буквой U):

U(D = SytKpJv^, (4.1.16)
(4.1.17)
где Хар =(Хцп+1), Х2(п+1),..-, Х,ф+1)).

Для модели парной регрессии формула (4.1.16) принимает вид:




J (X(n + l)-XCD)2
l

^{Х,-Хср)2
"

Коэффициент ta является табличным значением f-статистики Стью-
дента при заданном уровне значимости а и числа наблюдений, / - пери­
од прогнозирования. Если исследователь задает вероятность попадания
прогнозируемой величины внутрь доверительного интервала, равную
70%, то ta = 1.05. Если вероятность составляет 95%, то ta = 1.96, а при
99% f„ = 2.65.
104
Как видно из формулы (4.1.18), величина U прямо пропорциональ­
но зависит от точности модели (Sy), коэффициента доверительной веро­
ятности (/„), степени удаления прогнозной оценки фактора Хот среднего
значения и обратно пропорциональна объему наблюдений.
В свою очередь


(4.1.19)
N-2
В результате получаем следующий интервал прогноза для шага
прогнозирования /:
• верхняя граница прогноза равна Y(n + /) + U(l),
• нижняя граница прогноза равна Y(n + I) - U(l).
Если построенная регрессионная модель адекватна и прогнозные
оценки факгоров достаточно надежны, то с выбранной пользователем
вероятностью можно утверждать, что при сохранении сложившихся за­
кономерностей развития прогнозируемая величина попадет в интервал,
образованный нижней и верхней границами.

Пример 4.1.1. Бюджетное обследование семи случайно выбранных
семей дало результаты (в тыс. руб.), показанные в табл. 4.1.3.
Т а б л и ц а 4.1.3
Наблюдение Накопления. Y Доход, X
1 3 40
55
2 6
45
3 5
4 30
35
30
15
5
50
6 45
35
7 2

Требуется:
1) построить однофакторную модель регрессии;
2) оценить накопления семьи, имеющей доход 42 тыс. руб.;
3) отобразить на графике исходные данные, результаты моделирования.

105
Решение.
1. Для вычисления параметров модели следует воспользоваться фор­
мулами (4.1.7) и (4.1.8). Промежуточные расчеты приведены в табл. 4.1.4.
Т аблица4.14
(у, -у. (х,-х) (х, -х)2 (У˜У)
Наблюдение Накопления, Доход, X (х,-х)

<< Пред. стр.

страница 12
(всего 15)

ОГЛАВЛЕНИЕ

След. стр. >>

Copyright © Design by: Sunlight webdesign