Прогнозирование, проектирование и моделирование социальной работы (лекции) - Статистические данные должны быть сопоставимы

Статистические данные должны быть сопоставимы

по территории, кругу охватываемых объектов, единицам измерения, времени регистрации, ценам, методологии расчета. Сопоставимость по территории означает, что данные по странам и регионам, границы которых изменились, должны быть пересчитаны в старых пределах. Сопоставимость по кругу охватываемых объектов означает сравнение совокупностей с равным числом элементов. Территориальная и объемная сопоставимость обеспечивается смыканием рядов динамики, при этом либо абсолютные уровни заменяются относительными, либо делается пересчет в условные абсолютные уровни. Не возникает особых сложностей при обеспечении сопоставимости данных по единицам измерения; стоимостная сравнимость достигается системой сопоставимых цен.

Числовые уровни рядов динамики должны быть упорядоченными во времени. Не допускается анализ рядов с пропусками отдельных уровней, если же такие пропуски неизбежны, то их восполняют условными расчетными значениями.

2. Показатели анализа рядов динамики

При изучении явления во времени перед исследователем встает проблема описания интенсивности изменения и расчета средних показателей динамики. Решается она путем построения соответствующих показателей. Для характеристики интенсивности изменения во времени такими показателями будут:

1)  абсолютный прирост,

2)  темпы роста,

3)  темпы прироста,

4)  абсолютное значение одного процента прироста. Расчет показателей динамики представлен в следующей таблице.

Показатель

Базисный

Цепной

Yi-Y0

Yi-Yi-1

Коэффициент роста (Кр)

Yi : Y0

Yi : Yi-1

Темп роста (Тр)

(Yi : Y0)Ч100

(Yi : Yi-1)Ч100

Коэффициент прироста (Кпр )**

Темп прироста (Тпр)

Абсолютное значение одного процента прироста (А)

В случае, когда сравнение проводится с периодом (моментом) времени, начальным в ряду динамики, получают базисные показатели. Если же сравнение производится с предыдущим периодом или моментом времени, то говорят о цепных показателях.

Рассмотрим пример. Имеются данные об объемах и динамике продаж акций на 15 крупнейших биржах России за пять месяцев 1993 г.

Показатель

Март

Апрель

Май

Июнь

Июль

Август

Объем продаж, млн. руб.

709,98

1602,61

651,83

220,80

327,68

277,12

Абсолютный прирост:

           

цепной,

-

892,63

-950,78

-431,03

106,88

-50,56

базисный

-

892,63

-58,15

-489,18

-382,3

-432,86

Коэффицент (индекс) роста цепной

-

2,257

0,407

0,339

1,484

0,846

Темп роста, %:

           

цепной,

-

225,7

40,7

33,9

148,4

84,6

базисный

100

225,7

91,8

31,1

46,2

39,0

Темп прироста

           

цепной, %

-

125,7

-59,3

-66,1

48,4

-15,4

базисный, %

-

125,7

-8,2

-68,9

-53,8

61,0

Абсолютное значение 1% прироста (цепной)

-

7,10

16,03

6,52

2,21

3,28

Система средних показателей динамики включает:

средний уровень ряда,

средний абсолютный прирост,

средний темп роста,

средний темп прироста.

Средний уровень ряда – это показатель, обобщающий итоги развития явления за единичный интервал или момент

из имеющейся временной последовательности. Расчет среднего уровня ряда динамики определяется видом этого

ряда и величиной интервала, соответствующего каждому уровню.

Для интервальных рядов с равными периодами времени средний уровень Y рассчитывается следующим образом:

где n или (n +1) – общая длина временного ряда или общее число равных временных отрезков, каждому из которых соответствует свой уровень Yi (1 = 1, 2, ..., n или 1 = 0, 1, 2, ..., n).

Средний темп роста:

 

Средний абсолютный прирост рассчитывается по формулам в зависимости от способа нумерации интервалов (моментов).

 

 

где

– средний коэффициент роста, рассчитанный как

коэффициенты роста;

Средний темп прироста (%) определяется по единственной методологии:

 

. Здесь Кцеп – цепные

3. Изучение тенденции развития

Всякий ряд динамики теоретически может быть представлен в виде составляющих:

1)  тренд – основная тенденция развития динамического ряда (к увеличению либо снижению его уровней);

2)  циклические (периодические) колебания, в том числе сезонные;

3)  случайные колебания. Изучение тренда включает два основных этапа:

 

1)  ряд динамики проверяется на наличие тренда;

2)  производится выравнивание временного ряда и непосредственное выделение тренда с экстраполяцией полученных результатов. Непосредственное выделение тренда может быть произведено тремя методами.

 

1.  Укрупнение интервалов. Ряд динамики разделяют на некоторое достаточно большое число равных интервалов. Если средние уровни по интервалам не позволяют увидеть тенденцию развития явления, переходят к расчету уровней за большие промежутки времени, увеличивая длину каждого интервала (одновременно уменьшается количество интервалов).

2.  Скользящая средняя. В этом методе исходные уровни ряда заменяются средними величинами, которые получают

из данного уровня и нескольких симметрично его окружающих. Целое число уровней, по которым рассчитывается

среднее значение, называют интервалом сглаживания. Интервал может быть нечетным (3, 5, 7 и т.д. точек) или

четным (2, 4, 6 и т.д. точек).

При нечетном сглаживании полученное среднее арифметическое значение закрепляют за серединой расчетного

интервала, при четном этого делать нельзя. Поэтому при обработке ряда четными интервалами их искусственно

делают нечетными, для чего образуют ближайший больший нечетный интервал, но из крайних его уровней берут

только 50 %.

Недостаток методики сглаживания скользящими средними состоит в условности определения сглаженных уровней

для точек в начале и конце ряда. Получают их специальными приемами - расчетом средней арифметической

взвешенной.

3. Аналитическое выравнивание. Под этим понимают определение основной проявляющейся во времени тенденции

развития изучаемого явления. Развитие предстает перед исследователем как бы в зависимости только от течения

времени. В итоге выравнивания временного ряда получают наиболее общий, суммарный, проявляющийся во

времени результат действия всех причинных факторов. Отклонение конкретных уровней ряда от уровней,

соответствующих общей тенденции, объясняют действием факторов, проявляющихся случайно или циклически. В

результате приходят к трендовой модели   Yt-f(t)*ct

где f(t) - уровень, определяемый тенденцией развития;

et - случайное и циклическое отклонение от тенденции.

Целью аналитического выравнивания динамического ряда является определение аналитической или графической

зависимости f(t). На практике по имеющемуся временному ряду задают вид и находят параметры функции f(t), а

затем анализируют поведение отклонений от тенденции. Функцию f(t) выбирают таким образом, чтобы она давала

содержательное объяснение изучаемого процесса.

Чаще всего при выравнивании используются следующие зависимости:

линейная f(t)= ao +a1t;

параболическая f(t) - а0 + a1t + a2t2 , экспоненциальные   f(t) = exp (a0 + a 1t)

или f(t) = exp (a0 +a1t+ a2t2 ).

Линейная зависимость выбирается в тех случаях, когда в исходном временном ряду наблюдаются более или менее постоянные абсолютные цепные приросты, не проявляющие тенденции ни к увеличению, ни к снижению. Параболическая зависимость используется, если абсолютные цепные приросты сами по себе обнаруживают некоторую тенденцию развития, но абсолютные цепные приросты абсолютных цепных приростов (разности второг порядка) никакой тенденции развития не проявляют.

Экспоненциальные зависимости применяются, если в исходном временном ряду наблюдается либо более или менее постоянный относительный рост (устойчивость цепных темпов роста, темпов прироста, коэффициентов роста), либ при отсутствии такого постоянства, - устойчивость в изменении показателей относительного роста (цепных темпов роста цепных же темпов роста, цепных коэффициентов роста цепных же коэффициентов или темпов роста и т.п.). Оценка параметров (a0, a1, a2, ...) осуществляется следующими методами:

1)      методом избранных точек,

2)  методом наименьших расстояний,

3)      методом наименьших квадратов (МНК).

В большинстве расчетов используют метод наименьших квадратов, который обеспечивает наименьшую сумму квадратов отклонений фактических уровней от выравненных:

min (Yt-f(t))2.

Для линейной зависимости (f(t)=a0+a1t) параметр а0 обычно интерпретации не имеет, но иногда его рассматривают как обобщенный начальный уровень ряда; а 1 - сила связи, т.е. параметр, показывающий, насколько изменится результат при изменении времени на единицу. Таким образом, а можно представить как постоянный теоретический абсолютный прирост. Построив уравнение регрессии, проводят оценку его надежности. Это делается посредством критерия Фишера (F). Фактический уровень (Fфакт) сравнивается с теоретическим (табличным) значением:

 

 

где k – число параметров функции, описывающей тенденцию; n – число уровней ряда;

Таким образом, f(t) = уt = 10,128-0,073t для t= -13, -11, -9, ..., +13, или f(t) = уt = 11,077-0,1461 для t = 0, 1, ..., 13. Параметры последнего уравнения регрессии можно интерпретировать следующим образом: a0 = 11,077 – это исходный уровень брачности по России за период до 1977 г.; а1 = -0,146 – показатель силы связи, т.е. в России за период с 1977 по 1990 г. происходило снижение уровня брачности на 0,146 ‰ ежегодно.

В качестве примера рассмотрим число зарегистрированных браков на 1000 жителей России за период с 1977 по 1990 г.: Следующий шаг аналитического выравнивания – оценка надежности уравнения регрессии:

Таким образом, Fтеор = 4,747; a = 0,05; v1 (k-1) = 1; v2 = (n-k) = 12 и Fтеор = 9,330 при a = 0,01, v1 = 1, v2 = 12. Fфакт > Fтеор, и уравнение прямой адекватно отражает сложившуюся в исследуемом ряду динамики тенденцию.

Fфакт сравнивается с Fтеор при v1 = (k-1), v2 = (n-k) степенях свободы и уровне значимости a (обычно a = 0,05). Если Fфакт > Fтеор, уравнение регрессии значимо, т.е. построенная модель адекватна фактической временной тенденции. Выравнивание проведено по линейной трендовой модели. Оценка параметров уравнения выполнена методом наименьших квадратов.

 

Год

Число зарегистри-рованных браков, %

t

у×t

t2

f(t)

1977

11,2

-13

-145,6

169

11,077

1978

10,9

-11

-119,9

121

10,931

1979

10,7

-9

-96,3

81

10,785

1980

10,6

-7

-74,2

49

10,639

1981

10,6

-5

-53,2

25

10,493

1982

10,4

-3

-31,2

9

10,347

1983

10,4

-1

-10,4

1

10,202

1984

9,6

1

9,6

1

10,056

1985

9,7

3

29,1

9

9,910

1986

9,8

5

49,0

25

9,764

1987

9,9

7

69,3

49

9,618

1988

9,5

9

85,5

81

9,472

1989

9,4

11

103,4

121

9,326

1990

9,1

13

118,3

169

9,180

Итого

141,8

0

-66,4

910

141,800