Анализ временных рядов в STATISTICA. Преобразования переменных

Детские товары 11.04.2019

Детские товары

Виды и методы анализа временных рядов

Временной ряд представляет собой совокупность последовательных измерений переменной, проведенных через одинаковые интервалы времени . Анализ временных рядов позволяет решать следующие задачи:

исследовать структуру временного ряда, включающую, как правило, тренд - закономерные изменения среднего уровня, а также случайные периодические колебания;
исследовать причинно-следственные взаимосвязи между процессами, определяющие изменения рядов, которые проявляются в корреляционных связях между временными рядами;
построить математическую модель процесса, представленного временным рядом;
преобразовать временной ряд средствами сглаживания и фильтрации;
прогнозировать будущее развития процесса.

Значительная часть известных методов предназначена для анализа стационарных процессов, статистические свойства которых, характеризуемые при нормальном распределении средним значением и дисперсией, постоянны, не меняются с течением времени.

Но ряды часто имеют нестационарный характер. Нестационарность можно устранить следующим образом:

вычесть тренд, т.е. изменения среднего значения, представленного некоторой детерминированной функцией, которую можно подобрать путем регрессионного анализа;
выполнить фильтрацию специальным нестационарным фильтром.

Для стандартизации временных рядов в целях единообразия методов

анализа целесообразно провести их общее или посезонное центрирование путем деления на среднюю величину, а так же нормирование путем деления на стандартное отклонение.

Центрирование ряда удаляет ненулевое среднее значение, которое может затруднить интерпретацию результатов, например, при спектральном анализе. Цель нормирования - избежать в вычислениях операций с большими числами, что может привести к снижению точности расчетов.

После указанных предварительных преобразований временного ряда может быть построена его математическая модель, по которой осуществлено прогнозирование, т.е. получено некоторое продолжение временного ряда.

Чтобы результат прогноза можно было сопоставить с исходными данными, над ним следует произвести преобразования, обратные выполненным.

На практике наиболее часто используют методы моделирования и прогнозирования, а корреляционный и спектральный анализ рассматривают как вспомогательные методы. Это заблуждение. Методы прогнозирования развития средних тенденций позволяют получить оценки с существенными погрешностями, что весьма затрудняет прогнозирование будущих значений переменной, представленной временным рядом.

Методы корреляционного и спектрального анализа позволяют выявить различные, в том числе инерционные свойства системы, в которой идет развитие изучаемых процессов. Применение этих методов позволяет по текущей динамике процессов с достаточной уверенностью установить, как и с какой задержкой, известная динамика скажется на будущем развитии процессов. Для долгосрочного прогнозирования эти виды анализа позволяют получить ценные результаты.

Анализ и прогнозирование тренда

Анализ тренда предназначен для исследования изменений среднего значения временного ряда с построением математической модели тренда и с прогнозированием на этой основе будущих значений ряда. Анализ тренда выполняют путем построения моделей простой линейной или нелинейной регрессии.

Используемые исходные данные представляют собой две переменные, одна из которых - значения временного параметра, а другая - собственно значения временного ряда. В процессе анализа можно:

опробовать несколько математических моделей тренда и выбрать ту, которая с большей точностью описывает динамику изменения ряда;
построить прогноз будущего поведения временного ряда на основании выбранной модели тренда с определенной доверительной вероятностью;
удалить тренд из временного ряда в целях обеспечения его стационарности, необходимой для корреляционного и спектрального анализа, для этого после расчета регрессионной модели необходимо сохранить остатки для выполнения анализа.

В качестве моделей трендов используют различные функции и сочетания, а так же степенные ряды, иногда называемые полиномиальными моделями. Наибольшую точность обеспечивают модели в виде рядов Фурье, однако не многие статистические пакеты позволяют использовать такие модели.

Проиллюстрируем получение модели тренда ряда. Используем ряд данных о валовом национальном продукте США на период 1929-1978 гг. в текущих ценах. Построим полиномиальную регрессионную модель. Точность модели повышалась, пока степень полинома не достигла пятой:

У = 145,6 - 35,67* + 4,59* 2 - 0,189* 3 + 0,00353х 4 + 0,000024* 5 ,

(14,9) (5,73) (0,68) (0,033) (0,00072) (0,0000056)

где У - ВНП, млрд дол.;

* - годы, отсчитываемые от первого 1929 г.;

под коэффициентами указаны их стандартные ошибки.

Стандартные ошибки коэффициентов модели малы, не достигают величин, равных половине значений коэффициентов модели. Это свидетельствует о хорошем качестве модели.

Коэффициент детерминации модели, равный квадрату приведенного коэффициента множественной корреляции составил 99%. Это означает, что модель объясняет данные на 99%. Стандартная ошибка модели оказалась равна 14,7 млрд, а уровень значимости нулевой гипотезы - гипотезы об отсутствии связи - менее 0,1%.

С помощью полученной модели можно дать прогноз, который в сопоставлении с фактическими данными приведен в табл. ПЗ. 1.

Прогноз и фактический размер ВНП США, млрд дол.

Таблица ПЗ.1

Прогноз, полученный с помощью полиномиальной модели, не слишком точен, о чем свидетельствуют данные, приведенные в таблице.

Корреляционный анализ

Корреляционный анализ необходим для выявления корреляций и их лагов - задержек их периодичности. Связь в одном процессе получила название автокорреляции, а связь между двумя процессами, характеризуемыми рядами - кросскорреляции. Высокий уровень корреляции может служить индикатором причинно-следственных связей, взаимодействий внутри одного процесса, между двумя процессами, а величина лага указывает временную задержку в передаче взаимодействия.

Обычно в процессе расчета значений корреляционной функции на к -м шаге вычисляется корреляция между переменными по длине отрезка / = 1,..., (п - к) первого ряда X и отрезка / = к ,..., п второго ряда К Длина отрезков, таким образом, меняется.

В результате получается некоторая трудная для практической интерпретации величина, напоминающая параметрический коэффициент корреляции, но не идентичная ему. Поэтому возможности корреляционного анализа, методику которого используют во многих статистических пакетах, ограничены узким кругом классов временных рядов, которые нехарактерны для большинства экономических процессов.

Экономистов в корреляционном анализе интересует исследование лагов в передаче воздействия от одного процесса к другому или влияния начального возмущения на последующее развитие того же самого процесса. Для решения таких задач была предложена модификация известного метода, названная интервальной корреляцией ".

Кулаичев А.П. Методы и средства анализа данных в среде Vindows. - М.: Информатика и компьютеры, 2003.

Интервальная корреляционная функция представляет собой последовательность коэффициентов корреляции, вычисленных между фиксированным отрезком первого ряда заданного размера и положения и равными им по размеру отрезками второго ряда, выбранных с последовательными сдвигами от начала ряда.

В определение добавляется два новых параметра: длина сдвигаемого фрагмента ряда и его начальное положение, а также используется принятое в математической статистике определение коэффициента корреляции Пирсона. Благодаря этому вычисляемые значения становятся сравнимы между собой и просто интерпретируемы.

Обычно для выполнения анализа необходимо выбрать одну или соответственно две переменные для автокорреляционного или кросскорреляцион-ного анализа, а так же задать следующие параметры:

Размерность временного шага анализируемого ряда для согласования

результатов с реальной временной шкалой;

Длину сдвигаемого фрагмента первого ряда, в виде числа включаемых в

него элементов ряда;

Сдвиг этого фрагмента относительно начала ряда.

Разумеется, необходимо выбрать вариант интервальной корреляции или иной корреляционной функции.

Если для анализа выбрана одна переменная, то вычисляются значения автокорреляционной функции для последовательно увеличивающихся лагов. Автокорреляционная функция позволяет определить, в какой степени динамика изменения заданного фрагмента воспроизводится в сдвинутых во времени его же отрезках.

Если для анализа выбраны две переменные, то вычисляются значения кросскорреляционной функции для последовательно увеличивающихся лагов - сдвигов второй из выбранных переменных относительно первой. Кросскорреляционная функция позволяет определить, в какой степени изменения фрагмента первого ряда воспроизводятся в сдвинутых во времени фрагментах второго ряда.

Результаты анализа должны включать оценки критического значения коэффициента корреляции г 0 для гипотезы «г 0 = 0» на определенном уровне значимости. Это позволяет не принимать во внимание статистически незначимые коэффициенты корреляции. Необходимо получить значения корреляционной функции с указанием лагов. Весьма полезны и наглядны графики авто- или кросскорреляционных функций.

Проиллюстрируем применение кросскорреляционного анализа на примере. Оценим взаимосвязи темпов прироста ВНП США и СССР за 60 лет с 1930 по 1979 гг. Для получения характеристик долгосрочных тенденций сдвигаемый фрагмент ряда выбран длиной 25 лет. В результате были получены коэффициенты корреляции при разных лагах.

Единственный лаг, при котором корреляция оказывается значимой - 28 лет. Коэффициент корреляции при этом лаге составляет 0,67, тогда как пороговое, минимальное значение - 0,36. Оказывается, что цикличность долгосрочного развития экономики СССР с лагом величиной 28 лет была тесно связана с цикличностью долгосрочного развития экономики США.

Спектральный анализ

Общепринятый способ анализа структуры стационарных временных рядов - это использование дискретного преобразования Фурье для оценки спектральной плотности или спектра ряда. Этот метод можно применять:

для получения описательных статистик одного временного ряда или описательных статистик зависимостей между двумя временными рядами;
для выявления периодических и квазипериодических свойств рядов;
для проверки адекватности моделей, построенных другими методами;
для сжатого представления данных;
для интерполяции динамики временных рядов.

Точность оценок спектрального анализа можно повысить за счет применения специальных методов - использования сглаживающих окон и методов усреднения.

Для анализа необходимо выбрать одну или две переменные, при этом должны быть заданы следующие параметры:

размерность временного шага анализируемого ряда, необходимая для согласования результатов с реальной временной и частотной шкалами;
длина к анализируемого отрезка временного ряда, в виде числа включаемых в него данных;
сдвиг очередного отрезка ряда к 0 относительно предыдущего;
тип временного окна сглаживания для подавления в спектре так называемого эффекта вытекания мощности ;
тип усреднения частотных характеристик, вычисленных на последовательных отрезках временного ряда.

Результаты анализа включают спектрограммы - значения характеристик амплитудно-частотной спектра и значения фазочастотных характеристик. В случае кросс-спектрального анализа результаты - это также значения передаточной функции и функции когерентности спектра. Результаты анализа могут включать и данные периодограмм.

Амплитудно-частотная характеристика кросс-спектра, называемая также кросс-спектральной плотностью, представляет зависимость амплитуды взаимного спектра двух взаимосвязанных процессов от частоты. Такая характеристика наглядно показывает, на каких частотах наблюдается синхронные и соответствующие по величине изменения мощности в двух анализируемых временных рядах или где находятся области их максимальных совпадений и максимальных несовпадений.

Проиллюстрируем применение спектрально анализа на примере. Проанализируем волны экономической конъюнктуры в Европе в период начала индустриального развития. Для анализа используем не сглаженный временной ряд индексов цен на пшеницу, усредненных Бевериджем по данным 40 рынков Европы за 370 лет с 1500 по 1869 г. Получим спектры

ряда и отдельных его отрезков продолжительностью 100 лет через каждые 25 лет.

Спектральный анализ позволяет оценить мощность каждой гармоники спектра. Наиболее мощными оказываются волны с 50-летним периодом, которые, как известно, были открыты Н. Кондратьевым 1 и получили его имя. Анализ позволяет установить, что сформировались они не в конце XVII - начале XIX в., как полагают многие экономисты. Они сформировались с 1725 по 1775 г.

Построение моделей авторегрессии и проинтегрированного скользящего среднего (ARIMA) считаются полезными для описания и прогнозирования стационарных временных рядов и нестационарных рядов, обнаруживающих однородные колебания вокруг изменяющегося среднего значения.

Модели ARIMA представляют собой комбинации двух моделей: авторегрессии {AR) и скользящего среднего (moving average - МА).

Модели скользящего среднего (МА) представляют стационарный процесс в виде линейной комбинации последовательных значений так называемого «белого шума». Такие модели оказываются полезными как в качестве самостоятельных описаний стационарных процессов, так и в качестве дополнения к моделям авторегрессии для более детального описания шумовой составляющей.

Алгоритмы вычисления параметров модели МА очень чувствительны к неправильному выбору числа параметров для конкретного временного ряда, особенно в сторону их увеличения, что может выражаться в отсутствии сходимости вычислений. Рекомендуется не выбирать на начальных этапах анализа модель скользящего среднего с большим числом параметров.

Предварительное оценивание - первый этап анализа с использованием модели ARIMA. Процесс предварительного оценивания прекращается по принятию гипотезы об адекватности модели временному ряду или по исчерпанию допустимого числа параметров. В итоге результаты анализа включают:

значения параметров авторегрессионой модели и модели скользящего среднего;
для каждого шага прогнозирования указываются - среднее значение прогноза, стандартная ошибка прогноза, доверительный интервал прогноза для определенного уровня значимости;
статистику оценки уровня значимости гипотезы не коррелированное™ остатков;
графики временного ряда с указанием стандартной ошибки прогноза.

Значительная часть материалов раздела ПЗ основана на положениях книг: Басовский Л.Е. Прогнозирование и планирование в условиях рынка. - М.: ИНФРА-М, 2008. Гилмор Р. Прикладная теория катастроф: В 2 кн. Кн. 1/ Пер. с англ. М.: Мир, 1984.
Жан Батист Жозеф Фурье (Jean Baptiste Joseph Fourier ; 1768-1830) - французский математик и физик.
Николай Дмитриевич Кондратьев (1892-1938) - русский и советский экономист.

Реальные процессы свойством стационарности второго порядка могут и не обладать. Однако с помощью достаточно несложных преобразований часто удается привести наблюдаемый ряд к стационарному процессу.

Примерами таких преобразований являются:

а) взятие конечных разностей

D yt – первая разность. Это преобразование целесообразно использовать, когда закон изменения yt близок к линейному.

D хt – вторая разность. Преобразование применяется, когда закон изменения yt близок к квадратической зависимости и т. д.;

б) логарифмирование цепных индексов

Применяется при экспоненциальном росте уt, t =1,2,..., Т;

в) расчет темпов прироста

а также некоторые другие.

Заметим, что преобразование (6.41) предоставляет исследователю несколько большие “удобства” в формировании исходной информации по сравнению с другими. Это связано с тем, что оно позволяет достаточно просто изменять временные серии исходных данных в связи, например, с укрупнением временных интервалов. В самом деле, предположим, что возникла необходимость проанализировать временные ряды серии удвоенного временного интервала (t–1, t+1), т. е., например, у1, у3, у5,..., уt–1, уt +1,... . Для такой серии преобразование (6.41) приводит к следующему временному ряду:

где хt+1, 2 – преобразованное значение показателя на удвоенном интервале.

Его величина представляет собой простую арифметическую сумму преобразованных значений показателей исходных интервалов, объединение которых привело к новой серии.

В то же время для преобразования (6.42) в этом случае получим более сложное выражение, определяющее для значения нового временного ряда:

Для превращения исходного нестационарного ряда в стационарный могут быть использованы и другие преобразования. Например, хt=lnуt, и т. д. В каждом конкретном случае, выбирая преобразование, необходимо исходить из примерной формы временного графика зависимости уt.

“Удачное” преобразование должно обеспечивать приблизительное выполнение условия xt=f(уt)»const.

В условиях постоянства математического ожидания и дисперсии особенности конкретного стационарного процесса второго порядка полностью определяются характером его автокорреляционной функции, имеющей вид зависимости значений коэффициентов автокорреляции от сдвига. Иными словами, автокорреляционная функция является дискретной и представляет собой последовательность значений коэффициентов автокорреляции r0, r1,..., ri–1,..., поставленных в зависимость от сдвига i, где r0=1, –1£ri£1, i=1,2,... .

Аналогично можно сформировать автоковариационную функцию стационарного процесса уt, представив ее в виде последовательности коэффициентов автоковариаций g0, g1,..., gi,..., поставленных в зависимость от сдвига i. Напомним, что между соответствующими значениями этих функций существует однозначная взаимосвязь gi =ri ?s y2, i=0,1,... , т. е. g 0=s y2.

Автокорреляционную функцию можно представить как проекцию диагональных элементов автокорреляционной матрицы на ось сдвигов (см. рис. 6.1).

Все множество стационарных процессов второго порядка в общем случае в зависимости от особенностей их автокорреляционных функций разбивается на несколько однородных групп, для каждой из которых можно подобрать и построить адекватную модель.

В общем случае можно выделить три группы таких моделей – модели авторегрессии (autoregressive), модели скользящего среднего (moving average) и смешанные модели авторегрессии-скользящего среднего (autoregressive- moving average).

Метод прогнозирования - способ создания прогноза через практические и теоретические действия. Существует большое количество методов прогнозирования. Единой классификации методов прогнозирования не существует .

Прогнозирование временного ряда - вычисление величины его будущих значений либо характеристик, позволяющих определить эту величину, на основании анализа известных значений. Величина, подлежащая прогнозу, называется прогнозируемой величиной (ПВ) .

Данные, представленные в виде временных рядов, интерпретируются в качестве последовательностей измерений, упорядоченных в неслучайные моменты времени. В отличие от анализа случайных выборок, анализ временных рядов основывается на предположении, что последовательные значения данных наблюдаются через равные промежутки времени (тогда как в других методах не важна и часто неинтересна привязка наблюдений ко времени). Задача прогнозирования временных рядов заключается в предсказании будущего поведения системы (вычисления будущих, неизвестных значений того или иного временного ряда) по имеющейся последовательности ее предыдущих состояний.

Прогнозирование временных рядов является важной научно-технической проблемой, т.к. позволяет предсказать поведение различных факторов в экологических, экономических, социальных и иных системах. Таким образом, основной целью любого прогнозирования является создание некой «машины времени», которая позволяет заглянуть в будущее и оценить тенденции в изменениях того или иного фактора. Такая «машина времени» в большинстве случаев базируется на методах математического моделирования, в частности, на построении модельной авторегрессии, скользящей по временному ряду и позволяющей осуществлять экстраполирование на несколько шагов вперед.

Существует множество методов прогнозирования. Одним из них является многослойный персептрон. Многослойный персептрон - это полносвязная модель без обратных связей. Количество слоев и нейронов в них обычно обусловлено постановкой задачи и вычислительными способностями ЭВМ.

Схему решения задачи прогнозирования можно представить в виде последовательности этапов (рис. 5.1).

Если временной ряд порождается динамической системой, т.е. значения {a(t)} - произвольная функция состояния такой системы, существует такое число d, что d предыдущих значений временного ряда однозначно определяет следующее значение. На практике большинство прогнозируемых временных рядов порождаются сложными динамическими системами, для которых велико значение d. Кроме того, в самом временном ряде может присутствовать случайная составляющая. Поэтому на этапе предварительных преобразований выполняются предварительные преобразования исходных данных, позволяющие уменьшить ошибку прогнозирования .

Предварительные преобразования (ПП) - получение для момента времени ti набора из определяющих факторов и соответствующего им значения ПВ. Определяющие факторы представляют собой некую функцию от прошлых значений временного рядя. После выполнения ПП для различных моментов времени t, временной ряд представляется в виде множества значений функции зависимости от определяющих факторов. Из множества полученных наборов выделяются два непересекающиеся подмножества. Одно из них представляет собой исходные данные (обучающую выборку). Другое подмножество представляет собой контрольную выборку, используется для проверки качества прогноза. Таким образом, прогнозирование временного ряда сводится к задаче интерполяции функции многих переменных. Система прогнозирования используется для восстановления этой функции по множеству наборов, входящих в состав обучающей выборки .

Определенной сложностью является формирование обучающей выборки, которая должна выполнять требования к полноте (выборка не должна содержать пропуски, должна содержать все допустимые примеры исследуемого диапазона) и непротиворечивости (выборка не должна содержать противоречивых примеров). Для проверки обучающей выборки на соответствие требованиям необходима оценка их качества, непосредственно определение понятий качества выборки, критериев оценки качества и разработки математического аппарата для их однозначной оценки. Для повышения прогностической способности допустимы (иногда необходимы) дополнительные преобразования, такие как методы фильтрации и восстановления данных (например, вейвлет-преобразование) .

Очевидно, с увеличением количества входных переменных погрешность растет. Также следует отметить, что погрешность слабо разнится у систем с одинаковой размерностью входных данных. Несмотря на достаточно высокие показатели погрешности, целесообразно проверить полученные результаты на тестовой выборке и сравнить с реальными показателями.

Например, искусственная нейронная сеть показывают хорошие результаты, когда размер обучающей выборки имеет приблизительно 200-300 значений. В случаях, когда временной ряд содержит тысячи, десятки тысяч значений, оптимальным было бы сократить его до нужного размера, при этом, не потеряв его значимости, отразив всю нужную информацию, т.е. осуществить сегментацию таким образом, чтобы временной ряд имел более компактное представление, но при этом ошибка прогноза по преобразованным данным не была недопустимой (рис. 5.2).

К сожалению, в работах большинства авторов основное внимание уделено выбору архитектуры алгоритма, способу обучения нейронных сетей, а этап ПП рассматривается лишь в контексте конкретной практической задачи, либо не рассматривается вообще. Как правило приводится описание определенного типа ПП и результатов, полученных от его использования в той или иной области, а сравнительного анализа с другими типами ПП и критериев, по которым можно было бы их сравнить, не приводится. Тем не менее, ПП влияет на результат решения задачи прогнозирования, т.к. результат ПП является исходными данными для алгоритмов прогнозирования. Корректно проведенный этап ПП может значительно уменьшить ошибку прогноза. Использование в качестве предварительного преобразования сверток исходных данных позволит описать ситуацию меньшим количеством признаков без потери или с допустимой потерей точности. Это также приводит к сокращению времени обучения нейронной сети .

Итак, необходимо разработать алгоритм, который позволит сформировать выборку по временному ряду таким образом, что потеря точности будет в допустимых пределах, а уменьшение количества значений не повлечет за собой увеличение ошибки алгоритма прогнозирования. Следовательно, входными данными будет являться временной ряд, выходными - выборка, которая в последствии будет являться входными данными для алгоритмов прогнозирования.

Данный алгоритм должен удовлетворять следующим требованиям:

-- возможность восстановления будущих значений ВР с требуемой точностью;
-- описывать ситуацию меньшим количеством признаков без потери или с допустимой потерей точности;
-- исключать избыточность;
-- обеспечивать стационарность ряда признаков;
-- обеспечить непротиворечивость ряда признаков.

Преобразование временных рядов включает в себя приемы, позволяющие сделать ряды более удобными для анализа. В частности, оно включает в себя такие приемы, как приведение рядов к одному основанию и смыкание рядов.

Приведение рядов к одному основанию позволяет лучше увидеть, какой ряд растет быстрее, а какой медленнее. К этому приему приходится прибегать тогда, когда сравниваемые ряды имеют разные начальные периоды, исчислены в разной валюте или имеют другие различия, затрудняющие их непосредственное сравнение.

Для приведения рядов к одному основанию выбирается один, общий для всех рядов начальный период, который берется за 100%.

Надо сказать, что выбор начального периода в какой-то мере предопределяет результаты анализа: при одной начальной базе более “быстрым” может показаться один ряд, а при другой базе - иной. Приведем пример. Имеются следующие данные о численности населения Ростовской области за ряд лет:

Численность населения Ростовской области

(тыс.чел. на начало года)

Если взять за базу 1970 г., то можно будет сделать вывод о более быстром росте городского населения:

в процентах к 1970 г.

Картина получится совсем иной, если взять за базу 1988 г. Для последнего случая мы будем иметь такую таблицу:

Динамика численности населения Ростовской области

в процентах к 1988 г.

Данный пример говорит о том, что надо очень продумано подходить к выбору начальной базы для сравниваемых рядов.

Выбор упомянутой базы - проблема не математическая, а общеэкономическая. Никакого простого правила для правильного выбора начальной базы рядов, приводимых к одному основанию, не существует. Надо только помнить, что выбор начальной базы может тем или иным способом повлиять на конечный вывод. Надо также понимать, что это обстоятельство может быть использовано недобросовестными исследователями для сознательного искажения динамики изучаемых явлений.

Смыкание временных рядов. К этому приему приходится прибегать тогда, когда надо создать один длинный, сквозной ряд из нескольких коротких рядов, отличающихся либо методологией расчета показателей, либо границами территории, либо ценами, что не позволяет их соединить вместе без всяких пересчетов. Смыкание рядов может быть осуществлено только в том случае, если ряды имеют хотя бы один общий период.

Для иллюстрации приведем следующий пример. По одному из районов области имеются данные о численности населения с 1970 г. по 1990 г. в одних границах, а с 1990 г. по 1998 г. - в других. Эти данные представлены ниже:

Численность населения района

на начало года (тыс.чел.)

Поскольку у двух рядов имеется один общий год, постольку их смыкание возможно. По данным этого общего года исчисляем коэффициент пересчета данных для старых границ в данные для новых границ:

С помощью этого коэффициента делаем пересчет численности населения:

для 1970 г. 200х1.25 = 250

для 1985 г. 230х1.25 = 287.5

Можно сделать и обратный пересчет - из новых границ в старые:

для 1995 г. 330: 1.25 = 264

для 2000 г. 340: 1.25 = 272

В результате этих пересчетов получаем такую таблицу:

Численность населения района

на начало года (тыс.чел.)

Контрольные вопросы к теме «Анализ динамики социально-экономических процессов»

1. Что такое ряды динамики и из роль в статистическом анализе?

2. Укажите виды рядов динамики.

3. Чем объясняется выбор формулы для нахождения среднего уровня динамического ряда?

4. Какие показатели рассчитываются для характеристики изменений уровней ряда динамики?

5. Как рассчитывается средний темп (коэффициент) роста и прироста?

6. В каких случаях применяют «период удвоения ряда»?

7. Укажите приемы, применяемые для преобразования временных рядов.

8. Каким образом временные ряды приводят к одному основанию?

9. Чем вызвана необходимость смыкания временных рядов?

10. Назовите методы анализа основной развития в рядах динамики.

11. На чем основан метод укрупнения интервалов?

12. Охарактеризуйте метод скользящей средней, его недостатки и достоинства.

13. Чем вызвана необходимость аналитического выравнивания рядов?

14. Какие уравнения регрессии наиболее часто используются для выравнивания динамических рядов?

15. Какой критерий применяется для оценки качества модели динамического ряда?

16. Как измеряются сезонные колебания в динамических рядах?

17. Как рассчитываются индексы сезонности?

18. Как измеряется автокорреляция в рядах динамики?

19. Дайте понятие экстраполяции рядов динамики.

20. Укажите простейшие приемы прогнозирования.

Контрольные задания к теме «Анализ динамики социально-экономических процессов»

1. Имеются следующие данные об остатках сырья и материалов на складе предприятия, млн. руб.: на 1/01 – 400; на 1/02 - 455; на 1/03 – 465; на 1/04 – 460. Определить среднемесячный остаток сырья и материалов на складе предприятия за 1 квартал.

2. Имеются следующие данные об остатках дебиторской задолженности фирмы “Сатурн” на начало месяца (тыс. руб.):

Определите: 1)вид ряда динамики;

2) среднемесячные уровни остатка дебиторской задолженности за I, за II кварталы и за полугодие;

3) изменение остатка дебиторской задолженности во II квартале по сравнению с I кварталом.

3. Остатки вкладов населения в сбербанках города в 2002 году характеризуются следующими данными на 1-е число месяца, руб.:

Определите: среднемесячные остатки вкладов за 1 и 2 кварталы; средние остатки вкладов за полугодие; абсолютный прирост изменения среднего остатка вклада во II квартале по сравнению с I.

4. Имеются следующие данные о товарных запасах розничного торгового предприятия, млн. руб.: на 1.01.2002 г. – 61,1; на 1.05.2002 г. – 57,5; на 1.08.2002 г. – 51,3; на 1.01.2003г. – 74,7. Вычислить среднегодовой товарный запас розничного торгового предприятия за 2002 год.

5. Остаток средств на расчетном счете предприятия составил на 1.01.2003 г. 180 тыс. руб., 15.01 поступило на расчетный счет 900 тыс. руб., 22.01. списано со счета 530 тыс. руб., 27.01 поступило 380 тыс. руб. С 28.01. до конца месяца остаток средств на расчетном счете не изменился. Определить среднесуточный остаток средств на расчетном счете предприятия в январе.

6. Определить, на сколько рублей и на сколько процентов различаются средние остатки по вкладам за I квартал, если на 1.01.2003 г. остаток по первому вкладу составлял 500 у.е., по второму вкладу – 700 у.е. В течение I квартала имели место следующие изменения величины остатков вкладов (у.е.):

Определить среднегодовое производство продукции за 1993 – 1998 гг.

7. Имеются следующие данные Госкомстата РФ о количестве россиян отдыхающих за рубежом в период 1999-2003 годы (тыс. чел.):

Среднегодовое количество россиян, отдыхающих за рубежом;

Среднегодовые темпы роста и прироста;

Изобразите динамику россиян, отдыхающих за рубежом, на графике. Сделайте выводы.

8. Ввод в действие жилых домов предприятиями всех форм собственности в одном из регионов в 1997-2001 годах характеризуется следующими данными, млн. кв. м общей площади:

Для анализа ряда динамики исчислите:

Абсолютные приросты, темпы роста, темпы прироста – базисные и цепные, абсолютное содержание 1% прироста, пункты роста. Полученные данные представьте в таблице;

Средний уровень ряда;

Среднегодовой абсолютный прирост;

Среднегодовые темпы роста и прироста

9. Производство продукции предприятия характеризуется следующими данными:

Проведите анализ ряда динамики и исчислите:

Средний уровень ряда;

Среднегодовой абсолютный прирост;

10. Имеются следующие данные о производстве продукции предприятия за 1998-2003 гг. (в сопоставимых ценах), млн. руб.

Определить аналитические показатели ряда динамики производства продукции предприятия за 1998-2003 гг.

Абсолютные приросты, темпы роста, темпы прироста – базисные и цепные, - абсолютное содержание 1% прироста, пункты роста. Полученные данные представьте в таблице;

Средний уровень ряда;

Среднегодовой абсолютный прирост;

Среднегодовой темп роста и прироста.

11. Имеются следующие данные о продаже легковых автомобилей в РФ:

Для анализа ряда динамики исчислите:

Средний уровень ряда;

Среднегодовой абсолютный прирост;

Среднегодовой темп роста и прироста.

12. Имеются данные о бюджетных расходах РФ на исследования и разработки в постоянных ценах 1996 г. за 1996 – 2004 гг.

Рассчитайте показатели динамики затрат на исследования и разработки за период 1996 – 2004 гг. Сделайте выводы.

13. Количество дорожно-транспортных происшествий (ДТП), совершенных водителями в регионе, увеличилось в 1995 по сравнению с 1990 годом на 2 тыс. или на 4%; в 2000 году по сравнению с 1995 годом их число возросло на 30%, а в 2002 году по сравнению с 2000 годом – на 2%. Определить количество ДТП в 1990, 1995, 2000 и 2002 годах.

14. Численность населения региона возросла за период с 1.01.1999 по 1.01.2002 г. на 4,2%, при этом удельный вес мужского населения за этот период увеличился с 42,1 до 44,3%. Определить показатели динамики численности мужского и женского населения региона.

15. Удельный вес городского населения региона увеличился с 1.01 1993 г. по 1.01.2000 г. с 36,2 до 42,8%. Определить показатели динамики численности городского и сельского населения региона, если общая численность населения данного региона за этот период возросла на 8,4%.

16. Динамика объема реализации услуг коммунальных предприятий города в процентах к 1999г. составила: 2000г. – 108,0; 2001 г. – 110,5; 2002 г. – 125,0; 2003 г. – 153,2. Определить среднегодовой темп прироста за период 1999 – 2003 гг.

17. Среднегодовые темпы роста продукции за период 1999 – 2003 гг. в тяжелой промышленности составили 102,6%, а в легкой промышленности – 105,3%. Величина продукции в 2003 г. (в у.е.) составила в тяжелой промышленности – 7820, а в легкой – 8590. Определите среднегодовой темп роста продукции в целом за период 1999 – 2003 гг.

18. Заполнить таблицу:

19. Имеются данные о среднемесячной заработной плате на одного работника и стоимости набора 25 основных продуктов питания в расчете на одного человека в РФ за первое полугодие 1999 года.

Привести ряды динамики к сопоставимому виду, вычислить коэффициенты опережения, сделать краткие выводы.

20. Имеются данные о динамике кредитов коммерческих банков по видам (по состоянию на 1 января), млн. руб.:

Приведите ряды к одному основанию. Определите коэффициенты опережения темпов роста краткосрочных кредитов по сравнению с долгосрочными кредитами.

21. Имеются следующие данные о розничном товарообороте по одному из районов города (млн. руб.). Осуществить смыкание рядов.

22. Приведите уровни следующего ряда динамики, характеризующие численность работников фирмы, к сопоставимому виду, чел.:

23. Имеются данные об объеме продукции (млн. руб.), вычисленные по старой и новой методике. Приведите уровни ряда к сопоставимому виду.

Преобразование данных

Задание выходной переменной выделения компонента из переменной даты/времени

Рисунок 8-29

Выделение части переменной даты/времени, шаг 2

E Введите имя в поле Выходная переменная. Оно не может быть именем существующей переменной.

E Если Вы выделяете компонент даты или времени из переменной даты/времени, то в списке Формат выходной переменной необходимо выбрать формат. В тех случаях, когда выходной формат не требуется, список Формат выходной переменной будет недоступен.

Дополнительно Вы можете:

 Задать описательную метку для новой переменной.

Преобразования временных рядов

Есть несколько способов преобразования данных, которые полезны при анализе временных рядов:

 Генерация переменных, содержащих даты, для задания периодичности и разделения периодов обучения, контроля и предсказания.

 Создание новых переменных как функций существующих переменных временных рядов.

 Замена системных или пользовательских пропущенных значений оценками (имеются несколько методов).

Временной ряд представляет собой измерения переменной (или совокупности переменных) в течение некоторого периода времени. Преобразования временных рядов предполагают такую структуру файла данных, в которой каждая строка (наблюдение)

представляет набор характеристик в определенный момент времени, а интервалы времени между наблюдениями равны

Задать даты

Процедура Задать даты генерирует переменные, которые могут быть использованы для выделения периодических компонент временного ряда , а также в качестве меток вывода в анализе временных рядов.

Рисунок 8-30

Диалоговое окно Задать даты

Наблюдения - это. Здесь задаются единицы времени, которые будут использоваться для создания дат.

 При выборе пункта Без даты все ранее введенные переменные, содержащие даты, удаляются. Уничтожаются переменные со следующими именами:year_ ,quarter_ ,month_ ,week_ ,day_ ,hour_ ,minute_ ,second_ иdate_ .

 Выбор пункта Настраиваемая означает, что существуют специальные переменные, содержащие даты, созданные с помощью командного синтаксиса (например, четырехдневная рабочая неделя). Этот пункт просто отражает текущее состояние активного набора данных. Выбор его из списка не даст никакого результата.

Первое наблюдение. Здесь задается значение начальной даты, которое будет присвоено первому наблюдению. Последующим наблюдениям будут присвоены последовательные значения, основанные на заданном интервале времени.

Периодичность более высокого уровня. Указывает на циклы, например, число месяцев в году или число дней в неделе. Выведенное значение указывает максимальное число, которое можно ввести. Для часов, минут и секунд максимум - это отображаемое значение минус один.

Для каждой компоненты, которая используется для задания дат, создается новая числовая переменная. Имена новых переменных оканчиваются знаком подчеркивания. На основе всех компонент создается описательная текстовая переменная date_ . Например, если Вы

Преобразование данных

выберете Недели, дни, часы , то создается четыре новых переменных:week_ ,day_ ,hour_ иdate_ .

Если переменные дат уже существуют, то при задании новых дат, новые переменные дат заменят существующие переменные дат, имеющие такие же имена.

Как задать даты для Данных временного ряда

E Выберите в меню:

Данные > Задать даты...

E Выберите временной интервал из списка Наблюдения - это.

E Введите значения даты в поля Первое наблюдение. Введенные значения задают дату, присваиваемую первому наблюдению.

Переменные, созданные процедурой Задать даты, и переменные, имеющие тип даты

Переменные, созданные процедурой Задать даты, не следует путать с переменными, имеющими формат типа Дата, который определяется при задании свойств переменных. Переменные, созданные процедурой Задать даты, служат для определения периодичностей временного ряда. Переменные, имеющие формат Дата, представляют даты и/или времена, отображаемые в различных форматах. Значения переменных, созданных процедурой Задать даты, - это целые положительные числа, каждое из которых представляет количество дней, недель, часов или других единиц времени, прошедших с заданного пользователем начального момента времени. Значения же большей части переменных в формате Дата представляют собой количества секунд, прошедших с 14 октября 1582 года.

Создать временной ряд

Диалоговое окно Создать временной ряд используется для создания новых переменных, которые являются функциями существующих переменных, образующих временной ряд . Эти новые переменные полезны во многих процедурах анализа временных рядов.

По умолчанию имя новой переменной создается следующим образом: берутся шесть символов имени исходной переменной, добавляется подчеркивание (‘_’), затем добавляется порядковый номер. Например, для переменной price новая переменная будетprice_1 . Новые переменные сохраняют все метки значений исходных переменных.

Функции, предназначенные для создания временных рядов, включают разности, скользящие средние, скользящие медианы, функции задержки (лаги) и опережения.

Рисунок 8-31

Диалоговое окно Создать временной ряд

Как создать новую переменную, представляющую временной ряд

E Выберите в меню:

Преобразовать > Создать временной ряд...

E Выберите функцию, которую Вы хотите использовать для преобразования существующих переменных в новые.

E Выберите переменные, из которых Вы хотите создать новые временные ряды. Допускается использование только числовых переменных.

Дополнительно Вы можете:

 Ввести имена новых переменных, если Вам не подходят имена, присваиваемые автоматически.

 Изменить функцию для выбранной переменной.

Функции преобразования временных рядов

Разность. Несезонная разность между последовательными значениями ряда. Порядок здесь - это число предшествующих значений, используемых для вычисления разности. Поскольку для каждого следующего порядка одно наблюдение теряется, в начале ряда появляются системные пропущенные значения. Например, если порядок равен 2, то для новой переменной первые 2 наблюдения будут системными пропущенными значениями.

Сезонная разность. Разность между значениями ряда, отстоящими друг от друга на постоянный интервал. Величина этого интервала основана на текущей заданной периодичности. Чтобы вычислить сезонные разности, Вы должны сначала определить

Преобразование данных

переменные, содержащие даты и включающие периодические компоненты (например, месяцы). Порядок здесь - это число сезонных периодов, используемых для вычисления разностей. Число наблюдений с системным пропущенным значением в начале ряда равно периоду, умноженному на порядок дифференцирования. Например, если текущий период равен 12, а порядок равен 2, то для новой переменной первые 24 наблюдения будут системными пропущенными значениями.

Центрированное скользящее среднее. Среднее на промежутке значений ряда,

окружающем и включающем текущее значение. Протяженность - это число значений ряда, используемых для вычисления среднего. Если это число четное, то скользящее среднее вычисляется путем усреднения каждой пары нецентрированных средних. Количество наблюдений с системным пропущенным значением в начале и в конце получаемого ряда для протяженности n равноn /2 для четного n и (n –1)/2 - для нечетного. Например, если протяженность равна 5, число наблюдений с системным пропущенным значением в начале и в конце ряда равно 2.

Опережающее скользящее среднее. Интервал усреднения предшествует текущему значению. Протяженность - это число значений ряда, используемых для вычисления среднего. Число наблюдений с системным пропущенным значением в начале получаемого ряда равно протяженности.

Скользящая медиана. Медиана на интервале значений ряда, окружающих и включающих текущее значение. Протяженность - это число значений ряда, используемых для вычисления медианы. Если данное число четное, то медиана вычисляется путем усреднения каждой пары не центрированных медиан. Количество наблюдений с системным пропущенным значением в начале и в конце получаемого ряда для протяженностиn равноn /2 для четного n и (n –1)/2 - для нечетного. Например, если протяженность равна 5, число наблюдений с системным пропущенным значением в начале и в конце ряда равно 2.

Кумулятивная сумма. Кумулятивная сумма значений ряда вплоть до текущего значения включительно.

Лаг. Значение предшествующего наблюдения, отстоящего на заданное число отсчетов от текущего момента. Порядок - число наблюдений между текущим наблюдением и наблюдением, из которого получается значение. Число наблюдений с системным пропущенным значением в начале получаемого ряда равно значению порядка.

Опережение. Значение последующего наблюдения, в соответствии с заданным порядком опережения. Порядок - число наблюдений между текущим наблюдением и наблюдением, из которого получается значение. Число наблюдений с системным пропущенным значением в конце получаемого ряда равно значению порядка.

Сглаживание. Новые значения ряда, основанные на комбинированном сглаживании данных. Процесс сглаживания начинается со скользящей медианы ширины 4, которая центрирована скользящей медианой ширины 2. Эти значения затем повторно сглаживаются с применением скользящей медианы ширины 5, скользящей медианы ширины 3, и ханнинга (скользящих взвешенных средних). Остатки вычисляются путем вычитания сглаженного рядаизисходного. Весьэтотпроцессзатемповторяетсянавычисленныхостатках. Наконец, сглаженные остатки вычисляются путем вычитания сглаженных значений, полученных в первый раз в начале процесса. Иногда этот процесс называютсглаживанием T4253H .

Анализ временных рядов в STATISTICA. Преобразования переменных

Преобразования временных рядов

Задать даты

Создать временной ряд

Рекомендуем почитать

Поиск по сайту