Моделі стаціонарних часових рядів. Яковлєва А.В. Лінійні моделі стаціонарного часового ряду. Особливості стаціонарних часових рядів та тести на стаціонарність

Анотація: Під тимчасовими рядами розуміють економічні величини, залежні від часу. При цьому час передбачається дискретним, інакше говорять про випадкові процеси, а не про тимчасові ряди.

Моделі стаціонарних та нестаціонарних тимчасових рядів, їх ідентифікація

Нехай Розглянемо часовий ряд. Нехай спочатку тимчасовий ряд набуває числових значень. Це можуть бути, наприклад, ціни на батон хліба у сусідньому магазині або курс обміну долара на рублі у найближчому обмінному пункті. Зазвичай у поведінці тимчасового ряду виявляють дві основні тенденції – тренд та періодичні коливання.

При цьому під трендом розуміють залежність від часу лінійного, квадратичного або іншого типу, яку виявляють тим чи іншим способом згладжування (наприклад, експоненційне згладжування) або розрахунковим шляхом, зокрема, за допомогою методу найменших квадратів. Іншими словами, тренд – це очищена від випадковостей основна тенденція часового ряду.

Тимчасовий ряд зазвичай коливається навколо тренду, причому відхилення від тренду часто виявляють правильність. Часто це пов'язано з природною або призначеною періодичністю, наприклад, сезонною або тижневою, місячною або квартальною (наприклад, відповідно до графіків виплати сплати та сплати податків). Іноді наявність періодичності і тим більше її причини незрозумілі, і завдання економетрика - з'ясувати, чи є періодичність.

Елементарні методи оцінки характеристик часових рядів зазвичай досить докладно розглядаються в курсах "Загальної теорії статистики" (див., наприклад, підручники), тому немає потреби докладно розбирати їх тут. (Втім, про деякі сучасні методи оцінювання довжини періоду та найперіодичнішою складовою йтиметься нижче.)

Характеристики часових рядів. Для більш докладного вивчення часових рядів використовуються імовірнісно-статистичні моделі. У цьому тимчасової ряд сприймається як випадковий процес (з дискретним часом) основними характеристиками є математичне очікування , тобто.

Дисперсія, тобто.

і автокореляційна функціятимчасового ряду

тобто. функція двох змінних, рівна коефіцієнту кореляціїміж двома значеннями часового ряду та .

У теоретичних та прикладних дослідженнях розглядають широкий спектр моделей часових рядів. Виділимо спочатку стаціонарнімоделі. Вони спільні функції розподілу для будь-якої кількості моментів часу, а тому і всі перераховані вище характеристики часового ряду не змінюються з часом. Зокрема, математичне очікування та дисперсія є постійними величинами, автокореляційна функція залежить лише від різниці. Тимчасові ряди, що не є стаціонарними, називаються нестаціонарними.

Лінійні регресійні моделі з гомоскедастичними та гетероскедастичними, незалежними та автокорельованими залишками. Як очевидно зі сказаного вище, головне - це " очищення " тимчасового ряду від випадкових відхилень, тобто. оцінювання математичного очікування На відміну від найпростіших моделей регресійного аналізу, Розглянуті в , тут природним чином з'являються складніші моделі. Наприклад, дисперсія може залежати від часу. Такі моделі називають гетероскедастичними, а ті, в яких немає залежності від часу – гомоскедастичними. (Точніше кажучи, ці терміни можуть належати не тільки до змінної "час", але й до інших змінних.)

Зауваження. Як уже зазначалося в "Багатомірний статистичний аналіз", найпростіша модель методу найменших квадратівдопускає дуже далекі узагальнення, особливо у сфері системам одночасних економетричних рівнянь для часових рядів. Для розуміння відповідної теорії та алгоритмів необхідне професійне володіння матричною алгеброю. Тому ми відсилаємо тих, кому це цікаво, до літератури за системами економетричних рівнянь і безпосередньо з тимчасових рядів , у якій багато цікавляться спектральної теорією, тобто. виділенням сигналу з шуму та розкладанням його на гармоніки. Підкреслимо в черговий раз, що за кожним розділом цієї книги стоїть велика область наукових та прикладних досліджень, цілком гідна того, щоб присвятити їй багато зусиль. Проте через обмеженість обсягу книги ми змушені виклад зробити конспективним.

Системи економетричних рівнянь

Приклад моделі авторегресії. Як первісний приклад розглянемо економетричну модель часового ряду, що описує зростання індексу споживчих цін (індексу інфляції). Нехай зростання цін на місяць (докладніше про цю проблематику див. "Економетричний аналіз інфляції"). Тоді, на думку деяких економістів, природно припустити, що

(6.1)

де - зростання цін у попередній місяць (а - певний коефіцієнт згасання, що передбачає, що за відсутності зовнішній впливів зростання цін припиниться), - константа (вона відповідає лінійному зміні величини з часом), - доданок, що відповідає впливу емісії грошей (тобто. збільшення обсягу грошей економіки країни, здійсненому Центральним Банком) у вигляді і пропорційне емісії з коефіцієнтом , причому цей вплив проявляється не відразу, а ще через 4 місяці; нарешті, - це неминуча похибка.

Модель (1), незважаючи на свою простоту, демонструє багато характерних рис набагато складніших економетричних моделей. По-перше, звернемо увагу на те, що деякі змінні визначаються (розраховуються) всередині моделі, як . Їх називають ендогенними (внутрішніми). Інші задаються ззовні (це екзогеннізмінні). Іноді, як у теорії управління, серед екзогенних змінних, виділяють керованіЗмінні - ті, за допомогою яких менеджер може привести систему в потрібний стан.

По-друге, у співвідношенні (1) виникають змінні нових типів - з лагами, тобто. аргументи у змінних відносяться не до поточного моменту часу, а до деяких попередніх моментів.

По-третє, складання економетричної моделі типу (1) – це зовсім не рутинна операція. Наприклад, запізнення саме на 4 місяці у пов'язаному з емісією грошей доданку - це результат досить витонченої попередньої статистичної обробки. Далі, вимагає вивчення питання залежності чи незалежності величин і . Від вирішення цього питання залежить, як вище зазначалося, конкретна реалізація процедури методу найменших квадратів.

З іншого боку, в моделі (1) всього 3 невідомих параметри, та постановку методу найменших квадратіввиписати неважко:

Проблема ідентифікованості. Представимо тепер модель тапа (6.1) з великою кількістю ендогенних і екзогенних змінних, з лагами та складною внутрішньою структурою. Взагалі кажучи, нізвідки не випливає, що існує хоча б одне рішення такої системи. Тому виникає не одна, а дві проблеми. Чи є хоч одне рішення (проблема ідентифікованості)? Якщо так, то як знайти найкраще рішення із можливих? (Це проблема статистичної оцінки параметрів.)

І перше, і друге завдання досить складне. Аби вирішити обох завдань розроблено безліч методів, зазвичай досить складних, лише з яких має наукове обгрунтування. Зокрема, досить часто користуються статистичними оцінками, які не є заможними (строго кажучи, їх навіть не можна назвати оцінками).

Коротко опишемо деякі поширені прийоми під час роботи з системами лінійних економетричних рівнянь.

Система лінійних одночасних економетричних рівнянь. Чисто формально можна всі змінні висловити через змінні, що залежать лише від поточного часу. Наприклад, у разі рівняння (6.1) достатньо покласти

Тоді рівняння приклад вигляд

(6.2)

Зазначимо тут можливість використання регресійних моделей з змінною структуроюшляхом запровадження фіктивних змінних. Ці змінні при одних значеннях часу (скажімо, початкових) набувають помітних значень, а за інших - сходять нанівець (стають фактично рівними 0). У результаті формально (математично) та сама модель визначає зовсім різні залежності.

Непрямий, двокроковий та трикроковий методи найменших квадратів. Як зазначалося, розроблено масу методів евристичного аналізу систем економетричних рівнянь. Вони призначені для вирішення тих чи інших проблем, що виникають під час спроб знайти чисельні рішення систем рівнянь.

Одна з проблем пов'язана з наявністю апріорних обмежень на параметри, що оцінюються. Наприклад, дохід домогосподарства може бути витрачений або споживання, або заощадження. Отже, сума часток цих двох видів витрат апріорі дорівнює 1. А системі економетричних рівнянь ці частки можуть брати участь незалежно. Виникає думка оцінити їх методом найменших квадратівне звертаючи уваги на апріорне обмеження, а потім підкоригувати. Такий підхід називають непрямим методом найменших квадратів.

Двокроковий метод найменших квадратіву тому, що оцінюють параметри окремого рівняння системи, а чи не розглядають систему загалом. Водночас трикроковий метод найменших квадратівзастосовується з метою оцінки параметрів системи одночасних рівнянь загалом. Спочатку до кожного рівняння застосовується двокроковий метод з метою оцінити коефіцієнти та похибки кожного рівняння, а потім побудувати оцінку для коваріаційної матриці похибок. Після цього для оцінювання коефіцієнтів усієї системи застосовується узагальнений метод найменших квадратів.

Менеджеру та економісту не слід ставати спеціалістом зі складання та розв'язання систем економетричних рівнянь, навіть за допомогою тих чи інших програмних систем, але він повинен бути поінформований про можливості цього напряму економетрики, щоб у разі виробничої необхідності кваліфіковано сформулювати завдання для фахівців-економетриків.

Від оцінювання тренду (основної тенденції) перейдемо до другого основного завдання економетрики часових рядів - оцінювання періоду (циклу).

Важливе значення в аналізі та прогнозуванні на основі тимчасових рядів мають стаціонарні часові ряди,ймовірні властивості яких не змінюються в часі. Тимчасовий ряд у ( = (1,2,..., д)називається строго стаціонарним, якщо спільний розподіл ймовірностей пспостережень у ( ,у 2 , ???,у птаке ж, як у «спостережень у 1+т, у 2+т, ???, У п + Т(за будь-яких «, / їх). Отже, для стаціонарного випадкового процесу характерна незмінність у часі його основних імовірнісних характеристик, таких, як математичне очікування та дисперсія.

Під стаціонарними рядами розуміються однорідні у часі випадкові процеси, характеристики яких змінюються з часом /. Характеристики цих процесів визначають особливості процесів і є предметом дослідження. Якщо ці характеристики (математичне очікування, дисперсія та ін.) вдалося із заданим ступенем точності знайти, то завдання прогнозу таких стаціонарних процесів стає надзвичайно простим. У той самий час стаціонарні процеси може мати найрізноманітніший характер динаміки - зміна однієї частини їх немає яскраво виражених тенденцій у часі, динаміка інший частини має явно виражену тенденцію зміни у часі, що може мати дуже складний нелінійний характер. Таким чином, стаціонарна група типів динаміки часового ряду може бути, у свою чергу, розділена на дві підгрупи: 1) прості стаціонарні; 2) складні стаціонарні. Для першої групи факторів, простого стаціонарного типу, виконується умова незмінності у часі їхнього математичного очікування та інших характеристик випадкових процесів. Якщо ж математичне очікування та інші характеристики ймовірнісного процесу зазнають змін у часі, такі ряди є складними стаціонарними.

Моделі стаціонарних та нестаціонарних часових рядів

Прості стаціонарні процесистосовно соціально-економічних об'єктів аналізуються та прогнозуються за допомогою найпростіших методів математичної статистики (точковий та інтервальний прогнозидинаміки часового ряду). Найчастіше можна стверджувати наявність закону нормального розподілу, і тому основні зусилля мають бути спрямовані на доказ цього положення за допомогою відповідних статистичних гіпотез та методів їх перевірки, а потім – на обчислення характеристик процесу. Якщо вдалося підтвердити гіпотезу про нормальний характер розподілу ряду, що вивчається, то кращою оцінкою його математичного очікування виступає середня арифметична, а кращою оцінкою дисперсії - вибіркова дисперсія. Причому тут доречний основний принцип вибіркового методу - що більше спостережень, то краще оцінки моделі.

Складні стаціонарні процесисвідчать про наявність багатьох факторів, що впливають на об'єкт, показники якого змінюються у часі. Тому завданням прогнозиста є виявлення основних цих чинників і побудова моделі, що описує вплив основних чинників на об'єкт прогнозування. Якщо цих факторів багато, і виділити головні з якихось міркувань неможливо, вважають, що час виступає таким узагальнюючим фактором, і знаходять модель залежності між прогнозним показником та часом. Як правило, у цих випадках досліднику невідомо більшість основних характеристик випадкового динамічного стаціонарного процесу. Він повинен за даними спостережень за процесом визначити ці параметри. Тут дослідник змушений вдаватися до деяких апріорних припущень – допускати наявність того чи іншого закону розподілу ймовірностей, властивостей процесу та його взаємозв'язків, характеру динаміки тощо. В даному випадку найбільш ефективно може використовуватися той розділ економічної науки, який отримав назву економетрики.

Оскільки статистичні властивості складних стаціонарних рядів не

змінюються з часом, то їх властивості можна накопичити і виявити з допомогою обчислення деяких функцій відданих. Функція, яку вперше використали для цієї мети, є автокореляційною функцією(АКФ). Ступінь тісноти зв'язку між послідовностями спостережень тимчасовогоряду р 2 , -,уіу 1+т, у 2+х,Уп+хзазвичай визначають за допомогою вибіркового коефіцієнта кореляції г(т). Його формула наведена нижче:

/7-Т (/7-Т Л ^

(л-т)2>, 2 - 5>,

Хп-"шАЪ.

  • (6.5)

де т - число періодів, якими розраховується коефіцієнт автокореляції (Лаг).

Цей коефіцієнт оцінює кореляцію між рівнями того самого ряду, тому іноді його називають коефіцієнтом автокореляції.Формулу розрахунку коефіцієнта автокореляції 1-го порядку(при т = 1) можна так:

  • (6.6)
  • 1=2 1=2

Коефіцієнт автокореляції 2-го порядкувизначається за формулою

  • (6.8)
  • - 2
  • 5> н
  • (6.9)

Зі збільшенням лага число пар значень, якими розраховується коефіцієнт автокореляції, зменшується. Вважається за доцільне для забезпечення статистичної достовірності коефіцієнтів автокореляції використовувати правило - максимальний лаг повинен бути не більшим п/6.Функція г(т) називається вибірковою автокореляційною функцією,а її графік - корелограм-мій.Вигляд вибіркової автокореляційної функції тісно пов'язаний з

; у, = " 3

структурою низки.

  • 1. Автокореляційна функція г(т)для «білого шуму» при т>О також утворює стаціонарний часовий ряд із середнім значенням нуль.
  • 2. Для стаціонарного ряду АКФ швидко зменшується зі зростанням т. За наявності чіткого тренду автокореляційна функція набуває характерного вигляду дуже повільно спадаючою кривою.
  • 3. У разі вираженої сезонності у графіку АКФ також присутні «викиди» для запізнювань, кратних періоду сезонності, але ці «викиди» можуть бути завуальовані наявністю тренду або великою дисперсією випадкової компоненти.

Якщо найвищим виявився коефіцієнт автокореляції першого порядку, досліджуваний ряд містить лише тенденцію. Якщо найвищим виявився коефіцієнт автокореляції порядку т, ряд містить циклічні коливання з періодичністю в моментів часу. Якщо жоден з коефіцієнтів автокореляції не є значущим, можна зробити одне з двох припущень щодо структури цього ряду: або ряд не містить тенденції і циклічних коливань, або містить яскраво виражену нелінійну тенденцію, для виявлення якої необхідно провести додатковий аналіз. Тому коефіцієнт автокореляції та автокореляційну функцію доцільно використовувати для виявлення у часовому ряді трендової компоненти та циклічної (сезонної) компоненти. Таким чином, при вивченні складних стаціонарних часових рядів основним завданням є виявлення та усунення автокореляції.

Нестаціонарні процесина противагу стаціонарним відрізняються тим, що вони змінюють у часі всі свої характеристики. Причому ця зміна може бути настільки суттєвою, що динаміка одного показника відображатиме розвиток абсолютно різних процесів. Усі взаємозв'язку та взаємозалежності об'єкта прогнозування змінюються у часі. Більше того, змінюється в часі і структура та напрямок взаємодії елементів, що становлять об'єкт прогнозування. Залежно від того, наскільки змінюються у часі збільшення АУ(Т),нестаціонарні процеси також можуть бути виділені у дві підгрупи: 1) еволюційні процеси; 2) хаотичні процеси.

Якщо прирощення АУ(Т)поступово збільшуються з часом в результаті кількісних та якісних змін, що відбуваються в системі, відображенням якої реалізацією є нестаціонарний ряд, то ці процеси можуть бути названі еволюційними.При цьому відношення Д К(7)/Т(? + 7), що характеризує наростання невизначеності, має з часом, що збільшується. Тдинаміку - від нуля до нескінченності. У разі коли прирощення АУ(Т)не мають якоїсь досить вираженої тенденції в часі та їх зміни хаотичні (наприклад, при першому ж спостереженні АУ(Т)може бути досить велике в порівнянні з самим показником У(Т)),то такі процеси можуть бути віднесені до хаотичним.Хаотичний характер динаміки виникає в тих випадках, коли або сам процес неінерційний і динаміка його розвитку легко змінюється під впливом зовнішніх або внутрішніх факторів, або коли на інерційний процес впливають зовнішні фактори такої сили, що під їх впливом «ламаються» і внутрішня структура процесу, та його взаємозв'язку, та його динаміка. Інакше висловлюючись, еволюційна динаміка характеризує процес адаптаціїоб'єкта до зовнішніх та внутрішніх впливів, а хаотична динаміка - відсутність здатності об'єкта до адаптації.

Складний характер нестаціонарної динаміки визначає і складність апарату моделювання та прогнозування цієї динаміки. Прогнозування еволюційних складових економічної кон'юнктури досі не потрапляло в поле зору фахівців із соціально-економічного прогнозування - лише останніми роками до підручників з прогнозування стали включатися відповідні розділи. На практиці еволюційні процеси просто не виділяли в окрему групу та для їх аналізу та прогнозування використовували прийоми класичної економетрики, не замислюючись над коректністю такого застосування. Саме використання апарату прогнозування, методологічно несумісного з властивостями об'єкта прогнозування, і призводить до серйозних помилок при виборі інструментарію та суттєвої дисперсії прогнозу на практиці прогнозування соціально-економічної динаміки. Для прогнозування тимчасових рядів соціально-економічних показників еволюційного типу методологічно обґрунтованим є застосування адаптивні методи прогнозування.Питання прогнозування хаотичних лав соціально-економічної динаміки нині вирішуються з використанням теорії хаосуі теорії катастроф.

Далі розглянемо методи прогнозування часто спостерігаються у практиці соціально-економічних досліджень складних стаціонарних і еволюційних нестаціонарних динамічних процесів. Для рядів вищезазначених типів англійськими статистиками Д. Бокс і В. Дженкінс в середині 1990-х рр.. розроблено алгоритм прогнозування. В ієрархію алгоритмів Бокса - Дженкінса входить кілька алгоритмів, найвідомішим і найвикористанішим з них є алгоритм АЯ1МА.Він вбудований практично у будь-який спеціалізований пакет для прогнозування. У класичному варіанті ЛЯ1МАне використовуються незалежні змінні. Моделі спираються тільки на інформацію, що міститься в передісторії прогнозованих рядів, що обмежує можливості алгоритму. В даний час у науковій літературі часто згадуються варіанти моделей АЯ1МА,що дозволяють враховувати незалежні змінні.

Моделі АЯ1МАспираються переважно на автокореляційну структуру даних. У методології АЯ1МАне передбачається будь-якої чіткої моделі для прогнозування цього часового ряду. Задається лише загальний клас моделей, які описують часовий ряд і дозволяють якось виражати поточне значення змінної через попередні значення. Потім алгоритм АЯ1МА,задаючи параметри моделей, сам обирає найприйнятнішу модель прогнозування. Існує ціла ієрархія моделей Бокса – Дженкінса. Логічно її можна визначити так:

АЯ(р) + МА(д) -> АЯМА (р, д) АЯМА (р, д) (Р, 0 ->

-? АЯ1МА(р, д, г)(Р, 0 Я) ... (6.10)

де АЯ(р) -авторегресійна модель порядку р МА(д) -модель ковзної середньої порядку д; АЯМА(р, д) -комбінована модель авторегресії та ковзної середньої; АЯМА(р, д) (Р, О)- модель експонентного згладжування; АЯ1МА(р, д, г) (Р, 0 Я)- моделювання нестаціонарного еволюційного процесу з лінійним трендом.

Перші три моделі апроксимують динаміку складних стаціонарних часових рядів, наступні дві - динаміку еволюційних нестаціонарних часових рядів. Модель вважається прийнятною, якщо залишки (переважно малі) розподілені випадково і містять корисної інформації. Якщо задана модель є незадовільною, процес повторюється, але вже з використанням нової покращеної моделі. Подібна ітераційна процедура повторюється доти, доки знайдено задовільна модель. З цього моменту задана модель може використовуватися з метою прогнозування.

У моделі Ашмарівень динамічного ряду увизначається як виважена сума попередніх його значень та значень залишків е г -поточних та попередніх. Вона поєднує модель авторегресії порядку рта модель ковзної середньої порядку ц.Тренд включається до ЛШМАза допомогою оператора кінцевих різниць ряду у гДля фільтрації лінійного тренду використовують різниці 1-го порядку, для фільтрації параболічного тренду – різниці 2-го порядку тощо. Різниця ймає бути стаціонарною. Вид моделі АШМА,адекватність її реальному процесу та прогнозні властивості залежать від порядку авторегресії рта порядку ковзної середньої

Ключовим моментом моделювання вважається процедура ідентифікації – обґрунтування виду моделі. У стандартній методиці Ашмаідентифікація зводиться до візуального аналізу авто-корелограм і ґрунтується на принципі економії, за яким (р+Ашма порядку , (1 , (Ря, А?, 05). Таким чином, ідентифікацією часового рядуназивається побудова для низки залишків адекватної моделі, в якій залишки є «білим шумом», а всі регресори значущі.

Розглянемо деякі моделі АшмаДетальніше. Авторегресійна модельпорядку рмає вид

У =Ро + Р1 У,-1 + Р 2 Т/- 2 + + Р Р У, - Р+ е, (* = I 2, ..., п), (6.11)

де Р 0 р., ..., р - деякі константи; г (-рівень «білого шуму», який можна опустити.

Якщо досліджуваний процес уу момент Г визначається його значеннями лише у попередній період 7-1, то отримуємо авторегресійну модель першого порядку

У,=Р 0 +Р1Л-1 + е, (7 = 1,2,...,«), (6.12)

В моделях ковзної середньоїмодельована величина задається лінійною функцією від збурень (залишків) у попередні моменти часу. Модель ковзної середньої порядку д має вигляд

У, =е 1 -У 1 е,-1-У 2 е,- 2 - - -У,е,-, (7 = 1,2,...,«), (6.13)

де у р у., ..., у – деякі константи; е – помилки.

Нерідко використовується комбінована модель авторегресії та ковзної середньої, яка має вигляд

У =Ро + Р.Л-, + РзЯ-2+-+ РрУ"-р +?1 - У&-1 - У 2^-2 -???- У&-Я (6.14)

Параметри рі

  • 1) один параметр (р),якщо автокореляційна функція (АКФ) експонентно зменшується;
  • 2) два параметри авторегресії (р),якщо АКФ має форму синусоїди або експоненційно зменшується;
  • 3) один параметр ковзного середнього (
  • 4) два параметри ковзного середнього (д), якщо АКФ має різко виділяються на лагах 1 і 2 і немає кореляції на інших лагах.

Адаптивне прогнозування

При вивченні нестаціонарних еволюційних часових рядів застосовується адаптивне прогнозування. Адаптивні методи прогнозування- це сукупність моделей дисконтування даних, здатні пристосовувати свою структуру та параметри зміни умов. Оцінюючи параметрів адаптивних моделей спостереженням (рівням низки) присвоюються різні ваги залежно від цього, наскільки сильним визнається їхнього впливу поточний рівень. Це дозволяє враховувати зміни у тенденції, і навіть будь-які коливання, у яких простежується закономірність. Адаптивні методи прогнозування є підбір і адаптацію моделей прогнозування на підставі нової інформації. До найпоширеніших їх відноситься метод експоненційного згладжування і метод гармонійних ваг Хель-вига.

Метод експонентного згладжування. Особливість його у тому, що у процедурі вирівнювання кожного спостереження використовуються лише значення попередніх рівнів низки динаміки, взятих з певною вагою. Вага кожного спостереження зменшується в міру його віддалення з моменту, для якого визначається згладжене значення. Згладжене значення рівня ряду 5 на момент / визначається за формулою

5, = ау, + (1-а) 5, 1, (6.15)

де 5 - значення експоненційної середньої в момент/; 5 / _ 1 - значення експоненційної середньої в момент (/- 1); ? - значення економічного процесу у момент часу/; а - вага/-го значення низки динаміки (або параметр згладжування, значення якого змінюються від нуля до одиниці).

Послідовне застосування формули (6.15) дозволяє обчислити експонентну середню через значення всіх рівнів даного ряду динаміки. З іншого боку, з урахуванням формули (6.15) визначаються експоненційні середні 1-го порядку, тобто. середні отримані безпосередньо згладжування вихідних даних низки динаміки. Тоді, коли тенденція після згладжування вихідного ряду визначена недостатньо ясно, процедуру згладжування повторюють, тобто. обчислюють експоненційні середні другого, третього порядку тощо, користуючись виразами (6.16-6.18):

^ 2] = ос?, [,] + (1-а)?, [3;

^ ] = а5, !2] + (1-а) ^];

5 1 , 1 * 1 = а^* -1] + (1 - а)5^,

де 5^ - експоненційна середня до тогопорядку в точці I (до = 1,

2, 3,..., п).

Для лінійної моделі у = а 0 + а іпочаткові умови такі:

? - а - а2 (1 ~ а) а^О(у) “ОУр (у) "Про а"

Експонентні середні першого та другого порядку для цієї моделі:

5,1" = ау,+ (1? - а) 5 ™ 5,1 "= а5 |" + (1 - а)5Й

Прогноз здійснюється за формулою у *= я 0 + я/. Причому параметри а 0і а (відповідно рівні

  • (6.19)
  • (6.20)

Помилка прогнозу визначається за формулою

)/(Г-а)[* -4(1-а) + 5(1 - а) 2 + 2а(4-3а)

/ + 2 а год

де 'у -Середня квадратична помилка відхилення від лінійного тренду.

Метод гармонійних терезів. Цей метод був розроблений польським статистиком 3. Гельвіг. Він близький до методу простого експонентного згладжування, використовує той же принцип. В його основі лежить зважування ковзного показника, але замість ковзної середньої використовується ідея ковзного тренду. Екстраполяція про-

водиться по ковзному тренду, окремі точки ламаної лінії зважуються за допомогою гармонійних терезів, що дозволяє пізнішим спостереженням надавати більшої ваги. Метод гармонійних терезів базується на наступних передумовах:

  • період часу, протягом якого вивчається економічний процес, має бути досить тривалим, щоб можна було визначити його закономірності;
  • вихідний ряд динаміки не повинен мати стрибкоподібних змі-
  • соціально-економічне явище має мати інерційністю, тобто. для настання суттєвої зміни у характеристиках процесу необхідно, щоб пройшов значний час;
  • відхилення від ковзного тренду мають випадковий характер;
  • автокореляційна функція, розрахована з урахуванням послідовних різниць, має зменшуватися зі зростанням /, тобто. вплив пізнішої інформації має сильніше відбиватися на прогнозованій величині, ніж вихідної інформації.

Для отримання точного прогнозу методом гармонійних терезів необхідно виконання всіх вищезазначених передумов для вихідного ряду динаміки. Для використання цього методу вихідний ряд розбивається на фази до.Число фаз має бути менше числа членів ряду п, тобто. Зазвичай фаза дорівнює трьом-п'яти рівням. Для кожної фази обчислюється лінійний тренд, тобто.

У т = а,+ V 0" = 1, 2 ,п - до + 1).

При цьому для /, рівного одиниці, Г = 1, 2,..., до;для /, рівного двом, Г = 2, 3, ..., до+ 1; для /, рівного п - до+ 1, г = я - до + ,п - до +2,..., п.Для оцінки параметрів а. (і Ь швикористовується метод найменших квадратів. За допомогою отриманих (п - до + 1) рівнянь визначаються значення ковзного тренду. З цією метою виділяються ті значення у (цудля яких Г = /, їх позначають у.^.Нехай їх буде ПуПотім перебуває середнє значення у тза формулою

Після цього необхідно перевірити гіпотезу про те, що відхилення від ковзного тренду є стаціонарним процесом. Для цього він розраховується автокореляційна функція. Якщо значення автокореляційної функції зменшуються від періоду до періоду, п'ята передумова даного методу виконується. Далі розраховуються прирости за формулою

Середня приростів обчислюється за формулою

де С" +| - гармонічні коефіцієнти, що задовольняють умов С" +1 > 0 (/ = 1,2, п- 1) і ^С," (= 1.

Вираз (6.25) дозволяє пізнішої інформації надавати більші ваги, так як прирости обернено пропорційні часу, яке відокремлює вихідну інформацію від пізнішої для моменту Г = п.Якщо вихідна інформація має вагу т 2 = /[п - 1), то

вага інформації, що відноситься до наступного моменту часу, дорівнює

т, = т 2 - 1--- = --I---. (6.26)

3 2 п-2 п- 1 /7-2

У загальному вигляді ряд гармонійних ваг визначають як

= т,л--

  • (/ = 2, 3, , п 1),
  • (6.27)

^ т, +1 =/7 -1. (6.29)

Щоб отримати гармонійні коефіцієнти С,", що задовольняють двом вищевказаним умовам, гармонічні ваги т 1+1 необхідно розділити на (п - 1), тобто.

У,= У/ + Ю (6.31)

за початкової умови У* = Уд,уЦей метод прогнозування застосовується, коли є впевненість, що у майбутньому описується плавної кривою, тобто. у ряду відсутні сезонні та циклічні коливання. Таким чином, перед передбаченням розвитку досліджуваного об'єкта необхідно зробити висновок про стаціонарність або нестаціонарність часового ряду. Це положення можна перевірити за допомогою тесту Дікі - Фуллера. Базовий процес, що породжує цей процес, який використовується в тесті, - авторегресійний процес першого порядку:

у (= т 0 + т ( / + г-у (_ (+ е/? (6.32)

де т 0 , т (іг - постійні коефіцієнти, які можна знайти з допомогою МНК; ? - Випадкова помилка, яка в розрахунок може не прийматися.

Якщо виконується умова 0 г 1, ряд є стаціонарним. При г 0 і г> 1 то тимчасовий ряд не є стаціонарним.

Можна сформулювати цілі статистичного аналізу часового ряду так:

за наявною траєкторією x(1), x(2), …x(N) аналізованого часового ряду x(t) вимагається:

1) визначити, які з невипадкових функцій (що відповідають трендовому, сезонному та циклічному компонентам) присутні у розкладанні, тобто визначити значення індикаторів  i у розкладанні

2) побудувати «хороші» оцінки тих невипадкових функцій, які у розкладанні;

3) підібрати модель, що адекватно описує поведінку «випадкових залишків u(t), і статистично оцінити параметри цієї моделі.

Успішне вирішення перелічених завдань є основою для досягнення кінцевих прикладних цілей дослідження і, насамперед, для вирішення задачі коротко- та середньострокового прогнозу значень тимчасового ряду.

Автоковаріаційна та автокореляційна функції

Для ідентифікації часових рядів зручно використовувати спеціальні функції: автоковаріаційну та автокореляційну.

Автоковаріаційна функція

З припущення про сувору стаціонарність часового ряду x(t) коваріація між значеннями x(t) і x(t  ) залежатиме лише від величини «зсуву за часом»  (і не залежатиме від t). Ця коваріація називається автоковаріацією (оскільки вимірює коваріацію для різних значень одного і того ж часового ряду x(t) і визначається співвідношенням:

При аналізі величини () залежно від значення  прийнято говорити про автоковаріаційну функцію (). Значення автоковаріаційної функції можуть статистично оцінені за наявними спостереженнями тимчасового ряду за формулою

, Де  = 1,2, … N-1. Очевидно

(0)=  2 =М;

()=cov(x(t+), x(t)) = cov(x(t), x(t+)) = cov(x(t), x(t-));

()= cov(x(t), x(t-))= (-).

Автокореляційна функція

Одна з головних відмінностей послідовності спостережень, що утворюють часовий ряд, від випадкової вибірки полягає в тому, що члени часового ряду є, взагалі кажучи, статистично взаємозалежними. Ступінь тісноти статистичного зв'язку між двома випадковими величинами може бути виміряний парним коефіцієнтом кореляції. Отже, ступінь статистичного зв'язку між двома спостереженнями часового ряду, «рознесеними» (за часом) на одиниць, визначиться величиною коефіцієнта кореляції.

Коефіцієнт кореляції r() вимірює кореляцію, що існує між членами одного і того ж часового ряду, тому його прийнято називати коефіцієнтом автокореляції. При аналізі зміни величини r() залежно від значення прийнято говорити про автокореляційну функцію r(). Графік автокореляційної функції називають корелограмою. Автокореляційна функція, на відміну автоковаріаційної, безрозмірна. Її значення можуть коливатись у межах від –1 до +1. Очевидно, що r() =r(-), а(0) =1.

Пошук моделі, адекватно описує поведінка випадкових залишків u(t) аналізованого часового ряду x(t), виробляють, зазвичай, у межах деякого спеціального класу випадкових часових послідовностей - класу стаціонарних часових рядів. На інтуїтивному рівні стаціонарність тимчасового рядуа ми пов'язуємо з вимогою, щоб він мав постійне середнє значення і коливався навколо цього середнього з постійною дисперсією. У деяких випадках тимчасові послідовності цього класу можуть відтворювати поведінку самого аналізованого часового ряду x(t).

Ряд x(t) називається строго стаціонарним(або стаціонарним у вузькому сенсі), якщо спільний розподіл ймовірностей m спостережень x(t 1), x(t 2), …, x(tm) такий самий, як і для m спостережень x(t 1 +), x( t 2 +), …x(tm +), за будь-яких m, t 1 , t 2 , …, tm і .

Іншими словами, характеристики строго стаціонарного часового ряду не змінюються при зміні початку відліку часу. Зокрема, при m= 1 з припущення про строгу стаціонарність тимчасового ряду x(t) слід, що закон розподілу ймовірностей випадкової величини x(t) не залежить від t, а значить, не залежать від t і всі його основні числові характеристики, в тому числі: середнє значення М(x(t)) =  та дисперсія D(x(t))= М(x(t) –) 2 =  2 .

Очевидно, значення μ визначає постійний рівень, щодо якого розкидані значення аналізованого часового ряду x(t), а постійна величина 2 характеризує розмах цього розкиду. Оскільки закон розподілу ймовірностей випадкової величини x(t) однаковий при всіх t, він сам і його основні числові характеристики можуть бути оцінені за спостереженнями x(1), x(2), …x(N). Зокрема:

-Оцінка середнього значення,

- Оцінка дисперсії.

Під методами згладжуваннятимчасового ряду розуміється виділення невипадкової складової. Припустимо, що відомий загальний вигляд невипадкової складової F(t) для низки x(t)=F(t,)+ u(t). Це може бути поліном, ряд Фур'є і т.д. Тоді постає завдання оцінки параметрів . У такій постановці завдання використовуються аналітичні методи.

Якщо вид невипадкової складової невідомий F(t), використовуються алгоритмічні методи. До таких методів відноситься метод ковзного середнього, що лежить в основі складніших процедур згладжування.

Характеристики часових рядів. Для більш докладного вивчення часових рядів використовуються імовірнісно-статистичні моделі. У цьому тимчасової ряд X(t) сприймається як випадковий процес (з дискретним часом) основними характеристиками є математичне очікування X(t), тобто.

дисперсія X(t), тобто.

та автокореляційна функція тимчасового ряду X(t)

тобто. функція двох змінних, рівна коефіцієнту кореляції між двома значеннями часового ряду X(t) та X(s).

У теоретичних та прикладних дослідженнях розглядають широкий спектр моделей часових рядів. Виділимо спочатку стаціонарні моделі. Вони спільні функції розподілу будь-якого числа моментів часу k, тому й усе перераховані вище характеристики часового ряду не змінюються з часом. Зокрема, математичне очікування та дисперсія є постійними величинами, автокореляційна функція залежить лише від різниці t-s. Тимчасові ряди, які є стаціонарними, називаються нестаціонарними.

Під тимчасовим поруч розуміють упорядковану у часі послідовність значень однієї чи кінцевої множини випадкових величин. У першому випадку говорять про одномірний часовий ряд, у другому - про багатовимірний часовий ряд. Тут розглядатимуться лише одномірні часові ряди. Одномірний часовий ряд називається стаціонарним, якщо його ймовірні характеристики постійні. Тимчасовий ряд називається нестаціонарним, якщо хоча б одна з імовірнісних характеристик є непостійною. Послідовність випадкових величин у 1, у 2,. . . або у -1, у 0, у 1,. . називається випадковим процесом із дискретним параметром часу.

Оскільки важлива послідовність у часі появи наступного значення часового ряду, а чи не конкретне значення часу появи, то часових рядах як аргумент використовують номер відліку значення часового ряду. Наприклад:

x(1), x(2), ..., x(k), ...

де x(k) - значення часового ряду в k-тому по порядку спостереження; k – номер спостереження.

У більшості практичних додатків розглядають стаціонарні та нестаціонарні з математичного очікування тимчасові ряди з нормальним законом розподілу значень ряду. Це означає, що:

стаціонарний ряд: x(k) є (µ, у 2), µ = const, у 2 = const;

нестаціонарний ряд: x(k) є (µ, у 2), µ = var, у 2 = const.

Нижче наведено реалізацію стаціонарного тимчасового ряду:

Прогнозованість часового ряду.

Для прогнозування часового ряду потрібно побудувати його модель. Прогнозованість ряду можлива лише тоді, коли існує імовірнісний (аналітичний) зв'язок наступних значень ряду від попередніх. Прогнозованість стаціонарного часового ряду визначається за допомогою автокореляційної функції (АКФ):

с(m) = M[(x(k) - µ)*(x(k + m) - µ)]/у 2

де: с(m) - значення автокореляційної функції на зсуві m часового ряду x(k)

Оцінки АКФ ряду мають вигляд:

Вочевидь, що з(0) = 1, оскільки це кореляція часового низки самого себе.

Стаціонарний часовий ряд прогнозуємо, якщо m>0 існує з(m)? 0.

Стаціонарний часовий ряд не прогнозується, якщо для будь-якого m>0 с(m) = 0. Такий ряд називають "білим шумом".

Оскільки, АКФ це значення коефіцієнтів кореляції, вона є функцією невипадкових значень.

Оцінювання АКФ здійснюється за реалізацією тимчасового ряду. Якщо реалізація містить n значень, то оцінка автокореляційної функції має вигляд:

де: r(m) – оцінка АКФ; x - середнє значення реалізації часового ряду; S 2 – оцінка дисперсії реалізації тимчасового ряду.

При перевірці прогнозованості часового ряду довжина реалізації має бути не менше ніж 20 - 30 спостережень.

Слід звернути увагу, що прогнозування часових рядів розглянутим методом передбачає виконання двох умов:

  • 1. Випадкова величина е(k) "білого шуму", як складова моделей, повинна підпорядковуватися нормальному закону розподілу з нульовим математичним очікуванням та кінцевою дисперсією у е 2 .
  • 2. Дисперсія "білого шуму" у е 2 повинна бути постійною величиною.

Формула обчислення прогнозу має вигляд:

x(k) = 27,2661 – 0,900766*

де x(k) - прогноз моделі k-го значення часового ряду.

Ідентифікація моделі стаціонарного часового ряду

Ідентифікація моделі. Для прогнозування майбутніх показників на основі наявних часових рядів необхідно ідентифікувати модель, яка найкраще описує процес виродження вибіркового часового ряду. Для ідентифікації такої моделі можна користуватися розрахунковою автокореляційною функцією. З безлічі моделей для опису динаміки часових рядів найчастіше використовуються три: модель білого шуму, авторегресійна модель першого порядку і авторегрессионная модель другого порядку. Якщо розрахункова автокореляційна функція є сукупність незначних автокореляцій, це явне вказівку те що, що мінливість даного часу n-ого ряду найкраще охарактеризувати як " білий шум " , чи випадкові флуктуації.

Основна ідея, що лежить в основі ідентифікації моделі тимчасового ряду, залишається однією і тією ж і для простих, і для складних моделей: відповідність структури даних відомої структурі, що зв'язується з певним класом моделей. Після того, як модель попередньо ідентифікована, проводиться оцінка її параметрів.

Діагностична перевірка. Так як в основі ідентифікації моделі часового ряду лежить певною мірою суб'єктивна процедура, іноді рекомендується оцінити адекватність ідентифікованої моделі шляхом перевірки значущості функції кореляційної функції залишків даної моделі. Це доцільно, оскільки залишки моделі часового ряду не є автокорельованими.

Проте автокореляційна функція стаціонарного часового ряду не дозволяє однозначно ідентифікувати модель ряду. Це можливо з використанням другої додаткової функції – приватної автокореляційної функції (ЧАКФ). Значення ЧАКФ - це значення m-го коефіцієнта у поданні часового ряду процесом авторегресії порядку m. Нехай є стаціонарний часовий ряд x(k). Розглянемо наступні уявлення часового ряду через процес авторегресії:

x(k) - м = 11 *

x(k) - м = a 12 * + a 22 *

x(k) - м = a 13 * + a 23 * + a 33 *

... ... ... ... ... ... ... ... ...

x(k) - м = a 1 * + a 2 * + a 33 * + ... + a mm *

Значеннями ЧАКФ для зрушень 1, 2, 3, ..., m є значення коефіцієнтів: a 11 , a 22 , a 33 , ..., a mm. Графік ЧАКФ може мати вигляд:

Після оцінювання ЧАКФ необхідно для кожного m перевірити гіпотезу про рівність нуля відповідного коефіцієнта приватної кореляції. У програмах статистичної обробки даних для кожного з коефіцієнтів обчислюються критичні значення, які на графіку оцінки ЧАКФ набувають вигляду контрольних кордонів.

При ідентифікації моделі зазвичай користуються такими правилами:

  • 1. Якщо h перших значень АКФ відмінні від нуля, а ЧАКФ за модулем асимптотично прагне нулю, має місце процес АРСС(0,h) - ковзного середнього порядку h.
  • 2. Якщо h перших значень ЧАКФ відмінні від нуля, а АКФ за модулем асимптотично прагне нулю, має місце процес АРСС(h,0) - авторегрессии порядку h.
  • 3. Якщо значення АКФ і ЧАКФ за модулем асимптотично прагнуть нуля, має місце змішаний процес АРСС(p,q).

Набір випадкових змінних X(t), де (речові числа) називається стохастичним процесом. Дискретний стохастичний процес визначається як послідовність випадкових змінних X(t), де t = t 1 , t 2 , ..., t Tабо коротше Х 1 , Х 2 ,..., Х Т...,або просто X t.

Математичне очікування E(X t)може змінюватися в часі і є функцією середнього в залежності від часу

.

Аналогічним чином дисперсія (X t)є функцією, що також залежить від часу:

У випадку в кожний момент часу існує певна дисперсія. Це не те саме, що мінливість емпіричних даних у міру розвитку процесу в часі.

Автоковаріація

у загальному вигляді залежить від кожного t1 та t2.

Кінцева реалізація x 1, х 2,..., х т дискретного стохастичного процесу... Х 1, Х 2,... Х т... називається тимчасовим рядом.

Розглянемо різницю між стохастичним процесомі згенерованим ним тимчасовим поряд.

Процеси позначаються великими літерами, позначають часові ряди малими літерами. Винятками є залишки у моделях стохастичних процесів, які мають жодної самостійної практичної значимості. Вони також позначаються малими літерами, наприклад а, іта ε. Суворе розмежування необхідне коректного виведення властивостей часових рядів із властивостей стохастичних процесів. Пізніше при моделюванні реальних часових рядів цю умову можна буде послабити чи опустити.

Стохастичний процес X tназивається стаціонарним у сильному сенсі,якщо спільний розподіл ймовірностей всіх змінних точно те саме, що й для змінних .

Під стаціонарним процесом у слабкому розуміннірозуміється стохастичний процес, для якого середнє і дисперсія незалежно від періоду часу, що розглядається, мають постійне значення, а автоковаріація залежить тільки від довжини лага між аналізованими змінними.

Середнє ……………. .

Дисперсія …………. .

Автоковаріація …… ,

де (лаг).

Автоковаріація як функція довжини лага τ

називається автоковаріаційною функцією. При τ = 0 її значення дорівнює дисперсії.



Провівши нормування, отримаємо автокореляційну функцію стаціонарного стохастичного процесу:

Тимчасовий ряд х 1, х 2,..., х Т,тобто конкретна реалізація стаціонарного стохастичного процесу X tтакож називається стаціонарним.

У практичній аналітичній роботі стаціонарність часового ряду означає відсутність:

Систематичні зміни дисперсії;

Суворо періодичних флуктуацій;

Систематично змінюються взаємозалежності між елементами часового ряду.

Економічні часові ряди є дані спостережень за економічними показниками, наприклад, валовим внутрішнім продуктом, за ряд років, і такі ряди, як правило, нестаціонарні.

Графічне уявлення стаціонарного ряду

Ергодичність

Основна проблема в оцінюванні параметрів розподілу стохастичного процесу полягає в тому, що в загальному випадку розмір вибірки n = 1, оскільки є єдина реалізація процесу. З огляду на це зробити осмислену оцінку практично неможливо. Досліджуваний стохастичний процес як такий невідомий. Його стаціонарність чи нестаціонарність може бути встановлена ​​лише за допомогою аналізу відповідного йому часового ряду. Але, з іншого боку, багато методів аналізу часових рядів припускають їхню стаціонарність. Це призводить до свого роду замкненого кола, коли властивість, на наявність якого проводиться дослідження, входить у початкові причини.

Цю проблему можна вирішити з використанням поняття ергодичність : це поведінка великого класу стаціонарних процесів, коли арифметичне середнє з часом схоже на математичне очікування μ. Ергодичність уможливлює оцінювання стохастичного процесу тільки з його реалізації - часового ряду.

Відомі різні підходи до розпізнавання стаціонарності часових рядів:

· графічне уявлення часового ряду та візуальна перевірка на наявність якогось тренду, тобто. мінливого середнього, дисперсії, що збільшується або зменшується, стійких періодичностей;

· Дослідження на наявність автокореляції в реальних даних;

· Тести на присутність детерміністичного тренду, наприклад t - тест на коефіцієнти оцінок методу найменших квадратів;

· Тести на наявність стохастичного тренду, наприклад тести на одиничний корінь.

Особливі випадки

Процес називається нормальним, якщо спільний розподіл X t1 , X t2 ,..., X t n- це n-мірний нормальний розподіл. У разі зі стаціонарності у слабкому сенсі слід стаціонарність у сенсі.

«Білим шумом» називається суто випадковий процес, тобто. ряд незалежних, однаково розподілених випадкових величин a t (iid). Основні характеристики «білого шуму» такі:

З цього очевидним чином випливає стаціонарність. "Білий шум" відіграє важливу роль при моделюванні залишків або шоків стохастичного процесу, що генерує дані (тимчасовий ряд).

Для того щоб перевірити, чи є тимчасовий ряд x t «білим шумом», можна протестувати його вибіркову автокореляцію за допомогою Q-статистики Бокса – Пірса:

При нульовій гіпотезі про те, що X t - «білий шум» Q-статистика має -розподіл з рступенями свободи.

Схожі статті

  • Моделі стаціонарних часових рядів

    Інструкція: Під тимчасовими рядами розуміють економічні величини, залежні від часу. При цьому час передбачається дискретним, інакше говорять про випадкові процеси, а не про тимчасові ряди. Моделі стаціонарних та...

  • Характеристики статистичного розподілу

    Для вибірки можна визначити ряд числових характеристик, які аналогічні основним числовим характеристикам випадкових величин у теорії ймовірностей (математичне очікування, дисперсія, середнє квадратичне відхилення, мода, медіана) та...

  • Навчальний посібник: Математична статистика

    Математична статистика - це сучасна галузь математичної науки, яка займається статистичним описом результатів експериментів та спостережень, а також побудовою математичних моделей, що містять поняття ймовірності.

  • Чому нам складно спілкуватися: бар'єри взаємодії Отже, які ж основні види бар'єрів у спілкуванні

    Характер являє собою поєднання найбільш стійких, суттєвих особливостей людини.

  • Статистична сукупність

    Теорія статистики Посібник для студентів, які навчаються за дистанційною системою Введення Статистика є однією з базових дисциплін, що формує професійний рівень сучасного економіста, займає особливе місце в системі...

  • Логарифмічно нормальний розподіл Закон розподілу вейбулу

    Теоретично надійності найбільшого поширення набули такі закони розподілу випадкових величин f (t ):Для дискретних випадкових величин - біномінальний закон; закон Пуассона; Для безперервних випадкових величин - експонентний...