2.1.4. Выборочные статистические характеристики ряда
В общем случае определение статистических характеристик случайной функции по экспериментальным данным представляет собой весьма сложную процедуру, состоящую из трех этапов: оценки стационарности функции, оценки характеристик ординат случайной функции и осреднения этих оценок. На практике при анализе временных рядов им приписывают свойство эргодичности, основанное на предположении о том, что единственная реализация случайной функции репрезентативной продолжительности является достаточным опытным материалом для получения ее статистических характеристик.
Другим свойством, которым должна обладать итоговая статистика, является устойчивость. Если при резком изменении малой доли количества данных (вследствие выбросов или других случайных искажений) значение статистической характеристики претерпевает существенные изменения, то такая статистика неустойчива.
Среднее значение для стационарного временного ряда определяется как математическое ожидание любого индивидуального значения (ввиду стационарности это математическое ожидание не зависит от момента наблюдения). В качестве оценки среднего используют обычно выборочное среднее значений ряда - сумму значений ряда, деленную на их общее число. При предположениях эргодичности эта оценка состоятельна, хотя при наличии сильной автокорреляции она теряет свою эффективность. Арифметическое среднее - прототип неустойчивого итога.
Медиана временного ряда определяется как медиана распределения реализаций случайной функции в момент времени t, т.е. такое действительное число, вероятность превышения которого для произвольного измерения равна 0.5 (для стационарного временного ряда эта величина не зависит от момента наблюдения). Для оценки медианы используют выборочную медиану ряда, т.е. центральный член (либо полусумму центральных членов) последовательности измерений, упорядоченной по возрастанию. В случае симметричного, например гауссовского распределения, теоретическое значение медианы совпадает со средним значением ряда, а выборочная медиана является альтернативной оценкой среднего значения. Медиана служит прототипом простого устойчивого итога.
Если при исследовании временных рядов требуется робастность эффективности (т.е. гарантированное качество оценки при широком варьировании ситуаций) то рекомендуется использовать более сложные устойчивые статистики, как, например, бивес-оценку (Мостеллер, Тьюки, 1982):
, где
s - медиана абсолютных отклонений |xi – b|, с - константа, которая берется равной 9 или 6. Поскольку s есть оценка для примерно 2/3 , то при расчете бивес-оценки не учитываются "хвосты" нормального распределения, т.е. измерения, превышающие 4 (при с = 6) или 6 (при с = 9). Так как мы не можем непосредственно вычислить b, не зная вектора весовых коэффициентов , и, в то же время, не можем найти веса, пока не знаем b, бивес-оценка рассчитывается по приведенным формулам с использованием итеративной процедуры.
Дисперсия динамического ряда определяется как дисперсия любого индивидуального значения (для стационарных рядов эта величина не зависит от момента наблюдения). Для его оценки используют обычно выборочную дисперсию ряда - сумму квадратов отклонений от среднего значения ряда, деленную на (n-1), где n - число значений ряда. При предположениях эргодичности эта оценка состоятельна, хотя при наличии сильной автокорреляции она теряет эффективность.
Выборочные оценки среднего, медианы и дисперсии могут быть вычислены и для нестационарного ряда, но в этом случае они не имеют вероятностной интерпретации.
Таблица 2.1
Выборочные статистические характеристики исследуемых временных рядов
Ряд | Среднее
| Медиана | Бивес- оценка | Дисперсия | Стандарт-ная ошибка |
РАСХОД СКОРОСТЬ ПОВТОР NH4+ Fe NCAL NROT | 20.1873 4.92077 12.1056 89.9827 129.369 2.10397 64.5805 | 16.595 4.3 11 60 100 1.01 48.5 | 16.373 4.685 11.637 70.16 116.67 1.51 56.266 | 153.134 4.51953 54.0767 6242.46 11867.4 8.34914 4573.81 | 12.3747 2.12592 7.35368 79.0092 108.938 2.88949 67.6299 |
В табл. 2.1 видно cущественное различие между средним и медианой для ряда NCAL, которое объясняется существенной ассиметрией распределения данных этого показателя (см. гистограмму на рис. 2.2). Значения бивес-оценки занимают, как правило, промежуточное место между средним и медианой.
- Глава 2. Классические методы исследования
- 2.1. Предварительная обработка и анализ рядов динамики
- 2.1.1. Общие представления о динамических рядах
- 2.1.2. Примеры временных рядов и их характеристики
- 2.1.3. Пропуски, выбросы и разрывы временных рядов
- 2.1.4. Выборочные статистические характеристики ряда
- 2.2. Методы выделения тренда временных рядов
- Булат Окуджава
- 2.2.1. Общие замечания
- 2.2.2. Метод скользящих средних
- 2.2.3. Медианное сглаживание
- 2.2.4. Метод экспоненциального сглаживания
- 2.2.5. Процедура сезонного экспоненциального сглаживания
- 2.2.6. Частотные фильтры
- 2.2.7. Тесты для оценки наличия тренда
- 2.2.8. Параметрические модели тренда
- 2.3. Автокорреляционная функция и спектр
- Булат Окуджава
- 2.3.1. Коэффициент автокорреляции и его оценка
- 2.3.2. Автокорреляционные функции
- 2.3.3. Критерий Дарбина-Уотсона
- 2.3.4. Спектральный анализ
- 2.4. Стохастические модели временных рядов
- Булат Окуджава
- 2.4.1. Основные типы стохастических моделей
- 2.4.2. Этапы построения моделей
- 2.4.3. Модель авторегрессии
- 2.4.4. Модель скользящего среднего
- 2.4.5. Модель Бокса-Дженкинса (арисс)
- 2.4.6. Сезонная модель