Вводное руководство к данным временных рядов
Опубликовано: 2021-09-07«Время» - важная переменная, когда речь идет о накоплении данных. В анализе временных рядов время является важным элементом данных.
Что такое данные временных рядов?
Данные временного ряда относятся к ряду точек данных, упорядоченных во времени. Он вводит зависимость порядка между набором наблюдений. В современном мире, управляемом данными, временные ряды повсеместны. Поскольку каждое событие следует по стрелке времени, мы постоянно взаимодействуем с различными данными временных рядов.
Обычно предполагается, что временные ряды генерируются через равные промежутки времени и называются регулярными временными рядами. Однако данные в рамках этого временного ряда необязательно генерировать через регулярные промежутки времени. Такие примеры охватывают нерегулярные временные ряды, где данные следуют за временной фазовой последовательностью. Это означает, что измерения могут производиться не через регулярные промежутки времени. Однако данные могут генерироваться через дискретные временные интервалы или в виде пакета. Снятие средств в банкоматах или пополнение счета - примеры нерегулярных временных рядов.
Технически во временном ряду одна или несколько переменных изменяются в течение заданного периода времени. Если одна переменная изменяется со временем, это называется одномерным временным рядом. Например, рассмотрим датчик, измеряющий температуру в комнате каждую секунду. Здесь в каждый момент времени (т. Е. В секунду) генерируется только одномерное значение температуры. Напротив, когда с течением времени изменяется более одной переменной, это называется многомерным временным рядом. Например, рассмотрим экономику банка. В таких случаях многомерные временные ряды используются для понимания того, как изменения политики в отношении одной переменной, такой как ставка РЕПО, могут повлиять на другие переменные (например, на выдачу ссуд для коммерческих банков).
Данные временных рядов находят применение во всех дисциплинах, от финансов, геологии, метеорологии, производства до вычислительной техники, Интернета вещей, физических и социальных наук. Он используется для отслеживания изменений погоды, рождаемости, смертности, колебаний рынка, производительности сети и многих других приложений. Некоторые из его основных вариантов использования включают мониторинг, прогнозирование и обнаружение аномалий. Например, прогнозирование временных рядов играет решающую роль в определении популярности систем управления базами данных. На рисунке ниже показан рост популярности СУБД на протяжении многих лет (2019-2021 гг.) На графике временных рядов.

Ключевые компоненты временных рядов
Факторы, влияющие на значения наблюдения во временном ряду, рассматриваются как их ключевые компоненты. К трем категориям компонентов относятся:
- Тренд или долгосрочные движения
- Краткосрочные движения
- Сезонные вариации
- Циклические вариации
- Случайные или нерегулярные движения

Тренд
Тенденция увеличения или уменьшения данных в течение длительного периода времени называется трендом или долгосрочным компонентом. Однако важно отметить, что движение вверх или вниз не обязательно должно происходить в одном и том же направлении в течение заданного промежутка времени.
Тенденции могут расти, падать или оставаться стабильными в разные периоды времени. Однако общая тенденция всегда должна соответствовать восходящей, нисходящей или стабильной модели. Такие тенденции движения очевидны на таких примерах, как производительность сельского хозяйства, уровень смертности, произведенные устройства, количество фабрик и т. Д.
Линейный и нелинейный тренд
Построение графика значений временных рядов в зависимости от времени позволяет выявить тип тенденции, основанный на схеме кластеризации данных. Если кластер данных более или менее расположен вокруг прямой линии, то тренд называется линейным трендом. В противном случае шаблон кластера данных показывает нелинейный тренд, поскольку соотношение изменений между двумя переменными не является стабильным или постоянным. Поэтому такие тренды также называют криволинейными корреляциями.
Краткосрочные движения
Во временном ряду эти компоненты имеют тенденцию повторяться в течение определенного периода времени. Они имеют нерегулярные короткие всплески и влияют на исследуемые переменные. Два типа категорий краткосрочного движения включают:
Сезонные колебания
Эти версии работают регулярно и периодически в течение менее года. У них, как правило, наблюдается похожая или почти такая же картина в течение 12-месячного периода. Такие вариации становятся частью временного ряда, если данные записываются регулярно, т. Е. Ежечасно, ежедневно, еженедельно, ежемесячно или ежеквартально.
Сезонные колебания возникают либо в результате деятельности человека, либо в природе. Решающую роль в таких изменениях играют разные сезоны или климатические условия. Например, растениеводство полностью зависит от времени года. Точно так же рынок зонтика или дождевика зависит от сезона дождей, в то время как продажи кулеров и кондиционеров достигают пика в летний сезон.
Искусственные конвенции включают фестивали, вечеринки и такие случаи, как свадьбы. Такие краткосрочные события повторяются год за годом.
Циклические вариации
Вариации временных рядов, которые имеют тенденцию действовать в течение периода более года, называются циклическими вариациями. Для бизнеса один полный период рассматривается как «деловой цикл». Рост или снижение эффективности бизнеса зависит от различных факторов, таких как структура экономики, управление бизнесом и других взаимодействующих факторов. Эти циклические изменения деловой активности могут быть регулярными, но не периодическими. Как правило, предприятия проходят четырехэтапный циклический процесс, включающий процветание, спад, депрессию и возрождение.
Такие циклические изменения являются неотъемлемой частью модели временных рядов, поскольку развитие бизнеса в значительной степени зависит от сгенерированных «последовательных точек данных».
Случайные или нерегулярные движения
Случайные компоненты вызывают значительное изменение наблюдаемой переменной. Это чисто нерегулярные колебания без какой-либо определенной закономерности. Силы непредвиденные, непредсказуемые и неустойчивые по своей природе - например, землетрясения, наводнения, голод и другие бедствия.
Случайные события, описанные выше, анализируются с использованием исходных данных временных рядов, чтобы лучше справляться с такими реальными сценариями, которые могут произойти в будущем.
Типы временных рядов
Данные временных рядов можно разделить на четыре типа: детерминированные, недетерминированные, стационарные и нестационарные. Давайте подробно рассмотрим каждый тип.
№1. Детерминированный временной ряд
Детерминированный временной ряд можно описать аналитическим выражением. Он не включает случайных или вероятностных аспектов. Математически это может быть выражено точно для всех временных интервалов в терминах разложения в ряд Тейлора. Это возможно, если в произвольный момент времени известны все его производные. Эти производные явно определяют прошлое и будущее на тот момент. Если все условия выполнены, можно точно предсказать его будущее поведение и проанализировать, как оно вело себя в прошлом.
№2. Недетерминированные временные ряды
Недетерминированный временной ряд имеет связанный с ним случайный аспект, который препятствует его явному описанию. Следовательно, аналитические выражения не являются достаточно подходящими решениями для выражения такого временного ряда. Временной ряд может быть недетерминированным по следующим причинам:
- Информация, необходимая для его описания, недоступна полностью. Хотя данные могут присутствовать в принципе, их нельзя рассматривать как поддающиеся явной количественной оценке.
- Процесс генерации данных носит случайный характер.
Из-за случайного фактора недетерминированные временные ряды подчиняются вероятностным законам. Следовательно, данные обрабатываются в статистических терминах - подразумевая, что данные определяются распределениями вероятностей и средними значениями различных форм. Сюда входят средства и меры дисперсии, т. Е. Дисперсии.
№3. Стационарные временные ряды
В стационарных временных рядах статистические свойства, такие как среднее значение, дисперсия и другие, не зависят от временного аспекта. Стационарный временной ряд легче предсказать, поскольку можно с уверенностью заявить, что его статистические свойства останутся такими же, как они наблюдались в прошлом. Следовательно, различные методы статистического прогнозирования основаны на аргументе, что временной ряд практически стационарен. Это означает, что временной ряд можно рассматривать как стационарный в приближении, применяя простые математические преобразования.
№4. Нестационарные временные ряды
В нестационарных рядах статистические свойства меняются со временем. Следовательно, временные ряды с трендами или сезонностью попадают в категорию нестационарных, поскольку тренд и сезонность могут влиять на значение временного ряда в разные временные интервалы. Нестационарные временные ряды описывают непредсказуемые данные, не позволяя моделировать или прогнозировать их.

Анализ и прогнозирование временных рядов
Анализ и прогнозирование временных рядов - удобные инструменты для наблюдения, анализа и изучения эволюции и динамики жизненно важных процессов и различных объектов. Давайте рассмотрим каждый из них более подробно.
Анализ временных рядов
Анализ временных рядов определяется как процесс анализа данных, собранных за определенный период времени. Здесь аналитики данных записывают данные с постоянными интервалами в течение фиксированного периода времени. Скорость наблюдения данных, т. Е. Временной интервал, может варьироваться от секунд до лет.
Данные временных рядов описывают проверяемые переменные, поскольку они обеспечивают подробный анализ модели колебаний за определенный промежуток времени. Параметры, необходимые для анализа, могут варьироваться в зависимости от предметной области и дисциплины. Некоторые из примеров могут включать:
- Научные инструменты - данные записываются за день
- Коммерческий веб-сайт - Посещений клиентов в день
- Фондовый рынок - Стоимость акций за неделю
- Сезон - Дождливые дни в году
Чтобы обеспечить согласованность и надежность, анализ временных рядов работает с большим количеством точек данных. Хороший размер выборки - это тонкое представление об истинности обнаруженного тренда или паттерна.
Кроме того, анализ временных рядов также подходит для прогнозирования будущих событий на основе прошлых записанных данных.

Прогнозирование временных рядов
Анализ временных рядов позволяет организациям определить основную причину колебаний тенденций с течением времени. Имея данные в руках, предприятия могут изучать и исследовать дальше, чтобы лучше понять, как бороться с незнакомыми тенденциями и прогнозировать предстоящие события. Компании обычно используют методы визуализации данных для определения таких аномалий в данных.
Прогнозирование временных рядов основывается на двух основных факторах:
- Прогнозируйте будущие события на основе прошлых данных.
- Предположим, что предстоящие тенденции будут иметь сходство с прошлыми моделями данных.
При прогнозировании основная цель состоит в том, чтобы предсказать, как точки данных будут оставаться такими же или изменяться в будущем. Вот несколько примеров из разных секторов промышленности, чтобы лучше понять нюансы анализа и прогнозирования временных рядов.
- Фондовый рынок - Ежедневное прогнозирование цены акций на момент закрытия.
- Продажи - прогнозируйте продажи товаров в магазине каждый день.
- Ценообразование - Ежедневный прогноз средней цены на топливо.
Некоторые из общих статистических методов, используемых для прогнозирования временных рядов, включают простое скользящее среднее (SMA), экспоненциальное сглаживание (SES), авторегрессионное интегрированное скользящее среднее (ARIMA) и нейронную сеть (NN).
Данные временных рядов в облаке
Чтобы раскрыть ценность данных временных рядов, предприятия должны иметь возможность быстро хранить и запрашивать данные. Компании на рынке капитала полагаются на большие объемы исторических и потоковых данных для использования аналитики данных в реальном времени и принятия эффективных бизнес-решений. Это может включать прогнозирование уязвимости по ценам на акции, определение требований к чистому капиталу или прогнозирование обменных курсов. Чтобы обеспечить гибкость и беспрепятственно обрабатывать данные, многие компании предпочитают перенос своих баз данных временных рядов в облако.
Благодаря миграции баз данных временных рядов в облака организации могут получить доступ к неограниченным ресурсам по запросу. Это позволяет компаниям использовать сотни ядер для выполнения своей задачи, которая максимизирует пропускную способность сети без проблем с задержками.
Базы данных временных рядов в облачной инфраструктуре подходят для рабочих нагрузок с интенсивными вычислениями. Сюда входит выполнение расчетов рисков в ответ на рыночные тенденции в реальном времени. Финансовые компании могут избавиться от накладных расходов на центры обработки данных и сосредоточиться на использовании ресурсов для повышения производительности своих рабочих нагрузок.
Поставщики облачных услуг, такие как AWS, предоставляют Amazon Timestream, службу базы данных временных рядов, которая позволяет легко загружать, хранить и анализировать наборы данных временных рядов. Они предлагают хранилище для управления рабочими нагрузками с большим количеством транзакций, инструменты анализа в реальном времени и функции потоковой передачи данных для отслеживания событий по мере их возникновения.
Следовательно, облачная инфраструктура расширяет и масштабирует преимущества данных временных рядов.
Приложения временных рядов
Модели временных рядов служат двум целям:
- Понять основные факторы, которые привели к определенному шаблону данных.
- На основе анализа подберите модель для прогнозирования и мониторинга.
Давайте посмотрим на некоторые примеры использования данных временных рядов в приложениях.

№1. Временные ряды в финансовой и деловой сфере
Все финансовые, деловые и инвестиционные решения принимаются на основе текущих рыночных тенденций и прогнозов спроса. Данные временных рядов используются для объяснения, корреляции и прогнозирования динамичного финансового рынка. Финансовые эксперты могут изучать финансовые данные, чтобы давать прогнозы для приложений, которые помогают снизить риски, стабилизировать ценообразование и торговлю.
Анализ временных рядов играет ключевую роль в финансовом анализе. Он используется для прогнозирования процентных ставок, прогнозирования волатильности фондовых рынков и многого другого. Заинтересованные стороны и лица, определяющие политику, могут принимать информированные решения о производстве, закупках, распределении ресурсов и оптимизировать свои бизнес-операции.
Этот анализ эффективно используется в инвестиционном секторе для отслеживания ставок безопасности и их колебаний с течением времени. Цену ценной бумаги также можно наблюдать в краткосрочной перспективе (т. Е. Запись данных за час или день) или в долгосрочной перспективе (т. Е. Наблюдение, растянутое на месяцы или годы). Анализ временных рядов - полезный инструмент для отслеживания того, как ценная бумага, актив или экономическая переменная работает в течение длительного периода времени.
№2. Временные ряды в медицинской сфере
Здравоохранение стремительно развивается как сфера, управляемая данными. В дополнение к финансовому и бизнес-анализу, в медицинской сфере широко используется анализ временных рядов.
Рассмотрим сценарий, который требует синергии данных временных рядов, согласованных с медицинской точки зрения процедур и методов интеллектуального анализа данных при лечении больных раком. Такая гибридная структура может использоваться для использования функций извлечения признаков из собранных данных временного ряда (т. Е. Рентгеновских изображений пациента) для отслеживания прогресса пациента и реакции на лечение, предоставляемое медицинским сообществом.
В секторе здравоохранения критически важно делать выводы из постоянно изменяющихся данных временных рядов. Кроме того, передовая медицинская практика требует, чтобы записи о пациентах были связаны с течением времени для лучшей видимости состояния здоровья пациента. Кроме того, параметры здоровья пациента должны регистрироваться точно через регулярные промежутки времени, чтобы иметь более четкое представление о состоянии здоровья пациента.
С выходом на передний план передовых медицинских инструментов анализ временных рядов зарекомендовал себя в сфере здравоохранения. Рассмотрим ниже примеры,
- Устройства ЭКГ: устройства, изобретенные для наблюдения за состоянием сердца путем регистрации электрических импульсов сердца.
- Устройства ЭЭГ: устройства, используемые для количественной оценки электрической активности мозга.
Такие устройства позволили практикующим врачам проводить анализ временных рядов для более быстрой, эффективной и точной медицинской диагностики.
Кроме того, с появлением устройств Интернета вещей, таких как носимые датчики и портативные медицинские устройства, теперь люди могут регулярно измерять параметры своего здоровья с минимальными затратами времени. Это приводит к последовательному сбору зависящих от времени медицинских данных как для больных, так и для здоровых людей.
№3. Временные ряды в астрономии
Астрономия и астрофизика - две современные дисциплины, в которых значительно используются данные временных рядов.
По сути, астрономия включает построение траекторий космических объектов и небесных тел и выполнение точных измерений, чтобы лучше понять Вселенную за пределами земной атмосферы. В связи с этим требованием астрономические эксперты имеют опыт работы с данными временных рядов при калибровке и настройке сложных инструментов и изучении представляющих интерес астрономических объектов.
Данные временных рядов уже давно связаны с областью астрономии. В 800 г. до н.э. данные временных рядов солнечных пятен собирались через регулярные промежутки времени. С тех пор анализ временных рядов использовался для
- Откройте для себя далекие звезды, основываясь на звездных расстояниях,
- Наблюдайте за космическими событиями, такими как сверхновые, чтобы лучше понять происхождение нашей Вселенной.
В данном случае данные временных рядов относятся к длинам волн и интенсивности света, излучаемого звездами, небесными телами или объектами. Астрономы постоянно отслеживают такие потоковые данные в реальном времени, чтобы обнаруживать космические события в реальном времени по мере их возникновения.
В последнее время появились такие области исследований, как астроинформатика и астростатистика, которые сочетают в себе различные дисциплины, такие как интеллектуальный анализ данных, машинное обучение, вычислительный интеллект и статистика. В этих новых областях исследований роль данных временных рядов заключается в быстром и эффективном обнаружении и классификации астрономических объектов.
№4. Временные ряды в прогнозировании погоды
Аристотель тщательно изучал погодные условия, чтобы лучше понять причины и следствия погодных изменений в древние времена. По прошествии нескольких дней ученые начали записывать данные о погоде с помощью таких инструментов, как «барометр», для вычисления атмосферных переменных. Данные собирались через равные промежутки времени и хранились в разных местах.
Со временем прогнозы погоды стали появляться в газетах. Перенесемся в наши дни, повсеместно установлены станции прогнозирования погоды в разных регионах по всему миру для сбора точных погодных переменных.
Такие станции имеют современные функциональные устройства, которые связаны между собой для сбора и сопоставления данных о погоде из разных мест. Коррелированные данные используются для прогнозирования погодных условий в каждый момент времени в зависимости от требований.
№5. Временные ряды в развитии бизнеса
Данные временных рядов позволяют предприятиям принимать бизнес-решения. Это достигается, поскольку процесс анализирует прошлые данные, чтобы вывести будущие события и пролить свет на вероятные возможности. Шаблон прошлых данных используется для получения следующих параметров:
- Рост бизнеса : для оценки общих финансовых и бизнес-показателей и измерения роста наиболее подходящим и надежным активом являются данные временных рядов.
- Оценить тенденцию : для оценки возникающих тенденций могут использоваться различные методы временных рядов. Рассмотрим, например, эти методы для анализа данных наблюдений за период времени, чтобы отразить увеличение или уменьшение продаж конкретного электронного устройства.
- Выявить сезонные закономерности : записанные точки данных могут выявить колебания и сезонные закономерности, которые могут помочь в прогнозировании данных. Полученная информация играет ключевую роль для рынков, где цены на продукцию меняются в зависимости от сезона. Такие данные могут помочь предприятиям в лучшем планировании и разработке продуктов.
Вывод
Таким образом, данные временных рядов можно рассматривать как характеристики сложных точек данных, собранных за постоянный период времени. Анализ, моделирование и прогнозирование временных рядов стали неотъемлемой частью нашей повседневной жизни с появлением гаджетов Интернета вещей, умной бытовой техники и портативных устройств. Кроме того, данные временных рядов находят свое применение в самых разных областях, включая здравоохранение, астрофизику, экономику, инженерию, бизнес и многие другие.
