Una guida introduttiva ai dati delle serie temporali
Pubblicato: 2021-09-07Il "tempo" è una variabile cruciale quando si tratta di accumulare dati. Nell'analisi delle serie temporali, il tempo è un elemento importante dei dati.
Che cosa sono i dati delle serie temporali?
I dati di serie temporali si riferiscono a una serie di punti dati ordinati nel tempo. Introduce una dipendenza dall'ordine tra un insieme di osservazioni. Le serie temporali sono onnipresenti nel mondo guidato dai dati di oggi. Poiché ogni evento segue la freccia del tempo, siamo in costante interazione con una varietà di dati di serie temporali.
In genere si presume che le serie temporali vengano generate a intervalli di tempo regolari e vengono chiamate serie temporali regolari. Tuttavia, i dati all'interno di tali serie temporali non devono essere generati a intervalli regolari. Tali istanze comprendono serie temporali irregolari in cui i dati seguono una sequenza temporale graduale. Ciò implica che le misurazioni potrebbero non verificarsi a intervalli regolari. Tuttavia, i dati potrebbero essere generati a intervalli di tempo discreti o come burst. I prelievi bancomat o i depositi in conto sono esempi di serie temporali irregolari.
Tecnicamente, in una serie temporale, una o più variabili cambiano in un determinato periodo di tempo. Se una singola variabile varia nel tempo, viene definita serie temporale univariata. Ad esempio, considera un sensore che misura la temperatura di una stanza ogni secondo. Qui, in ogni istante (cioè, secondo) viene generato solo un valore di temperatura unidimensionale. Al contrario, quando più di una variabile cambia nel tempo, si parla di serie storica multivariata. Prendiamo ad esempio l'economia bancaria. In tali casi, vengono utilizzate serie temporali multivariate per comprendere come le modifiche delle politiche a una variabile, come il tasso repo, possano influenzare altre variabili (ad esempio, l'erogazione del prestito per le banche commerciali).
I dati delle serie temporali trovano la loro applicazione in ogni disciplina, dalla finanza, geologia, meteorologia, produzione all'informatica, IoT, scienze fisiche e sociali. Viene utilizzato per tenere traccia dei cambiamenti meteorologici, del tasso di natalità, del tasso di mortalità, delle fluttuazioni del mercato, delle prestazioni della rete e di molte altre applicazioni. Alcuni dei suoi principali casi d'uso includono monitoraggio, previsione e rilevamento di anomalie. Ad esempio, la previsione delle serie temporali svolge un ruolo fondamentale nel determinare la popolarità dei sistemi di gestione dei database. La figura seguente mostra la crescente popolarità dei DBMS nel corso degli anni (2019-2021) in un grafico di serie temporali.

Componenti chiave delle serie temporali
I fattori che influenzano i valori di un'osservazione in una serie temporale sono trattati come loro componenti chiave. Le tre categorie di componenti includono:
- Trend o movimenti a lungo termine
- Movimenti a breve termine
- Variazioni stagionali
- Variazioni cicliche
- Movimenti casuali o irregolari

Tendenza
La tendenza dei dati ad aumentare o diminuire in un lungo periodo di tempo viene definita trend o componente a lungo termine. Tuttavia, è importante notare che il movimento verso l'alto o verso il basso non deve necessariamente essere nella stessa direzione in un dato intervallo di tempo.
Le tendenze possono aumentare, diminuire o rimanere stabili in diversi periodi di tempo. La tendenza generale, tuttavia, deve sempre corrispondere a un modello al rialzo, al ribasso o stabile. Tali tendenze di movimento sono evidenti negli esempi come la produttività agricola, il tasso di mortalità, i dispositivi fabbricati, il numero di fabbriche, ecc.
Trend lineare e non lineare
Tracciare i valori delle serie temporali rispetto al tempo su un grafico rivela il tipo di tendenza in base al modello di clustering dei dati. Se il cluster di dati è più o meno attorno a una linea retta, allora il trend è definito come un trend lineare. In caso contrario, il pattern del cluster di dati mostra un andamento non lineare poiché il rapporto di variazione tra due variabili non è stabile o costante. Pertanto, tali tendenze sono anche chiamate correlazioni curvilinee.
Movimenti a breve termine
In una serie temporale, questi componenti tendono a ripetersi per un periodo di tempo. Hanno brevi raffiche irregolari e influenzano le variabili oggetto di studio. I due tipi di categorie in movimento a breve termine includono:
Variazioni stagionali
Queste versioni funzionano regolarmente e periodicamente per un periodo inferiore a un anno. Tendono ad avere uno schema simile o quasi uguale durante un periodo di 12 mesi. Tali variazioni diventano parte di una serie temporale se i dati vengono registrati regolarmente, ovvero ogni ora, giorno, settimana, mese o trimestre.
Le variazioni stagionali sono provocate dall'uomo o naturali. Diverse stagioni o condizioni climatiche giocano un ruolo critico in tali variazioni. Ad esempio, la produzione agricola dipende interamente dalle stagioni. Allo stesso modo, il mercato per un ombrello o un impermeabile dipende dalla stagione delle piogge, mentre la vendita di frigoriferi e condizionatori ha un picco durante la stagione estiva.
Le convenzioni create dall'uomo includono festival, feste e occasioni come i matrimoni. Tali eventi a breve termine si ripetono anno dopo anno.
Variazioni cicliche
Le variazioni di serie temporali che tendono a operare su un periodo di più di un anno sono indicate come variazioni cicliche. Per un'impresa, un periodo completo è considerato il "ciclo economico". Il picco o il calo delle prestazioni aziendali dipende da vari fattori come la struttura economica, la gestione aziendale e altre forze interagenti. Queste variazioni di business cicliche possono essere regolari ma non periodiche. In generale, le aziende subiscono un processo ciclico in quattro fasi che comprende prosperità, recessione, depressione e rinascita.
Tali variazioni cicliche sono parte integrante di un modello di serie temporali poiché lo sviluppo del business si basa fortemente sui "punti di dati sequenziali" generati.
Movimenti casuali o irregolari
Le componenti casuali provocano una variazione significativa nella variabile in osservazione. Queste sono fluttuazioni puramente irregolari senza uno schema prestabilito. Le forze sono impreviste, imprevedibili e di natura irregolare, ad esempio terremoti, inondazioni, carestie e altri disastri.
Gli eventi casuali descritti sopra vengono analizzati utilizzando i dati delle serie temporali di origine per affrontare meglio tali scenari di vita reale che potrebbero verificarsi in futuro.
Tipi di serie temporali
I dati delle serie temporali possono essere suddivisi in quattro tipi, deterministici, non deterministici, stazionari e non stazionari. Diamo un'occhiata a ciascun tipo in dettaglio.
#1. Serie temporali deterministiche
Una serie temporale deterministica può essere descritta con un'espressione analitica. Non comporta aspetti casuali o probabilistici. Matematicamente, può essere espresso esattamente per tutti gli intervalli di tempo in termini di espansione in serie di Taylor. Ciò è possibile se tutte le sue derivate sono note in un momento arbitrario. Questi derivati specificano esplicitamente il passato e il futuro in quel momento. Se tutte le condizioni sono soddisfatte, è possibile prevedere con precisione il suo comportamento futuro e analizzare come si è comportato in passato.
#2. Serie temporali non deterministiche
Una serie temporale non deterministica ha un aspetto casuale associato che ne impedisce la descrizione esplicita. Quindi, le espressioni analitiche non sono soluzioni abbastanza fattibili per esprimere una tale serie temporale. Una serie storica può essere non deterministica per i seguenti motivi:
- Le informazioni necessarie per descriverlo non sono disponibili nella sua interezza. Sebbene i dati possano essere presenti in linea di principio, non possono essere trattati come quantificabili in modo esplicito.
- Il processo di generazione dei dati è di natura casuale.
A causa del fattore casuale, la serie temporale non deterministica obbedisce a leggi probabilistiche. Pertanto, i dati sono affrontati in termini statistici, i dati che implicano sono definiti da distribuzioni di probabilità e medie di varie forme. Ciò include mezzi e misure di dispersione, cioè varianze.
#3. Serie temporali stazionarie
In una serie temporale stazionaria, le proprietà statistiche come media, varianza e altre non si basano sull'aspetto temporale. Una serie temporale stazionaria è più facile da prevedere in quanto si può affermare con certezza che le sue proprietà statistiche rimarranno le stesse osservate in passato. Pertanto, vari metodi di previsione statistica si basano sull'argomento che le serie temporali sono quasi stazionarie. Ciò implica che le serie temporali possono essere considerate stazionarie in approssimazione applicando semplici trasformazioni matematiche.
#4. Serie temporali non stazionarie
In una serie non stazionaria, le proprietà statistiche variano nel tempo. Pertanto, le serie temporali con tendenze, o stagionalità, rientrano nella categoria non stazionaria poiché la tendenza e la stagionalità possono influenzare il valore delle serie temporali a intervalli di tempo diversi. Le serie temporali non stazionarie descrivono dati imprevedibili, impedendone la modellazione o la previsione.

Analisi e previsione delle serie temporali
L'analisi e la previsione delle serie temporali sono strumenti utili per osservare, analizzare e studiare l'evoluzione e la dinamica di processi vitali e oggetti di diverso tipo. Diamo un'occhiata a ciascuno in modo più approfondito.
Analisi delle serie temporali
L'analisi delle serie temporali è definita come un processo di analisi dei dati raccolti in un periodo di tempo. Qui, gli analisti di dati registrano i dati a intervalli costanti in un periodo di tempo fisso. Il tasso di osservazione dei dati, ovvero l'intervallo di tempo, può variare da secondi ad anni.
I dati delle serie temporali descrivono le variabili sotto ispezione in quanto forniscono un'analisi dettagliata del modello fluttuante in un intervallo di tempo specifico. I parametri necessari per l'analisi possono variare tra diversi domini e discipline. Alcuni degli esempi possono includere:
- Strumenti scientifici – Dati registrati al giorno
- Sito web commerciale – Visite dei clienti al giorno
- Mercato azionario – Valori azionari a settimana
- Stagione – Giorni di pioggia all'anno
Per garantire coerenza e affidabilità, l'analisi delle serie temporali opera su grandi quantità di punti dati. Una buona dimensione del campione è una sottile rappresentazione dell'autenticità di una tendenza o di un modello scoperto.
Inoltre, l'analisi delle serie temporali è adatta anche per prevedere eventi futuri sulla base di dati registrati in passato.
Previsione delle serie temporali
L'analisi delle serie temporali consente alle organizzazioni di identificare la causa principale delle fluttuazioni delle tendenze nel tempo. Con i dati alla mano, le aziende possono quindi studiare e ricercare ulteriormente per capire meglio come affrontare tendenze sconosciute e prevedere eventi imminenti. Le aziende generalmente utilizzano tecniche di visualizzazione dei dati per determinare tali anomalie nei dati.

La previsione delle serie temporali ruota attorno a due fattori essenziali:
- Anticipa gli eventi futuri in base al comportamento dei dati passati.
- Supponiamo che le tendenze future presenteranno somiglianze con il modello di dati passato.
Nella previsione, l'obiettivo principale è essenzialmente prevedere come i punti dati continueranno a rimanere gli stessi oa variare in futuro. Ecco alcuni esempi di diversi settori industriali per comprendere meglio le sfumature dell'analisi e della previsione delle serie temporali.
- Mercato azionario – Previsione del prezzo di chiusura delle azioni ogni giorno.
- Vendite: prevedi le vendite di prodotti per un negozio ogni giorno.
- Prezzi: previsione del prezzo medio del carburante ogni giorno.
Alcune delle tecniche statistiche comuni utilizzate per la previsione delle serie temporali includono la media mobile semplice (SMA), il livellamento esponenziale (SES), la media mobile integrata autoregressiva (ARIMA) e la rete neurale (NN).
Dati di serie temporali nel cloud
Per svelare il valore dei dati delle serie temporali, le aziende dovrebbero essere in grado di archiviare ed eseguire query sui dati rapidamente. Le società del mercato dei capitali si affidano a grandi volumi di dati storici e in streaming per utilizzare analisi dei dati in tempo reale e prendere decisioni aziendali di grande impatto. Ciò può comportare la previsione della vulnerabilità ai prezzi delle azioni, la determinazione dei requisiti patrimoniali netti o la previsione dei tassi di cambio. Per fornire flessibilità ed elaborare i dati senza problemi, molte aziende stanno optando per la migrazione dei propri database di serie temporali nel cloud.
Con la migrazione dei database delle serie temporali ai cloud, le organizzazioni possono accedere a risorse illimitate su richiesta. Consente alle aziende di utilizzare centinaia di core per svolgere il proprio compito che massimizza il throughput di rete senza problemi di latenza.
I database di serie temporali nell'infrastruttura cloud sono adatti per carichi di lavoro ad alta intensità di calcolo. Ciò include l'esecuzione di calcoli del rischio in risposta alle tendenze del mercato in tempo reale. Le società finanziarie possono eliminare il sovraccarico del data center e concentrarsi sull'utilizzo delle risorse per migliorare la produttività dei loro carichi di lavoro.
I fornitori di cloud come AWS forniscono Amazon Timestream, un servizio di database di serie temporali che consente di caricare, archiviare e analizzare facilmente i set di dati di serie temporali. Offrono storage per gestire carichi di lavoro ad alta intensità di transazioni, strumenti di analisi in tempo reale e funzionalità di streaming dei dati per presentare gli eventi nel momento in cui si verificano.
Pertanto, l'infrastruttura cloud amplifica e ridimensiona i vantaggi dei dati delle serie temporali.
Applicazioni delle serie storiche
I modelli di serie temporali hanno due scopi,
- Comprendere i fattori sottostanti che hanno prodotto un determinato modello di dati.
- Sulla base dell'analisi, adattare un modello da prevedere e monitorare.
Diamo un'occhiata ad alcuni casi d'uso delle applicazioni di dati di serie temporali.

#1. Serie temporali nel dominio finanziario e aziendale
Tutte le decisioni finanziarie, commerciali e di investimento vengono prese in base alle tendenze attuali del mercato e alle previsioni della domanda. I dati delle serie temporali vengono utilizzati per spiegare, correlare e prevedere il mercato finanziario dinamico. Gli esperti finanziari possono esaminare i dati finanziari per fornire previsioni per applicazioni che aiutano a mitigare il rischio, stabilizzare i prezzi e il trading.
L'analisi delle serie temporali svolge un ruolo chiave nell'analisi finanziaria. Viene utilizzato nella previsione dei tassi di interesse, nella previsione della volatilità nei mercati azionari e molti altri. Gli stakeholder aziendali e i responsabili delle politiche possono prendere decisioni informate sulla produzione, gli acquisti, l'allocazione delle risorse e ottimizzare le operazioni aziendali.
Questa analisi è efficacemente utilizzata nel settore degli investimenti per monitorare i tassi di sicurezza e le loro fluttuazioni nel tempo. Il prezzo del titolo può essere osservato anche a breve termine (ovvero registrare dati per ora o giorno) oa lungo termine (ovvero, osservazione estesa su mesi o anni). L'analisi delle serie temporali è uno strumento utile per tenere traccia delle prestazioni di un titolo, di un bene o di una variabile economica in un lungo periodo di tempo.
#2. Serie temporali in ambito medico
L'assistenza sanitaria sta rapidamente emergendo come un campo basato sui dati. Oltre all'analisi finanziaria e aziendale, il settore medico sta sfruttando notevolmente l'analisi delle serie temporali.
Considera uno scenario che richiede una sinergia di dati di serie temporali, procedure allineate dal punto di vista medico e tecniche di data mining durante il trattamento dei malati di cancro. Tale struttura ibrida può essere impiegata per sfruttare le funzionalità di estrazione delle caratteristiche dai dati delle serie temporali raccolte (ad esempio, le immagini a raggi X del paziente) per monitorare i progressi del paziente e la risposta ai trattamenti forniti dalla confraternita medica.
Nel settore sanitario, trarre deduzioni dai dati delle serie temporali in costante cambiamento è di fondamentale importanza. Inoltre, le pratiche mediche avanzate richiedono che i record dei pazienti siano collegati nel tempo per una migliore visibilità della salute del paziente. Inoltre, i parametri di salute del paziente devono essere registrati con precisione a intervalli regolari per avere un quadro più chiaro dello stato di salute del paziente.
Con l'emergere di strumenti medici avanzati, l'analisi delle serie temporali si è affermata nel settore sanitario. Considera gli esempi seguenti,
- Dispositivi ECG: dispositivi inventati per monitorare le condizioni cardiache registrando gli impulsi elettrici del cuore.
- Dispositivi EEG: dispositivi utilizzati per quantificare l'attività elettrica nel cervello.
Tali dispositivi hanno consentito ai medici di esercitare l'analisi delle serie temporali per una diagnosi medica più rapida, efficace e accurata.
Inoltre, con l'avvento di dispositivi IoT come sensori indossabili e dispositivi sanitari portatili, le persone possono ora effettuare misurazioni regolari delle loro variabili di salute nel tempo con input minimi. Ciò porta a una raccolta coerente di dati medici dipendenti dal tempo sia per gli individui malati che per quelli sani.
#3. Serie temporali in astronomia
L'astronomia e l'astrofisica sono le due discipline moderne in cui i dati delle serie temporali vengono sfruttati in modo significativo.
Fondamentalmente, l'astronomia implica la tracciatura delle traiettorie degli oggetti cosmici e dei corpi celesti e l'esecuzione di misurazioni accurate per comprendere meglio l'universo oltre l'atmosfera terrestre. A causa di questo requisito, gli esperti astronomici sono abili nella gestione dei dati delle serie temporali durante la calibrazione e la configurazione di strumenti complessi e lo studio di oggetti astronomici di interesse.
I dati delle serie temporali sono stati a lungo associati al campo dell'astronomia. Nell'800 aC, i dati delle serie temporali sulle macchie solari sono stati raccolti a intervalli regolari. Da allora, l'analisi delle serie temporali è stata utilizzata per
- Scopri stelle lontane in base a distanze stellari,
- Osserva gli eventi cosmici come le supernove per comprendere meglio l'origine del nostro universo.
I dati delle serie temporali, in questo caso, si riferiscono alle lunghezze d'onda e alle intensità della luce emessa da stelle, corpi celesti o oggetti. Gli astronomi monitorano costantemente tali dati in streaming dal vivo per rilevare eventi cosmici in tempo reale come e quando si verificano.
Negli ultimi tempi sono emerse aree di ricerca come l'astroinformatica e l'astrostatistica, che fondono varie discipline come il data mining, l'apprendimento automatico, l'intelligenza computazionale e la statistica. In queste nuove aree di ricerca, il ruolo dei dati delle serie temporali è quello di rilevare e classificare gli oggetti astronomici in modo rapido ed efficiente.
#4. Serie temporali nelle previsioni del tempo
Aristotele studiò ampiamente i modelli meteorologici per comprendere meglio le cause e gli effetti osservati nei cambiamenti meteorologici nei tempi antichi. Con il passare dei giorni, gli scienziati hanno iniziato a registrare i dati meteorologici su strumenti come il "barometro" per calcolare le variabili atmosferiche. I dati sono stati raccolti a intervalli regolari e conservati in luoghi diversi.
Con il tempo, alla fine, le previsioni del tempo iniziarono a comparire sui giornali. Avanti veloce fino ai giorni e all'età di oggi, le onnipresenti stazioni di previsione del tempo sono installate in diverse aree geografiche in tutto il mondo per raccogliere variabili meteorologiche accurate.
Tali stazioni dispongono di dispositivi funzionali avanzati interconnessi per raccogliere e correlare i dati meteorologici da varie località. I dati correlati vengono utilizzati per prevedere le condizioni meteorologiche in ogni momento a seconda delle esigenze.
#5. Serie temporali nello sviluppo aziendale
I dati delle serie temporali consentono alle aziende di prendere decisioni aziendali. Ciò si ottiene quando il processo analizza i dati passati per ricavare eventi futuri e gettare luce su probabili possibilità. Il modello di dati passati viene utilizzato per derivare i seguenti parametri:
- Crescita aziendale : per valutare le prestazioni finanziarie e aziendali complessive e misurare la crescita, i dati delle serie temporali sono la risorsa più adatta e affidabile.
- Stima del trend : per stimare i trend emergenti possono essere impiegati vari metodi di serie temporali. Si consideri, ad esempio, questi metodi che analizzano le osservazioni dei dati in un periodo di tempo per riflettere su un aumento o una diminuzione delle vendite di un particolare dispositivo elettronico.
- Svela modelli stagionali : i punti dati registrati potrebbero rivelare fluttuazioni e modelli stagionali che potrebbero aiutare nella previsione dei dati. Le informazioni sui dati ottenute svolgono un ruolo chiave per i mercati in cui i prezzi dei prodotti variano stagionalmente. Tali dati possono aiutare le imprese a una migliore pianificazione e sviluppo del prodotto.
Conclusione
In sintesi, i dati delle serie temporali possono essere visualizzati come le caratteristiche di punti dati complessi raccolti in un periodo di tempo costante. L'analisi, la modellazione e le previsioni delle serie temporali sono diventate parte integrante della nostra vita quotidiana con l'emergere di gadget IoT, elettrodomestici intelligenti e dispositivi portatili. Inoltre, i dati delle serie temporali stanno trovando applicazione in diversi campi, tra cui sanità, astrofisica, economia, ingegneria, economia e molti altri.
