Panduan Pengantar Data Deret Waktu

Diterbitkan: 2021-09-07

"Waktu" adalah variabel penting dalam hal akumulasi data. Dalam analisis deret waktu, waktu merupakan elemen penting dari data.

Apa itu Data Deret Waktu?

Data deret waktu mengacu pada serangkaian titik data yang diurutkan dalam waktu. Ini memperkenalkan ketergantungan urutan antara satu set pengamatan. Deret waktu ada di mana-mana di dunia yang didorong oleh data saat ini. Karena setiap peristiwa mengikuti panah waktu, kita selalu berinteraksi dengan berbagai data deret waktu.

Deret waktu umumnya diasumsikan dihasilkan pada interval waktu yang teratur dan disebut sebagai deret waktu reguler. Namun, data dalam deret waktu tersebut tidak perlu dibuat secara berkala. Contoh seperti itu mencakup deret waktu yang tidak teratur di mana data mengikuti urutan bertahap sementara. Ini menyiratkan pengukuran mungkin tidak terjadi secara berkala. Namun, data mungkin dihasilkan pada interval waktu diskrit atau sebagai burst. Penarikan ATM atau penyetoran rekening adalah contoh deret waktu yang tidak teratur.

Secara teknis, dalam deret waktu, satu atau lebih variabel berubah selama periode waktu tertentu. Jika variabel tunggal bervariasi dari waktu ke waktu, itu disebut sebagai deret waktu Univariat. Misalnya, pertimbangkan sensor yang mengukur suhu ruangan setiap detik. Di sini, hanya nilai suhu satu dimensi yang dihasilkan setiap saat (yaitu, detik). Sebaliknya, ketika lebih dari satu variabel berubah dari waktu ke waktu, itu disebut deret waktu Multivariat. Misalnya, pertimbangkan ekonomi bank. Dalam kasus tersebut, deret waktu multivariat digunakan untuk memahami bagaimana perubahan kebijakan pada satu variabel, seperti suku bunga repo, dapat mempengaruhi variabel lain (yaitu, penyaluran pinjaman untuk bank umum).

Data deret waktu menemukan penerapannya di setiap disiplin ilmu, mulai dari keuangan, geologi, meteorologi, manufaktur hingga komputasi, IoT, ilmu fisika dan sosial. Ini digunakan untuk melacak perubahan cuaca, tingkat kelahiran, tingkat kematian, fluktuasi pasar, kinerja jaringan, dan banyak aplikasi lainnya. Beberapa kasus penggunaan utamanya termasuk pemantauan, peramalan, dan deteksi anomali. Misalnya, peramalan deret waktu memainkan peran penting dalam menentukan popularitas sistem manajemen basis data. Gambar di bawah menunjukkan semakin populernya DBMS selama bertahun-tahun (2019-2021) dalam plot deret waktu.

https://www.influxdata.com/time-series-database/

Komponen Utama Deret Waktu

Faktor-faktor yang mempengaruhi nilai-nilai pengamatan dalam deret waktu diperlakukan sebagai komponen kuncinya. Tiga kategori komponen tersebut antara lain:

  1. Tren atau pergerakan jangka panjang
  2. Gerakan jangka pendek
    1. Variasi musiman
    2. Variasi siklik
  3. Gerakan Acak atau Tidak Teratur

Kecenderungan

Kecenderungan data untuk bertambah atau berkurang dalam jangka waktu yang lama disebut sebagai trend atau komponen jangka panjang. Namun, penting untuk dicatat bahwa gerakan ke atas atau ke bawah tidak harus dalam arah yang sama selama rentang waktu tertentu.

Kecenderungan bisa naik, turun, atau tetap stabil selama bagian waktu yang berbeda. Tren keseluruhan, bagaimanapun, harus selalu sama dengan pola naik, turun, atau stabil. Kecenderungan pergerakan tersebut terlihat dalam contoh-contoh seperti produktivitas pertanian, tingkat kematian, perangkat yang diproduksi, jumlah pabrik, dll.

Tren Linier dan Non Linier

Memplot nilai deret waktu terhadap waktu pada grafik mengungkapkan jenis tren berdasarkan pola pengelompokan data. Jika klaster data kurang lebih berada di sekitar garis lurus, maka tren tersebut disebut sebagai tren linier. Sebaliknya, pola klaster data menunjukkan tren non-linier karena rasio perubahan antara dua variabel tidak stabil atau konstan. Oleh karena itu, tren semacam itu juga disebut korelasi lengkung.

Gerakan Jangka Pendek

Dalam deret waktu, komponen-komponen ini cenderung berulang selama periode waktu tertentu. Mereka memiliki ledakan pendek yang tidak teratur dan mempengaruhi variabel yang diteliti. Dua jenis kategori di bawah gerakan jangka pendek meliputi:

Variasi Musiman

Versi ini beroperasi secara teratur dan berkala selama periode kurang dari satu tahun. Mereka cenderung memiliki pola yang sama atau hampir sama selama periode 12 bulan. Variasi tersebut menjadi bagian dari time series jika data dicatat secara teratur, yaitu per jam, harian, mingguan, bulanan, atau triwulanan.

Variasi musim adalah buatan manusia atau terjadi secara alami. Musim atau kondisi iklim yang berbeda memainkan peran penting dalam variasi tersebut. Misalnya, produksi tanaman bergantung sepenuhnya pada musim. Demikian pula, pasar payung atau jas hujan tergantung pada musim hujan, sedangkan penjualan unit pendingin dan AC puncak selama musim panas.

Konvensi buatan manusia termasuk festival, pesta, dan acara-acara seperti pernikahan. Peristiwa jangka pendek seperti itu berulang dari tahun ke tahun.

Variasi siklik

Variasi deret waktu yang cenderung beroperasi selama lebih dari satu tahun disebut sebagai variasi siklik. Untuk sebuah bisnis, satu periode penuh dianggap sebagai “Siklus Bisnis”. Lonjakan atau penurunan kinerja bisnis tergantung pada berbagai faktor seperti struktur ekonomi, manajemen bisnis, dan kekuatan interaksi lainnya. Variasi bisnis siklik ini mungkin teratur tetapi tidak berkala. Umumnya, bisnis menjalani proses siklus empat fase yang terdiri dari kemakmuran, resesi, depresi, dan kebangkitan.

Variasi siklus seperti itu merupakan bagian integral dari pola deret waktu karena pengembangan bisnis sangat bergantung pada "titik data berurutan" yang dihasilkan.

Gerakan Acak atau Tidak Teratur

Komponen acak menyebabkan variasi yang signifikan pada variabel yang diamati. Ini adalah fluktuasi murni tidak teratur tanpa pola yang ditetapkan. Kekuatannya tidak terduga, tidak dapat diprediksi, dan sifatnya tidak menentu—misalnya, gempa bumi, banjir, kelaparan, dan bencana lainnya.

Peristiwa acak yang dijelaskan di atas dianalisis menggunakan data deret waktu sumber untuk menangani skenario kehidupan nyata yang lebih baik yang mungkin terjadi di masa depan.

Jenis Deret Waktu

Data deret waktu dapat dibagi menjadi empat jenis, deterministik, non-deterministik, stasioner, dan non-stasioner. Mari kita lihat masing-masing jenis secara detail.

#1. Deret Waktu Deterministik

Deret waktu deterministik dapat digambarkan dengan ekspresi analitik. Ini tidak melibatkan aspek acak atau probabilistik. Secara matematis, dapat dinyatakan secara tepat untuk semua interval waktu dalam bentuk ekspansi deret Taylor. Ini dimungkinkan jika semua turunannya diketahui pada suatu titik waktu yang berubah-ubah. Derivatif ini secara eksplisit menentukan masa lalu dan masa depan pada saat itu. Jika semua kondisi terpenuhi, adalah mungkin untuk secara akurat memprediksi perilaku masa depan dan menganalisis bagaimana berperilaku di masa lalu.

#2. Deret Waktu Non-deterministik

Deret waktu non-deterministik memiliki aspek acak yang terkait dengannya yang mencegah deskripsi eksplisitnya. Oleh karena itu, ekspresi analitik bukanlah solusi yang cukup layak untuk mengekspresikan deret waktu seperti itu. Deret waktu mungkin non-deterministik karena alasan berikut:

  1. Informasi yang diperlukan untuk menggambarkannya tidak tersedia secara keseluruhan. Meskipun data mungkin ada pada prinsipnya, itu tidak dapat diperlakukan sebagai kuantitatif secara eksplisit.
  2. Proses menghasilkan data bersifat acak.

Karena faktor acak, deret waktu non-deterministik mematuhi hukum probabilistik. Oleh karena itu, data ditangani dalam istilah statistik - menyiratkan data ditentukan oleh distribusi probabilitas dan rata-rata dari berbagai bentuk. Ini termasuk sarana dan ukuran dispersi, yaitu varians.

#3. Deret Waktu Stasioner

Dalam deret waktu stasioner, sifat-sifat statistik seperti mean, varians, dan lain-lain tidak bergantung pada aspek waktu. Deret waktu stasioner lebih mudah diprediksi karena seseorang dapat menyatakan dengan pasti bahwa sifat statistiknya akan tetap sama seperti yang telah diamati di masa lalu. Oleh karena itu, berbagai metode peramalan statistik didasarkan pada argumen bahwa deret waktu hampir stasioner. Ini menyiratkan bahwa deret waktu dapat dianggap stasioner dalam pendekatan dengan menerapkan transformasi matematika sederhana.

#4. Deret Waktu Non-stasioner

Dalam deret non-stasioner, sifat statistik berubah terhadap waktu. Oleh karena itu, deret waktu dengan tren, atau musiman, termasuk dalam kategori tidak stasioner karena tren dan musiman dapat mempengaruhi nilai deret waktu pada interval waktu yang berbeda. Deret waktu non-stasioner menggambarkan data yang tidak dapat diprediksi, mencegahnya dimodelkan atau diramalkan.

https://www.oreilly.com/library/view/hands-on-machine-learning/9781788992282/15c9cc40-bea2-4b75-902f-2e9739fec4ae.xhtml

Analisis dan Peramalan Deret Waktu

Analisis deret waktu dan peramalan adalah alat yang berguna untuk mengamati, menganalisis, dan mempelajari evolusi dan dinamika proses dan objek vital dari berbagai jenis. Mari kita lihat masing-masing secara lebih mendalam.

Analisis Deret Waktu

Analisis deret waktu didefinisikan sebagai proses menganalisis data yang dikumpulkan selama periode waktu tertentu. Di sini, analis data merekam data dalam interval konstan selama periode waktu tertentu. Laju pengamatan data, yaitu interval waktu, dapat bervariasi dari detik hingga tahun.

Data deret waktu menjelaskan variabel yang diperiksa karena menyediakan analisis terperinci tentang pola yang berfluktuasi selama rentang waktu tertentu. Parameter yang diperlukan untuk analisis dapat bervariasi di berbagai domain dan disiplin ilmu. Beberapa contohnya mungkin termasuk:

  • Instrumen ilmiah – Data direkam per hari
  • Situs web komersial – Kunjungan pelanggan per hari
  • Pasar saham – Nilai saham per minggu
  • Musim – Hari hujan per tahun

Untuk memastikan konsistensi dan keandalan, analisis deret waktu beroperasi pada sejumlah besar titik data. Ukuran sampel yang baik adalah representasi halus dari keaslian tren atau pola yang ditemukan.

Selain itu, analisis deret waktu juga cocok untuk memprediksi peristiwa masa depan berdasarkan data yang direkam sebelumnya.

Peramalan Deret Waktu

Analisis deret waktu memungkinkan organisasi untuk mengidentifikasi akar penyebab fluktuasi tren dari waktu ke waktu. Dengan data di tangan, perusahaan kemudian dapat mempelajari dan meneliti lebih lanjut untuk lebih memahami cara mengatasi tren yang tidak dikenal dan memperkirakan acara mendatang. Perusahaan umumnya menggunakan teknik visualisasi data untuk menentukan anomali tersebut dalam data.

Peramalan deret waktu berkisar pada dua faktor penting:

  1. Mengantisipasi kejadian masa depan berdasarkan perilaku data masa lalu.
  2. Asumsikan bahwa tren yang akan datang akan memiliki kesamaan dengan pola data masa lalu.

Dalam peramalan, tujuan utama pada dasarnya adalah untuk memprediksi bagaimana titik data akan terus tetap sama atau bervariasi di masa depan. Berikut adalah beberapa contoh dari berbagai sektor industri untuk lebih memahami nuansa analisis dan peramalan deret waktu.

  • Pasar saham – Memprediksi harga penutupan saham setiap hari.
  • Penjualan – Memprediksi penjualan produk untuk toko setiap hari.
  • Harga – Memprediksi harga rata-rata bahan bakar setiap hari.

Beberapa teknik statistik umum yang digunakan untuk peramalan deret waktu termasuk rata-rata pergerakan sederhana (SMA), pemulusan eksponensial (SES), rata-rata pergerakan terintegrasi autoregresif (ARIMA), dan jaringan saraf (NN).

Data Deret Waktu di Cloud

Untuk mengungkap nilai data deret waktu, perusahaan harus dapat menyimpan dan meminta data dengan cepat. Perusahaan pasar modal mengandalkan volume besar data historis dan streaming untuk menggunakan analisis data waktu nyata dan membuat keputusan bisnis yang berdampak. Ini mungkin melibatkan memprediksi kerentanan pada harga saham, menentukan kebutuhan modal bersih, atau memperkirakan nilai tukar. Untuk memberikan fleksibilitas dan memproses data dengan mulus, banyak perusahaan memilih migrasi database deret waktu mereka ke cloud.

Dengan migrasi database deret waktu ke cloud, organisasi dapat memperoleh akses ke sumber daya tak terbatas sesuai permintaan. Ini memungkinkan perusahaan untuk memanfaatkan ratusan inti untuk menyelesaikan tugas mereka yang memaksimalkan throughput jaringan tanpa masalah latensi.

Basis data deret waktu di infrastruktur cloud cocok untuk beban kerja komputasi intensif. Ini termasuk melakukan perhitungan risiko sebagai respons terhadap tren pasar waktu nyata. Perusahaan keuangan dapat menghilangkan overhead pusat data dan memanfaatkan sumber daya untuk meningkatkan produktivitas beban kerja mereka.

Vendor cloud seperti AWS menyediakan Amazon Timestream, layanan database deret waktu yang memungkinkan pemuatan, penyimpanan, dan analisis set data deret waktu dengan mudah. Mereka menawarkan penyimpanan untuk mengelola beban kerja intensif transaksi, alat analisis waktu nyata, dan fungsionalitas streaming data untuk menampilkan peristiwa saat dan saat terjadi.

Oleh karena itu, infrastruktur cloud memperkuat dan menskalakan manfaat data deret waktu.

Aplikasi Deret Waktu

Model deret waktu melayani dua tujuan,

  1. Memahami faktor-faktor yang mendasari yang menghasilkan pola data tertentu.
  2. Berdasarkan analisis, model cocok untuk meramalkan dan memantau.

Mari kita lihat beberapa kasus penggunaan aplikasi data deret waktu.

#1. Seri Waktu dalam Domain Keuangan dan Bisnis

Semua keputusan keuangan, bisnis, dan investasi diambil berdasarkan tren pasar saat ini dan perkiraan permintaan. Data deret waktu digunakan untuk menjelaskan, menghubungkan, dan memprediksi pasar keuangan yang dinamis. Pakar keuangan dapat memeriksa data keuangan untuk memberikan perkiraan untuk aplikasi yang membantu dalam mitigasi risiko, menstabilkan harga, dan perdagangan.

Analisis deret waktu memainkan peran kunci dalam analisis keuangan. Ini digunakan dalam prediksi suku bunga, meramalkan volatilitas di pasar saham, dan banyak lagi. Para pemangku kepentingan bisnis dan pembuat kebijakan dapat membuat keputusan berdasarkan informasi tentang manufaktur, pembelian, alokasi sumber daya, dan mengoptimalkan operasi bisnis mereka.

Analisis ini secara efektif digunakan di sektor investasi untuk memantau tingkat keamanan dan fluktuasinya dari waktu ke waktu. Harga sekuritas juga dapat diamati untuk jangka pendek (yaitu, merekam data per jam atau hari) atau jangka panjang (yaitu, pengamatan yang dilakukan selama berbulan-bulan atau bertahun-tahun). Analisis deret waktu adalah alat yang berguna untuk melacak bagaimana kinerja keamanan, aset, atau variabel ekonomi selama periode waktu yang diperpanjang.

#2. Deret Waktu dalam Domain Medis

Perawatan kesehatan dengan cepat muncul sebagai bidang yang didorong oleh data. Selain analisis keuangan dan bisnis, domain medis sangat memanfaatkan analisis deret waktu.

Pertimbangkan skenario yang memerlukan sinergi data deret waktu, prosedur yang selaras secara medis, dan teknik penambangan data saat merawat pasien kanker. Kerangka kerja hibrida semacam itu dapat digunakan untuk memanfaatkan fungsionalitas ekstraksi fitur dari data deret waktu yang dikumpulkan (yaitu, gambar x-ray pasien) untuk melacak kemajuan dan respons pasien terhadap perawatan yang diberikan oleh persaudaraan medis.

Di sektor perawatan kesehatan, menarik kesimpulan dari data deret waktu yang terus berubah sangat penting. Selain itu, praktik medis tingkat lanjut menuntut agar catatan pasien dihubungkan dari waktu ke waktu untuk visibilitas kesehatan pasien yang lebih baik. Selain itu, parameter kesehatan pasien harus dicatat secara tepat secara berkala untuk mendapatkan gambaran yang lebih jelas tentang status kesehatan pasien.

Dengan instrumen medis canggih yang muncul, analisis deret waktu telah memantapkan dirinya dalam domain perawatan kesehatan. Perhatikan contoh di bawah ini,

  • Perangkat EKG: Perangkat yang diciptakan untuk memantau kondisi jantung dengan merekam denyut listrik jantung.
  • Perangkat EEG: Perangkat yang digunakan untuk mengukur aktivitas listrik di otak.

Perangkat tersebut telah memungkinkan praktisi medis untuk melakukan analisis deret waktu untuk diagnosis medis yang lebih cepat, efektif, dan akurat.

Selain itu, dengan munculnya perangkat IoT seperti sensor yang dapat dikenakan, dan perangkat perawatan kesehatan portabel, orang kini dapat melakukan pengukuran rutin terhadap variabel kesehatan mereka dari waktu ke waktu dengan input minimal. Ini mengarah pada pengumpulan data yang konsisten dari data medis yang bergantung pada waktu untuk individu yang sakit dan sehat.

#3. Deret Waktu dalam Astronomi

Astronomi dan astrofisika adalah dua disiplin ilmu modern di mana data deret waktu dimanfaatkan secara signifikan.

Pada dasarnya, astronomi melibatkan merencanakan lintasan objek kosmik dan benda langit dan melakukan pengukuran yang akurat untuk lebih memahami alam semesta di luar atmosfer bumi. Karena persyaratan ini, para ahli astronomi mahir dalam menangani data deret waktu sambil mengkalibrasi dan mengkonfigurasi instrumen yang kompleks dan mempelajari objek astronomi yang menarik.

Data deret waktu telah lama dikaitkan dengan bidang astronomi. Pada 800 SM, data deret waktu bintik matahari dikumpulkan secara berkala. Sejak itu, analisis deret waktu digunakan untuk

  • Temukan bintang yang jauh berdasarkan jarak bintang,
  • Amati peristiwa kosmik seperti supernova untuk memahami asal usul alam semesta kita dengan lebih baik.

Data deret waktu, dalam hal ini, berkaitan dengan panjang gelombang dan intensitas cahaya yang dipancarkan oleh bintang, benda langit, atau benda. Para astronom terus-menerus memantau data streaming langsung tersebut untuk mendeteksi peristiwa kosmik secara real-time saat dan ketika itu terjadi.

Belakangan ini, bidang penelitian seperti astroinformatika dan astrostatistik telah muncul, yang memadukan berbagai disiplin ilmu seperti penambangan data, pembelajaran mesin, kecerdasan komputasional, dan statistik. Di bidang penelitian baru ini, peran data deret waktu adalah untuk mendeteksi dan mengklasifikasikan objek astronomi dengan cepat dan efisien.

#4. Rangkaian Waktu dalam Peramalan Cuaca

Aristoteles mempelajari pola cuaca secara ekstensif untuk memahami lebih baik penyebab dan efek yang diamati dalam perubahan cuaca di zaman kuno. Seiring berjalannya waktu, para ilmuwan mulai merekam data terkait cuaca pada instrumen seperti "barometer" untuk menghitung variabel atmosfer. Data dikumpulkan secara berkala dan disimpan di lokasi yang berbeda.

Seiring waktu, akhirnya, ramalan cuaca mulai ditampilkan di surat kabar. Maju cepat ke hari dan usia hari ini, stasiun prakiraan cuaca di mana-mana dipasang di berbagai geografi di seluruh dunia untuk mengumpulkan variabel cuaca yang akurat.

Stasiun tersebut memiliki perangkat fungsional canggih yang saling berhubungan untuk mengumpulkan dan menghubungkan data cuaca dari berbagai lokasi. Data yang berkorelasi digunakan untuk meramalkan kondisi cuaca setiap saat tergantung pada kebutuhan.

#5. Seri Waktu dalam Pengembangan Bisnis

Data deret waktu memungkinkan bisnis membuat keputusan bisnis. Ini dicapai saat proses menganalisis data masa lalu untuk mendapatkan peristiwa masa depan dan menyoroti kemungkinan yang mungkin terjadi. Pola data masa lalu digunakan untuk menurunkan parameter berikut:

  • Pertumbuhan bisnis : Untuk mengevaluasi kinerja keuangan dan bisnis secara keseluruhan dan mengukur pertumbuhan, data deret waktu adalah aset yang paling sesuai dan dapat diandalkan.
  • Perkirakan tren : Berbagai metode deret waktu dapat digunakan untuk memperkirakan tren yang muncul. Pertimbangkan, misalnya, metode ini menganalisis pengamatan data selama periode waktu tertentu untuk mencerminkan peningkatan atau penurunan penjualan perangkat elektronik tertentu.
  • Mengungkap pola musiman : Titik data yang direkam dapat mengungkapkan fluktuasi dan pola musiman yang dapat membantu dalam peramalan data. Informasi data yang diperoleh memainkan peran kunci untuk pasar di mana harga produk berfluktuasi secara musiman. Data tersebut dapat membantu perusahaan dalam perencanaan dan pengembangan produk yang lebih baik.

Kesimpulan

Singkatnya, data deret waktu dapat dilihat sebagai karakteristik titik data kompleks yang dikumpulkan selama periode waktu yang konstan. Analisis deret waktu, pemodelan, dan peramalan telah menjadi bagian integral dari kehidupan kita sehari-hari dengan munculnya gadget IoT, peralatan rumah pintar, dan perangkat portabel. Selain itu, data deret waktu menemukan penerapannya di berbagai bidang, termasuk perawatan kesehatan, astrofisika, ekonomi, teknik, bisnis, dan banyak lagi.