1212
GitHub - srarykurniawan/ETL-Project: Extract-Load-Transform · GitHub
Skip to content

srarykurniawan/ETL-Project

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 

Repository files navigation

ETL

ETL adalah singkatan dari Extract, Transform, Load, yaitu proses yang digunakan untuk memindahkan data dari berbagai sumber ke dalam data warehouse atau sistem target lainnya. ETL biasanya digunakan dalam data integration dan data warehousing untuk mengonsolidasikan data dari banyak sistem agar siap dianalisis.

1.Extract (Ekstraksi)

Mengambil data dari berbagai sumber seperti database, API, file CSV, log, atau sistem cloud. Tujuannya adalah mengumpulkan data mentah sebelum diproses lebih lanjut. Contoh: Mengambil data penjualan dari database MySQL dan data pelanggan dari API.

2.Transform (Transformasi)

Mengubah data mentah menjadi format yang bersih dan konsisten. Pembersihan data (menghapus duplikat, mengisi nilai NULL) Penggabungan tabel (join) Perhitungan atau agregasi Mengubah format kolom (misal tanggal atau satuan)

3.Load (Memuat)

Memasukkan data yang sudah bersih dan terstruktur ke data warehouse atau sistem target. Bisa dilakukan incremental (hanya data baru) atau full load (seluruh data).

4.Perbedaan ETL vs ELT

ETL: Transformasi dilakukan sebelum data dimuat ke data warehouse. ELT: Transformasi dilakukan setelah data dimuat ke data warehouse, biasanya dengan bantuan SQL (dbt termasuk ELT tool).

About

Extract-Load-Transform

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors