ETL adalah singkatan dari Extract, Transform, Load, yaitu proses yang digunakan untuk memindahkan data dari berbagai sumber ke dalam data warehouse atau sistem target lainnya. ETL biasanya digunakan dalam data integration dan data warehousing untuk mengonsolidasikan data dari banyak sistem agar siap dianalisis.
Mengambil data dari berbagai sumber seperti database, API, file CSV, log, atau sistem cloud. Tujuannya adalah mengumpulkan data mentah sebelum diproses lebih lanjut. Contoh: Mengambil data penjualan dari database MySQL dan data pelanggan dari API.
Mengubah data mentah menjadi format yang bersih dan konsisten. Pembersihan data (menghapus duplikat, mengisi nilai NULL) Penggabungan tabel (join) Perhitungan atau agregasi Mengubah format kolom (misal tanggal atau satuan)
Memasukkan data yang sudah bersih dan terstruktur ke data warehouse atau sistem target. Bisa dilakukan incremental (hanya data baru) atau full load (seluruh data).
ETL: Transformasi dilakukan sebelum data dimuat ke data warehouse. ELT: Transformasi dilakukan setelah data dimuat ke data warehouse, biasanya dengan bantuan SQL (dbt termasuk ELT tool).