ANALISIS DAN PERANCANGAN DATAWAREHOUSE AKADEMIK PERGURUAN TINGGI BINA SRIWIJAYA BERBASIS PENTAHO DATA INTEGRATION (PDI) KETTLE
Arsitektur
Extract, transform, dan load (ETL) : sebuah sistem yang dapat membaca data
dari suatu data store, merubah bentuk data, dan menyimpan ke data store yang
lain. Data store yang dibaca ETL disebut data source, sedangkan data store yang
disimpan ETL disebut target.
Extraction
Ekstraksi dilakukan dari sumber data yang digunakan melalui proses
pemilihan data yang kemudian disimpan pada basis data sementara. Dalam
penelitian ini, basis data sementara ditempatkan pada penyimpanan basis
data, mesin dan platform yang sama dengan yang digunakan untuk data
warehouse nantinya.
Cleaning
Proses cleaning adalah proses untuk membersihkan data yang rangkap,
tidak konsisten, rusak, tidak benar (bernilai salah), data yang hilang
(kosong), atau data dengan spasi yang berlebihan.
Transformasi
Proses transformasi yang dilakukan dibagi berdasarkan dua level yaitu
record level dan field level. Pada proses ini dilakukan proses pemilihan,
penggabungan dan agregasi untuk mendapatkan data ringkasan sesuai
dengan dimensi yang akan dibuat. Proses transformasi ke field yang baru
dapat dilakukan dengan (menggunakan script) tertentu untuk
melakukannya.
Infrastruktur
Arsitektur
Extract, transform, dan load (ETL) : sebuah sistem yang dapat membaca data
dari suatu data store, merubah bentuk data, dan menyimpan ke data store yang
lain. Data store yang dibaca ETL disebut data source, sedangkan data store yang
disimpan ETL disebut target.
Extraction
Ekstraksi dilakukan dari sumber data yang digunakan melalui proses
pemilihan data yang kemudian disimpan pada basis data sementara. Dalam
penelitian ini, basis data sementara ditempatkan pada penyimpanan basis
data, mesin dan platform yang sama dengan yang digunakan untuk data
warehouse nantinya.
Cleaning
Proses cleaning adalah proses untuk membersihkan data yang rangkap,
tidak konsisten, rusak, tidak benar (bernilai salah), data yang hilang
(kosong), atau data dengan spasi yang berlebihan.
Transformasi
Proses transformasi yang dilakukan dibagi berdasarkan dua level yaitu
record level dan field level. Pada proses ini dilakukan proses pemilihan,
penggabungan dan agregasi untuk mendapatkan data ringkasan sesuai
dengan dimensi yang akan dibuat. Proses transformasi ke field yang baru
dapat dilakukan dengan (menggunakan script) tertentu untuk
melakukannya.
Infrastruktur
Perangkat Keras (Hardware)
Perangkat keras yang digunakan adalah laptop dengan spesifikasi berikut :
a. Laptop Toshiba Satelite U 400
b. RAM 3GB
c. Hardisk 250 GB
d. Intel Pentium dual core processor T4200 @2.00Ghz
e. Flash Disk 2 GB
Perangkat Lunak (Software)
a . Windows 7 Professional sebagai operating system
b. Microsoft Office 2007 untuk penulisan laporan tugas akhir ini
c. Software pendukung yaitu xampp (mysql), Pentaho Kettle.
mohon maaf terjadi kesalahan jam pada postingan blog saya
BalasHapus