Jumat, 09 Mei 2014

perancangan data warehuse

Perancangan Data Warehouse pada Perpustakaan


       Star Schema


Pada sistem OLTP (Online Transactional Processing) digunakan suatu teknik pemodelan data yang disebut sebagai E-R (Entity-Relationaship). Pada data warehouse digunakan teknik pemodelan data yang disebut dimensional modelling technique. Pemodelan dimensional adalah suatu model berbasis pemanggilan yang mendukung akses query volume tinggi. Star Schema adalah alat dimana pemodelan dimesional diterapkan dan berisi sebuah tabel fakta pusat. Tabel fakta berisi atribut deskriptif yang digunakan untuk proses query dan foreign key untuk menghubungkan ke tabel dimensi. Atribut analisis keputusan terdiri dari ukuran performa, metrik operasional, ukuran agregat, dan semua metrik yang lain yang diperlukan untuk menganalisis performa organisasi. Tabel fakta menunjukkan apa yang didukung oleh data warehouse untuk analisis keputusan. Tabel dimensi mengelilingi tabel fakta pusat. Tabel dimensi berisi atribut yang menguraikan data yang dimasukkan dalam tabel fakta. Tabel dimensi menunjuk bagaimana data akan dianalisis. Contoh Star Schema ditunjukkan pada gambar 1.

                 Tabel Dimensi Waktu

Tabel dimensi waktu adalah suatu tabel dimensi yang harus ada dalam sebuah data warehouse karena setiap data warehouse adalah time series. Waktu merupakan dimensi pertama yang harus diperhatikan dalam proses sort order dalam suatu database karena ketika hal itu pertama kali dilakukan, loading data secara berturut-turut dalam interval waktu tertentu akan masuk kedalam tempat yang sebenarnya dalam sebuah disk.
Data designer menyatakan secara eksplisit mengenai kebutuhan tabel dimensi waktu karena jika kunci waktu didalam tabel fakta adalah tipe data tanggal, beberapa SQL query mendapat kendala langsung dari kunci waktu pada tabel fakta dan menggunakan natural SQL untuk kendala pada bulan dan tahun.

Perencanaan proyek.

Pada fase perencanaan proyek dihasilkan subyek dari data warehouse, yaitu sirkulasi.

 Mendefinisikan kebutuhan.

Pada fase ini mendefinisikan semua sumber data yang digunakan dalam data warehouse dan mendefiniskan kebutuhan informasi yang harus dihasilkan oleh data warehouse melalui analisis reporting.

                        Sumber data

Sumber data yang digunakan dalam data warehouse adalah data-data dalam database perpustakaan, yang berisi antara lain:
1.                                          Tabel Buku
2.                                          Tabel Jenis
3.                                          Tabel Pengarang
4.                                          Tabel Karang
5.                                          Tabel Isi CD
6.                                          Tabel Program
7.                                          Tabel Terbit
8.                                          Tabel Penerbit
9.                                          Tabel Kuliah
10.                                      Tabel Buku_mk
11.                                      Tabel Data_buku
12.                                      Tabel Sumber
13.                                      Tabel Mhs
14.                                      Tabel Dosen
15.                                      Tabel Pinjam_Mhs
16.                                      Tabel Pinjam_DSN
17.                                       Tabel Sirkulasi1
18.                                       Tabel Sirkulasi2
Adapun gambar ER-Diagram database perpustakaan yang digunakan bisa dilihat pada gambar 2.




Gambar 2.  ER-Diagram Perpustakaan

                  Kebutuhan Informasi

Berdasarkan hasil pengamatan dan wawancara langsung kepada petugas atau manajemen perpustakaan didapat kebutuhan informasi sebagai berikut.
1.      Tren terhadap buku-buku yang dipinjam oleh dosen dan mahasiswa.
2.      Informasi mengenai jenis buku yang sering dipinjam.
3.      Tren proses sirkulasi.
4.      Informasi pengenai nama pengarang yang bukunya sering dipinjam.
5.      Informasi mengenai nama penerbit yang bukunya sering dipinjam.

                 Desain

Pada fase ini aktifitas yang dilakukan adalah membuat model data dimensional yang berupa star Schema, mendesain proses ETL (Extraction, Transformation, Loading), dan menganalisis metadata yang digunakan dalam data warehouse.

                  Model data dimensional

Berdasarkan ER-Diagram Perpustakaan dan kebutuhan informasi yang dibutuhkan oleh petugas dan manajemen perpustakaan maka model data dimensional yang dibuat dalam bentuk star schema untuk data warehouse perpustakaan bisa dilihat pada gambar 6.
 







Gambar 3. Star Schema untuk data warehouse perpustakaan

                  Desain proses ETL

Proses selanjutnya setelah star schema dibuat adalah membuat desain proses ETL. Desain proses ETL yang dipakai bisa dilihat pada gambar 7. dibawah ini. Proses ETL mengambil data dari source systems menggunakan query. ETL berkoneksi dengan source system database dan mengambil data dengan query. Setelah data hasil query diambil langkah selanjutnya dilakukan eksekusi proses ETL dan mengirimnya ke database data warehouse.







Analisis pada data warehouse
Analisis pada data warehouse pada penelitian ini dilakukan dengan cara membuat suatu
reporting sesuai dengan business requirement. Adapun beberapa report yang telah dibuat adalah
sebagai berikut:
1. Laporan jumlah peminjaman pertahun.





Peminjaman pertahun
 
2. laporan hari teramai.


3. Laporan pengarang terlaris.

4. Laporan penerbit terlaris.