Rabu, 21 Juni 2023

Data Multi Dimensi

Data Multi Dimensi pada
 Data Warehouse


Nama : Cindy Amallia Juliani

Npm  : 21120009

Kelas : SI-M2101

Dosen            : Dito Putro Utomo, M.Kom

Mata Kuliah : Data Warehouse

Universitas   : Budi Darma

Jurusan         : Sistem Informasi (SI-M2101)



   Data multi dimensi adalah data yang tidak terfokus pada satu titik saja untuk menghasilkan informasi tetapi bisa menjadi titik lain dengan menambahkan titik lainnya. Data multi dimensi ini digubakan pada data warehouse, karena itu yang membuat datawarehouse berbeda dengan database biasa. 

       Data-data yang ada pada data warehouse selain bertujuan untuk historis juga bertujuan untuk menganalisa yang dilihat dari dimensi yang berbeda. Materi tentang data multi dimensi akan membahas tentang definisi, data mart, OLTP dan OLAP, Model pengembangan data warehouse, dan contoh dari data dimensi.

1. Definisi Data Mart

   Data mart merupakan subset dari data resource, biasanya berorientasi untuk suatu tujuan yang spesifik atau subjek data yang didistribusikan untuk mendukung kebutuhan bisnis.

2. Definisi OLTP (Online Transaction Processing)


Online Transaction Processing atau sering dikenal dengan OLTP adalah sistem yang berorientasi proses yang memproses transaksi secara langsung melalui komputer yang terhubung dalam jaringan.
Misalnya biasa digunakan pada sebuah supermarket, kasir menggunakan mesin dalam proses transaksinya.
OLTP mempunyai karakteristik beberapa user dapat creating, updating, retrieving untuk setiap record data, OLTP sangat optimal untuk updating data.

3. Definisi OLAP (Online Analytical Processing)


Online Analytical Processing, atau disingkat OLAP adalah metode pendekatan untuk menyajikan jawaban dari permintaan proses analisis yang bersifat dimensional secara cepat, yaitu desain dari aplikasi dan teknologi yang dapat mengoleksi, menyimpan, memanipulasi suatu data multidimensi untuk tujuan analis. 

Aplikasi khusus dari OLAP adalah pelaporan bisnis untuk penjualan, pemasaran, manajemen pelaporan, manajemen proses bisnis (MPB), penganggaran dan peramalan, laporan keuangan dan bidang-bidang yang serupa. 

4. Model Pengembangan Data Warehouse

    Model pengembangan datawarehouse dibagi menjadi dua macam yaitu yang memiliki user feedback dan yang tidak memiliki user feedback. Macam yang tidak memiliki user feedback dibagi menjadi 3 macam yaitu sebagai berikut.

    a.  Top Down Tanpa User Feedback

            


Pada model Top Down Tanpa User Feedback, dengan tanpa adanya user feedback maka aliran datanya sangat sederhana, yaitu berawal dari sumber-sumber data (data sources) kemudian diteruskan ke data warehouse, lalu diteruskan (dipecah) ke dalam beberapa buah data mart.

    b. Bottom Up tanpa User Feedback


Model Bottom Up tanpa User Feedback ini merupakan kebalikan dari model Top Down tanpa User Feedback dimana berbeda dari Top Down yang memulai pengembangan dari atas, model ini memulai pengembangannya dari bawah dimana Data Mart dibentuk dari data-data yang berasal dari berbagai sumber data.

    c. Parallel tanpa User Feedback


Model Parallel tanpa User Feedback merupakan modifikasi dari model Top Down, namun Data Mart tidak sepenuhnya bergantung kepada Data Warehouse (dalam hal sumber data yang diperoleh). Mekanisme kerja dimulai dengan dibangunnya Data Warehouse dari berbagai sumber data.

    Model pengembangan yang memiliki feedback juga dibagi menjadi 3 macam yaitu sebagai berikut.

    a. Top Down User Feedback


Model pengembangan ini sumber data membentuk data warehouse yang menjadi pusat gudang data-data dari berbagai sumber data tersebut yang memiliki proses integrasi untuk memudahkan data-data menjadi satu dalam gudang data. Dari data warehouse terbentuk sejumlah data mart sesuai kebutuhan pengguna, lalu pada data mart menjadi tolak ukur dalam pengembangan baik dalam data mart maupun data warehouse.

    b.  Bottom Down User Feedback


Model pengembangan ini terlebih dahulu 2 data mart atau lebih menggunakan data-data dari berbagai sumber data yang menggunakan ETT untuk membantu pengumpulan data, ekstraksi data, transformasi ke format data yang telah disepakati bersama didalam data mart.

    c. Pararel User Feedback


Model pengembangan ini yang berawal dari penentuan aturan untuk model data dari data warehouse ke data mart yang terbentuk. Data dari sumber data menuju ke data mart saja yang melalui proses ETT sedangakan data daalam data warehouse menuju data model untuk memberikan kesamaan format dan tidak terjadi ETT pada data warehouse.

5. Contoh Dari Data Dimensi

Contoh dari data multi dimensi seperti data mahasiswa yang dilihat dari 3 dimensi sudut pandang yaitu kelulusan, sidang, dan wisuda. Contoh kedua data rumah sakit dimana data rumah sakit ada dalam berbagai dimensi yaitu dimensi pasien, dimensi perawat, dimensi daftar obat , dan dimensi kelas inap pasien.



Sekian Penjelasan Materi di Blog Saya Kali Ini.....
Semoga Bermanfaat :)đź’—








Infrastruktur Data Warehouse

Infrastruktur
 Data Warehouse

 

Dosen            : Dito Putro Utomo, M.Kom

Mata Kuliah : Data Warehouse

Universitas   : Budi Darma

Jurusan         : Sistem Informasi (SI-M2101)



     Infrastruktur  yang  dibutuhkan  untuk  mendukung  arsitektur  data warehouse mencakup  semua elemen  dasar  yang  memungkinkan    arsitektur  diimplementasikan.  Singkatnya,  infrastruktur mencakup  beberapa  elemen  seperti  perangkat  keras  server,  sistem  operasi,  perangkat  lunak jaringan,  perangkat  lunak  basis  data,  LAN  dan  WAN,  alat  vendor  untuk  setiap  komponen arsitektur, orang, prosedur, dan pelatihan. 

    Unsur-unsur   infrastruktur   data   warehouse   dapat   dikelompokkan   menjadi   dua kategori: infrastruktur operasional dan infrastruktur fisik. Perbedaan ini penting karena elemen dalam setiap kategori berbeda sifat dan fiturnya dibandingkan dengan kategori lainnya.

1) Infrastruktur Operasional

  Infrastruktur operasional untuk mendukung setiap komponen arsitektural terdiri dari: 

*People (orang) Pengguna Data Warehouse 

*Procedures (Prosedur) 

2) Infrastruktur Fisik Gambar

    Seperti yang diketahui, setiap  sistem,  termasuk  data  warehouse  harus  memiliki  platform  yang  terdiri  dari komponen perangkat keras dasar, sistem operasi dengan perangkat lunak utilitas, jaringan, dan perangkat lunak jaringan. Keseluruhan platform adalah seperangkat  alat yang  berjalan  di  platform  yang  dipilih  untuk  melakukan  berbagai  fungsi  dan layanan komponen arsitektur individu. 

    Infrastruktur ini harus dimanfaatkan secara maksimal. Selain itu, infrastruktur juga harus dibuat semodular mungkin dan terbaharukan jika ada perkembangan infrastruktur terbaru atau karena ada harga infrastruktur yang lebih terjangkau.

contoh infrastruktur fisik :

1)Hardware

2)Operating Sistem

3)DBMS

4)Network Software


PILIHAN UMUM HARDWARE

Dalam pemiilihan Hardware terdapat beberapa pilihan untuk digunakan dalam penerapan Insfrastuktur data warehouse antara lain :

-Mainframe

    Hardware Teruji kemampuannya Dirancang Untuk OLTP dan bukan untuk aplikasi pendukung keputusan Tidak hemat biaya untuk data warehouse.

-Server Open System

    Server UNIX, pilihan medium untuk kebanyakan data warehouse biasanya Sempurna Sesuai untuk pengolahan paralel.

-NT Server

    Mendukung data warehouse ukuran menengah Kemampuan proses paralel yang terbatas Hemat biaya untuk data warehouse kecil dan ukuran menengah.


SOFTWARE DATABASE

Seperti halnya pemilihan hardware . ada beberapa pilihan juga terkait dalam pemilihan software yang akan di terapkan dalam insfrastuktur data warehouse antara lain :

-Parallel Processing Options

-Pemilihan DBMS

-Collection Tools


KESIMPULAN 

Kesimpulan yang dapat diambil adalah dalam penerapan insfrastuktur da beberapa hal yang harus diperhatikan dan juga langkah – langkah dalam penerapan insfrastuktur itu sendiri , agar dalam penggunaan sehari hari dapat berjalan secara efektif 


Sekian materi dari blog saya kali ini....

Semoga bermanfaat❤

Big Data

Big Data 


Dosen            : Dito Putro Utomo, M.Kom

Mata Kuliah : Data Warehouse

Universitas   : Budi Darma

Jurusan         : Sistem Informasi (SI-M2101)



Apa sih sebenarnya big data dan data warehouse ini? Jadi, Big data ini merupakan Sekumpulan data dengan skala besar sehingga tidak bisa diproses menggunakan alat tradisional dan harus menggunakan cara maupun alat baru untuk mendapatkan nilai dari data tersebut. Hal tersebut bisa dilakukan dengan cara clustering, partisi, dan digudangkan pada data warehouse.

Sedangkan, data warehouse merupakan database yang sudah didesain secara khusus untuk mengerjakan proses query, membuat laporan dan melakukan analisa. Data yang sudah disimpan dalam data business history dari sebuah perusahaan tidak tersimpan secara rinci atau detail. Sehingga data bisa bertahan lebih lama, berbeda dengan data online transaction Processing  yang tersimpan secara langsung dan lengkap. 

Karakteristik Big Data

    Karakteristik big data didefinisikan oleh tiga karakteristik utama yaitu volume, variety, dan velocity.

-Volume mengacu pada jumlah data yang tersedia berupa terabytes, petabytes, atau bahkan exabytes. Data besar ini dapat berasal dari berbagai sumber seperti website, aplikasi mobile, jaringan sosial, log perangkat, dan lain-lain.

-Variety mengacu pada jenis data yang tersedia yang terstruktur seperti data tabel atau data yang tidak terstruktur seperti teks, gambar, suara, video, dll.

-Velocity mengacu pada kecepatan data yang tersedia yang dapat dikumpulkan dan diproses dalam waktu yang sangat singkat, sehingga perlu diolah dengan cepat untuk membuat keputusan bisnis yang tepat.

Sumber Big Data 

Data besar atau big data kemudian seperti yang disampaikan di awal bisa ditemukan di berbagai sumber. Saat ini terdapat beberapa sumber yang terbilang paling sering memberi kontribusi data dalam jumlah besar dan memiliki kualitas baik. Diantaranya adalah: 

1. Internet 

Sumber pertama adalah internet, dan merupakan penyedia data raksasa paling besar dan paling sering dimanfaatkan perusahaan. Sebab cara kerja internet sendiri adalah menyimpan semua data dari para penggunanya. Jadi, aktivitas pencarian apapun nantinya akan disimpan dan kemudian menjadi kumpulan data. 

2. Smartphone 

Smartphone juga menjadi penyumbang data dalam skala besar, sebab aktivitas apapun di dalamnya akan otomatis disimpan oleh perangkat. Sumber data terbesar di smartphone sendiri adalah aplikasi yang diinstal di dalamnya. Jadi, setiap kali aplikasi ini berjalan maka data akan didapatkan dan dikumpulkan oleh sistem. 

3. Media Sosial 

Media sosial dimana menjadi media yang banyak dibuka siapa saja di era sekarang bahkan sesaat setelah bangun tidur juga menjadi sumber data dalam skala besar. Setiap foto, video, termasuk cuitan di media sosial sudah disebut data. Bisa dibayangkan berapa miliar data didapatkan perusahaan saat mengelola media sosial? 

Cara Kerja Big Data

Data dalam jumlah besar dan beragam di dalam Big Data disimpan di dalam wadah khusus yang biasanya menggunakan penyimpanan data besar seperti Hadoop, Cloud, atau NoSQL.

Data tersebut dapat dikumpulkan dari berbagai sumber dalam format mentah, kemudian difilter dan diproses agar dapat ditampilkan sesuai kebutuhan untuk program analitik tertentu.

Pada kasus lain, data dalam Big Data dapat difilter terlebih dahulu menggunakan program pengumpulan dan pengolahan data tertentu, sehingga dapat langsung digunakan untuk menganalisis.

Proses pemrosesan Big Data membutuhkan daya komputasi yang besar, biasanya pemrosesan dilakukan dan didistribusikan ke beberapa perangkat dengan menggunakan skema jaringan komputer atau Cloud.

Setelah data tersimpan dan diproses, seorang ilmuwan data atau analis data akan menganalisis data tersebut menggunakan aplikasi analitik. Ahli tersebut harus memiliki pemahaman yang kuat tentang data yang ingin dicari dan dianalisis dalam Big Data.

Dalam proses analisis ini, para ahli tersebut melakukan serangkaian upaya untuk memahami Big Data tersebut. Biasanya, ilmuwan data atau analis data akan melakukan penyaringan, validasi, serta transformasi pada kumpulan data tersebut.

Contoh Big Data dalam Kehidupan Sehari-Hari

1. Perusahaan Perbankan 

Perusahaan perbankan kini sudah jamak memanfaatkan olah data dalam skala besar untuk menyediakan produk dan layanan yang semakin beragam dan berkualitas. Perbankan akan mendapatkan data dari aplikasi perbankan maupun transaksi perbankan offline di berbagai kantor cabang. 

2. Perusahaan Retail 

Banyak perusahaan retail kini menawarkan layanan membership, menyediakan aplikasi belanja online, membangun website, dan lain sebagainya. Semau ini membantu perusahaan mendapatkan data berskala besar tidak hanya dari transaksi langsung di lokasi retail. 

Namun juga mendapatkan data dari sumber lain, sehingga membantu perusahaan retail ini untuk berkembang. Misalnya menentukan promosi seperti apa yang tepat, menarik, dan sesuai kebutuhan konsumen. Kemudian produk apa saja yang termasuk jenis produk baru dan perlu segera di disediakan. 


Sekian materi di blog saya kali ini....

Semoga menjadi ilmu yang bermanfaat♡

Pemodelan Data Multidimensi

Pemodelan
 Data Multidimensi

 

Dosen            : Dito Putro Utomo, M.Kom

Mata Kuliah : Data Warehouse

Universitas   : Budi Darma

Jurusan         : Sistem Informasi (SI-M2101)


Model Pemrosesan Data dari Cube

Terdiri dari 3 macam yaitu :

1. MOLAP


    Multidimensional online analitycal processing (MOLAP) menyimpan data dan aggregasi pada struktur data multidimensi.Struktur MOLAP ini tidak tersimpan pada datawarehouse tapi tersimpan pada OLAP server. Sehingga performa query yang dihasilkan olehnya sangat bagus. Model penyimpanan ini sesuai untuk database dengan ukuran kecil sampai sedang.

Cara kerja MOLAP secara umum dibagi ke dalam 2 tahap sebagai berikut :
  1. Tahap konstruksi dan populasai data, pada tahap ini sumber data akan dibaca, dilakukan perhitungan agerasi (summary group) pada berbagai level dimensi, dan hasilnya akan disimpan di storage MOLAP.
  2. Tahap query atau layanan permintaan data analisis, pada tahap ini OLAP Server akan melayani permintaan query dari client dan membaca data dari storage MOLAP.

2. ROLAP

    


    ROLAP adalah tipe OLAP yang bergantung kepada database relasional atau RDBMS (Relational Database Management System) sebagai media penyimpanan (storage) data yang akan diolah.

Dengan strategi tersebut maka OLAP Server terhindar dari masalah pengelolaan data storage dan hanya menerjemahkan proses query analysis (MDX) ke relational query (SQL).

Otomatis proses optimasi ROLAP akan sangat ditentukan di sisi produk RDBMS yang digunakan misalkan dari sisi penanganan jumlah data dan strategi indexing.

3. HOLAP


    HOLAP merupakan kombinasi atau “jalan tengah” antara keduanya dimana HOLAP akan menyimpan data precomputed aggregate pada media penyimpanan (storage) HOLAP sendiri.

    Yang disimpan pada storage HOLAP adalah data untuk beberapa level teratas atau high level view. Sedangkan untuk level yang lebih rendah atau lebih rinci akan disimpan di database relasional. 


PEMODELAN

-Requirements Definition adalah bagian dari data design untuk data warehouse. 

-Data Design terdiri dari struktur data yang merupakan kelompok elemen data. 

- Logical data design 

 => menentukan masukan dari berbagai elemen data yang dibutuhkan dan dikombinasikan elemen data ke dalam struktur data. 

 => menentukan relationships diantara struktur data







Sekian materi di blog saya kali ini.....
Semoga bermanfaatđź’•