
Dengan kata sederhana, data mart adalah gudang data yang terbatas ruang lingkupnya dan datanya dapat diperoleh dengan merangkum dan memilih data dari gudang data atau dengan bantuan mengekstraksi, mengubah, dan memuat proses yang berbeda dari sistem data sumber.
Grafik perbandingan
Dasar untuk perbandingan | Gudang data | Data Mart |
---|---|---|
Dasar | Data warehouse adalah aplikasi yang independen. | Data mart khusus untuk aplikasi sistem pendukung keputusan. |
Jenis sistem | Terpusat | Terdesentralisasi |
Bentuk data | Terperinci | Diringkas |
Penggunaan denormalisasi | Data sedikit dinormalisasi. | Data sangat dinormalisasi. |
Model data | Top-down | Dari bawah ke atas |
Alam | Fleksibel, berorientasi data, dan panjang umur. | Terbatas, berorientasi proyek, dan umurnya pendek. |
Jenis skema yang digunakan | Konstelasi fakta | Bintang dan kepingan salju |
Kemudahan bangunan | Sulit dibangun | Mudah dibangun |
Definisi Gudang Data
Istilah gudang data berarti varian waktu, berorientasi pada subjek, tidak mudah menguap, dan kelompok data terintegrasi yang membantu dalam proses pengambilan keputusan manajemen. Atau, itu adalah repositori informasi yang dikumpulkan dari berbagai sumber, disimpan dalam skema terpadu, di satu-satunya situs yang memungkinkan integrasi berbagai sistem aplikasi. Setelah data ini dikumpulkan, data akan disimpan untuk waktu yang lama, sehingga memiliki umur yang panjang dan memungkinkan akses ke informasi bersejarah .

Akibatnya, data warehouse menyediakan pengguna dengan antarmuka terintegrasi tunggal ke data di mana pengguna dapat menulis permintaan dukungan keputusan dengan mudah. Data warehouse membantu dalam mengubah data menjadi informasi. Merancang gudang data mencakup pendekatan top-down.
Ini mengumpulkan informasi tentang subjek yang menjangkau seluruh organisasi, seperti pelanggan, penjualan, aset, barang, dan oleh karena itu jangkauannya adalah untuk seluruh perusahaan. Secara umum, skema rasi fakta digunakan di dalamnya, yang mencakup beragam subjek. Gudang data bukanlah struktur statis dan terus berkembang .
Definisi Data Mart
Data mart dapat disebut sebagai bagian dari gudang data atau sub-kelompok data perusahaan yang sesuai dengan satu set pengguna tertentu. Gudang data melibatkan beberapa mart data departemen dan logis yang harus gigih dalam ilustrasi data mereka untuk memastikan kekokohan gudang data. Data mart adalah seperangkat tabel yang berkonsentrasi pada satu tugas yang dirancang menggunakan pendekatan bottom-up.

Karena skema bintang dan kepingan salju didorong menuju pemodelan subjek tunggal, itulah sebabnya ini umumnya digunakan dalam data mart. Meskipun, skema bintang lebih populer daripada skema kepingan salju. Bergantung pada sumber data, mart data dapat diklasifikasikan menjadi dua jenis: mart data independen dan dependen .
Perbedaan Kunci Antara Gudang Data dan Data Mart
- Data warehouse adalah aplikasi independen sedangkan data mart khusus untuk aplikasi sistem pendukung keputusan.
- Data disimpan dalam repositori terpusat tunggal dalam data warehouse. Sebaliknya, data mart menyimpan data secara desentralisasi di area pengguna.
- Gudang data berisi formulir data terperinci . Sebaliknya, data mart berisi data yang dirangkum dan dipilih.
- Data dalam gudang data sedikit dinormalisasi sedangkan dalam kasus data mart sangat dinormalisasi.
- Pembangunan gudang data melibatkan pendekatan top-down . Sebaliknya, saat membangun data mart, pendekatan bottom-up digunakan.
- Data warehouse bersifat fleksibel, berorientasi informasi, dan sudah lama ada. Sebaliknya, data mart bersifat membatasi, berorientasi proyek dan memiliki keberadaan yang lebih pendek.
- Skema konstelasi fakta biasanya digunakan untuk memodelkan data warehouse sedangkan dalam skema data mart star lebih populer.
Kesimpulan
Data warehouse menyediakan tampilan perusahaan, sistem penyimpanan tunggal dan terpusat, arsitektur yang melekat dan kemandirian aplikasi sementara Data mart adalah bagian dari data warehouse yang menyediakan tampilan departemen, penyimpanan terdesentralisasi. Karena data warehouse sangat besar dan terintegrasi, ia memiliki risiko kegagalan dan kesulitan yang tinggi dalam membangunnya. Di sisi lain, data mart mudah dibangun dan risiko kegagalan terkait juga kurang tetapi data mart bisa mengalami fragmentasi.