Apakah yang dimaksud dengan basis data terdistribusi?
Basis data terdistribusi merupakan sekumpulan basis data yang saling terelasi secara logic dan tersebar dalam jaringan computer. System manajemen basis data terdistribusi (D-DBMS) merupakan perangkat lunak yang bertugas untuk mengatur basis data terdistribusi dan memberikan mekanisme akses yang akan membuat basis data terdistribusi ini transparan kepada user yang menggunakan.
Asumsi implicit
Data akan disimpan dalam beberapa site dimana setiap site secara logic memiliki sebuah processor, dimana processor dari site yang berlainan akan terhubung didalam sebuah jaringan computer, sehingga tidak akan ditemukan adanya multiprocessor.Tiga faktor penting yang dapat menjadi acuan pada saat mendesain basis data terdistribusi :
2. replikasi data – merupakan salinan dari tiap-tiap fragment yang dapat pula disimpan dalam beberapa site.
3. alokasi data – tiap fragment data harus dialokasikan kepada satu atau beberapa site, dimana fragment tersebut akan disimpan.
Fragmentasi
Fragmentasi merupakan sebuah proses pengambilan bagian-bagian baris ataupun kolom dari table-tabel sebagai unit data terkecil yang akan dikirimkan melalui jaringan computer.
Sedangkan fragmentasi data merupakan proses dimana basis data akan dipecah-pecah kedalam unit-unit logic yang disebut fragment yang kemudian akan disimpan dalam site yang berbeda, fragmentasi data tergabung dalam proses desain basis data, yang kemudian akan menentukan apa yang kemudian akan dilakukan terhadapa fragment yang telah dibuat.
Faktor yang memperngaruhi fragmentasi :
1. struktur global basis data
2. karakteristik dari aplikasi, meliputi predikat yang digunakan, lokasi antar site, dan frekuensi penggunaan.
3. karakteristik jaringan computer
4. kekuatan dan kemampuan proses dari computer yang digunakan
informasi struktur basis data mutlak dibutuhkan, sebagai contoh, oleh karena mata rantai (foreign key/referential integrity) yang digunakan untuk mendefinisikan derived horizontal fragmentations. Karakteristik dari aplikasi merupakan penggerak yang secara tidak langsung akan menentukan fragment apa yang harus didefinisikan, seperti halnya membantu untuk menentukan dimana fragment tersebut harus diletakkan, disimpan, dan atau diduplikasi. Koneksi jaringan dan kecepatan seperti halnya kemampuan proses dari computer juga turut menentukan prose pengambilan keputusan tersebut.
Ketepatan fragmentasi
Fragmentasi untuk mencapai “benar” harus mengikuti dan mematuhi beberapa kondisi, antara lain :
- Completeness: jika sebuah unit data masih merupakan bagian dari relasi asli, maka data tersebut akan berada dalam satu fragment.
- Reconstruction: sebuah relasi asli dapat kembali dibuat dari sebuah fragment.
- Disjointness: data didalam sebuah fragment tidak boleh diikutkan dalam fragment yang lain, kecuali untuk atribut primary key dalam vertical fragmentation
Secara esensial, completeness berarti jikaa sebuah data dapat secara valid masuk kedalam relasi asli yang belum ter-fragment, dan kemudian terdapat pemetaan yang menentukan data tersebut menjadi bagian dari sebuah fragmen dan mendapat jaminan untuk menjadi bagian dari fragment tersebut. Dengan kata lain, tidak ada data didalam relasi asli yang akan gagal ter-fragment karena tidak ada fragment yang sesuai untuk data tersebut.Untuk proses rekonstruksi, akan selalu dapat ditemukan sebuah atau kombinasi dari operasi aljabar relasional untuk menyatukan relasi asli dari fragmen-fragmen yang ada. Untuk horizontal fragmentation operasi ini merupakan suatu penyambungan, sedangkan untuk vertical fragmentation, operasi ini merupakan suatu penggabungan.Aturan disjointness merupakan sebuah aturan yang sangat wajar dan jelas, untuk horizontal fragmentation, disjointness berarti tuple harus dipetakan secara jelas dalam sebuah fragment, sedangkan untuk vertical fragmentation, disjointness berarti setiap atribut harus dipetakan kedalam sebuah fragment
Aturan untuk pelaksanaan fragmentasi
2. fragment harus terpisah dan gabungan dari fragment-fragment tersebut harus terdiri atas keseluruhan fragment. Fragment yang mendahului akan menjadi lebih sulit untuk di analisis dan diimplementasikan
3. fragment yang terbesar adalah keseluruhan table, fragment terkecil merupakan sebuah record. Fragment harus didesain sedemikian rupa untuk memelihara keseimbangan diantara perbedaan ini.
Fragmentasi data
Tidak bisakan kita secara langsung mendistribusikan relasi?
Apakah yang merupakan unit yang paling layak untuk distribusi?
- relasi
- tampilan merupakan subset dari relas
- komunikasi ekstra
- fragment-fragment dari relasi-relasi (sub-relations)
- eksekusi secara bersamaan beberapa transaksi yang mengakses bagian-bagian yang berbeda dari sebuah relasi
- tampilan yang tidak dapat didefinisikan dalam sebuah fragment akan membutuhkan pemrosesan ekstra
- pengendalian data semantic (terutama penyelenggaraan integritas) akan menjadi lebih sulit
Jenis Fragmentasi Data :
Fragmentasi data dapat diselesaikan melalui beberapa cara, antara lain fragmentasi horizontal, fragmentasi vertical, dan fragmentasi mixed atau hybrid.
Fragmentasi horizontal
Fragmentasi horizontal terdiri atas tuples dari fragment global yang kemudian dipecah-pecah atau disekat menjadi beberapa subsets. Penyekatan tipe ini sangat berguna didalam basis data terdistribusi, dimana setiap subsets dapat berisi data yang memiliki properti secara umum. Fragmentasi horizontal didefinisikan menurut sebuah kondisi atau predikat yang menyatakan bahwa tuples yang ada telah mencukupi.
Kemudian fragmentasi horizontal dibagi kedalam dua bagian, antara lain :
1. primary horizontal fragmentation
2. derived horizontal fragmentation
Primary Horizontal Fragmentation
Ketika fragmentasi horizontal didefinisikan melalui predikat yang dapat secara langsung diaplikasikan pada tuples dari relasi, maka fragmentasi tersebut akan disebut sebagai primary horizontal fragmentation
Derived Horizontal Fragmentation
ketika fragmentasi didefinisikan dari sebuah predikat yang diaplikasikan pada tuple dalam relasi yang berbeda, maka fragmentasi ini disebut sebagai derived horizontal fragmentation.Fragmentasi ini sering terjadi ketika sebuah relasi mengalami perubahan dan konflik, yang memungkinkan terjadinya fragmentasi derived.Hal ini dapat terjadi ketika ia ter-relasikan dengan dua (atau lebih) relasi “parent” melalui foreign keys.
Dua factor yang mempengaruhi adalah :
1. Application usage
2. Join characteristics
Fragmentasi vertical akan membagi lagi atribut-atribut dari fragment global yang tersedia menjadi beberapa grup. Bentuk yang paling simple dari fragmentasi vertical adalah dekomposisi, dimana sebuah row-id yang unik dapat disertakan dalam setiap fragment untuk menjamin dan menjada adanya kemungkinan terjadinya proses rekonstruksi melalui sebuah operasi join.Fragmentasi vertical mengambil atribut-atribut dari sebuah relasi-relasi dan menggabungkan relasi-relasi tersebut dalam non-overlapping fragment. Dan fragment-fragment tersebut kemudian dialokasikan dalam system basis data terdistribusi untuk menaikkan performa system, tujuan dari fragmentasi vertical adalah untuk meminimalisasi besarnya biaya yang dibutuhkan untuk mengakses data dalam sebuah proses transaksi.Banyaknya kemungkinan untuk melaksanakan fragmentasi vertical akan naik sebanding dengan jumlah atribut yang terdapat dalam relasi.
Pendekatan kepada fragmentasi vertikal
- Terdapat dua pendekatan dasar pada fragmentasi vertical :
- Mengelompokkan tiap-tiap atribut dari awal
2. Pendekatan pertama lebih diperlukan karena :
- Fragment yang sesuai akan lebih mendekati ukuran dari relasi daripada ukuran dari masing-masing atribut
Pendekatan dengan pelaksanaan pemilahan akan membawa seluruh relasi yang telah dibangun sesuai dengan prinsip-prinsip standard dari desain basis data terpusat. Hal ini akan menghindari kemungkinan berkurangnya struktur relasi ideal yang secara nyata dapat terjadi selama proses menggolongan sebuah pendekatan. Lebih lanjut, duplikasi dari (non-key) atribut dalam fragment yang berbeda secara tak terpisahkan juga dihindari dalam pendekatan dengan pemilahan.
Informasi aplikasi dari fragmentasi vertikal
Informasi aplikasi yang dibutuhkan dalam fragmentasi vertical antara lain :
- Aplikasi/query yang mana yang membutuhkan atribut yang mana
- Besarnya frekuensi dari satau atau beberap aplikasi/query yang akan dieksekusi
- Informasi yang pertama dapat ditemukan dalam attribute usage matrix, dan aplikasi kedua dapat digunakan dengan attribute affinity matrix
Secara mendasar, tugas untuk mendefinisikan atau mengidentifikasi sebuah atribut tertentu adalah dari pengaksesan bersama dan seberapa sering, dan kemudian untuk mendesain sebuah fragmentasi vertical untuk mendukung kombinasi dari atribut yang digunakan secara rutin. Dan secara jelas, tidak semua aplikasi/query akan secara ideal didukung oleh desain final – akan selau terdapat kompromi dari kebutuhan-kebutuhan yang saling bertentangan dan tidak dapat diacuhkan. Kemudian dari pada itu, dikarenakan teknik yang digunakan adalah teknik pemilahan maka akan terdapat atribut usage dan affinity matrix untuk setiap relasi yang akan difragmentasi vertical.
Fragmentasi Mixed/Hybrid
Pada kenyataanny banyak aplikasi/query yang membutuhkan fragmentasi yang lebih kompleks daripada hanya menggunakan fragmentasi vertical atau fragmentasi horizontal saja. Teknik penggunaan tipe fragmentasi ini adalah dengan mengaplikasikan teknik fragmentasi horizontal terlebih dahulu yang kemudian diikuti dengan teknik ffragmentasi vertical kepada satu atau lebih fragment horizontal yang telah dibentuk sebelumnya.
Teknik fragmentasi mixed merupakan sebuah proses yang menggabungkan teknik fragmentasi horizontal dan vertical.