Thiết kế Cơ sở dữ liệu phân tán môn Cơ sở dữ liệu phân tán | Trường đại học kinh doanh và công nghệ Hà Nội

Phân mảnh ngang là việc tách ngang một quan hệ toàn cục thànhnhiều nhiều mảnh. Mỗi một mảnh là một quan hệ khả hợp, chứa một số bộ và các bộ trong các quan hệ con là tách biệt nhau. Phân mảnh ngang thực chất là phép chọn quan hệ thỏa mãn một biểu thức điều kiện cho trước. Tài liệu giúp bạn tham  khảo, ôn tập và đạt kết quả cao. Mời đọc đón xem!

Ts. Phan Thị Hà
Nội dung
Phương pháp phân mảnh ngang
Phân mảnh ngang dẫn xuất
Phân mảnh dọc
Phương pháp phân mảnh hỗn hợp
Cấp phát và mô hình cấp phát
lOMoARcPSD| 45469857
Downloaded by Hà Anh (vjt987@gmail.com) 2
Phn mng ngang
Phân mnh ngang là vic tách ngang mt quan h toàn cc thành nhiu
nhiu mnh. Mi mt mnh là mt quan h kh hp, cha mt s b và các
b trong các quan h con là tách bit nhau.
Phân mnh ngang thc cht là phép chn quan h tha mãn mt biu thc
iu kiện cho trước.
Có hai phương pháp phân mảnh ngang:
Phân mnh ngang nguyên thy: Là phân mảnh ngang ược thc hin trên
các v t ca chính quan h.
lOMoARcPSD| 45469857
Phân mnh ngang dn xut: phân mnh mt quan h da trên các v
t ca quan h khác.
Thông tin Phân mảnh ngang
Thông tin v CSDL bao gm tp các quan h, mi quan
h, tp các thuc tính và tp các ph thuc hàm
Thông tin v các ng dng gm các câu truy vn trên các
quan h, v trí các truy vấn….
(Ko)Thông tin v mng máy tính, cấu trúc, băng thông…
(Ko)Thông tin v h thng máy tính, b nh lưu trữ…
lOMoARcPSD| 45469857
Downloaded by Hà Anh (vjt987@gmail.com) 4
Yêu cu thông tin v mng thông tin v h thng máy nh ch
ược s dng trong các hình cp phát, không s dng trong
các thut toán phân mnh d liu
lOMoARcPSD| 45469857
5
Downloaded by Hà Anh (vjt987@gmail.com)
Phân mảnh ngang: Dựa trên thông tin về CSDL
Thông tin v CSDL: thông tin v mi quan h mt - mt, mt - nhiu
và nhiu - nhiu gia các quan h (bảng), ưc liên kết bằng các ường
ni (Link) có hướng, kết ni bng
Thông tin vịnh lượng cn thiết v cơ sở dl là lực lượng ca quan h
R, ký
hiu
|
R
|
là Card(R)
Mi
quan
h
mt
-
nhiu
tr
t
các quan
h
PAY
ến
quan
h
EMP
bng
ung
ni
L1
Mi
quan
h
nhiu
-
nhiu
tr
t
các quan
h
EMP và PROJ
ến
quan
h
ASG
bng
hai
ung
ni
L2 và L3.
EMP
ENO,
ENAME, TITLE
L1
PROJ
PAY
TITLE, SAL
ASG
ENO, PNOE
, RESP, DUR
L2
L3
, LOC
PNAME, BUDGET
PNO,
lOMoARcPSD| 45469857
Downloaded by Hà Anh (vjt987@gmail.com) 6
Phân mảnh ngang: Dựa trên thông tin ứng dụng
Thông tin v ng dng: Thông tin ịnh lượng vàThông tin nh
phát ( ko s dng ây)
Thông tin ịnh nh bản: hướng dn hot ng phân mnh
.
a) V t n gin
Ký hiu: p
j
: A
i
θ “value”, Trong ó:
tính
Thông tin
dnh
ng
:
ch
yếu
s
dng
trong các mô hình
cp
lOMoARcPSD| 45469857
Phân mảnh ngang: Dựa trên thông tin ứng dụng
7
Downloaded by Hà Anh (vjt987@gmail.com)
A
i
thuc tính ca R(A
1
, A
,..,A ),
“Value” là một giá tr A
i
hiu Pr tp tt c các v t ơn giản ược ịnh nghĩa trên quan hệ
R: Pr = {p
1
, p
2
, ...., p
m
}.
b). V t hi s cp
2
n
lOMoARcPSD| 45469857
Downloaded by Hà Anh (vjt987@gmail.com) 8
dng ph nh ca nó.
Pr = {p
1
, p
2
, ...., p
m
}
mt
tp
các
v
t
ơn
gin
Trong
ó
, p
*
k
= p
k
hoc
.
Như
vy
,
v
t
ơn
gin
xut
hin
trong
v
t
hi
cp
i
dng
t
nhiên
hoc
lOMoARcPSD| 45469857
Phân mảnh ngang: Dựa trên thông tin ứng dụng
9
Downloaded by Hà Anh (vjt987@gmail.com)
Ví d:
p
1
: TITLE = “Elect.Eng”
p
2
: TITLE = “Syst. Anal” PAY
p
3
: TITLE = “Mech. Eng” p
4
:
TITLE = “Programmer” p
5
: SAL
≤ 30000 p
6
: SAL > 30000
Sau ây là 1 s v t hi m
1
:
TITLE = “Elect.Eng” ^ SAL ≤ 30000
m
2
:
TITLE = “Elect.Eng” ^ SAL > 30000
m
3
:
¬(TITLE = “Elect.Eng”) ^ SAL ≤ 30000
m
4
:
¬(TITLE = “Elect.Eng”) ^ SAL > 30000
lOMoARcPSD| 45469857
Phân mảnh ngang: Dựa trên thông tin ứng dụng
Downloaded by Hà Anh (vjt987@gmail.com) 10
m
5
:
TITLE = “Programmer” ^ SAL ≤ 30000
m
6
:
TITLE = “Programmer” ^ SAL > 30000
Trên ây là 1 s v tu hi c to ra t tp v t cơ sở
trên, CÆc v t ny đã đc viết đơn giản ha ca cÆc hội. Định nghĩa hội
đòi hỏi mi v t dng t nhiŒn hoặc ph định ca n, bi vy m1 c
th viết l
Ký hiu
lOMoARcPSD| 45469857
Phân mảnh ngang: Dựa trên thông tin ứng dụng
11
Downloaded by Hà Anh (vjt987@gmail.com)
Độ tuyn hội cấp (Minterm Selectivity): s b ca quan
h kết qu ược chn theo v t hội cấp cho trước.
hiu là sel(m).Ví d, sel(m1)=0. Sel(m2)=1.
Tn s ng dụng người dùng truy nhp d liu.
Nếu Q = {q1, q2, , qk} tp truy vn, tn s truy nhp
ca truy vn qi trong mt khong thi gian ã cho, hiu là
acc(qi)
Tn s truy nhp hội sơ cấp hội sơ cấp m, ký hiu là
acc(m).
lOMoARcPSD| 45469857
Downloaded by Hà Anh (vjt987@gmail.com) 12
Phân mảnh ngang cơ sở
Phân mảnh ngang sở ược ịnh nghĩa bng phép chn
trên quan h toàn R:
i=1 ...n ; trong ó m
i
là v t hội sơ cấp.
f
i
ược gi là mnh hội sơ cấp (Minterm Fragment).
Mt tp M các v t hội sơ cấp, s ng phân mnh ngang
ca quan h R bng s ng các v t hội sơ cấp.
lOMoARcPSD| 45469857
Downloaded by Hà Anh (vjt987@gmail.com)
Phân mảnh ngang cơ sở
m
1
: {BUDGET≤200000} m
2
: {
200000 < BUDGET ≤ 400000} m
3
: { 400000
< BUDGET ≤ 600000} m
4
: { 600000 <
BUDGET}
Khi ó quan h PROJ ược phân thành các mảnh ngang như
sau:
PROJ
1
= σ
BUDGET≤200000
(PROJ)
d
:
Gi
s
tp
các
v
t
hi
cp
:
lOMoARcPSD| 45469857
Downloaded by Hà Anh (vjt987@gmail.com) 14
PROJ2 = σ 200000 < BUDGET ≤ 400000 (PROJ)
PROJ3 = σ400000 < BUDGET ≤ 600000 (PROJ)
PROJ4 = σ600000 < BUDGET (PROJ)
lOMoARcPSD| 45469857
Downloaded by Hà Anh (vjt987@gmail.com)
Phân
mảnh
ngang
sở
-
T
huật
toán
lOMoARcPSD| 45469857
Downloaded by Hà Anh (vjt987@gmail.com) 16
lOMoARcPSD| 45469857
Downloaded by Hà Anh (vjt987@gmail.com) 17
Tính ầy của vị từ ơn giản
Pr y khi ch khi xác sut truy nhp ca mi ng dng ến
b bt k ca mnh hội cp bt k ược ịnh nghĩa theo Pr
như nhau.
V t y s m bo cho các mảnh cp nht quán v
mặt logic. Đồng nht v mt thng theo cách ng dng
truy nhp. vy, mt tp v t y sở cho vic phân
mảnh ngang cơ sở.
VD(1). Cho 1 quan h EMP
Downloaded by Hà Anh (vjt987@gmail.com)
lOMoARcPSD| 45469857
lOMoARcPSD| 45469857
Downloaded by Hà Anh (vjt987@gmail.com)
UD1: Gi s ng dng AP1 truy vn vo quan h EMP tm kiếm những nhn viŒn lm
viecj in Los Angeles (LA),
Tp v t ơn giản l Pr = {p1: Loc= “LA”}
Tp v t hội l {m1: Loc = “LA”, m2: Loc<>“LA”}”, vy tp Pr l cc tiu v y , cÆc
mảnh ược phn ra:
Fragment F1: Create table LA_EMPS as Select * from EMP Where Loc = "LA"; Fragment
F2: Create table NON_LA_EMPS as Select * from EMP Where Loc <>
"LA";
UD2: Gi s ng dụng 1 thŒm k loại b tt c những ngưi c salary<=30000 t khi ó
Pr khng cn cc tiu v y na, khi ó phi sa thnh
Pr = {p1: Loc= “LA”, p2: salary > 30000}
Tp cÆc v t hi
{m1: Loc = "LA" Sal > 30000,
m2: Loc = "LA" Sal <= 30000,
m3: Loc <>"LA" Sal > 30000, m4:
Loc <>"LA" Sal <= 30000}
Downloaded by Hà Anh (vjt987@gmail.com)
lOMoARcPSD| 45469857
Completeness (4)
JNO JNAME BUDGET LOC
J1 Instrumental 150,000 Montreal
J2 Database Dev. 135,000 New York J3
CAD/CAM 250,000 New York
J1 LOC "MONTREAL"(J)
J2 LOC "NewYork"(J)
J3 LOC "Orlando"(J)
| 1/60

Preview text:


Ts. Phan Thị Hà Nội dung
 Phương pháp phân mảnh ngang
 Phân mảnh ngang dẫn xuất  Phân mảnh dọc
 Phương pháp phân mảnh hỗn hợp
 Cấp phát và mô hình cấp phát lOMoAR cPSD| 45469857 lOMoAR cPSD| 45469857 Phn mảng ngang
 Phân mảnh ngang là việc tách ngang một quan hệ toàn cục thành nhiều
nhiều mảnh. Mỗi một mảnh là một quan hệ khả hợp, chứa một số bộ và các
bộ trong các quan hệ con là tách biệt nhau.
 Phân mảnh ngang thực chất là phép chọn quan hệ thỏa mãn một biểu thức iều kiện cho trước.
 Có hai phương pháp phân mảnh ngang: •
Phân mảnh ngang nguyên thủy: Là phân mảnh ngang ược thực hiện trên
các vị từ của chính quan hệ.
Downloaded by Hà Anh (vjt987@gmail.com) 2 •
Phân mảnh ngang dẫn xuất: Là phân mảnh một quan hệ dựa trên các vị từ của quan hệ khác.
Thông tin Phân mảnh ngang
 Thông tin về CSDL bao gồm tập các quan hệ, mối quan
hệ, tập các thuộc tính và tập các phụ thuộc hàm
 Thông tin về các ứng dụng gồm các câu truy vấn trên các
quan hệ, vị trí các truy vấn….
 (Ko)Thông tin về mạng máy tính, cấu trúc, băng thông…
 (Ko)Thông tin về hệ thống máy tính, bộ nhớ lưu trữ… lOMoAR cPSD| 45469857
Yêu cầu thông tin về mạng và thông tin về hệ thống máy tính chỉ
ược sử dụng trong các mô hình cấp phát, không sử dụng trong
các thuật toán phân mảnh dữ liệu
Downloaded by Hà Anh (vjt987@gmail.com) 4 lOMoAR cPSD| 45469857
Phân mảnh ngang: Dựa trên thông tin về CSDL
Thông tin về CSDL: Là thông tin về mối quan hệ một - một, một - nhiều
và nhiều - nhiều giữa các quan hệ (bảng), ược liên kết bằng các ường
nối (Link) có hướng, kết nối bằng
Thông tin vịnh lượng cần thiết về cơ sở dl là lực lượng của quan hệ R, ký hiệu |R là Card(R) PAY | TITLE, SAL •
Mối quan hệ một - nhiều trỏ từ EMP L1 các quan hệ PAY ến quan hệ ENO, ENAME, TITLE EMP bằng uờng nối L1 PROJ •
Mối quan hệ nhiều - nhiều trỏ từ PNAM PNO, E, B , LOC UDGET các quan hệ EMP và PROJ ến L2 quan hệ ASG bằng hai uờng L3 nối ASG L2 và L3. ENO, PNOE , RESP, DUR
Downloaded by Hà Anh (vjt987@gmail.com) 5 lOMoAR cPSD| 45469857
Phân mảnh ngang: Dựa trên thông tin ứng dụng tính Thông tin dịnh lượ
ng : chủ yếu sử dụng trong các mô hình cấp
Thông tin về ứng dụng: Thông tin ịnh lượng vàThông tin ịnh
phát ( ko sử dụng ở ây)
Thông tin ịnh tính là cơ bản: hướng dẫn hoạt ộng phân mảnh .
a) Vị từ n giản
 Ký hiệu: pj: Ai θ “value”, Trong ó:
Downloaded by Hà Anh (vjt987@gmail.com) 6 lOMoAR cPSD| 45469857
Phân mảnh ngang: Dựa trên thông tin ứng dụng
Ai là thuộc tính của R(A1, A ,..,A ), 2 n
“Value” là một giá trị Ai
 Ký hiệu Pr là tập tất cả các vị từ ơn giản ược ịnh nghĩa trên quan hệ R: Pr = {p1, p2, ...., pm}.
b). Vị từ hội s cấp
Downloaded by Hà Anh (vjt987@gmail.com) 7 lOMoAR cPSD| 45469857  Pr = {p , p , ...., p } là ơn 1 một tập từ giản 2 m các vị  Trong ó ơn , p * = p hoặc vậy từ giản k . Như , vị k  xuất sơ dướ hiện trong vị từ hội cấp i dạng tự nhiên hoặc dạng phủ ịnh của nó.
Downloaded by Hà Anh (vjt987@gmail.com) 8 lOMoAR cPSD| 45469857
Phân mảnh ngang: Dựa trên thông tin ứng dụng Ví dụ: p1: TITLE = “Elect.Eng” p2: TITLE = “Syst. Anal” PAY
p3: TITLE = “Mech. Eng” p4:
TITLE = “Programmer” p5: SAL ≤ 30000 p6: SAL > 30000
Sau ây là 1 số vị từ hội m1:
TITLE = “Elect.Eng” ^ SAL ≤ 30000 m2:
TITLE = “Elect.Eng” ^ SAL > 30000 m3:
¬(TITLE = “Elect.Eng”) ^ SAL ≤ 30000 m4:
¬(TITLE = “Elect.Eng”) ^ SAL > 30000
Downloaded by Hà Anh (vjt987@gmail.com) 9 lOMoAR cPSD| 45469857
Phân mảnh ngang: Dựa trên thông tin ứng dụng m5:
TITLE = “Programmer” ^ SAL ≤ 30000 m6:
TITLE = “Programmer” ^ SAL > 30000
Trên ây là 1 số vị từu hội c tạo ra từ tập vị từ cơ sở
trên, CÆc vị từ ny đã đc viết đơn giản ha của cÆc hội. Định nghĩa hội
đòi hỏi mỗi vị từ ở dạng tự nhiŒn hoặc phủ định của n, bởi vậy m1 c thể viết l Ký hiệu
Downloaded by Hà Anh (vjt987@gmail.com) 10 lOMoAR cPSD| 45469857
Phân mảnh ngang: Dựa trên thông tin ứng dụng
 Độ tuyển hội sơ cấp (Minterm Selectivity): số bộ của quan
hệ kết quả ược chọn theo vị từ hội sơ cấp cho trước. Ký
hiệu là sel(m).Ví dụ, sel(m1)=0. Sel(m2)=1.
 Tần số ứng dụng người dùng truy nhập dữ liệu.
Nếu Q = {q1, q2, … , qk} là tập truy vấn, tần số truy nhập
của truy vấn qi trong một khoảng thời gian ã cho, ký hiệu là acc(qi)
 Tần số truy nhập hội sơ cấp hội sơ cấp m, ký hiệu là acc(m).
Downloaded by Hà Anh (vjt987@gmail.com) 11 lOMoAR cPSD| 45469857
Phân mảnh ngang cơ sở
 Phân mảnh ngang cơ sở ược ịnh nghĩa bằng phép chọn trên quan hệ toàn R:
i=1 ...n ; trong ó mi là vị từ hội sơ cấp.
 fi ược gọi là mảnh hội sơ cấp (Minterm Fragment).
 Một tập M các vị từ hội sơ cấp, số lượng phân mảnh ngang
của quan hệ R bằng số lượng các vị từ hội sơ cấp.
Downloaded by Hà Anh (vjt987@gmail.com) 12 lOMoAR cPSD| 45469857 Ví dụ sơ
: Giả sử tập các vị từ hội cấp :
Phân mảnh ngang cơ sở m1: {BUDGET≤200000} m2: {
200000 < BUDGET ≤ 400000} m3: { 400000
< BUDGET ≤ 600000} m4: { 600000 < BUDGET}
Khi ó quan hệ PROJ ược phân rã thành các mảnh ngang như sau:
PROJ1 = σ BUDGET≤200000(PROJ)
Downloaded by Hà Anh (vjt987@gmail.com) lOMoAR cPSD| 45469857
PROJ2 = σ 200000 < BUDGET ≤ 400000 (PROJ)
PROJ3 = σ400000 < BUDGET ≤ 600000 (PROJ)
PROJ4 = σ600000 < BUDGET (PROJ)
Downloaded by Hà Anh (vjt987@gmail.com) 14 lOMoAR cPSD| 45469857 mảnh cơ sở Thuật ngang - toán
Downloaded by Hà Anh (vjt987@gmail.com) Phân lOMoAR cPSD| 45469857
Downloaded by Hà Anh (vjt987@gmail.com) 16 lOMoAR cPSD| 45469857
Tính ầy ủ của vị từ ơn giản
Pr là ầy ủ khi và chỉ khi xác suất truy nhập của mỗi ứng dụng ến
bộ bất kỳ của mảnh hội sơ cấp bất kỳ ược ịnh nghĩa theo Pr là như nhau.
Vị từ ầy ủ sẽ ảm bảo cho các mảnh sơ cấp nhất quán về
mặt logic. Đồng nhất về mặt thống kê theo cách ứng dụng
truy nhập. Vì vậy, một tập vị từ ầy ủ là cơ sở cho việc phân mảnh ngang cơ sở. VD(1). Cho 1 quan hệ EMP
Downloaded by Hà Anh (vjt987@gmail.com) 17 lOMoAR cPSD| 45469857
Downloaded by Hà Anh (vjt987@gmail.com) lOMoAR cPSD| 45469857
UD1: Giả sử ứng dụng AP1 truy vấn vo quan hệ EMP ể tm kiếm những nhn viŒn lm
viecj ở in Los Angeles (LA),
Tập vị từ ơn giản l Pr = {p1: Loc= “LA”}
Tập vị từ hội l {m1: Loc = “LA”, m2: Loc<>“LA”}”, vậy tập Pr l cực tiểu v ầy ủ , cÆc mảnh ược phn ra:
Fragment F1: Create table LA_EMPS as Select * from EMP Where Loc = "LA"; Fragment
F2: Create table NON_LA_EMPS as Select * from EMP Where Loc <> "LA";
UD2: Giả sử ứng dụng 1 thŒm k loại bỏ tất cả những người c salary<=30000 t khi ó
Pr khng cn cực tiểu v ầy ủ nữa, khi ó phải sửa thnh
Pr = {p1: Loc= “LA”, p2: salary > 30000} Tập cÆc vị từ hội
{m1: Loc = "LA" Sal > 30000,
m2: Loc = "LA" Sal <= 30000,
m3: Loc <>"LA" Sal > 30000, m4:
Loc <>"LA" Sal <= 30000}
Downloaded by Hà Anh (vjt987@gmail.com) lOMoAR cPSD| 45469857 Completeness (4) JNO JNAME BUDGET LOC J1 Instrumental 150,000 Montreal J2 Database Dev. 135,000 New York J3 CAD/CAM 250,000 New York J1
LOC "MONTREAL"(J) J2
LOC "NewYork"(J) J3
LOC "Orlando"(J)
Downloaded by Hà Anh (vjt987@gmail.com)