Câu hỏi lý thuyết ôn tập môn Cơ sở dữ liệu có lời giải | Đại học Sư phạm Kỹ thuật Thành phố Hồ Chí Minh

Câu hỏi lý thuyết ôn tập môn Cơ sở dữ liệu có lời giải của Đại học Sư phạm Kỹ thuật Thành phố Hồ Chí Minh với những kiến thức và thông tin bổ ích giúp sinh viên tham khảo, ôn luyện và phục vụ nhu cầu học tập của mình cụ thể là có định hướng ôn tập, nắm vững kiến thức môn học và làm bài tốt trong những bài kiểm tra, bài tiểu luận, bài tập kết thúc học phần, từ đó học tập tốt và có kết quả cao cũng như có thể vận dụng tốt những kiến thức mình đã học vào thực tiễn cuộc sống. Mời bạn đọc đón xem!

 

lOMoARcPSD|36625228
Gii thích khái nim d liu (data) và cho thí d
D liu (data) là mt khái niệm cơ bản trong h qun tr cơ sở d liu quan h
(RDBMS).
Theo định nghĩa, dữ liu là các s kin, hoạt động hay các ghi chép v một đối
ng, s vật nào đó người s dng muốn lưu trữ qun trong h thng
cơ sở d liu.
Ví d: thông tin cá nhân ca sinh viên, lch s mua hàng ca khách hàng, thông
tin sn phm, doanh thu bán hàng hàng tháng, v.v.
Trong RDBMS, d liệu được t chức, lưu trữ truy xuất dưới dng các bng có
quan h vi nhau. Mi bng cha các bn ghi (record), mi bản ghi lưu trữ các
giá tr d liu ca mt thc th o đó.
d bng SinhViên các ct MSSV, HTên, NgàySinh, Lớp, Khoa, đây các
d liu mô t thông tin chi tiết ca mt sinh viên.
Mt s đặc điểm ca d liu trong RDBMS:
D liệu được t chc thành các ct và hàng có cu trúc rõ ràng.
D liu không b trùng lp nh s dng khóa chính các ràng buc toàn
vn.
D liệu được lưu trữ riêng bit vi các ng dng và b x lý.
D liu có quan h vi nhau gia các bng thông qua khóa ngoi.
D liu th truy vn, thao tác báo cáo linh hot thông qua ngôn ng
SQL.
Như vậy, th thy d liu thành phn ct lõi, quan trng nht trong mt
h thng qun tr cơ sở d liệu, là cơ sở để thc hin các chức năng khác nhau
ca h thng.
Gii thích khái nim thông tin (information)
Thông tin (information) mt khái nim quan trng trong khoa hc máy tính
và công ngh thông tin.
Theo định nghĩa, thông tin là nhng d liệu đã được x lý, t chc và trình bày
một cách ý nghĩa, hữu ích cho người s dng. Thông tin mang li gtr
li ích thiết thực cho người tiếp nhn nó. Ví d:
D liệu: Ngày 20/11/2022, hoá đơn BH29839, sản phm A, s ng 10.
lOMoARcPSD|36625228
Thông tin: Vào ngày 20/11/2022, đã bán được 10 sn phm A trong
hoá đơn BH29839.
Ta thấy, thông tin đã liên kết nhng d liu l t thành một ý nghĩa giá trị s
dụng rõ ràng hơn.
Mt s đặc điểm ca thông tin:
Có tính c th, rõ ràng, d hiu.
Đúng ngữ cnh, phù hp và liên quan tới người dùng.
Đầy đủ, trung thc và chính xác.
Cp nht, kp thi và sn sàng khi cn.
D truy nhp, tra cu và s dng.
H tr ra quyết định và gii quyết vấn đề.
Như vậy, có th thy thông tin chính là kết qu ca vic x lý và t chc d liu
sao cho ý nghĩa mang lại li ích thiết thc nhất cho người s dng. Thông
tin là nn tng quan trọng để đưa ra các quyết định đúng đắn.
Định nghĩa về sở d liu
Cơ sở d liu (database) là tp hp các d liu có t chức, được lưu tr và truy
xut mt cách có h thống để phc v mục đích cụ th. C th hơn:
Cơ sở d liu là tp hp có cu trúc các d liu liên quan với nhau, được
lưu trữ trên y tính để phc v nhu cu tra cu s dng thông tin
của người dùng.
sở d liệu được thiết kế, t chc qun bi h qun tr sở d
liu (DBMS).
D liệu trong sở d liệu được t, truy xut thao tác thông qua
mt ngôn ng đặc bit gi là ngôn ng truy vn (Query Language).
Các ng dng của cơ sở d liu rt phong phú, t qun lý doanh nghip,
ngân hàng, bnh vin, cho tới thương mại điện t, mng xã hi, v.v.
Như vậy, có th hiểu cơ sở d liệu là nơi lưu trữ và qun lý d liu mt cách có
h thng phc v nhu cu s dng thông tin trong các ng dng c thể.
s d liu là mt thành phn không th thiếu trong h thng thông tin hin
đại.
Định nghĩa về H qun tr cơ s d liu (DBMS)
lOMoARcPSD|36625228
H qun tr cơ sở d liu (Database Management System - DBMS) phn mm
h thống được thiết kế để qun lý vic to lp, duy trì và s dụng cơ sở d liu.
C th hơn:
DBMS phn mềm cho phép người dùng to, cp nht, qun tr sở
d liu mt cách thun tin và hiu qu.
DBMS qun lý vic truy cp, bo mt và toàn vn d liu.
DBMS h tr ngôn ng truy vấn (SQL) để truy xut d liu mt cách linh
hot.
Các chức năng chính ca DBMS bao gồm: định nghĩa dữ liu, truy vn,
cp nhật, báo cáo, sao lưu phục hồi, đồng b hóa, v.v.
Các DBMS ph biến hin nay Oracle, MySQL, Microsoft SQL Server,
PostgreSQL, MongoDB, v.v.
Như vậy, DBMS là phn mm quan trng, cho phép to lp quản lý cơ sở d
liu mt cách hiu quả. DBMS là “bộ não” của h thng qun tr cơ sở d liu.
Lit kê mt s h qun tr cơ s d liu (DBMS) ph biến
ới đây là một s h qun tr cơ sở d liu (DBMS) ph biến:
Oracle: DBMS được s dng rng rãi nht, phù hp cho các h thng ln.
Cung cấp các tính năng bảo mật và độ tin cy cao.
MySQL: DBMS ngun m, ph biến vi các ng dụng web và di đng.
Hoạt động tt trên nn tng Linux.
Microsoft SQL Server: DBMS ca Microsoft, tích hp tt vi các sn phm
Microsoft khác. Giao din qun tr thân thin.
PostgreSQL: DBMS mã ngun m, mnh m và có độ tin cy cao. H tr
nhiu kiu d liu và chức năng mở rng.
MongoDB: DBMS dạng NoSQL, lưu trữ d liu dng document. Hoạt động
tt vi d liu phi cu trúc.
Microsoft Access: DBMS nh gọn, thường đi kèm với Office. Thích hp vi
các ng dng quy mô nh.
SQLite: DBMS nh gọn, nhanh và đa nền tảng. Thường được tích hp sn
trong các ng dng.
Đây một s DBMS tiêu biu, ph biến hin nay. Mi DBMS có nhng ưu điểm
và nhược điểm riêng, phù hp vi nhng ng dng c th.
lOMoARcPSD|36625228
Mt h qun tr cơ sở d liệu (DBMS) thường bao gm các thành
phn nào ?
Mt h qun tr s d liệu (DBMS) thường bao gm các thành phn chính
sau:
1. Ngôn ng định nghĩa d liu (DDL): Ngôn ng cho phép định nghĩa cấu
trúc d liệu như tạo bng, ct, khóa, gii hn, mi quan h, ch mc, v.v.
Ngôn ng tiêu chun là SQL.
2. Ngôn ng thao tác d liu (DML): Ngôn ng cho phép thc hin các thao
tác trên d liệu như chèn, cập nht, xóa d liệu. Cũng sử dng SQL.
3. Ngôn ng truy vn (DQL): Ngôn ng cho phép truy vn truy xut d
liu t cơ sở d liệu dưới dng báo cáo. S dng SQL.
4. B x truy vn: Thành phn phân tích và x các truy vn, tối ưu hóa
hiệu năng truy vấn.
5. Qun tr và kim soát: Quản lý người dùng, phân quyn truy cập, sao lưu
d liu, phc hi thm ha, v.v.
6. Giao diện người dùng: Cho phép người dùng tương tác vi DBMS thông
qua ng dng hoc trình duyt web.
7. Các dch vcông c h tr: H tr import/export d liu, to báo cáo,
giám sát h thng, tối ưu hóa, v.v.
Như vậy, DBMS bao gm nhiu thành phần khác nhau để đảm bo qun
vận hành cơ sở d liu mt cách hiu qu.
Siêu d liu (Metadata) là gì ?
Siêu d liu (Metadata) là d liu mô t v d liu. C
th hơn:
Siêu d liu cung cp thông tin v cấu trúc, đặc tính, quan h, ngun gc,
cách thc s dng... ca d liu.
d siêu d liu: tên bng, tên ct, kiu d liu ca ct, khóa chính, khóa
ngoi, giá tr mặc đnh, người to, thi gian to... của các đối tượng trong
cơ sở d liu.
Siêu d liệu giúp document hóa s d liu, hiu ngun gc ý
nghĩa của d liu.
lOMoARcPSD|36625228
Siêu d liu h tr tìm kiếm, truy xut và phân tích d liu mt cách hiu
qu.
Siêu d liệu thường được lưu trữ trong các thư viện siêu d liu hoc các
công c qun lý siêu d liu.
Như vậy, siêu d liu là "d liu v d liu", cung cp các thông tin hữu ích để
làm vic hiu qu vi d liu.
Chi tiết v 3 nhóm đối tượng chính người s dng, qun tr viên
v nh phát trin, mi nhóm có vai trò v nhu cu s dng khác nhau
đối với cơ sở d liu
Có 3 loại đối tưng chính s dụng cơ sở d liu:
1. Ngưi s dng cui (End-user) Là những người trc tiếp s dng
các ng dng của cơ sở d liu.
Thường ch đưc cp quyn truy cp và s dng c th vào các phn d
liu nhất định.
d: nhân viên bán hàng, kế toán, c sĩ, giáo viên,.. sử dng các ng dng
cơ sở d liu ca công ty.
2. Qun tr cơ sở d liu (Database Administrators) Qun lý,
vn hành, bo trì cơ sở d liu và h thng DBMS.
Quyết định cu trúc d liu, phân quyền, sao lưu dữ liu, hiu năng và
bo mt h thng.
Cn có kiến thc chuyên sâu v cơ sở d liu.
3. Lp trình viên ng dng (Application Developers)
Phát trin các ng dng phn mềm tương tác với cơ sở d liu.
S dng ngôn ng lp trình và các công c để truy cp, thao tác d liu.
Cn hiu rõ mô hình d liu và cách vn hành của cơ sở d liu.
Như vậy 3 nhóm đối tượng chính người s dng, qun tr viên và nhà phát
trin, mi nhóm có vai trò và nhu cu s dụng khác nhau đối với cơ sở d liu.
Nêu nhim v ca DBA, Database designer, System Analyst,
lOMoARcPSD|36625228
Application Programmer
i đây nhim v chính ca mt s đối ng liên quan đến s d liu:
1. DBA (Database Administrator - Qun tr cơ sở d liu):
Quản lý, cài đặt, nâng cp h thống cơ s d liu.
Kim soát và bo mt d liu.
Sao lưu và phục hi d liu.
Tối ưu hóa hiệu năng cơ sở d liu.
Giám sát và khc phc s c.
2. Database Designer - Người thiết kế sở d liu:
Phân tích yêu cu nghip v ca t chc.
Thiết kế mô hình d liu conceptual, logical, physical.
Chuẩn hóa cơ sở d liệu, đảm bo tính toàn vn.
La chn công ngh sở d liu phù hp.
3. System Analyst - Chuyên viên phân tích h thng:
Phân tích yêu cu nghip v ca khách hàng.
Xác định yêu cu d liu cn thiết.
Đưa ra khuyến ngh v gii pháp công ngh.
Lp kế hoch và điều phi d án.
4. Application Programmer - Lp trình viên ng dng: X y dng
chương trìnhng dụng tương tác với cơ sở d liu.
S dng các công c và ngôn ng lập trình để kết ni và thao tác d
liu.
Viết các câu truy vn, cp nht d liu trong mã ngun.
Tối ưu hóa hiệu năng truy vấn và xd liu.
Như vậy mi v trí đòi hỏi các k năng và trách nhiệm khác nhau đi với sở
d liu.
Mô hình d liu (Data Model) là gì ?
lOMoARcPSD|36625228
hình d liu (Data Model) mt hình khái nim (conceptual model)
đưc s dụng để t cu trúc d liu trong h thống sở d liu. Mt s
đặc điểm ca mô hình d liu:
t các đối tượng d liu, mi quan h gia chúng các ràng buc
trên d liu.
Trừu tượng hóa d liệu, độc lp vi h qun tr CSDL c th.
Cho phép nhìn nhn d liu mt cách logic, d hiu gn vi thế gii
thc.
Là cơ sở để thiết kế cơ sở d liu vt lý.
Các hình d liệu thường dùng: hình thc th - kết hp (ER Model),
mô hình quan h (Relational Model), mô hình mng (Network Model),...
Ngôn ng hình hóa d liu ph biến: UML (Unified Modeling
Language).
Như vậy, mô hình d liệu là bước quan trng trong thiết kế cơ sở d liu, giúp
người thiết kế cái nhìn tng quát v d liệu trước khi xây dng cấu trúc lưu
tr c th.
--------------
hình d liu (Data Model) mt hình trừu tượng t cu trúc d liu
ca h thng. hình d liệu định nghĩa các đối tượng d liu, mi quan h
gia chúng các ràng buc trên d liu. Mt s loi mô hình d liu ph biến:
Mô hình thc th - kết hp (ER Model): S dng các thc th, thuc tính
và mi quan h để mô t d liu.
hình quan h (Relational Model): D liệu được t chc thành các bng
có quan h vi nhau.
hình sở d liệu đối tượng (Object Database Model): Da trên
hình OOP vi các lớp, đối tượng có quan h vi nhau.
hình d liu mng (Network Model): T chc d liu thành các mi
quan h hướng.
Mô hình d liu nhân bn (Hierarchical Model): D liu có cu trúc phân
cp, cây.
Mục đích của mô hình d liu là cung cp cái nhìn tng quan v d liu, t đó
thiết kế sở d liu hoc h thống u trữ, truy xut d liu mt cách hiu qu.
Gii thích 3 loi mô hình: mô hình mc khái nim, mô hình d liu
mc logic và mô hình d liu mc vt lý
lOMoARcPSD|36625228
Ba loi mô hình d liu chính trong thiết kế cơ sở d liu là:
1. Mô hình d liu mc khái nim (Conceptual data model)
Mô tc thc th, thuc tính và mi quan h gia chúng.
Không cha thông tin k thut c th.
Ví d: mô hình E-R, diagram lp UML.
2. Mô hình d liu mc logic (Logical data model)
t d liệu dưới dng hình d liu c th như hình quan h
hoặc đối tượng.
Cha thông tin v kiu d liu, khóa, quan h bảng,... nhưng không phụ
thuc vào h qun tr cơ sở d liu c th.
Ví d: mô hình quan h, mô hình d liệu đối tượng.
3. Mô hình d liu mc vt lý (Physical data model)
Mô t ch lưu trữ d liệu trên phương tiện lưu trữ thc tế.
Ph thuc vào h qun tr cơ sở d liu.
Cha thông tin v bng, index, view, trigger,...
Như vậy các hình mc trừu tượng khác nhau phc v trong các giai
đon thiết kế cơ sở d liu.
Trình bày kiến trúc 3 mc ca 1 h cơ sở d liu
Kiến trúc 3 mc ca h cơ sở d liu bao gm:
1. External/Conceptual Level
Là mc trừu tượng cao nht, che giu chi tiết trin khai vt lý.
Mô t d liu dng các thc th và mi quan h gia chúng.
S dng mô hình E-R, UML để biu din.
Người dùng ch cn biết d liu mình cn, không cn quan tâm chi tiết
bên dưới.
lOMoARcPSD|36625228
2. Logical Level
Còn gi là conceptual-to-internal mapping.
Ánh x hình thc th-kết hp xung hình c th như quan hệ,
mng,...
Quy định rõ ràng trên cu trúc d liu.
3. Physical Level
Mô t ch lưu trữ vật lý trên phương tiện lưu trữ.
Ph thuc h qun tr csdl: cách lưu trữ file, index, bng,...
Tối ưu hiệu năng, tốc độ truy xut.
Như vậy, kiến trúc 3 mc giúp tách bit người dùng và d liu khi các chi tiết
triển khai phía dưới.
Cho thí d v kiến trúc 3 mc ca 1 h cơ s d liu
ới đây dụ minh ha kiến trúc 3 mc ca h sở d liu qun sinh
viŒn:
1. Mc Conceptual (mô hình E-R)
Thc th: SinhVien, Lop, MonHoc
Thuc tính: MSSV, HoTen, NgaySinh, MaLop, TenLop, MaMH, TenMH
Mi quan h: SinhVien theo hc Lop, Lop hc MonHoc
2. Mc Logical (mô hình quan h)
Bng SinhVien (MSSV, HoTen, NgaySinh, MaLop)
Bng Lop (MaLop, TenLop)
Bng MonHoc (MaMH, TenMH)
Khóa ngoi: SinhVien.MaLop tham chiếu Lop.MaLop
3. Mc Physical
lOMoARcPSD|36625228
SinhVien (file SV.dat, index MSSV) Lop (file Lop.dat, index MaLop)
MonHoc (file MH.dat, index MaMH)
Lưu trữ trên đĩa, tối ưu hóa truy xuất bng index.
Như vậy, t hình Conceptual, chúng ta ánh x xung hình Logical ri
xuống Physical để triển khai cơ sở d liu vt lý.
Tính độc lp d liu là gì ?
Tính độc lp d liu (Data Independence) là kh năng tách biệt lp truy cp d
liu của người dùng vi cấu trúc lưu trữ vật lý bên dưới. Có hai loại độc lp d
liu:
1. Độc lp logic (Logical Independence):
Người dùng không b nh hưng bởi thay đổi bên trong mô hình d liu
logic (VD: thay đổi schema).
Đảm bảo độc lp gia lp truy cp d liu vi mô hình d liu logic.
2. Độc lp vt lý (Physical Independence):
Người dùng không b nh hưng bởi thay đổi v cách lưu trữ vt lý (VD:
chuyn t file sang DBMS).
Đảm bảo độc lp gia mô hình d liu logic vi mô hình d liu vt lý.
Tính độc lp d liu giúp h thng tính m, d bo trì nâng cấp. Người
dùng và lp trình viên không cn quan tâm ti nhng thay đổi bên dưới.
Trình bày tính độc lp d liu vật lý và tính đc lp logic cho thí d
1. Tính độc lp d liu vt lý (Physical Independence):
Ví d:
Ban đầu d liệu lưu trữ i dng các file riêng l.
Sau này chuyn sang s dng h qun tr CSDL (VD: SQL Server) để lưu
tr d liu.
Những thay đổi v cách lưu trữ vt lý không ảnh hưởng tới người dùng. H vn
truy cp d liu thông qua giao diện như cũ.
2. Tính độc lp d liu logic (Logical Independence):
lOMoARcPSD|36625228
Ví d:
Ban đầu s dng mô hình d liu mạng để thiết kế CSDL.
Sau này chuyn sang mô hình quan h.
Những thay đổi v mô hình d liu logic không ảnh hưởng tới người dùng. H
vn truy vn d liu thông qua cùng giao din.
Như vậy, tính độc lp d liệu giúp người dùng không ph thuc vào các thay
đổi bên trong h thống, đem lại tính linh hot và d nâng cp.
| 1/11

Preview text:

lOMoARcPSD| 36625228
Giải thích khái niệm dữ liệu (data) và cho thí dụ
Dữ liệu (data) là một khái niệm cơ bản trong hệ quản trị cơ sở dữ liệu quan hệ (RDBMS).
Theo định nghĩa, dữ liệu là các sự kiện, hoạt động hay các ghi chép về một đối
tượng, sự vật nào đó mà người sử dụng muốn lưu trữ và quản lý trong hệ thống cơ sở dữ liệu.
Ví dụ: thông tin cá nhân của sinh viên, lịch sử mua hàng của khách hàng, thông
tin sản phẩm, doanh thu bán hàng hàng tháng, v.v.
Trong RDBMS, dữ liệu được tổ chức, lưu trữ và truy xuất dưới dạng các bảng có
quan hệ với nhau. Mỗi bảng chứa các bản ghi (record), mỗi bản ghi lưu trữ các
giá trị dữ liệu của một thực thể nào đó.
Ví dụ bảng SinhViên có các cột MSSV, HọTên, NgàySinh, Lớp, Khoa, đây là các
dữ liệu mô tả thông tin chi tiết của một sinh viên.
Một số đặc điểm của dữ liệu trong RDBMS:
• Dữ liệu được tổ chức thành các cột và hàng có cấu trúc rõ ràng.
• Dữ liệu không bị trùng lặp nhờ sử dụng khóa chính và các ràng buộc toàn vẹn.
• Dữ liệu được lưu trữ riêng biệt với các ứng dụng và bộ xử lý.
• Dữ liệu có quan hệ với nhau giữa các bảng thông qua khóa ngoại.
• Dữ liệu có thể truy vấn, thao tác và báo cáo linh hoạt thông qua ngôn ngữ SQL.
Như vậy, có thể thấy dữ liệu là thành phần cốt lõi, quan trọng nhất trong một
hệ thống quản trị cơ sở dữ liệu, là cơ sở để thực hiện các chức năng khác nhau của hệ thống.
Giải thích khái niệm thông tin (information)
Thông tin (information) là một khái niệm quan trọng trong khoa học máy tính và công nghệ thông tin.
Theo định nghĩa, thông tin là những dữ liệu đã được xử lý, tổ chức và trình bày
một cách có ý nghĩa, hữu ích cho người sử dụng. Thông tin mang lại giá trị và
lợi ích thiết thực cho người tiếp nhận nó. Ví dụ:
• Dữ liệu: Ngày 20/11/2022, hoá đơn BH29839, sản phẩm A, số lượng 10. lOMoARcPSD| 36625228
• Thông tin: Vào ngày 20/11/2022, đã bán được 10 sản phẩm A có trong hoá đơn BH29839.
Ta thấy, thông tin đã liên kết những dữ liệu lẻ tẻ thành một ý nghĩa có giá trị sử dụng rõ ràng hơn.
Một số đặc điểm của thông tin:
• Có tính cụ thể, rõ ràng, dễ hiểu.
• Đúng ngữ cảnh, phù hợp và liên quan tới người dùng.
• Đầy đủ, trung thực và chính xác.
• Cập nhật, kịp thời và sẵn sàng khi cần.
• Dễ truy nhập, tra cứu và sử dụng.
• Hỗ trợ ra quyết định và giải quyết vấn đề.
Như vậy, có thể thấy thông tin chính là kết quả của việc xử lý và tổ chức dữ liệu
sao cho có ý nghĩa và mang lại lợi ích thiết thực nhất cho người sử dụng. Thông
tin là nền tảng quan trọng để đưa ra các quyết định đúng đắn.
Định nghĩa về cơ sở dữ liệu
Cơ sở dữ liệu (database) là tập hợp các dữ liệu có tổ chức, được lưu trữ và truy
xuất một cách có hệ thống để phục vụ mục đích cụ thể. Cụ thể hơn:
• Cơ sở dữ liệu là tập hợp có cấu trúc các dữ liệu liên quan với nhau, được
lưu trữ trên máy tính để phục vụ nhu cầu tra cứu và sử dụng thông tin của người dùng.
• Cơ sở dữ liệu được thiết kế, tổ chức và quản lý bởi hệ quản trị cơ sở dữ liệu (DBMS).
• Dữ liệu trong cơ sở dữ liệu được mô tả, truy xuất và thao tác thông qua
một ngôn ngữ đặc biệt gọi là ngôn ngữ truy vấn (Query Language).
• Các ứng dụng của cơ sở dữ liệu rất phong phú, từ quản lý doanh nghiệp,
ngân hàng, bệnh viện, cho tới thương mại điện tử, mạng xã hội, v.v.
Như vậy, có thể hiểu cơ sở dữ liệu là nơi lưu trữ và quản lý dữ liệu một cách có
hệ thống phục vụ nhu cầu sử dụng thông tin trong các ứng dụng cụ thể. Cơ
sở dữ liệu là một thành phần không thể thiếu trong hệ thống thông tin hiện đại.
Định nghĩa về Hệ quản trị cơ sở dữ liệu (DBMS) lOMoARcPSD| 36625228
Hệ quản trị cơ sở dữ liệu (Database Management System - DBMS) là phần mềm
hệ thống được thiết kế để quản lý việc tạo lập, duy trì và sử dụng cơ sở dữ liệu. Cụ thể hơn:
• DBMS là phần mềm cho phép người dùng tạo, cập nhật, quản trị cơ sở
dữ liệu một cách thuận tiện và hiệu quả.
• DBMS quản lý việc truy cập, bảo mật và toàn vẹn dữ liệu.
• DBMS hỗ trợ ngôn ngữ truy vấn (SQL) để truy xuất dữ liệu một cách linh hoạt.
• Các chức năng chính của DBMS bao gồm: định nghĩa dữ liệu, truy vấn,
cập nhật, báo cáo, sao lưu phục hồi, đồng bộ hóa, v.v.
• Các DBMS phổ biến hiện nay là Oracle, MySQL, Microsoft SQL Server, PostgreSQL, MongoDB, v.v.
Như vậy, DBMS là phần mềm quan trọng, cho phép tạo lập và quản lý cơ sở dữ
liệu một cách hiệu quả. DBMS là “bộ não” của hệ thống quản trị cơ sở dữ liệu.
Liệt kê một số hệ quản trị cơ sở dữ liệu (DBMS) phổ biến
Dưới đây là một số hệ quản trị cơ sở dữ liệu (DBMS) phổ biến:
• Oracle: DBMS được sử dụng rộng rãi nhất, phù hợp cho các hệ thống lớn.
Cung cấp các tính năng bảo mật và độ tin cậy cao.
• MySQL: DBMS mã nguồn mở, phổ biến với các ứng dụng web và di động.
Hoạt động tốt trên nền tảng Linux.
• Microsoft SQL Server: DBMS của Microsoft, tích hợp tốt với các sản phẩm
Microsoft khác. Giao diện quản trị thân thiện.
• PostgreSQL: DBMS mã nguồn mở, mạnh mẽ và có độ tin cậy cao. Hỗ trợ
nhiều kiểu dữ liệu và chức năng mở rộng.
• MongoDB: DBMS dạng NoSQL, lưu trữ dữ liệu dạng document. Hoạt động
tốt với dữ liệu phi cấu trúc.
• Microsoft Access: DBMS nhỏ gọn, thường đi kèm với Office. Thích hợp với
các ứng dụng quy mô nhỏ.
• SQLite: DBMS nhỏ gọn, nhanh và đa nền tảng. Thường được tích hợp sẵn trong các ứng dụng.
Đây là một số DBMS tiêu biểu, phổ biến hiện nay. Mỗi DBMS có những ưu điểm
và nhược điểm riêng, phù hợp với những ứng dụng cụ thể. lOMoARcPSD| 36625228
Một hệ quản trị cơ sở dữ liệu (DBMS) thường bao gồm các thành phần nào ?
Một hệ quản trị cơ sở dữ liệu (DBMS) thường bao gồm các thành phần chính sau:
1. Ngôn ngữ định nghĩa dữ liệu (DDL): Ngôn ngữ cho phép định nghĩa cấu
trúc dữ liệu như tạo bảng, cột, khóa, giới hạn, mối quan hệ, chỉ mục, v.v.
Ngôn ngữ tiêu chuẩn là SQL.
2. Ngôn ngữ thao tác dữ liệu (DML): Ngôn ngữ cho phép thực hiện các thao
tác trên dữ liệu như chèn, cập nhật, xóa dữ liệu. Cũng sử dụng SQL.
3. Ngôn ngữ truy vấn (DQL): Ngôn ngữ cho phép truy vấn và truy xuất dữ
liệu từ cơ sở dữ liệu dưới dạng báo cáo. Sử dụng SQL.
4. Bộ xử lý truy vấn: Thành phần phân tích và xử lý các truy vấn, tối ưu hóa hiệu năng truy vấn.
5. Quản trị và kiểm soát: Quản lý người dùng, phân quyền truy cập, sao lưu
dữ liệu, phục hồi thảm họa, v.v.
6. Giao diện người dùng: Cho phép người dùng tương tác với DBMS thông
qua ứng dụng hoặc trình duyệt web.
7. Các dịch vụ và công cụ hỗ trợ: Hỗ trợ import/export dữ liệu, tạo báo cáo,
giám sát hệ thống, tối ưu hóa, v.v.
Như vậy, DBMS bao gồm nhiều thành phần khác nhau để đảm bảo quản lý và
vận hành cơ sở dữ liệu một cách hiệu quả.
Siêu dữ liệu (Metadata) là gì ?
Siêu dữ liệu (Metadata) là dữ liệu mô tả về dữ liệu. Cụ thể hơn:
• Siêu dữ liệu cung cấp thông tin về cấu trúc, đặc tính, quan hệ, nguồn gốc,
cách thức sử dụng. . của dữ liệu.
• Ví dụ siêu dữ liệu: tên bảng, tên cột, kiểu dữ liệu của cột, khóa chính, khóa
ngoại, giá trị mặc định, người tạo, thời gian tạo.. của các đối tượng trong cơ sở dữ liệu.
• Siêu dữ liệu giúp document hóa cơ sở dữ liệu, hiểu rõ nguồn gốc và ý nghĩa của dữ liệu. lOMoARcPSD| 36625228
• Siêu dữ liệu hỗ trợ tìm kiếm, truy xuất và phân tích dữ liệu một cách hiệu quả.
• Siêu dữ liệu thường được lưu trữ trong các thư viện siêu dữ liệu hoặc các
công cụ quản lý siêu dữ liệu.
Như vậy, siêu dữ liệu là "dữ liệu về dữ liệu", cung cấp các thông tin hữu ích để
làm việc hiệu quả với dữ liệu.
Chi tiết về 3 nhóm đối tượng chính là người sử dụng, quản trị viên
v nh phát triển, mỗi nhóm có vai trò v nhu cầu sử dụng khác nhau
đối với cơ sở dữ liệu

Có 3 loại đối tượng chính sử dụng cơ sở dữ liệu:
1. Người sử dụng cuối (End-user) • Là những người trực tiếp sử dụng
các ứng dụng của cơ sở dữ liệu.
• Thường chỉ được cấp quyền truy cập và sử dụng cụ thể vào các phần dữ liệu nhất định.
• Ví dụ: nhân viên bán hàng, kế toán, bác sĩ, giáo viên,. sử dụng các ứng dụng
cơ sở dữ liệu của công ty.
2. Quản trị cơ sở dữ liệu (Database Administrators) • Quản lý,
vận hành, bảo trì cơ sở dữ liệu và hệ thống DBMS. •
Quyết định cấu trúc dữ liệu, phân quyền, sao lưu dữ liệu, hiệu năng và bảo mật hệ thống. •
Cần có kiến thức chuyên sâu về cơ sở dữ liệu.
3. Lập trình viên ứng dụng (Application Developers) •
Phát triển các ứng dụng phần mềm tương tác với cơ sở dữ liệu. •
Sử dụng ngôn ngữ lập trình và các công cụ để truy cập, thao tác dữ liệu. •
Cần hiểu rõ mô hình dữ liệu và cách vận hành của cơ sở dữ liệu.
Như vậy có 3 nhóm đối tượng chính là người sử dụng, quản trị viên và nhà phát
triển, mỗi nhóm có vai trò và nhu cầu sử dụng khác nhau đối với cơ sở dữ liệu. •
Nêu nhiệm vụ của DBA, Database designer, System Analyst, lOMoARcPSD| 36625228
Application Programmer
Dưới đây là nhiệm vụ chính của một số đối tượng liên quan đến cơ sở dữ liệu:
1. DBA (Database Administrator - Quản trị cơ sở dữ liệu): •
Quản lý, cài đặt, nâng cấp hệ thống cơ sở dữ liệu. •
Kiểm soát và bảo mật dữ liệu. •
Sao lưu và phục hồi dữ liệu. •
Tối ưu hóa hiệu năng cơ sở dữ liệu. •
Giám sát và khắc phục sự cố.
2. Database Designer - Người thiết kế cơ sở dữ liệu: •
Phân tích yêu cầu nghiệp vụ của tổ chức. •
Thiết kế mô hình dữ liệu conceptual, logical, physical. •
Chuẩn hóa cơ sở dữ liệu, đảm bảo tính toàn vẹn. •
Lựa chọn công nghệ cơ sở dữ liệu phù hợp.
3. System Analyst - Chuyên viên phân tích hệ thống: •
Phân tích yêu cầu nghiệp vụ của khách hàng. •
Xác định yêu cầu dữ liệu cần thiết. •
Đưa ra khuyến nghị về giải pháp công nghệ. •
Lập kế hoạch và điều phối dự án.
4. Application Programmer - Lập trình viên ứng dụng: • X y dựng
chương trình ứng dụng tương tác với cơ sở dữ liệu. •
Sử dụng các công cụ và ngôn ngữ lập trình để kết nối và thao tác dữ liệu. •
Viết các câu truy vấn, cập nhật dữ liệu trong mã nguồn. •
Tối ưu hóa hiệu năng truy vấn và xử lý dữ liệu.
Như vậy mỗi vị trí đòi hỏi các kỹ năng và trách nhiệm khác nhau đối với cơ sở dữ liệu.
Mô hình dữ liệu (Data Model) là gì ? lOMoARcPSD| 36625228
Mô hình dữ liệu (Data Model) là một mô hình khái niệm (conceptual model)
được sử dụng để mô tả cấu trúc dữ liệu trong hệ thống cơ sở dữ liệu. Một số
đặc điểm của mô hình dữ liệu:
• Mô tả các đối tượng dữ liệu, mối quan hệ giữa chúng và các ràng buộc trên dữ liệu.
• Trừu tượng hóa dữ liệu, độc lập với hệ quản trị CSDL cụ thể.
• Cho phép nhìn nhận dữ liệu một cách logic, dễ hiểu và gần với thế giới thực.
• Là cơ sở để thiết kế cơ sở dữ liệu vật lý.
• Các mô hình dữ liệu thường dùng: mô hình thực thể - kết hợp (ER Model),
mô hình quan hệ (Relational Model), mô hình mạng (Network Model),. .
• Ngôn ngữ mô hình hóa dữ liệu phổ biến: UML (Unified Modeling Language).
Như vậy, mô hình dữ liệu là bước quan trọng trong thiết kế cơ sở dữ liệu, giúp
người thiết kế có cái nhìn tổng quát về dữ liệu trước khi xây dựng cấu trúc lưu trữ cụ thể. --------------
Mô hình dữ liệu (Data Model) là một mô hình trừu tượng mô tả cấu trúc dữ liệu
của hệ thống. Mô hình dữ liệu định nghĩa các đối tượng dữ liệu, mối quan hệ
giữa chúng và các ràng buộc trên dữ liệu. Một số loại mô hình dữ liệu phổ biến:
• Mô hình thực thể - kết hợp (ER Model): Sử dụng các thực thể, thuộc tính
và mối quan hệ để mô tả dữ liệu.
• Mô hình quan hệ (Relational Model): Dữ liệu được tổ chức thành các bảng có quan hệ với nhau.
• Mô hình cơ sở dữ liệu đối tượng (Object Database Model): Dựa trên mô
hình OOP với các lớp, đối tượng có quan hệ với nhau.
• Mô hình dữ liệu mạng (Network Model): Tổ chức dữ liệu thành các mối quan hệ có hướng.
• Mô hình dữ liệu nhân bản (Hierarchical Model): Dữ liệu có cấu trúc phân cấp, cây.
Mục đích của mô hình dữ liệu là cung cấp cái nhìn tổng quan về dữ liệu, từ đó
thiết kế cơ sở dữ liệu hoặc hệ thống lưu trữ, truy xuất dữ liệu một cách hiệu quả.
Giải thích 3 loại mô hình: mô hình mức khái niệm, mô hình dữ liệu
mức logic và mô hình dữ liệu mức vật lý lOMoARcPSD| 36625228
Ba loại mô hình dữ liệu chính trong thiết kế cơ sở dữ liệu là:
1. Mô hình dữ liệu mức khái niệm (Conceptual data model) •
Mô tả các thực thể, thuộc tính và mối quan hệ giữa chúng. •
Không chứa thông tin kỹ thuật cụ thể. •
Ví dụ: mô hình E-R, diagram lớp UML.
2. Mô hình dữ liệu mức logic (Logical data model) •
Mô tả dữ liệu dưới dạng mô hình dữ liệu cụ thể như mô hình quan hệ hoặc đối tượng. •
Chứa thông tin về kiểu dữ liệu, khóa, quan hệ bảng,. . nhưng không phụ
thuộc vào hệ quản trị cơ sở dữ liệu cụ thể. •
Ví dụ: mô hình quan hệ, mô hình dữ liệu đối tượng.
3. Mô hình dữ liệu mức vật lý (Physical data model) •
Mô tả cách lưu trữ dữ liệu trên phương tiện lưu trữ thực tế. •
Phụ thuộc vào hệ quản trị cơ sở dữ liệu. •
Chứa thông tin về bảng, index, view, trigger,. .
Như vậy các mô hình ở mức trừu tượng khác nhau và phục vụ trong các giai
đoạn thiết kế cơ sở dữ liệu. •
Trình bày kiến trúc 3 mức của 1 hệ cơ sở dữ liệu
Kiến trúc 3 mức của hệ cơ sở dữ liệu bao gồm: 1. External/Conceptual Level •
Là mức trừu tượng cao nhất, che giấu chi tiết triển khai vật lý. •
Mô tả dữ liệu ở dạng các thực thể và mối quan hệ giữa chúng. •
Sử dụng mô hình E-R, UML để biểu diễn. •
Người dùng chỉ cần biết dữ liệu mình cần, không cần quan tâm chi tiết bên dưới. lOMoARcPSD| 36625228 2. Logical Level •
Còn gọi là conceptual-to-internal mapping. •
Ánh xạ mô hình thực thể-kết hợp xuống mô hình cụ thể như quan hệ, mạng,. . •
Quy định rõ ràng trên cấu trúc dữ liệu. 3. Physical Level •
Mô tả cách lưu trữ vật lý trên phương tiện lưu trữ. •
Phụ thuộc hệ quản trị csdl: cách lưu trữ file, index, bảng,. . •
Tối ưu hiệu năng, tốc độ truy xuất.
Như vậy, kiến trúc 3 mức giúp tách biệt người dùng và dữ liệu khỏi các chi tiết triển khai phía dưới. •
Cho thí dụ về kiến trúc 3 mức của 1 hệ cơ sở dữ liệu
Dưới đây là ví dụ minh họa kiến trúc 3 mức của hệ cơ sở dữ liệu quản lý sinh viŒn:
1. Mức Conceptual (mô hình E-R) •
Thực thể: SinhVien, Lop, MonHoc •
Thuộc tính: MSSV, HoTen, NgaySinh, MaLop, TenLop, MaMH, TenMH •
Mối quan hệ: SinhVien theo học Lop, Lop học MonHoc
2. Mức Logical (mô hình quan hệ) •
Bảng SinhVien (MSSV, HoTen, NgaySinh, MaLop) • Bảng Lop (MaLop, TenLop) • Bảng MonHoc (MaMH, TenMH) •
Khóa ngoại: SinhVien.MaLop tham chiếu Lop.MaLop 3. Mức Physical lOMoARcPSD| 36625228
• SinhVien (file SV.dat, index MSSV) • Lop (file Lop.dat, index MaLop) •
MonHoc (file MH.dat, index MaMH) •
Lưu trữ trên ổ đĩa, tối ưu hóa truy xuất bằng index.
Như vậy, từ mô hình Conceptual, chúng ta ánh xạ xuống mô hình Logical rồi
xuống Physical để triển khai cơ sở dữ liệu vật lý. •
Tính độc lập dữ liệu là gì ?
Tính độc lập dữ liệu (Data Independence) là khả năng tách biệt lớp truy cập dữ
liệu của người dùng với cấu trúc lưu trữ vật lý bên dưới. Có hai loại độc lập dữ liệu:
1. Độc lập logic (Logical Independence): •
Người dùng không bị ảnh hưởng bởi thay đổi bên trong mô hình dữ liệu
logic (VD: thay đổi schema). •
Đảm bảo độc lập giữa lớp truy cập dữ liệu với mô hình dữ liệu logic.
2. Độc lập vật lý (Physical Independence):
• Người dùng không bị ảnh hưởng bởi thay đổi về cách lưu trữ vật lý (VD:
chuyển từ file sang DBMS).
• Đảm bảo độc lập giữa mô hình dữ liệu logic với mô hình dữ liệu vật lý.
Tính độc lập dữ liệu giúp hệ thống có tính mở, dễ bảo trì và nâng cấp. Người
dùng và lập trình viên không cần quan tâm tới những thay đổi bên dưới.
Trình bày tính độc lập dữ liệu vật lý và tính độc lập logic cho thí dụ
1. Tính độc lập dữ liệu vật lý (Physical Independence): Ví dụ:
• Ban đầu dữ liệu lưu trữ dưới dạng các file riêng lẻ.
• Sau này chuyển sang sử dụng hệ quản trị CSDL (VD: SQL Server) để lưu trữ dữ liệu.
Những thay đổi về cách lưu trữ vật lý không ảnh hưởng tới người dùng. Họ vẫn
truy cập dữ liệu thông qua giao diện như cũ.
2. Tính độc lập dữ liệu logic (Logical Independence): lOMoARcPSD| 36625228 Ví dụ:
• Ban đầu sử dụng mô hình dữ liệu mạng để thiết kế CSDL.
• Sau này chuyển sang mô hình quan hệ.
Những thay đổi về mô hình dữ liệu logic không ảnh hưởng tới người dùng. Họ
vẫn truy vấn dữ liệu thông qua cùng giao diện.
Như vậy, tính độc lập dữ liệu giúp người dùng không phụ thuộc vào các thay
đổi bên trong hệ thống, đem lại tính linh hoạt và dễ nâng cấp.