Chương 1:
1.
Công ty VNXX điều hành 10.000 chỗ làm việc máy tính.
Tình huống 1: Máy khách béo (PC) Công suất tiêu thụ trên mỗi máy tính để
bàn: 400watt Công suất tiêu thụ trên mỗi màn hình: 100 watt
Tình huống 2: Máy khách mỏng Tiêu thụ điện trên máy khách mỏng: 30 watt
Côngsuất tiêu thụ trên mỗi màn hình: 100 watt
Công suất tiêu thụ trên mỗi phiến máy chủ: 400 watt. Mỗi phiến máy chủ có đủ tài
nguyên để chạy 40 máy ảo.
Chi phí điện mỗi năm cho hoạt động 24/7 khi giá điện là 0,24 $ / kWh là bao nhiêu?
Tình huống 1:
0.24*10,000*(400+100)*24*365/1000 = 10,512,000 $
Tình huống 2:
0.24*10,000*(100+30)*24*365/1000 = 2,733,120 $
0.24*(10,000/40)*400*24*365/1000 =
210,240 $ => 2,733,120 + 210,240 = 2,943,360
$
2.
Hãy tưởng tượng bạn đã huấn luyện một con chim bồ câu mang một ổ USB có dung
lượng lưu trữ là 32 GB. Chim bồ câu có thể bay với tốc độ trung bình 72 km / h.
1. Đối với khoảng cách nào thì chim bồ câu tốc độ dữ liệu cao hơn so với mạng
máytính có tốc độ dữ liệu là 100 Mbps?
Đổi 72 km/h = 20 m/s
100Mb/s = 12.5 MB/s
Truyền 32GB
=> thời gian mạng máy tính truyền: 32*1024/12.5
=> thời gian chim bồ câu truyền: S/20 (với S là quãng đường cần tìm)
Để tốc độ dữ liệu của chim bồ câu cao hơn mạng máy tính truyền
t chim bồ câu < t mạng máy tính => S/20 < 32*1024/12.5 => S < 52428.8(m)
2. Câu trả lời của bạn thay đổi như thế nào, nếu tốc độ trung bình của chim bồ câu
là108 km / h?
Đổi 108 km/h = 30 m/s
=> thời gian chim bồ câu truyền: S/30
=> S/30 < 32*1024/12.5 => S < 78643.2 (m)
3. Câu trả lời của bạn thay đổi như thế nào, nếu dung lượng của USB tăng gấp đôi?
Truyền 64GB => thời gian mạng máy tính truyền: 64*1024/12.5
=> S/20 < 64*1024/12.5 => S < 104857.6 (m)
4. Câu trả lời của bạn thay đổi như thế nào, nếu tốc độ dữ liệu của mạng máy tính
tănggấp đôi?
Tốc độ mạng tăng gấp đôi => thời gian mạng máy tính truyền:
32*1024/25 => S/20 < 32*1024/25 => S < 26214.4 (m) 3.
1. Khách hàng thể chạy các phiên bản máy chủ ảo thậm chí lập ra các trung
tâmdữ liệu ảo thuộc loại dịch vụ đám mây nào? iaaS vì khách hàng có thể cài đặt
lại cấu hình
2. PaaS là gì và khách hàng có thể làm gì với nó?
Nền tảng một dịch vụ (PaaS) là hình điện toán đám mây trong đó nhà cung
cấp bên thứ ba cung cấp các công cụ phần cứng phần mềm thường những
công cụ cần thiết để phát triển ứng dụng – cho người dùng qua internet.
3. Kháchng sử dụng dịch vụ phần mềm cần những gì?
Có kết nối Internet, trình duyệt web, đăng ký dịch vụ
4. Sự khác biệt chính giữa dịch vụ Public và Private Cloud là gì?
5. Đám mây lai là gì?
Đám mây lai là sự kết hợp giữa các nền tảng điện toán đám mây, bao gồm một hay
nhiều nhà cung cấp dịch vụ đám mây công cộng (ví dự như Amazon hay Google)
với một nền tảng đám mây nội bộ được thiết kế riêng cho một tổ chức hoặc một cơ
sở hạ tầng IT của nhân. Đám mây công cộng đám mây nội bộ hoạt động độc
lập với nhau và giao tiếp thông qua kết nối được hóa để truyền tải dữ liệu ứng
dụng.
4.
1. Gán các danh mục dịch vụ đám mây này cho các lớp trong hình
PaaS
Cloud Gaming
Cloud Printing
IaaS
HPCaaS
HuaaS
Cloud Operating System
SaaS
2. Assign these cloud service offerings to the layers in the figure
Google App Engine → PaaS
Google Cloud Print → SaaS
Amazon Elastic Compute Cloud → IaaS
Amazon Mechanical Turk → SaaS
eyeOS → PaaS
EC2 Cluster Compute Instances → IaaS
Google Apps → SaaS
OnLive → SaaS
Cloud OS nên ném xuống PaaS nhé !
NGUỒN CHỖ NÀY KO UY N ĐÂU
NHA
Một số dụ về dịch vụ PaaS: Đám mây SAP, Microsoft Azure,
Heroku, AWS Lambda, Công cụ ứng dụng của Google, Dokku, Nền tảng
đám mây Apprenda, Pivotal Cloud Foundry, Tia chớp Salesforce, IBM
Cloud Foundry, Red Hat OpenShift, Nền tảng đám mây Oracle, Zoho
Creator, Wasabi,Cloudways
Một số dụ về dịch vụ IaaS: Máy chủ Cherry, Microsoft
Azure,
Dịch vụ web của Amazon, InMotionHosting Flex Metal Cloud, Cơ sở hạ
tầng đám mây của Google, Đám mây của IBM, Vultr, shạ tầng đám
mây Oracle, Digital Ocean, ServerCentral, Dây buộc, Đám mây Alibaba,
Rackspace Open Cloud, Hewlett Packard Enterprise, Công nghệ đám
mây xanh, Đám mây CenturyLink, Đám mây doanh nghiệp của Hitachi
Một số ví dụ về dịch vụ SaaS:
Salesforce
Google Workspace apps
Microsoft 365
HubSpot
Trello
Netflix
Zoom
Zendesk
DocuSign
Slack
Adobe Creative Cloud
Shopify
Mailchimp
Chương 2:
1. Nêu các đặc điểm cơ bản của Hadoop?
Hadoop có một bộ xử lý gọi là hệ thống xử lý dữ liệu phân tán, có 1 máy chính gọi
là Master và nhiều máy nhỏ hơn gọi là Node. Khi yêu cầu một tác vụ như lưu trữ
dữ liệu, xử lý hoặc đọc dữ liệu thì máy Master sẽ đưa yêu cầu đến các Node nhỏ
hơn, tách yêu cầu thành nhiều phần để xử lý. Và sau đó kết quả sẽ được trả về cho
Master và đưa về người dùng.
Hadoop có 2 lớp chính:
Lớp xử lý/tính toán (MapReduce)
MapReduce một hình lập trình để thhiện các phép tính phân tán qua hàng
trăm hoặc hàng ngàn máy chủ trong một cụm Hadoop.
Lớp lưu trữ (HDFS)
- Điều này thể hiểu như sau:
Nếu như có
một cụm Hadoop trong đó bao
gồm 20 máy tính thì bạn chỉ cần đưa một file dữ liệu vào HDFS. Khi đó, thì file sẽ
tự động được chia nhỏ thành nhiều phần rồi được lưu trữ ở 20 máy tính đó.
- HDFS cho phép tính toán và phân tán
song song: Thay chỉ sdụng một
máy để xử công việc, thì với HDFS
thì bạn thể để c máy hoạt động
song song để xử chung một công
việc để tiết kiệm thời gian.
- HDFS cho phép nhân bản các file:
Đặc điểm này sẽ giúp bạn đề phòng
được các trường hợp một máy tính
trong cụm Hadoop phát sinh sự cố thì
dữ liệu sẽ được backup lại không
bị mất.
- HDFS thể mở rộng theo chiều dọc:
Lúc này, bạn sẽ nhiệm vụ nâng cấp
cho các hthống bằng cách tăng cấu
hình cho máy tính lên. Tính năng này
còn được gọi là Scale Up hay Vertical
scaling.
- HDFS sở hữu khả năng mở rộng hệ
thống theo chiều ngang: Đặc điểm này
nghĩa rằng, bạn không cần phải
nâng cấp cho phần cứng chỉ cần
mua thêm một chiếc máy tính mới để
chia svới chiếc máy hiện tại được.
2. Trong HDFS, data node là gì
Data node lưu trữ truy xuất c khối khi chúng được yêu cầu (bởi Client hoặc
Name node). Trong nội bộ, một tệp được chia thành một hoặc nhiều khối các khối
này được lưu trữ trong một tập hợp các nút dữ liệu.
Datanode sẽ là nơi lưu trữ các file dữ liệu mà bạn đưa vào.
HDFS cho phép dữ liệu có thể phân tán:
3. Tại sao trong HDFS, kích thước block thường rất lớn?
Big data là những tập dliệu rất lớn, đơn vị thuộc tầm Terabytes hay Petabytes. Vậy
nếu kích thước của block mà nhỏ tầm 4KB thì một file dữ liệu đưa vào HDFS sẽ bị
chia thành rất nhiều các block, điều này cũng cho các file metadata namenode
phình to hơn. Và đương nhiên điều này khiến việc quản lý metadata khó khăn hơn.
4. Một hệ thống HDFS hệ số sao chép (replication factor) 4, kích thước
block là 128MB. Client ghi 1 file có kích thước 1.2GB vào hệ thống HDFS.
a. Tính số block để chứa file đó
1.2 GB = 1228.8 MB
Số block để chứa 1.2 GB là: 1228.8/128= 10 (block)
Vì hệ số sao chép là 4 nên số block để chứa file là: 10 * 4 = 40 block
b. Tính kích thước không gian lưu trữ HDFS dùng để chứa file đó
Kích thước: 40 * 128 = 5120 MB = 5 GB
c. Tính lượng dữ liệu truyền trên mạng khi thực hiện ghi file đó.
Khi client ghi file vào datanode 1,2 GB sẽ được truyền vào. 4 bản sao datanode
nên sẽ có 4 lần ghi.
Khi đó lượng dữ liệu truyền trên mạng khi thực hiện khi file trên là:
1,2 * 1024 * 4 = 4915.2 MB
5. Một hệ thống HDFS có hệ số sao chép (replication factor) là 3, kích thước block
là 128MB. 1 file test.txt kích thước 640MB được lưu như sau
Các datanode client được nối với nhau qua switch 1Gbps. Tốc độ đọc/ghi đĩa
cứng của Datanode là 40MB/s. Hãy tính thời gian nhỏ nhất có thể để client đọc file
test.txt từ hệ thống này.
Kích thước file 640 MB = 5 block 128 MB. 4 datanode tốc độ đọc file khi đọc
song song là 160 MB/s. Tốc độ mạng là 1 Gbps = 128 MB/s.
- Giai đoạn 1: Đọc song song 4 block 1, 2, 4, 5 trên node 1, 2, 3, 4
Block 1, 2, 4 đọc xong và truyền xong trong: 128/40 = 3.2 s
- Giai đoạn 2: Đọc song song block 3 và phần còn lại của block 5 trên 2
node khác nhau: 128/40 = 3.2 s Tổng là 6.4 s
Chương 3:
1. Nêu các thành phần cơ bản của thuật toán MapReduce.
Thành phần cơ bản của thuật toán MapReduce:
- Map: nhận đầu vào một đối tương có khoá (k,v) và trả về một loạt các
cặpkhoá-giá trị: (k1,v1), (k2,v2),…., (kn,vn)
- Khung chức năng tập hợp tất cả các cặp có cùng khoá k và liên kết với
tất cảcác giá trị của k: (k, [v1,….,vn]
- Reduce: nhận đầu vào khoá danh sách các giá trị (k, [v1,…,vn])
và kếthợp chúng bằng cách nào đó.
2. Thiết kế thuật toán MapReduce đếm xem có bao nhiêu từ có độ dài nhất định
tồn tại trong một tập các file text.
Map: key = độ dài của từ, value = 1
Reduce: key không đổi, value = tổng của các value
3. Thiết kế thuật toán MapReduce để tìm trong một tập các file text danh sách
các file chứa từ “Hello”.
Map: file có chữ “Hello” thì key = 1 và value = tên file.
Reduce: key không đổi, value = nối chuỗi các value và ngăn cách bởi dấu “-”.
Chương 4:
1. Nêu các thành phần cơ bản của định lý CAP.
Định CAP: Một hệ thống phân tán chỉ thể được hai trong 3 đặc
tính mong muốn: tính nhất quán (Consistency), tính khả dụng
(Availability), Chịu lỗi phân vùng ( Partition tolerance) Các thành phần
bản:
- Tính nhất quán (Consistency):
+ Tất cả các bản sao đều chứa cùng một phiên bản dữ liệu
+ Khách hàng luôn có cùng cái nhìn về dữ liệu (bất kể nút
nào) - Khả dụng (Availability):
+ Hệ thống vẫn hoạt động khi bị lỗi giao điểm
+ Tất cả các khách hàng luôn có thể đọc và viết
- Chịu lỗi phân vùng (Partition tolerance)
+ nhiều điểm truy cập
+ Hệ thống vẫn hoạt động trên hệ thống bị phân chia (sự cố vtruyền
thông)
+ Hệ thống hoạt động tốt trên toàn bộ vật lý phân vùng mạng
2. So sánh NoSQL và SQL
So sánh SQL và NoSQL
Tham số
SQL
NoSQL
Định nghĩa
Cơ sở dữ liệu SQL chủ yếu
được gọi là RDBMS hoặc Cơ
sở dữ liệu quan hệ
Cơ sở dữ liệu NoSQL chủ yếu
được gọi là cơ sở dữ liệu không
liên quan hoặc phân tán
Design for
RDBMS truyền thống sử dụng
cú pháp và truy vấn SQL để
phân tích và lấy dữ liệu để có
thêm thông tin chi tiết. Chúng
được sử dụng cho các hệ
thống OLAP.
Hệ thống cơ sở dữ liệu NoSQL
bao gồm nhiều loại công nghệ cơ
sở dữ liệu khác nhau. Các cơ sở
dữ liệu này được phát triển để
đáp ứng nhu cầu trình bày cho sự
phát triển của ứng dụng hiện đại.
Ngôn ngữ
Query
Structured query language
(SQL)
Không có ngôn ngữ query
Type
SQL databases là cơ sở dữ
liệu dựa trên bảng
NoSQL databases có thể dựa
trên tài liệu, cặp khóa-giá trị, cơ
sở dữ liệu biểu đồ
Schema
SQL databases có lược đồ
được xác định trước
NoSQL databases sử dụng lược
đồ động cho dữ liệu phi cấu trúc.
Khả năng
mở rộng
SQL databases có thể mở rộng
theo chiều dọc
NoSQL databases có thể mở
rộng theo chiều ngang
Ví dụ
Oracle, Postgres, and
MSSQL.
MongoDB, Redis, , Neo4j,
Cassandra, Hbase.
Phù hợp
cho
Đây là 1 lựa chọn lý tưởng
cho môi trường truy vấn phức
tạp
Không phù hợp với truy vấn
phức tạp
Tham số
SQL
NoSQL
Lưu trữ dữ
liệu phân
cấp
SQL databases không thích
hợp cho việc lưu trữ dữ liệu
phân cấp.
Phù hợp hơn cho kho lưu trữ dữ
liệu phân cấp vì nó hỗ trợ
phương thức cặp khóa-giá trị.
Variations
Một loại có biến thể nhỏ
Nhiều loại khác nhau bao gồm
các kho khóa-giá trị, cơ sở dữ
liệu tài liệu và cơ sở dữ liệu đồ
thị.
Tính nhất
quán
Nó phải được cấu hình cho sự
nhất quán chặt chẽ.
Nó phụ thuộc vào DBMS như
một số cung cấp tính nhất quán
mạnh mẽ như MongoDB, trong
khi những người khác cung cấp
chỉ cung cấp sự nhất quán cuối
cùng, như Cassandra.
Được sử
dụng tốt
nhất cho
RDBMS database là tùy chọn
thích hợp để giải quyết các
vấn đề về ACID.
NoSQL được sử dụng tốt nhất để
giải quyết các vấn đề về tính khả
dụng của dữ liệu
Tầm quan
trọng
Nó nên được sử dụng khi hiệu
lực dữ liệu là siêu quan trọng
Sử dụng khi nó quan trọng hơn
để có dữ liệu nhanh hơn dữ liệu
chính xác
Lựa chọn
tốt nhất
Khi bạn cần hỗ trợ truy vấn
động
Sử dụng khi bạn cần mở rộng
quy mô dựa trên yêu cầu thay
đổi
Hardware
Specialized DB hardware
(Oracle Exadata, etc.)
Commodity hardware
Network
Highly available network
(Infiniband, Fabric Path, etc.)
Commodity network (Ethernet,
etc.)
Loại lưu trữ
Highly Available Storage
(SAN, RAID, etc.)
Commodity drives storage
(standard HDDs, JBOD)
Tính năng
Hỗ trợ đa nền tảng, Bảo mật
Dễ sử dụng, hiệu suất cao và
Tham số
SQL
NoSQL
tốt nhất
và miễn phí
công cụ linh hoạt.
Mô hình
ACID và
BASE
ACID (Atomicity, nhất quán,
cách ly và độ bền) là một
chuẩn cho RDBMS
Cơ bản (Về cơ bản có sẵn, trạng
thái mềm, phù hợp cuối cùng) là
một mô hình của nhiều hệ thống
NoSQL
Performanc
e
SQL hoạt động tốt và nhanh
thì việc design tốt là cực kì
quan trọng và ngược lại.
Nhanh hơn SQL NoSQL thì
denormalized cho phép bạn lấy
được tất cả thông tin về một item
cụ thể với các condition mà
không cần JOIN liên quan hoặc
truy vấn SQL phức tạp.
Kết luận
Dự án đã có yêu cầu dữ liệu rõ
ràng xác định quan hệ logic có
thể được xác định trước.
Phù hợp với những dự án yêu
cầu dữ liệu không liên quan, khó
xác định, đơn giản mềm dẻo khi
đang phát triển
Ngắn gọn: NoSQL so với SQL:
- Giản đồ định nghĩa dữ liệu lỏng lẻo
- Các ứng dụng được viết để xử lý các tài liệu/dữ liệu cụ thể-
Được thiết kế để xử lý các cơ sở dữ liệu lớn, phân tán - Đánh
đổi:
+ Không hỗ trợ mạnh mẽ cho các truy vấn đặc biệt nhưng được thiết kế
cho tốc độ và sự phát triển của cơ sở dữ liệu.
🡪 Ngôn ngữ truy vấn thông qua API
+ Các đặc tính ACID được nới lỏng
3. 1 tập hợp sao chép trong mongodb có 7 phần tử: 1 chính, 6 phụ. Người dung
cần ghi 1 file dữ liệu 2GB vào tập hợp theo chế độ w:majority. Tốc độ
truyền dữ liệu mạng 1Gbps. Tốc độ ghi của đĩa cứng 50MB/s. Hãy
tính thời gian ngắn nhất để ghi thành công file trên.
Thời gian truyền dữ liệu đến
primary 2GB = 2*8 Gb/ (1Gbs)
= 16 s //xoá nhớ đính kèm lý
do nhá.
Thời gian ghi vào primary:
2GB = 2 .2^10 (MB)/ 50MB = 40.96 s
quá trình truyền ghi diễn ra song song nên thời gian truyền ghi
dữ liệu vào các phần tử sẽ là 40.96 s.
Theo chế độ w:majority nên chỉ cần phần lớn phần tử xác nhận ghi thành
công (4/7) nên thời gian ngắn nhất:
40.96*4 = 163.84 s
Chương 5:
1. Cân bằng tải là gì?
Cân bằng tải hay còn gọi Load Balancing, một phương pháp phân
phối khối lượng tải trên nhiều máy tính hoặc một cụm máy tính để có thể
sử dụng tối ưu các nguồn lực, tối đa hóa thông lượng, giảm thời gian đáp
ứng và tránh tình trạng quá tải trên máy chủ.
2. Round-robin có trọng số
Trọng số được chỉ định cho mỗi máy chủ dựa trên các tiêu chí do quản trị viên trang
web chọn; tiêu chí được sử dụng phổ biến nhất là khả năng xử lý lưu lượng truy cập
của máy chủ. Trọng số càng cao, tỷ lệ yêu cầu máy khách máy chủ nhận được
càng lớn. Ví dụ: nếu máy chủ A được chỉ định trọng số 3 và máy chủ B có trọng
số 1, bộ cân bằng tải sẽ chuyển tiếp 3 yêu cầu đến máy chủ A cho mỗi yêu cầu
nó gửi đến máy chủ B.
Một cluster có 3 máy chủ A, B, C với trọng số tương ứng la 4, 3, 2. Có 180 request
đến bộ cân bằng tải. Hãy tính số request phân phối cho các máy chủ dùng thuật toán
Roundrobin có trọng số.
Số request/1 đơn vị trọng số là: 180/(4+3+2)= 20 (request/1 đơn vị trọng
số) Số request phân phối cho các máy chủ là:
A: 4*20 = 80 request
B: 3*20 = 60 request
C: 2*20 = 40 request
3. Một cluster có 3 máy chủ A, B, C với số connection đang xử lý tương ứng 433,
413, 403. 180 request đến bộ cân bằng tải. y tính số request phân phối cho các
máy chủ dùng thuật toán least connection.
Trung bình request nhận được của mỗi máy là:
(433 + 413 + 403 + 180)/3 = 476 (dư 1 request)
Số request phân phối về các máy chủ dùng thuật toán least connection là:
A: 476 – 433 = 43 (request)
B: 476 – 413 = 63 (request)
C: 476 – 403 = 73 (request) 🡪 bổ sung thêm 1 request dư 🡪 74 request
4. Trọng số được chỉ định cho mỗi máy chủ dựa trên các tiêu chí do quản trị viên
trang web chọn; tiêu chí được sử dụng phổ biến nhất khả năng xử lưu lượng
truy cập của máy chủ. Trọng số càng cao, tỷ lệ yêu cầu máy khách y chủ nhận
được càng lớn. Ví dụ: nếu máy chủ A được chỉ định trọng số 3 máy chủ B
trọng số là 1, bộ cân bằng tải sẽ chuyển tiếp 3 yêu cầu đến máy chủ A cho mỗi yêu
cầu mà nó gửi đến máy chủ B.
Một cluster có 3 lop máy chủ A, B, C với trọng số tương ứng la 4, 3, 2.
Lớp A: 3 máy; Lớp B: 4 máy; Lớp C: 2 máy
Số request cho mỗi đợt phân tải: 10, 15, 20, 14, 17, 30, 22, 13.
Đề xuất một thuật toán phân tải sao cho cuối cùng thì tải cân
bằng
Chương 6:
1. Nguy cơ mất kiểm soát là gì?
● Người tiêu dùng mất kiểm soát
- Dữ liệu, ứng dụng, tài nguyên được định vị với nhà cung cấp
- Quản lý danh tính người dùng do đám mây xử lý
- Các quy tắc kiểm soát quyền truy cập của người dùng, chính sách bảo
mật và việc thực thi được quản lý bởi nhà cung cấp đám mây
- Người tiêu dùng tin tưởng vào nhà cung cấp để đảm bảo
+ Bảo mật dữ liệu và quyền riêng tư
+ Nguồn lực sẵn có
+ Giám sát và sửa chữa các dịch vụ / tài nguyên
1. Nêu các giải pháp giải quyết sự thiếu tin tưởng.
Ngôn ngữ chính sách
Người tiêu dùng có nhu cầu bảo mật cụ thể nhưng không có ý nghĩa về
cách họ được xử lý
■ Nhà cung cấp đang làm cái quái gì cho tôi vậy?
Hiện tại, người tiêu dùng không thể đưa ra các yêu cầu của họ cho
nhà cung cấp (SLA là một phía)
○ Ngôn ngữ chuẩn để truyền đạt các chính sách và kỳ vọng của một người
■ Được sự đồng ý và ủng hộ của cả hai bên
■ Ngôn ngữ tiêu chuẩn để trình bày SLA
thể được sử dụng trong môi trường nội bộ đám mây để thực
hiện tư thế bảo mật bao trùm
○ Tạo ngôn ngữ chính sách với các đặc điểm sau:
■ Máy có thể hiểu được (hoặc ít nhất là có thể xử lý),
■ Dễ dàng kết hợp / hợp nhất và so sánh
dụ về các tuyên bố chính sách là, “yêu cầu cách ly giữa các
máy o”, “yêu cầu cách ly địa giữa các máy ảo”, “yêu cầu tách
biệt thực tế giữa các cộng đồng / người thuê khác trong cùng
ngành,” v.v.
Cần một công cụ xác thực để kiểm tra xem chính sách được tạo
bằng ngôn ngữ chuẩn phản ánh chính xác ý định của người
tạo chính sách hay không (nghĩa là ngôn ngchính sách tương
đương về mặt ngữ nghĩa với ý định của người dùng).
Chứng nhận
Chứng nhận
Một số hình thức đánh g tả uy tín, độc lập, thể so
sánh được và các tính năng bảo mật và đảm bảo
Sarbanes-Oxley, DIACAP, DISTCAP, v.v. (chúng đủ cho môi
trường đám mây không?)
○ Đánh giá rủi ro
Thực hiện bởi các bên thứ ba được chứng nhận
Cung cấp cho người tiêu dùng sự đảm bảo bổ
sung
3. 1 ví nhận diện người dùng có các thông tin sau:
Tên, ngày-tháng-năm sinh, username, password, email, tel, address, tax code, credit
card, job, office, marital status.
Xác định các thông tin cần thiết cho các dịch vụ sau:
- Web mail : email
- Google meet: tên , email
- Shopee customer: address, tel, tên
- Shopee seller: tên, tax code
- Facebook: email
Bài thi giữa kì:

Preview text:

Chương 1: 1.
Công ty VNXX điều hành 10.000 chỗ làm việc máy tính. •
Tình huống 1: Máy khách béo (PC) Công suất tiêu thụ trên mỗi máy tính để
bàn: 400watt Công suất tiêu thụ trên mỗi màn hình: 100 watt •
Tình huống 2: Máy khách mỏng Tiêu thụ điện trên máy khách mỏng: 30 watt
Côngsuất tiêu thụ trên mỗi màn hình: 100 watt
Công suất tiêu thụ trên mỗi phiến máy chủ: 400 watt. Mỗi phiến máy chủ có đủ tài
nguyên để chạy 40 máy ảo.
Chi phí điện mỗi năm cho hoạt động 24/7 khi giá điện là 0,24 $ / kWh là bao nhiêu? Tình huống 1:
0.24*10,000*(400+100)*24*365/1000 = 10,512,000 $ Tình huống 2:
0.24*10,000*(100+30)*24*365/1000 = 2,733,120 $
0.24*(10,000/40)*400*24*365/1000 =
210,240 $ => 2,733,120 + 210,240 = 2,943,360 $ 2.
Hãy tưởng tượng bạn đã huấn luyện một con chim bồ câu mang một ổ USB có dung
lượng lưu trữ là 32 GB. Chim bồ câu có thể bay với tốc độ trung bình 72 km / h.
1. Đối với khoảng cách nào thì chim bồ câu có tốc độ dữ liệu cao hơn so với mạng
máytính có tốc độ dữ liệu là 100 Mbps? Đổi 72 km/h = 20 m/s 100Mb/s = 12.5 MB/s Truyền 32GB
=> thời gian mạng máy tính truyền: 32*1024/12.5
=> thời gian chim bồ câu truyền: S/20 (với S là quãng đường cần tìm)
Để tốc độ dữ liệu của chim bồ câu cao hơn mạng máy tính truyền
⇔ t chim bồ câu < t mạng máy tính => S/20 < 32*1024/12.5 => S < 52428.8(m)
2. Câu trả lời của bạn thay đổi như thế nào, nếu tốc độ trung bình của chim bồ câu là108 km / h? Đổi 108 km/h = 30 m/s
=> thời gian chim bồ câu truyền: S/30
=> S/30 < 32*1024/12.5 => S < 78643.2 (m)
3. Câu trả lời của bạn thay đổi như thế nào, nếu dung lượng của ổ USB tăng gấp đôi?
Truyền 64GB => thời gian mạng máy tính truyền: 64*1024/12.5
=> S/20 < 64*1024/12.5 => S < 104857.6 (m)
4. Câu trả lời của bạn thay đổi như thế nào, nếu tốc độ dữ liệu của mạng máy tính tănggấp đôi?
Tốc độ mạng tăng gấp đôi => thời gian mạng máy tính truyền:
32*1024/25 => S/20 < 32*1024/25 => S < 26214.4 (m) 3.
1. Khách hàng có thể chạy các phiên bản máy chủ ảo và thậm chí lập ra các trung
tâmdữ liệu ảo thuộc loại dịch vụ đám mây nào? iaaS vì khách hàng có thể cài đặt lại cấu hình
2. PaaS là gì và khách hàng có thể làm gì với nó?
Nền tảng là một dịch vụ (PaaS) là mô hình điện toán đám mây trong đó nhà cung
cấp bên thứ ba cung cấp các công cụ phần cứng và phần mềm – thường là những
công cụ cần thiết để phát triển ứng dụng – cho người dùng qua internet.
3. Khách hàng sử dụng dịch vụ phần mềm cần những gì?
Có kết nối Internet, trình duyệt web, đăng ký dịch vụ
4. Sự khác biệt chính giữa dịch vụ Public và Private Cloud là gì? 5. Đám mây lai là gì?
Đám mây lai là sự kết hợp giữa các nền tảng điện toán đám mây, bao gồm một hay
nhiều nhà cung cấp dịch vụ đám mây công cộng (ví dự như Amazon hay Google)
với một nền tảng đám mây nội bộ được thiết kế riêng cho một tổ chức hoặc một cơ
sở hạ tầng IT của tư nhân. Đám mây công cộng và đám mây nội bộ hoạt động độc
lập với nhau và giao tiếp thông qua kết nối được mã hóa để truyền tải dữ liệu và ứng dụng. 4.
1. Gán các danh mục dịch vụ đám mây này cho các lớp trong hình • PaaS • Cloud Gaming • Cloud Printing • IaaS • HPCaaS • HuaaS • Cloud Operating System • SaaS
2. Assign these cloud service offerings to the layers in the figure
• Google App Engine → PaaS
• Google Cloud Print → SaaS
• Amazon Elastic Compute Cloud → IaaS
• Amazon Mechanical Turk → SaaS • eyeOS → PaaS
• EC2 Cluster Compute Instances → IaaS • Google Apps → SaaS • OnLive → SaaS
Cloud OS nên ném xuống PaaS nhé !
NGUỒN CHỖ NÀY KO UY TÍN ĐÂU NHA
Một số ví dụ về dịch vụ PaaS: Đám mây SAP, Microsoft Azure,
Heroku, AWS Lambda, Công cụ ứng dụng của Google, Dokku, Nền tảng
đám mây Apprenda, Pivotal Cloud Foundry, Tia chớp Salesforce, IBM
Cloud Foundry, Red Hat OpenShift, Nền tảng đám mây Oracle, Zoho Creator, Wasabi,Cloudways

Một số ví dụ về dịch vụ IaaS: Máy chủ Cherry, Microsoft Azure,
Dịch vụ web của Amazon,InMotionHosting Flex Metal Cloud, Cơ sở hạ
tầng đám mây của Google, Đám mây của IBM, Vultr, Cơ sở hạ tầng đám
mây Oracle, Digital Ocean, ServerCentral, Dây buộc, Đám mây Alibaba,
Rackspace Open Cloud, Hewlett Packard Enterprise, Công nghệ đám
mây xanh, Đám mây CenturyLink, Đám mây doanh nghiệp của Hitachi
Một số ví dụ về dịch vụ SaaS: ● Salesforce
● Google Workspace apps ● Microsoft 365 ● HubSpot ● Trello ● Netflix ● Zoom ● Zendesk ● DocuSign ● Slack
● Adobe Creative Cloud ● Shopify ● Mailchimp Chương 2: 1.
Nêu các đặc điểm cơ bản của Hadoop?
Hadoop có một bộ xử lý gọi là hệ thống xử lý dữ liệu phân tán, có 1 máy chính gọi
là Master và nhiều máy nhỏ hơn gọi là Node. Khi yêu cầu một tác vụ như lưu trữ
dữ liệu, xử lý hoặc đọc dữ liệu thì máy Master sẽ đưa yêu cầu đến các Node nhỏ
hơn, tách yêu cầu thành nhiều phần để xử lý. Và sau đó kết quả sẽ được trả về cho
Master và đưa về người dùng. Hadoop có 2 lớp chính:
Lớp xử lý/tính toán (MapReduce)
MapReduce là một mô hình lập trình để thể hiện các phép tính phân tán qua hàng
trăm hoặc hàng ngàn máy chủ trong một cụm Hadoop.
Lớp lưu trữ (HDFS)
HDFS cho phép dữ liệu có thể phân tán: -
Điều này có thể hiểu như sau: Nếu như có
một cụm Hadoop mà trong đó bao
gồm 20 máy tính thì bạn chỉ cần đưa một file dữ liệu vào HDFS. Khi đó, thì file sẽ
tự động được chia nhỏ thành nhiều phần rồi được lưu trữ ở 20 máy tính đó. -
HDFS cho phép tính toán và phân tán
song song: Thay vì chỉ sử dụng một
máy để xử lý công việc, thì với HDFS
thì bạn có thể để các máy hoạt động
song song để xử lý chung một công
việc để tiết kiệm thời gian. -
HDFS cho phép nhân bản các file:
Đặc điểm này sẽ giúp bạn đề phòng
được các trường hợp một máy tính
trong cụm Hadoop phát sinh sự cố thì
dữ liệu sẽ được backup lại mà không bị mất. -
HDFS có thể mở rộng theo chiều dọc:
Lúc này, bạn sẽ có nhiệm vụ nâng cấp
cho các hệ thống bằng cách tăng cấu
hình cho máy tính lên. Tính năng này
còn được gọi là Scale Up hay Vertical scaling. -
HDFS sở hữu khả năng mở rộng hệ
thống theo chiều ngang: Đặc điểm này
có nghĩa rằng, bạn không cần phải
nâng cấp cho phần cứng mà chỉ cần
mua thêm một chiếc máy tính mới để
chia sẻ với chiếc máy hiện tại là được. 2. Trong HDFS, data node là gì
Data node lưu trữ và truy xuất các khối khi chúng được yêu cầu (bởi Client hoặc
Name node). Trong nội bộ, một tệp được chia thành một hoặc nhiều khối và các khối
này được lưu trữ trong một tập hợp các nút dữ liệu.
Datanode sẽ là nơi lưu trữ các file dữ liệu mà bạn đưa vào. 3.
Tại sao trong HDFS, kích thước block thường rất lớn?
Big data là những tập dữ liệu rất lớn, đơn vị thuộc tầm Terabytes hay Petabytes. Vậy
nếu kích thước của block mà nhỏ tầm 4KB thì một file dữ liệu đưa vào HDFS sẽ bị
chia thành rất nhiều các block, điều này cũng là cho các file metadata ở namenode
phình to hơn. Và đương nhiên điều này khiến việc quản lý metadata khó khăn hơn. 4.
Một hệ thống HDFS có hệ số sao chép (replication factor) là 4, kích thước
block là 128MB. Client ghi 1 file có kích thước 1.2GB vào hệ thống HDFS. a.
Tính số block để chứa file đó 1.2 GB = 1228.8 MB
Số block để chứa 1.2 GB là: 1228.8/128= 10 (block)
Vì hệ số sao chép là 4 nên số block để chứa file là: 10 * 4 = 40 block b.
Tính kích thước không gian lưu trữ HDFS dùng để chứa file đó
Kích thước: 40 * 128 = 5120 MB = 5 GB c.
Tính lượng dữ liệu truyền trên mạng khi thực hiện ghi file đó.
Khi client ghi file vào datanode 1,2 GB sẽ được truyền vào. Có 4 bản sao có datanode nên sẽ có 4 lần ghi.
Khi đó lượng dữ liệu truyền trên mạng khi thực hiện khi file trên là: 1,2 * 1024 * 4 = 4915.2 MB
5. Một hệ thống HDFS có hệ số sao chép (replication factor) là 3, kích thước block
là 128MB. 1 file test.txt kích thước 640MB được lưu như sau
Các datanode và client được nối với nhau qua switch 1Gbps. Tốc độ đọc/ghi đĩa
cứng của Datanode là 40MB/s. Hãy tính thời gian nhỏ nhất có thể để client đọc file
test.txt từ hệ thống này.
Kích thước file 640 MB = 5 block 128 MB. Có 4 datanode tốc độ đọc file khi đọc
song song là 160 MB/s. Tốc độ mạng là 1 Gbps = 128 MB/s.
- Giai đoạn 1: Đọc song song 4 block 1, 2, 4, 5 trên node 1, 2, 3, 4
Block 1, 2, 4 đọc xong và truyền xong trong: 128/40 = 3.2 s
- Giai đoạn 2: Đọc song song block 3 và phần còn lại của block 5 trên 2
node khác nhau: 128/40 = 3.2 s Tổng là 6.4 s Chương 3: 1.
Nêu các thành phần cơ bản của thuật toán MapReduce.
Thành phần cơ bản của thuật toán MapReduce:
- Map: nhận đầu vào một đối tương có khoá (k,v) và trả về một loạt các
cặpkhoá-giá trị: (k1,v1), (k2,v2),…., (kn,vn)
- Khung chức năng tập hợp tất cả các cặp có cùng khoá k và liên kết với
tất cảcác giá trị của k: (k, [v1,….,vn]
- Reduce: nhận đầu vào là khoá và danh sách các giá trị (k, [v1,…,vn])
và kếthợp chúng bằng cách nào đó. 2.
Thiết kế thuật toán MapReduce đếm xem có bao nhiêu từ có độ dài nhất định
tồn tại trong một tập các file text.
Map: key = độ dài của từ, value = 1
Reduce: key không đổi, value = tổng của các value 3.
Thiết kế thuật toán MapReduce để tìm trong một tập các file text danh sách
các file chứa từ “Hello”.
Map: file có chữ “Hello” thì key = 1 và value = tên file.
Reduce: key không đổi, value = nối chuỗi các value và ngăn cách bởi dấu “-”. Chương 4: 1.
Nêu các thành phần cơ bản của định lý CAP.
Định lý CAP: Một hệ thống phân tán chỉ có thể có được hai trong 3 đặc
tính mong muốn: tính nhất quán (Consistency), tính khả dụng
(Availability), Chịu lỗi phân vùng ( Partition tolerance) Các thành phần cơ bản:
- Tính nhất quán (Consistency):
+ Tất cả các bản sao đều chứa cùng một phiên bản dữ liệu
+ Khách hàng luôn có cùng cái nhìn về dữ liệu (bất kể nút
nào) - Khả dụng (Availability):
+ Hệ thống vẫn hoạt động khi bị lỗi giao điểm
+ Tất cả các khách hàng luôn có thể đọc và viết
- Chịu lỗi phân vùng (Partition tolerance) + nhiều điểm truy cập
+ Hệ thống vẫn hoạt động trên hệ thống bị phân chia (sự cố về truyền thông)
+ Hệ thống hoạt động tốt trên toàn bộ vật lý phân vùng mạng 2. So sánh NoSQL và SQL So sánh SQL và NoSQL Tham số SQL NoSQL
Định nghĩa Cơ sở dữ liệu SQL chủ yếu
Cơ sở dữ liệu NoSQL chủ yếu
được gọi là RDBMS hoặc Cơ được gọi là cơ sở dữ liệu không sở dữ liệu quan hệ liên quan hoặc phân tán Design for
RDBMS truyền thống sử dụng Hệ thống cơ sở dữ liệu NoSQL
cú pháp và truy vấn SQL để
bao gồm nhiều loại công nghệ cơ
phân tích và lấy dữ liệu để có sở dữ liệu khác nhau. Các cơ sở
thêm thông tin chi tiết. Chúng dữ liệu này được phát triển để
được sử dụng cho các hệ
đáp ứng nhu cầu trình bày cho sự thống OLAP.
phát triển của ứng dụng hiện đại. Ngôn ngữ Structured query language Không có ngôn ngữ query Query (SQL) Type
SQL databases là cơ sở dữ
NoSQL databases có thể dựa liệu dựa trên bảng
trên tài liệu, cặp khóa-giá trị, cơ sở dữ liệu biểu đồ Schema
SQL databases có lược đồ
NoSQL databases sử dụng lược
được xác định trước
đồ động cho dữ liệu phi cấu trúc. Khả năng
SQL databases có thể mở rộng NoSQL databases có thể mở mở rộng theo chiều dọc rộng theo chiều ngang Ví dụ Oracle, Postgres, and MongoDB, Redis, , Neo4j, MSSQL. Cassandra, Hbase. Phù hợp
Đây là 1 lựa chọn lý tưởng
Không phù hợp với truy vấn cho
cho môi trường truy vấn phức phức tạp tạp Tham số SQL NoSQL
Lưu trữ dữ SQL databases không thích
Phù hợp hơn cho kho lưu trữ dữ liệu phân
hợp cho việc lưu trữ dữ liệu
liệu phân cấp vì nó hỗ trợ cấp phân cấp.
phương thức cặp khóa-giá trị. Variations
Một loại có biến thể nhỏ
Nhiều loại khác nhau bao gồm
các kho khóa-giá trị, cơ sở dữ
liệu tài liệu và cơ sở dữ liệu đồ thị. Tính nhất
Nó phải được cấu hình cho sự Nó phụ thuộc vào DBMS như quán nhất quán chặt chẽ.
một số cung cấp tính nhất quán
mạnh mẽ như MongoDB, trong
khi những người khác cung cấp
chỉ cung cấp sự nhất quán cuối cùng, như Cassandra. Được sử
RDBMS database là tùy chọn NoSQL được sử dụng tốt nhất để dụng tốt
thích hợp để giải quyết các
giải quyết các vấn đề về tính khả nhất cho vấn đề về ACID. dụng của dữ liệu Tầm quan
Nó nên được sử dụng khi hiệu Sử dụng khi nó quan trọng hơn trọng
lực dữ liệu là siêu quan trọng
để có dữ liệu nhanh hơn dữ liệu chính xác Lựa chọn
Khi bạn cần hỗ trợ truy vấn
Sử dụng khi bạn cần mở rộng tốt nhất động
quy mô dựa trên yêu cầu thay đổi Hardware Specialized DB hardware Commodity hardware (Oracle Exadata, etc.) Network Highly available network Commodity network (Ethernet,
(Infiniband, Fabric Path, etc.) etc.)
Loại lưu trữ Highly Available Storage Commodity drives storage (SAN, RAID, etc.) (standard HDDs, JBOD) Tính năng
Hỗ trợ đa nền tảng, Bảo mật
Dễ sử dụng, hiệu suất cao và Tham số SQL NoSQL tốt nhất và miễn phí công cụ linh hoạt. Mô hình
ACID (Atomicity, nhất quán, Cơ bản (Về cơ bản có sẵn, trạng ACID và
cách ly và độ bền) là một
thái mềm, phù hợp cuối cùng) là BASE chuẩn cho RDBMS
một mô hình của nhiều hệ thống NoSQL
Performanc SQL hoạt động tốt và nhanh Nhanh hơn SQL NoSQL thì e
thì việc design tốt là cực kì
denormalized cho phép bạn lấy
quan trọng và ngược lại.
được tất cả thông tin về một item
cụ thể với các condition mà
không cần JOIN liên quan hoặc truy vấn SQL phức tạp. Kết luận
Dự án đã có yêu cầu dữ liệu rõ Phù hợp với những dự án yêu
ràng xác định quan hệ logic có cầu dữ liệu không liên quan, khó
thể được xác định trước.
xác định, đơn giản mềm dẻo khi đang phát triển
Ngắn gọn: NoSQL so với SQL:
- Giản đồ định nghĩa dữ liệu lỏng lẻo
- Các ứng dụng được viết để xử lý các tài liệu/dữ liệu cụ thể-
Được thiết kế để xử lý các cơ sở dữ liệu lớn, phân tán - Đánh đổi:
+ Không hỗ trợ mạnh mẽ cho các truy vấn đặc biệt nhưng được thiết kế
cho tốc độ và sự phát triển của cơ sở dữ liệu.
🡪 Ngôn ngữ truy vấn thông qua API
+ Các đặc tính ACID được nới lỏng
3. 1 tập hợp sao chép trong mongodb có 7 phần tử: 1 chính, 6 phụ. Người dung
cần ghi 1 file dữ liệu 2GB vào tập hợp theo chế độ w:majority. Tốc độ
truyền dữ liệu mạng là 1Gbps. Tốc độ ghi của đĩa cứng là 50MB/s. Hãy
tính thời gian ngắn nhất để ghi thành công file trên.
Thời gian truyền dữ liệu đến primary 2GB = 2*8 Gb/ (1Gbs)
= 16 s //xoá nhớ đính kèm lý do nhá. Thời gian ghi vào primary:
2GB = 2 .2^10 (MB)/ 50MB = 40.96 s
Vì quá trình truyền và ghi diễn ra song song nên thời gian truyền và ghi
dữ liệu vào các phần tử sẽ là 40.96 s.
Theo chế độ w:majority nên chỉ cần phần lớn phần tử xác nhận ghi thành
công (4/7) nên thời gian ngắn nhất: 40.96*4 = 163.84 s Chương 5: 1.
Cân bằng tải là gì?
Cân bằng tải hay còn gọi là Load Balancing, là một phương pháp phân
phối khối lượng tải trên nhiều máy tính hoặc một cụm máy tính để có thể
sử dụng tối ưu các nguồn lực, tối đa hóa thông lượng, giảm thời gian đáp
ứng và tránh tình trạng quá tải trên máy chủ. 2.
Round-robin có trọng số
Trọng số được chỉ định cho mỗi máy chủ dựa trên các tiêu chí do quản trị viên trang
web chọn; tiêu chí được sử dụng phổ biến nhất là khả năng xử lý lưu lượng truy cập
của máy chủ. Trọng số càng cao, tỷ lệ yêu cầu máy khách mà máy chủ nhận được
càng lớn. Ví dụ: nếu máy chủ A được chỉ định trọng số là 3 và máy chủ B có trọng
số là 1, bộ cân bằng tải sẽ chuyển tiếp 3 yêu cầu đến máy chủ A cho mỗi yêu cầu mà
nó gửi đến máy chủ B.
Một cluster có 3 máy chủ A, B, C với trọng số tương ứng la 4, 3, 2. Có 180 request
đến bộ cân bằng tải. Hãy tính số request phân phối cho các máy chủ dùng thuật toán Roundrobin có trọng số.
Số request/1 đơn vị trọng số là: 180/(4+3+2)= 20 (request/1 đơn vị trọng
số) Số request phân phối cho các máy chủ là: A: 4*20 = 80 request B: 3*20 = 60 request C: 2*20 = 40 request
3. Một cluster có 3 máy chủ A, B, C với số connection đang xử lý tương ứng là 433,
413, 403. Có 180 request đến bộ cân bằng tải. Hãy tính số request phân phối cho các
máy chủ dùng thuật toán least connection.
Trung bình request nhận được của mỗi máy là:
(433 + 413 + 403 + 180)/3 = 476 (dư 1 request)
Số request phân phối về các máy chủ dùng thuật toán least connection là: A: 476 – 433 = 43 (request) B: 476 – 413 = 63 (request)
C: 476 – 403 = 73 (request) 🡪 bổ sung thêm 1 request dư 🡪 74 request
4. Trọng số được chỉ định cho mỗi máy chủ dựa trên các tiêu chí do quản trị viên
trang web chọn; tiêu chí được sử dụng phổ biến nhất là khả năng xử lý lưu lượng
truy cập của máy chủ. Trọng số càng cao, tỷ lệ yêu cầu máy khách mà máy chủ nhận
được càng lớn. Ví dụ: nếu máy chủ A được chỉ định trọng số là 3 và máy chủ B có
trọng số là 1, bộ cân bằng tải sẽ chuyển tiếp 3 yêu cầu đến máy chủ A cho mỗi yêu
cầu mà nó gửi đến máy chủ B.
Một cluster có 3 lop máy chủ A, B, C với trọng số tương ứng la 4, 3, 2.
Lớp A: 3 máy; Lớp B: 4 máy; Lớp C: 2 máy
Số request cho mỗi đợt phân tải: 10, 15, 20, 14, 17, 30, 22, 13.
Đề xuất một thuật toán phân tải sao cho cuối cùng thì tải cân bằng Chương 6:
1. Nguy cơ mất kiểm soát là gì?
● Người tiêu dùng mất kiểm soát
- Dữ liệu, ứng dụng, tài nguyên được định vị với nhà cung cấp
- Quản lý danh tính người dùng do đám mây xử lý
- Các quy tắc kiểm soát quyền truy cập của người dùng, chính sách bảo
mật và việc thực thi được quản lý bởi nhà cung cấp đám mây
- Người tiêu dùng tin tưởng vào nhà cung cấp để đảm bảo
+ Bảo mật dữ liệu và quyền riêng tư + Nguồn lực sẵn có
+ Giám sát và sửa chữa các dịch vụ / tài nguyên
1. Nêu các giải pháp giải quyết sự thiếu tin tưởng. ● Ngôn ngữ chính sách
○ Người tiêu dùng có nhu cầu bảo mật cụ thể nhưng không có ý nghĩa về cách họ được xử lý
■ Nhà cung cấp đang làm cái quái gì cho tôi vậy?
■ Hiện tại, người tiêu dùng không thể đưa ra các yêu cầu của họ cho
nhà cung cấp (SLA là một phía)
○ Ngôn ngữ chuẩn để truyền đạt các chính sách và kỳ vọng của một người
■ Được sự đồng ý và ủng hộ của cả hai bên
■ Ngôn ngữ tiêu chuẩn để trình bày SLA
■ Có thể được sử dụng trong môi trường nội bộ đám mây để thực
hiện tư thế bảo mật bao trùm
○ Tạo ngôn ngữ chính sách với các đặc điểm sau:
■ Máy có thể hiểu được (hoặc ít nhất là có thể xử lý),
■ Dễ dàng kết hợp / hợp nhất và so sánh
■ Ví dụ về các tuyên bố chính sách là, “yêu cầu cách ly giữa các
máy ảo”, “yêu cầu cách ly địa lý giữa các máy ảo”, “yêu cầu tách
biệt thực tế giữa các cộng đồng / người thuê khác trong cùng ngành,” v.v.
■ Cần một công cụ xác thực để kiểm tra xem chính sách được tạo
bằng ngôn ngữ chuẩn có phản ánh chính xác ý định của người
tạo chính sách hay không (nghĩa là ngôn ngữ chính sách tương
đương về mặt ngữ nghĩa với ý định của người dùng). ● Chứng nhận ○ Chứng nhận
■ Một số hình thức đánh giá và mô tả có uy tín, độc lập, có thể so
sánh được và các tính năng bảo mật và đảm bảo
■ Sarbanes-Oxley, DIACAP, DISTCAP, v.v. (chúng có đủ cho môi trường đám mây không?) ○ Đánh giá rủi ro
■ Thực hiện bởi các bên thứ ba được chứng nhận
■ Cung cấp cho người tiêu dùng sự đảm bảo bổ sung 3.
1 ví nhận diện người dùng có các thông tin sau:
Tên, ngày-tháng-năm sinh, username, password, email, tel, address, tax code, credit
card, job, office, marital status.
Xác định các thông tin cần thiết cho các dịch vụ sau: - Web mail : email - Google meet: tên , email -
Shopee customer: address, tel, tên - Shopee seller: tên, tax code - Facebook: email Bài thi giữa kì: