Bộ câu hỏi trắc nghiệm ôn tập Big Data môn Tin học | Trường đại học kinh doanh và công nghệ Hà Nội

Mục tiêu của NoSQL là gì?A. NoSQL cung cấp một giải pháp thay thế cho cơ sở dữ liệu SQL để lưu trữ dữ liệu dạng văn bản. B. Cơ sở dữ liệu NoSQL cho phép lưu trữ dữ liệu không có cấu trúc. C. NoSQL không thích hợp để lưu trữ dữ liệu có cấu trúc. D. NoSQL là một định dạng dữ liệu mới để lưu trữ các tập dữ liệu lớn. Tài liệu giúp bạn tham  khảo, ôn tập và đạt kết quả cao. Mời đọc đón xem!

lOMoARcPSD| 48599919
CÂU HỎI ÔN TẬP BIG DATA
1
Dữ liệu của Big Data là loại nào ?
A. Structured Data
B. Semi-Structured Data
C. Unstructured Data
D. Tất cả
Đăc trưng nào không phải của Big Data
A. Volume
B. Variety
C. Vision
D. Velocity
NoSQL là ?
A. Database
B. Field
C. Document
D. Collection
Mục tiêu của NoSQL là gì?
A. NoSQL cung cấp một giải pháp thay thế cho cơ sở dữ liệu SQL ể lưu trữ dữ
liệu dạng văn bản.
B. Cơ sở dữ liệu NoSQL cho phép lưu trữ dữ liệu không có cấu trúc.
C. NoSQL không thích hợp ể lưu trữ dữ liệu có cấu trúc.
D. NoSQL là một ịnh dạng dữ liệu mới ể lưu trữ các tập dữ liệu lớn.
Cloudera phát triển công cụ nào ?
A. HCatalog
B. Hbase
C. Imphala
D. Oozie
Loại nào không phải là CSDL NoSQL ?
A. SQL Server
B. MongoDB
C. Cassandra
D. Không có
lOMoARcPSD| 48599919
Đâu là một kiểu của CSDL NoSQL
A. SQL
B. Document databases
C. JSON
D. Tất cả
Chọn úng 5 ặc trưng cho Big Data ?
A. Volume, Velocity, Variety, Veracity, Value
B. Volume, Videos, Velocity, Variability, Value
C. Volume, Variability, Veracity, Visualization, Value
D. Volume, Velocity, Veracity, Visualization, Value
Velocity (Tốc ộ) là ặc trưng nói về?
A. Tốc ộ gia tăng khối lượng dữ liệu lớn
B. Tốc ộ cập nhật dữ liệu lớn
C. Tốc ộ xử lý dữ liệu lớn
D. Tốc ộ lưu trữ dữ liệu lớn
Variety (Tính a dạng) là ặc trưng về ?
A. Kiểu dữ liệu thu thập
B. Kiểu nội dung dữ liệu
C. Nguồn thu thập dữ liệu
D. Phương thức xử lý dữ liệu
11
Đặc trưng quan trọng nhất của Big Data?
A. Khối lượng
B. Tính a dạng
C. Tốc ộ
D. Tất cả
Đâu là ặc trưng quyết việc triển khai Dữ liệu lớn?
A. Khối lượng
B. Giá trị
C. Tốc Độ
D. Tính a dạng
Tích hợp dữ liệu là quá trình ?
A. Kết hợp các dữ liệu không ồng nhất từ nhiều nguồn khác nhau
B. Sao chép dữ liệu vào CSDL hệ thống ể tiến hành phân tích
lOMoARcPSD| 48599919
C. Làm sạch các dữ liệu thu thập ược từ các hệ thống thành phần
D. Tăng giá trị từ các tài nguyên dữ liệu ang lưu trữ phân tán
Thuật ngữ Thuật ngữ Dữ liệu lớn ra ời năm nào?
A. 1997
B. 2000
C. 1998
D. 1941
Các dạng thức khoa học dữ liệu của Jim Gray?
A. Thực
nghiệm
B. Lý thuyết
C. Tính
toán
D. Tất cả các ý
Phát biểu nào không phải dạng thức nghiên cứu Khoa học dữ liệu của Jim Gray?
A. Khai thác dữ liệu
B. Mô phỏng
C. Tính toán
D. Thực nghiệm
Đâu không phải là phương thức xử lý dữ liệu lớn?
A. Thu thập (acquire) B.
Đánh giá (reviews) C.
Tổ chức (organize) D.
Phân tích (analyze)
RDBMS là gì ?
A. Relational Database Management System
B. Relat Data Management System
C. Relational Database Microsoft System
D. Tất cả
Thị trường Big Data bao gồm:
A. Phần cứng B.
Phần Mềm
C. Tất cả
D. Dịch vụ
lOMoARcPSD| 48599919
Nhược iểm của tích hợp dữ liệu theo phương pháp Tight Coupling
A. Độ trễ
B. Phản hồi truy vấn
C. Phụ thuộc vào nguồn dữ liệu
D. Tất cả
21
Nhược iểm của tích hợp dữ liệu theo phương pháp Loose Coupling
A. Tất cả
B. Chi phí cao
C. Độ trễ
D. Phụ thuộc mạng / băng thông
Công cụ nào hỗ trợ tốt NoSQL?
A. SAP Data Services
B. Oracle Data Integrator
C. SQL Server Integration Services
D. Tất cả
Công cụ tích hợp dữ liệu Boomi là của?
A. Dell
B. IBM
C. Microsoft
D. SAP
Công cụ SQL Server Integrator do ai phát triển ?
A. Oracle
B. IBM
C. Microsoft
D. SAP
SAP Data Service là công cụ ể làm gì ?
A. Lưu trữ dữ liệu
B. Tích hợp dữ liệu
C. Phân tích dữ liệu
D. Tất cả
Hệ quản trị CSLD DynamoDB là kiểu nào ?
A. Key value
lOMoARcPSD| 48599919
B. Wide Column based
C. Document based
D. Graph based
Hệ quản trị CSLD MongoDB là kiểu nào ?
A. Document based
B. Key value
C. Wide Column based
D. Graph based
Hệ quản trị CSLD Neo4J là kiểu nào ?
A. Key value
B. Wide Column based
C. Document based
D. Graph based
Hệ quản trị CSLD IBM Graph là kiểu nào ?
A. Key value
B. Document based
C. Graph based
D. Wide Column based
Hệ quản trị CSLD Google Big Table là kiểu nào ?
A. Key value
B. Wide Column based
C. Document based
D. Graph based
31
Đâu không phải là RDBMS ?
A. IBM DB2
B. MS SQL Server
C. MS Access
D. Cassandra
Loại nào là dữ liệu Bán cấu trúc ?
A. Tất cả
B. JSON
lOMoARcPSD| 48599919
C. CSV
D. XML
Loại nào là dữ liệu Unstructured ?
A. Video
B. XML
C. Table
D. Tất cả
Yếu tố nào quyết ịnh ể sử dụng NoSQL
A. Tốc ộ gia tăng CSDL
B. Tính a dạng của dữ liệu C.
Tốc ộ truy cập dữ liệu
D. Tất cả
CSDL nào không phải kiểu Key-Value:
A. MongoDB
B. DynamoDB
C. Redis
D. Riak
CSDL nào không phải kiểu Document:
A. MongoDB
B. CouchDB
C. Elasticsearch
D. Riak
CSDL nào không phải kiểu Graph:
A. InfoGrid
B. Hbase
C. InfiniteGraph
D. IBM Graph
CSDL nào không phải kiểu Wide-Column:
A. Hbase
B. Cassandra
C. BigTable
D. Dex
lOMoARcPSD| 48599919
Ưu iểm của hệ thống HDFS là gì ?
A. Lưu trữ phân tán, xử lý song song, khả năng chịu lỗi cao
B. Lưu trữ song song, xử lý phân tán, tính sẵn sàng cao
C. Xử lý phân tán song song, khả năng chịu lỗi chấp nhận sai sót
D. Tất cả
Ưu iểm của DFS là gì ?
A. Hệ thống lưu trữ song song nên tránh ược ảnh hưởng khi một máy chủ hoặc
bộ nhớ bị lỗi
B. Hệ thống ược sao lưu tại Server thứ hai nên ảm bảo việc cung cấp dữ liệu C.
Khi một máy chủ hoặc bộ nhớ bị lỗi, hệ thống tệp phân tán vẫn ảm bảo
thể cung cấp dữ liệu ổn ịnh
D. Tất cả
41
Ưu iểm của công nghệ Cluster
A. Tất cả
B. Hiệu quả chi p
C. TÍnh sẵn sàng cao
D. Khả năng mở rộng linh hoạt
Cluster node có mấy loại ?
A. 1
B. 2
C. 3
D. 4
Nguồn của kiến trúc HDFS trong Hadoop có nguồn gốc là
A. Hệ thống tệp phân phối của Google
B. Hệ thống tệp phân tán của Yahoo
C. Hệ thống tệp phân tán của Facebook
D. Hệ thống tệp phân tán Azure
Loại dữ liệu mà Hadoop có thể xử lý là
A. Structred (Có cấu trúc)
B. Semi-structured (Bán cấu trúc)
C. Unstructured (Không có cấu trúc)
D. All of the above (Tất cả những iều trên)
YARN là viết tắt của
lOMoARcPSD| 48599919
A. Yahoo’s another resource name
B. Yet another resource negotiator
C. Yahoo’s archived Resource
names
D. Yet another resource need.
Điều nào sau ây không phải là mục tiêu của HDFS?
A. Phát hiện lỗi và khôi phục B.
Xử lý tập dữ liệu khổng lồ C.
Ngăn chặn việc xóa dữ liệu
D. Cung cấp băng thông mạng cao ể di chuyển dữ liệu
Trong HDFS, các tệp không thể
A. Đọc
B. Xóa
C. Thực thi
D. Lưu trữ
So với RDBMS, Hadoop
A. Có tính toàn vẹn dữ liệu cao hơn.
B. Có giao dịch ACID không C. Thích
hợp ể ọc và truy vấn nhanh
D. Hoạt ộng tốt hơn trên dữ liệu phi cấu trúc và bán cấu trúc.
Vấn ề chính gặp phải khi ọc và ghi dữ liệu song song từ nhiều ĩa là gì? A. Xử
lý khối lượng lớn dữ liệu nhanh hơn.
B. Kết hợp dữ liệu từ nhiều ĩa.
C. Phần mềm cần thiết ể thực hiện nhiệm vụ này là cực kỳ tốn kém.
D. Phần cứng cần thiết ể thực hiện tác vụ này là cực kỳ tốn kém.
Tính năng ịnh vị dữ liệu trong Hadoop có nghĩa là A.
lưu trữ cùng một dữ liệu trên nhiều nút.
B. chuyển vị trí dữ liệu từ nút này sang nút khác.
C. ồng ịnh vị dữ liệu với các nút tính toán.
D. Phân phối dữ liệu trên nhiều nút.
51
Các tệp HDFS ược thiết kế cho
A. Nhiều người viết và sửa ổi ở các hiệu số tùy ý.
B. Chỉ nối vào cuối tệp.
C. Chỉ ghi thành tệp một lần.
lOMoARcPSD| 48599919
D. Truy cập dữ liệu có ộ trễ thấp.
Hệ thống Apache Hadoop ược viết bằng ngôn ngữ nào?
A. C ++
B. Python
C. Java
D. Go
Cái nào không phải là một trong ặc trưng 3Vs của dữ liệu lớn?
A. Vận tốc - Velocity
B. Tính xác thực - Veracity
C. Khối lượng - Volume
D. Đa dạng - Variety
Điều nào sau ây úng ối với Hadoop? A.
Đây là một khung phân tán.
B. Thuật toán chính ược sử dụng trong ó là Map Reduce.
C. Nó chạy có thể thực thi trên hạ tầng Cloud Computing.
D. Tất cả ều úng
Loại nào sau ây lưu trữ dữ liệu?
A. Name node
B. Data node
C. Master node
D. Không có
Node nào sau ây quản lý các nút khác?
A. Name node
B. Data node
C. Slave node
D. Tất cả
Hadoop xử lý khối lượng lớn dữ liệu như thế nào?
A. Hadoop sử dụng song song rất nhiều máy. Điều này tối ưu hóa việc xử lý
dữ liệu.
B. Hadoop ược thiết kế ặc biệt ể xử lý lượng lớn dữ liệu bằng cách tận dụng
phần cứng MPP.
C. Hadoop gửi mã ến dữ liệu thay vì gửi dữ liệu ến mã.
D. Hadoop sử dụng các kỹ thuật bộ nhớ ệm phức tạp trên NameNode ể tăng tốc
ộ xử lý dữ liệu.
lOMoARcPSD| 48599919
MapReduce do công ty nào phát triển ?
A. Apache
B. Google
C. IBM
D. Amazon
Dịch vụ ám mây nào hỗ trợ tốt cho Big Data ?
A. Amazon AWS
B. Google Cloud
C. Tất cả
D. Microsoft Azure
Nhược iểm khi triển khai Big Data trên nền tảng Cloud Computing là?
A. Nhiều rủi ro cho hệ thống B. Không có ý úng
C. Tốc ộ xử lý không ảm bảo
D. Phân tích theo thời gian thực kém
61
Mô hình Điện toán ám mây IaaS ?
A. Cơ sở hạ tầng dưới dạng dịch vụ
B. Nền tảng dưới dạng dịch vụ
C. Phần mềm dưới dạng dịch vụ
D. Internet dưới dạng dịch vụ
Mô hình Điện toán ám mây PaaS ?
A. Cơ sở hạ tầng dưới dạng dịch vụ
B. Nền tảng dưới dạng dịch vụ
C. Phần mềm dưới dạng dịch vụ
D. Internet dưới dạng dịch vụ
Mô hình Điện toán ám mây SaaS ?
A. Cơ sở hạ tầng dưới dạng dịch vụ
B. Nền tảng dưới dạng dịch vụ
C. Phần mềm dưới dạng dịch vụ
D. Internet dưới dạng dịch vụ
Lợi ích của Cloud Computing với Big Data là ?
A. Triển khai hạ tầng nhanh chóng B.
Phân tích theo thời gian thực
lOMoARcPSD| 48599919
C. Tối ưu chi phí duy trì hoạt ộng
D. Tất cả
Lợi ích vượt trội của Cloud Computing với Big Data là ?
A. Hạn chế ầu tư máy móc B.
Phân tích theo thời gian thực
C. Tối ưu chi phí duy trì hoạt ộng
D. Tất cả
Dịch vụ lưu trữ dữ của Amazon – AWS là?
A. Amazon S3
B. Amazon RDS
C. Amazon Lambda
D. EC2
Dịch vụ lưu trữ của Microsoft Azure là ?
A. Virtual Machines
B. Azure Function
C. Azure Disk Storage
D. Azure Cosmos DB
Dịch vụ lưu trữ của Google Cloud Platfom là?
A. Google Driver
B. Goolge Functions
C. Google Cloud Storage
D. Google Cloud Datastore
Đám mây AWS cung cấp dịch vụ NoSQL Database
A. Amazon RDS
B. Amazon EC2
C. Amazon DynamoDB
D. Amazon Container Service
Đám mây Microsoft Azure cung cấp dịch vụ NoSQL Database
A. Table Storage
B. SQL DB
C. Azure Functions
D. Cloud Service
lOMoARcPSD| 48599919
71
Dịch vụ tích hợp dữ liệu trên ám mây trên Google Cloud Platform
A. Google Cloud Dataprep
B. Google Cloud Data Fusion
C. Google Data Catalog
D. Google BigQuery
Dịch vụ thông minh giúp khái phá, làm sạch dữ liệu trên Google Cloud Platform
A. Goolge Functions
B. Google BigQuery
C. Google Cloud Dataprep
D. Google Data Catalog
Trên Google Cloud Platform dịch vụ nào quản lý CSDL NoQuery
A. Google Cloud Dataprep
B. Google Data Catalog
C. Google BigQuery
D. Cloud Bigtable
Trên Google Cloud Platform dịch vụ nào quản lý danh mục dữ liệu
A. Google Data Catalog
B. Google Cloud Dataprep
C. Google Data Catalog
D. Google BigQuery
Trên Google Cloud Platform dịch vụ phân tích dữ liệu ược cung cấp
A. Google Data Catalog
B. Google BigQuery
C. Google Cloud Dataprep
D. Goolge Functions
Nền tảng Cloudera hỗ trợ hệ CSDL quan hệ nào?
A. MySQL
B. Oracle
C. PostgreSQL
D. Tất cả
Hệ CSDL NoSQL trên nền tảng Cloudera là ?
lOMoARcPSD| 48599919
A. Apache Accumulo
B. DynamoDB
C. AppEngine Datastore
D. Table Storage
Dich vụ phân tích dữ liệu lớn Cloudera cung cấp là?
A. Hadoop
B. BigQuery
C. Elastic MapReduce
D. Không có
Cloudera Enterprise có thể ược triển khai trên ám mây nào
A. Google Cloud
B. Amazon AWS
C. Tất cả
D. Microsoft Azure
Công cụ trên Google Cloud Platform chuyển ổi dữ liệu hỗ trợ quyết ịnh
A. Google Cloud
B. Google Data Catalog
C. Google Data Studio
D. Goolge Functions
| 1/13

Preview text:

lOMoAR cPSD| 48599919
CÂU HỎI ÔN TẬP BIG DATA 1
Dữ liệu của Big Data là loại nào ? A. Structured Data B. Semi-Structured Data C. Unstructured Data D. Tất cả
Đăc trưng nào không phải của Big Data A. Volume B. Variety C. Vision D. Velocity NoSQL là ? A. Database B. Field C. Document D. Collection
Mục tiêu của NoSQL là gì?
A. NoSQL cung cấp một giải pháp thay thế cho cơ sở dữ liệu SQL ể lưu trữ dữ liệu dạng văn bản.
B. Cơ sở dữ liệu NoSQL cho phép lưu trữ dữ liệu không có cấu trúc.
C. NoSQL không thích hợp ể lưu trữ dữ liệu có cấu trúc.
D. NoSQL là một ịnh dạng dữ liệu mới ể lưu trữ các tập dữ liệu lớn.
Cloudera phát triển công cụ nào ? A. HCatalog B. Hbase C. Imphala D. Oozie
Loại nào không phải là CSDL NoSQL ? A. SQL Server B. MongoDB C. Cassandra D. Không có lOMoAR cPSD| 48599919
Đâu là một kiểu của CSDL NoSQL A. SQL B. Document databases C. JSON D. Tất cả
Chọn úng 5 ặc trưng cho Big Data ?
A. Volume, Velocity, Variety, Veracity, Value
B. Volume, Videos, Velocity, Variability, Value
C. Volume, Variability, Veracity, Visualization, Value
D. Volume, Velocity, Veracity, Visualization, Value
Velocity (Tốc ộ) là ặc trưng nói về?
A. Tốc ộ gia tăng khối lượng dữ liệu lớn
B. Tốc ộ cập nhật dữ liệu lớn
C. Tốc ộ xử lý dữ liệu lớn
D. Tốc ộ lưu trữ dữ liệu lớn
Variety (Tính a dạng) là ặc trưng về ?
A. Kiểu dữ liệu thu thập
B. Kiểu nội dung dữ liệu
C. Nguồn thu thập dữ liệu
D. Phương thức xử lý dữ liệu 11
Đặc trưng quan trọng nhất của Big Data? A. Khối lượng B. Tính a dạng C. Tốc ộ D. Tất cả
Đâu là ặc trưng quyết việc triển khai Dữ liệu lớn? A. Khối lượng B. Giá trị C. Tốc Độ D. Tính a dạng
Tích hợp dữ liệu là quá trình ?
A. Kết hợp các dữ liệu không ồng nhất từ nhiều nguồn khác nhau
B. Sao chép dữ liệu vào CSDL hệ thống ể tiến hành phân tích lOMoAR cPSD| 48599919
C. Làm sạch các dữ liệu thu thập ược từ các hệ thống thành phần
D. Tăng giá trị từ các tài nguyên dữ liệu ang lưu trữ phân tán
Thuật ngữ Thuật ngữ Dữ liệu lớn ra ời năm nào? A. 1997 B. 2000 C. 1998 D. 1941
Các dạng thức khoa học dữ liệu của Jim Gray? A. Thực nghiệm B. Lý thuyết C. Tính toán D. Tất cả các ý
Phát biểu nào không phải dạng thức nghiên cứu Khoa học dữ liệu của Jim Gray? A. Khai thác dữ liệu B. Mô phỏng C. Tính toán D. Thực nghiệm
Đâu không phải là phương thức xử lý dữ liệu lớn?
A. Thu thập (acquire) B.
Đánh giá (reviews) C. Tổ chức (organize) D. Phân tích (analyze) RDBMS là gì ?
A. Relational Database Management System
B. Relat Data Management System
C. Relational Database Microsoft System D. Tất cả
Thị trường Big Data bao gồm: A. Phần cứng B. Phần Mềm C. Tất cả D. Dịch vụ lOMoAR cPSD| 48599919
Nhược iểm của tích hợp dữ liệu theo phương pháp Tight Coupling A. Độ trễ B. Phản hồi truy vấn
C. Phụ thuộc vào nguồn dữ liệu D. Tất cả 21
Nhược iểm của tích hợp dữ liệu theo phương pháp Loose Coupling A. Tất cả B. Chi phí cao C. Độ trễ
D. Phụ thuộc mạng / băng thông
Công cụ nào hỗ trợ tốt NoSQL? A. SAP Data Services B. Oracle Data Integrator
C. SQL Server Integration Services D. Tất cả
Công cụ tích hợp dữ liệu Boomi là của? A. Dell B. IBM C. Microsoft D. SAP
Công cụ SQL Server Integrator do ai phát triển ? A. Oracle B. IBM C. Microsoft D. SAP
SAP Data Service là công cụ ể làm gì ? A. Lưu trữ dữ liệu
B. Tích hợp dữ liệu C. Phân tích dữ liệu D. Tất cả
Hệ quản trị CSLD DynamoDB là kiểu nào ? A. Key value lOMoAR cPSD| 48599919 B. Wide Column based C. Document based D. Graph based
Hệ quản trị CSLD MongoDB là kiểu nào ? A. Document based B. Key value C. Wide Column based D. Graph based
Hệ quản trị CSLD Neo4J là kiểu nào ? A. Key value B. Wide Column based C. Document based D. Graph based
Hệ quản trị CSLD IBM Graph là kiểu nào ? A. Key value B. Document based C. Graph based D. Wide Column based
Hệ quản trị CSLD Google Big Table là kiểu nào ? A. Key value B. Wide Column based C. Document based D. Graph based 31
Đâu không phải là RDBMS ? A. IBM DB2 B. MS SQL Server C. MS Access D. Cassandra
Loại nào là dữ liệu Bán cấu trúc ? A. Tất cả B. JSON lOMoAR cPSD| 48599919 C. CSV D. XML
Loại nào là dữ liệu Unstructured ? A. Video B. XML C. Table D. Tất cả
Yếu tố nào quyết ịnh ể sử dụng NoSQL A. Tốc ộ gia tăng CSDL
B. Tính a dạng của dữ liệu C.
Tốc ộ truy cập dữ liệu D. Tất cả
CSDL nào không phải kiểu Key-Value: A. MongoDB B. DynamoDB C. Redis D. Riak
CSDL nào không phải kiểu Document: A. MongoDB B. CouchDB C. Elasticsearch D. Riak
CSDL nào không phải kiểu Graph: A. InfoGrid B. Hbase C. InfiniteGraph D. IBM Graph
CSDL nào không phải kiểu Wide-Column: A. Hbase B. Cassandra C. BigTable D. Dex lOMoAR cPSD| 48599919
Ưu iểm của hệ thống HDFS là gì ?
A. Lưu trữ phân tán, xử lý song song, khả năng chịu lỗi cao
B. Lưu trữ song song, xử lý phân tán, tính sẵn sàng cao
C. Xử lý phân tán song song, khả năng chịu lỗi chấp nhận sai sót D. Tất cả Ưu iểm của DFS là gì ?
A. Hệ thống lưu trữ song song nên tránh ược ảnh hưởng khi một máy chủ hoặc bộ nhớ bị lỗi
B. Hệ thống ược sao lưu tại Server thứ hai nên ảm bảo việc cung cấp dữ liệu C.
Khi một máy chủ hoặc bộ nhớ bị lỗi, hệ thống tệp phân tán vẫn ảm bảo có
thể cung cấp dữ liệu ổn ịnh
D. Tất cả 41
Ưu iểm của công nghệ Cluster A. Tất cả B. Hiệu quả chi phí C. TÍnh sẵn sàng cao
D. Khả năng mở rộng linh hoạt
Cluster node có mấy loại ? A. 1 B. 2 C. 3 D. 4
Nguồn của kiến trúc HDFS trong Hadoop có nguồn gốc là
A. Hệ thống tệp phân phối của Google
B. Hệ thống tệp phân tán của Yahoo
C. Hệ thống tệp phân tán của Facebook
D. Hệ thống tệp phân tán Azure
Loại dữ liệu mà Hadoop có thể xử lý là
A. Structred (Có cấu trúc)
B. Semi-structured (Bán cấu trúc)
C. Unstructured (Không có cấu trúc)
D. All of the above (Tất cả những iều trên) YARN là viết tắt của lOMoAR cPSD| 48599919
A. Yahoo’s another resource name
B. Yet another resource negotiator
C. Yahoo’s archived Resource names D. Yet another resource need.
Điều nào sau ây không phải là mục tiêu của HDFS?
A. Phát hiện lỗi và khôi phục B.
Xử lý tập dữ liệu khổng lồ C.
Ngăn chặn việc xóa dữ liệu

D. Cung cấp băng thông mạng cao ể di chuyển dữ liệu
Trong HDFS, các tệp không thể A. Đọc B. Xóa C. Thực thi D. Lưu trữ So với RDBMS, Hadoop
A. Có tính toàn vẹn dữ liệu cao hơn.
B. Có giao dịch ACID không C. Thích
hợp ể ọc và truy vấn nhanh
D. Hoạt ộng tốt hơn trên dữ liệu phi cấu trúc và bán cấu trúc.
Vấn ề chính gặp phải khi ọc và ghi dữ liệu song song từ nhiều ĩa là gì? A. Xử
lý khối lượng lớn dữ liệu nhanh hơn.
B. Kết hợp dữ liệu từ nhiều ĩa.
C. Phần mềm cần thiết ể thực hiện nhiệm vụ này là cực kỳ tốn kém.
D. Phần cứng cần thiết ể thực hiện tác vụ này là cực kỳ tốn kém.
Tính năng ịnh vị dữ liệu trong Hadoop có nghĩa là A.
lưu trữ cùng một dữ liệu trên nhiều nút.
B. chuyển vị trí dữ liệu từ nút này sang nút khác.
C. ồng ịnh vị dữ liệu với các nút tính toán.
D. Phân phối dữ liệu trên nhiều nút. 51
Các tệp HDFS ược thiết kế cho
A. Nhiều người viết và sửa ổi ở các hiệu số tùy ý.
B. Chỉ nối vào cuối tệp.
C. Chỉ ghi thành tệp một lần. lOMoAR cPSD| 48599919
D. Truy cập dữ liệu có ộ trễ thấp.
Hệ thống Apache Hadoop ược viết bằng ngôn ngữ nào? A. C ++ B. Python C. Java D. Go
Cái nào không phải là một trong ặc trưng 3Vs của dữ liệu lớn? A. Vận tốc - Velocity
B. Tính xác thực - Veracity C. Khối lượng - Volume D. Đa dạng - Variety
Điều nào sau ây úng ối với Hadoop? A.
Đây là một khung phân tán.
B. Thuật toán chính ược sử dụng trong ó là Map Reduce.
C. Nó chạy có thể thực thi trên hạ tầng Cloud Computing.
D. Tất cả ều úng
Loại nào sau ây lưu trữ dữ liệu? A. Name node B. Data node C. Master node D. Không có
Node nào sau ây quản lý các nút khác? A. Name node B. Data node C. Slave node D. Tất cả
Hadoop xử lý khối lượng lớn dữ liệu như thế nào? A.
Hadoop sử dụng song song rất nhiều máy. Điều này tối ưu hóa việc xử lý dữ liệu. B.
Hadoop ược thiết kế ặc biệt ể xử lý lượng lớn dữ liệu bằng cách tận dụng phần cứng MPP.
C. Hadoop gửi mã ến dữ liệu thay vì gửi dữ liệu ến mã.
D. Hadoop sử dụng các kỹ thuật bộ nhớ ệm phức tạp trên NameNode ể tăng tốc ộ xử lý dữ liệu. lOMoAR cPSD| 48599919
MapReduce do công ty nào phát triển ? A. Apache B. Google C. IBM D. Amazon
Dịch vụ ám mây nào hỗ trợ tốt cho Big Data ? A. Amazon AWS B. Google Cloud C. Tất cả D. Microsoft Azure
Nhược iểm khi triển khai Big Data trên nền tảng Cloud Computing là?
A. Nhiều rủi ro cho hệ thống B. Không có ý úng
C. Tốc ộ xử lý không ảm bảo
D. Phân tích theo thời gian thực kém 61
Mô hình Điện toán ám mây IaaS ?
A. Cơ sở hạ tầng dưới dạng dịch vụ
B. Nền tảng dưới dạng dịch vụ
C. Phần mềm dưới dạng dịch vụ
D. Internet dưới dạng dịch vụ
Mô hình Điện toán ám mây PaaS ?
A. Cơ sở hạ tầng dưới dạng dịch vụ
B. Nền tảng dưới dạng dịch vụ
C. Phần mềm dưới dạng dịch vụ
D. Internet dưới dạng dịch vụ
Mô hình Điện toán ám mây SaaS ?
A. Cơ sở hạ tầng dưới dạng dịch vụ
B. Nền tảng dưới dạng dịch vụ
C. Phần mềm dưới dạng dịch vụ
D. Internet dưới dạng dịch vụ
Lợi ích của Cloud Computing với Big Data là ?
A. Triển khai hạ tầng nhanh chóng B.
Phân tích theo thời gian thực lOMoAR cPSD| 48599919
C. Tối ưu chi phí duy trì hoạt ộng D. Tất cả
Lợi ích vượt trội của Cloud Computing với Big Data là ?
A. Hạn chế ầu tư máy móc B.
Phân tích theo thời gian thực
C. Tối ưu chi phí duy trì hoạt ộng D. Tất cả
Dịch vụ lưu trữ dữ của Amazon – AWS là? A. Amazon S3 B. Amazon RDS C. Amazon Lambda D. EC2
Dịch vụ lưu trữ của Microsoft Azure là ? A. Virtual Machines B. Azure Function C. Azure Disk Storage D. Azure Cosmos DB
Dịch vụ lưu trữ của Google Cloud Platfom là? A. Google Driver B. Goolge Functions
C. Google Cloud Storage D. Google Cloud Datastore
Đám mây AWS cung cấp dịch vụ NoSQL Database A. Amazon RDS B. Amazon EC2 C. Amazon DynamoDB D. Amazon Container Service
Đám mây Microsoft Azure cung cấp dịch vụ NoSQL Database A. Table Storage B. SQL DB C. Azure Functions D. Cloud Service lOMoAR cPSD| 48599919 71
Dịch vụ tích hợp dữ liệu trên ám mây trên Google Cloud Platform A. Google Cloud Dataprep
B. Google Cloud Data Fusion C. Google Data Catalog D. Google BigQuery
Dịch vụ thông minh giúp khái phá, làm sạch dữ liệu trên Google Cloud Platform A. Goolge Functions B. Google BigQuery
C. Google Cloud Dataprep D. Google Data Catalog
Trên Google Cloud Platform dịch vụ nào quản lý CSDL NoQuery A. Google Cloud Dataprep B. Google Data Catalog C. Google BigQuery D. Cloud Bigtable
Trên Google Cloud Platform dịch vụ nào quản lý danh mục dữ liệu
A. Google Data Catalog
B. Google Cloud Dataprep C. Google Data Catalog D. Google BigQuery
Trên Google Cloud Platform dịch vụ phân tích dữ liệu ược cung cấp A. Google Data Catalog B. Google BigQuery C. Google Cloud Dataprep D. Goolge Functions
Nền tảng Cloudera hỗ trợ hệ CSDL quan hệ nào? A. MySQL B. Oracle C. PostgreSQL D. Tất cả
Hệ CSDL NoSQL trên nền tảng Cloudera là ? lOMoAR cPSD| 48599919 A. Apache Accumulo B. DynamoDB C. AppEngine Datastore D. Table Storage
Dich vụ phân tích dữ liệu lớn Cloudera cung cấp là? A. Hadoop B. BigQuery C. Elastic MapReduce D. Không có
Cloudera Enterprise có thể ược triển khai trên ám mây nào A. Google Cloud B. Amazon AWS C. Tất cả D. Microsoft Azure
Công cụ trên Google Cloud Platform chuyển ổi dữ liệu hỗ trợ quyết ịnh A. Google Cloud B. Google Data Catalog C. Google Data Studio D. Goolge Functions