Câu hỏi ôn tập Big data môn Công nghệ thông tin | Trường đại học Kinh Doanh và Công Nghệ Hà Nội
Mục tiêu của NoSQL là gì?A. NoSQL cung cấp một giải pháp thay thế cho cơ sở dữ liệu SQL để lưu trữ dữ liệu dạng văn bản. B. Cơ sở dữ liệu NoSQL cho phép lưu trữ dữ liệu không có cấu trúc. C. NoSQL không thích hợp để lưu trữ dữ liệu có cấu trúc. Tài liệu giúp bạn tham khảo, ôn tập và đạt kết quả cao. Mời đọc đón xem!
Môn: Công nghệ thông tin (HUBT)
Trường: Đại học Kinh Doanh và Công Nghệ Hà Nội
Thông tin:
Tác giả:
Preview text:
lOMoAR cPSD| 48704538 CÂU HỎI ÔN TẬP BIG DATA 1
Dữ liệu của Big Data là loại nào ? A. Structured Data B. Semi-Structured Data C. Unstructured Data D. Tất cả
Đăc trưng nào không phải của Big Data A. Volume B. Variety C. Vision D. Velocity NoSQL là ? A. Database B. Field C. Document D. Collection
Mục tiêu của NoSQL là gì?
A. NoSQL cung cấp một giải pháp thay thế cho cơ sở dữ liệu SQL để lưu trữ
dữ liệu dạng văn bản.
B. Cơ sở dữ liệu NoSQL cho phép lưu trữ dữ liệu không có cấu trúc.
C. NoSQL không thích hợp để lưu trữ dữ liệu có cấu trúc.
D. NoSQL là một định dạng dữ liệu mới để lưu trữ các tập dữ liệu lớn.
Cloudera phát triển công cụ nào ? A. HCatalog B. Hbase C. Imphala D. Oozie
Loại nào không phải là CSDL NoSQL ? A. SQL Server B. MongoDB C. Cassandra lOMoAR cPSD| 48704538 D. Không có
Đâu là một kiểu của CSDL NoSQL A. SQL B. Document databases C. JSON D. Tất cả
Chọn đúng 5 đặc trưng cho Big Data ?
A. Volume, Velocity, Variety, Veracity, Value
B. Volume, Videos, Velocity, Variability, Value
C. Volume, Variability, Veracity, Visualization, Value
D. Volume, Velocity, Veracity, Visualization, Value
Velocity (Tốc độ) là đặc trưng nói về?
A. Tốc độ gia tăng khối lượng dữ liệu lớn
B. Tốc độ cập nhật dữ liệu lớn
C. Tốc độ xử lý dữ liệu lớn
D. Tốc độ lưu trữ dữ liệu lớn
Variety (Tính đa dạng) là đặc trưng về ?
A. Kiểu dữ liệu thu thập
B. Kiểu nội dung dữ liệu
C. Nguồn thu thập dữ liệu
D. Phương thức xử lý dữ liệu 11
Đâu không phải là phương thức xử lý dữ liệu lớn? ? A. Khối lượng B. Tính đa dạng C. Tốc độ D. Tất cả
Đâu là đặc trưng quyết việc triển khai Dữ liệu lớn? lOMoAR cPSD| 48704538 A. Khối lượng B. Giá trị C. Tốc Độ D. Tính đa dạng
Tích hợp dữ liệu là quá trình ?
A. Kết hợp các dữ liệu không đồng nhất từ nhiều nguồn khác nhau
B. Sao chép dữ liệu vào CSDL hệ thống để tiến hành phân tích
C. Làm sạch các dữ liệu thu thập được từ các hệ thống thành phần
D. Tăng giá trị từ các tài nguyên dữ liệu đang lưu trữ phân tán
Thuật ngữ Thuật ngữ Dữ liệu lớn ra đời năm nào? A. 1997 B. 2000 C. 1998 D. 1941
Các dạng thức khoa học dữ liệu của Jim Gray? A. Thực nghiệm B. Lý thuyết C. Tính toán D. Tất cả các ý
Phát biểu nào không phải dạng thức nghiên cứu Khoa học dữ liệu của Jim Gray? A. Khai thác dữ liệu B. Mô phỏng C. Tính toán D. Thực nghiệm
Đâu không phải là phương thức xử lý dữ liệu lớn? A. Thu thập (acquire) B. Đánh giá (reviews) C. Tổ chức (organize) D. Phân tích (analyze) RDBMS là gì ? lOMoAR cPSD| 48704538
A. Relational Database Management System
B. Relat Data Management System
C. Relational Database Microsoft System D. Tất cả
Thị trường Big Data bao gồm: A. Phần cứng B. Phần Mềm C. Tất cả D. Dịch vụ
Nhược điểm của tích hợp dữ liệu theo phương pháp Tight Coupling A. Độ trễ B. Phản hồi truy vấn
C. Phụ thuộc vào nguồn dữ liệu D. Tất cả 21
Nhược điểm của tích hợp dữ liệu theo phương pháp Loose Coupling A. Tất cả B. Chi phí cao C. Độ trễ
D. Phụ thuộc mạng / băng thông
Công cụ nào hỗ trợ tốt NoSQL? A. SAP Data Services B. Oracle Data Integrator
C. SQL Server Integration Services D. Tất cả
Công cụ tích hợp dữ liệu Boomi là của? A. Dell B. IBM C. Microsoft D. SAP lOMoAR cPSD| 48704538
Công cụ SQL Server Integrator do ai phát triển ? A. Oracle B. IBM C. Microsoft D. SAP
SAP Data Service là công cụ để làm gì ? A. Lưu trữ dữ liệu B. Tích hợp dữ liệu C. Phân tích dữ liệu D. Tất cả
Hệ quản trị CSLD DynamoDB là kiểu nào ? A. Key value B. Wide Column based C. Document based D. Graph based
Hệ quản trị CSLD MongoDB là kiểu nào ? A. Document based B. Key value C. Wide Column based D. Graph based
Hệ quản trị CSLD Neo4J là kiểu nào ? A. Key value B. Wide Column based C. Document based D. Graph based
Hệ quản trị CSLD IBM Graph là kiểu nào ? A. Key value B. Document based C. Graph based D. Wide Column based lOMoAR cPSD| 48704538
Hệ quản trị CSLD Google Big Table là kiểu nào ? A. Key value B. Wide Column based C. Document based D. Graph based 31
Đâu không phải là RDBMS ? A. IBM DB2 B. MS SQL Server C. MS Access D. Cassandra
Loại nào là dữ liệu Bán cấu trúc ? A. Tất cả B. JSON C. CSV D. XML
Loại nào là dữ liệu Unstructured ? A. Video B. XML C. Table D. Tất cả
Yếu tố nào quyết định để sử dụng NoSQL A. Tốc độ gia tăng CSDL
B. Tính đa dạng của dữ liệu
C. Tốc độ truy cập dữ liệu D. Tất cả
CSDL nào không phải kiểu Key-Value: A. MongoDB B. DynamoDB C. Redis D. Riak lOMoAR cPSD| 48704538
CSDL nào không phải kiểu Document: A. MongoDB B. CouchDB C. Elasticsearch D. Riak
CSDL nào không phải kiểu Graph: A. InfoGrid B. Hbase C. InfiniteGraph D. IBM Graph
CSDL nào không phải kiểu Wide-Column: A. Hbase B. Cassandra C. BigTable D. Dex
Ưu điểm của hệ thống HDFS là gì ?
A. Lưu trữ phân tán, xử lý song song, khả năng chịu lỗi cao
B. Lưu trữ song song, xử lý phân tán, tính sẵn sàng cao
C. Xử lý phân tán song song, khả năng chịu lỗi chấp nhận sai sót D. Tất cả
Ưu điểm của DFS là gì ?
A. Hệ thống lưu trữ song song nên tránh được ảnh hưởng khi một máy chủ hoặc bộ nhớ bị lỗi
B. Hệ thống được sao lưu tại Server thứ hai nên đảm bảo việc cung cấp dữ liệu C.
Khi một máy chủ hoặc bộ nhớ bị lỗi, hệ thống tệp phân tán vẫn đảm bảo có
thể cung cấp dữ liệu ổn định D. Tất cả 41
Ưu điểm của công nghệ Cluster A. Tất cả lOMoAR cPSD| 48704538 B. Hiệu quả chi phí C. TÍnh sẵn sàng cao
D. Khả năng mở rộng linh hoạt
Cluster node có mấy loại ? A. 1 B. 2 C. 3 D. 4
Nguồn của kiến trúc HDFS trong Hadoop có nguồn gốc là
A. Hệ thống tệp phân phối của Google
B. Hệ thống tệp phân tán của Yahoo
C. Hệ thống tệp phân tán của Facebook
D. Hệ thống tệp phân tán Azure
Loại dữ liệu mà Hadoop có thể xử lý là
A. Structred (Có cấu trúc)
B. Semi-structured (Bán cấu trúc)
C. Unstructured (Không có cấu trúc)
D. All of the above (Tất cả những điều trên)
YARN là viết tắt của A. Yahoo’s another resource name B. Yet
another resource negotiator C.
Yahoo’s archived Resource names D. Yet another resource need.
Điều nào sau đây không phải là mục tiêu của HDFS?
A. Phát hiện lỗi và khôi phục
B. Xử lý tập dữ liệu khổng lồ
C. Ngăn chặn việc xóa dữ liệu
D. Cung cấp băng thông mạng cao để di chuyển dữ liệu
Trong HDFS, các tệp không thể A. Đọc B. Xóa lOMoAR cPSD| 48704538 C. Thực thi D. Lưu trữ
So với RDBMS, Hadoop A. Có tính
toàn vẹn dữ liệu cao hơn.
B. Có giao dịch ACID không
C. Thích hợp để đọc và truy vấn nhanh
D. Hoạt động tốt hơn trên dữ liệu phi cấu trúc và bán cấu trúc.
Vấn đề chính gặp phải khi đọc và ghi dữ liệu song song từ nhiều đĩa là gì? A.
Xử lý khối lượng lớn dữ liệu nhanh hơn.
B. Kết hợp dữ liệu từ nhiều đĩa.
C. Phần mềm cần thiết để thực hiện nhiệm vụ này là cực kỳ tốn kém.
D. Phần cứng cần thiết để thực hiện tác vụ này là cực kỳ tốn kém.
Tính năng định vị dữ liệu trong Hadoop có nghĩa là
A. lưu trữ cùng một dữ liệu trên nhiều nút.
B. chuyển vị trí dữ liệu từ nút này sang nút khác.
C. đồng định vị dữ liệu với các nút tính toán.
D. Phân phối dữ liệu trên nhiều nút. 51
Các tệp HDFS được thiết kế cho
A. Nhiều người viết và sửa đổi ở các hiệu số tùy ý.
B. Chỉ nối vào cuối tệp.
C. Chỉ ghi thành tệp một lần.
D. Truy cập dữ liệu có độ trễ thấp.
Hệ thống Apache Hadoop được viết bằng ngôn ngữ nào? A. C ++ B. Python C. Java D. Go
Cái nào không phải là một trong đặc trưng 3Vs của dữ liệu lớn? A. Vận tốc - Velocity lOMoAR cPSD| 48704538
B. Tính xác thực - Veracity C. Khối lượng - Volume D. Đa dạng - Variety
Điều nào sau đây đúng đối với Hadoop? A.
Đây là một khung phân tán.
B. Thuật toán chính được sử dụng trong đó là Map Reduce.
C. Nó chạy có thể thực thi trên hạ tầng Cloud Computing. D. Tất cả đều đúng
Loại nào sau đây lưu trữ dữ liệu? A. Name node B. Data node C. Master node D. Không có
Node nào sau đây quản lý các nút khác? A. Name node B. Data node C. Slave node D. Tất cả
Hadoop xử lý khối lượng lớn dữ liệu như thế nào?
A. Hadoop sử dụng song song rất nhiều máy. Điều này tối ưu hóa việc xử lý dữ liệu.
B. Hadoop được thiết kế đặc biệt để xử lý lượng lớn dữ liệu bằng cách tận dụng phần cứng MPP.
C. Hadoop gửi mã đến dữ liệu thay vì gửi dữ liệu đến mã.
D. Hadoop sử dụng các kỹ thuật bộ nhớ đệm phức tạp trên NameNode để tăng
tốc độ xử lý dữ liệu.
MapReduce do công ty nào phát triển ? A. Apache B. Google C. IBM D. Amazon lOMoAR cPSD| 48704538
Dịch vụ đám mây nào hỗ trợ tốt cho Big Data ? A. Amazon AWS B. Google Cloud C. Tất cả D. Microsoft Azure
Nhược điểm khi triển khai Big Data trên nền tảng Cloud Computing là?
A. Nhiều rủi ro cho hệ thống B. Không có ý đúng
C. Tốc độ xử lý không đảm bảo
D. Phân tích theo thời gian thực kém 61
Mô hình Điện toán đám mây IaaS ?
A. Cơ sở hạ tầng dưới dạng dịch vụ
B. Nền tảng dưới dạng dịch vụ
C. Phần mềm dưới dạng dịch vụ
D. Internet dưới dạng dịch vụ
Mô hình Điện toán đám mây PaaS ?
A. Cơ sở hạ tầng dưới dạng dịch vụ
B. Nền tảng dưới dạng dịch vụ
C. Phần mềm dưới dạng dịch vụ
D. Internet dưới dạng dịch vụ
Mô hình Điện toán đám mây SaaS ?
A. Cơ sở hạ tầng dưới dạng dịch vụ
B. Nền tảng dưới dạng dịch vụ
C. Phần mềm dưới dạng dịch vụ
D. Internet dưới dạng dịch vụ
Lợi ích của Cloud Computing với Big Data là ?
A. Triển khai hạ tầng nhanh chóng B.
Phân tích theo thời gian thực
C. Tối ưu chi phí duy trì hoạt động D. Tất cả lOMoAR cPSD| 48704538
Lợi ích vượt trội của Cloud Computing với Big Data là ?
A. Hạn chế đầu tư máy móc
B. Phân tích theo thời gian thực
C. Tối ưu chi phí duy trì hoạt động D. Tất cả
Dịch vụ lưu trữ dữ của Amazon – AWS là? A. Amazon S3 B. Amazon RDS C. Amazon Lambda D. EC2
Dịch vụ lưu trữ của Microsoft Azure là ? A. Virtual Machines B. Azure Function C. Azure Disk Storage D. Azure Cosmos DB
Dịch vụ lưu trữ của Google Cloud Platfom là? A. Google Driver B. Goolge Functions C. Google Cloud Storage D. Google Cloud Datastore
Đám mây AWS cung cấp dịch vụ NoSQL Database A. Amazon RDS B. Amazon EC2 C. Amazon DynamoDB D. Amazon Container Service
Đám mây Microsoft Azure cung cấp dịch vụ NoSQL Database A. Table Storage B. SQL DB C. Azure Functions D. Cloud Service lOMoAR cPSD| 48704538 71
Dịch vụ tích hợp dữ liệu trên đám mây trên Google Cloud Platform A. Google Cloud Dataprep B. Google Cloud Data Fusion C. Google Data Catalog D. Google BigQuery
Dịch vụ thông minh giúp khái phá, làm sạch dữ liệu trên Google Cloud Platform A. Goolge Functions B. Google BigQuery C. Google Cloud Dataprep D. Google Data Catalog
Trên Google Cloud Platform dịch vụ nào quản lý CSDL NoQuery A. Google Cloud Dataprep B. Google Data Catalog C. Google BigQuery D. Cloud Bigtable
Trên Google Cloud Platform dịch vụ nào quản lý danh mục dữ liệu A. Google Data Catalog B. Google Cloud Dataprep C. Google Data Catalog D. Google BigQuery
Trên Google Cloud Platform dịch vụ phân tích dữ liệu được cung cấp A. Google Data Catalog B. Google BigQuery C. Google Cloud Dataprep D. Goolge Functions
Nền tảng Cloudera hỗ trợ hệ CSDL quan hệ nào? A. MySQL B. Oracle C. PostgreSQL lOMoAR cPSD| 48704538 D. Tất cả
Hệ CSDL NoSQL trên nền tảng Cloudera là ? A. Apache Accumulo B. DynamoDB C. AppEngine Datastore D. Table Storage
Dich vụ phân tích dữ liệu lớn Cloudera cung cấp là? lOMoAR cPSD| 48704538 A. Hadoop B. BigQuery C. Elastic MapReduce D. Không có
Cloudera Enterprise có thể được triển khai trên đám mây nào A. Google Cloud B. Amazon AWS C. Tất cả D. Microsoft Azure
Công cụ trên Google Cloud Platform chuyển đổi dữ liệu hỗ trợ quyết định A. Google Cloud B. Google Data Catalog C. Google Data Studio D. Goolge Functions
81. Lợi ích từ Phân tích dữ liệu lớn là:
Giảm chi phí và tăng hiệu quả hoạt động.
Ra quyết định nhanh hơn,tốt hơn. Tất cả.
Để Cải thiện theo định hướng dữ liệu cho thị trường
82. Phân tích dữ liệu lớn có thể giúp giảm chi phí và tăng hiệu quả hoạt động, cũng như giúp
ra quyết định nhanh hơn và tốt hơn để cải thiện theo định hướng dữ liệu cho thị trường.
Mục tiêu đúng nhất của phân tích dữ liệu lớn là .
Sắp xếp dữ liệu có ích để sử dụng.
Biến dữ liệu thành thông tin chi tiết hữu ích.
Tạo ra các dữ liệu phù hợp nhất với hệ thống.
Xây dựng hệ thống để quản lý dữ liệu lớn
83. Loại phân tích dữ liệu nào kết quả thu được cho ta biết làm thế nào để nó xảy ra.
Downloaded by ANhh Trân (Anhhtrann14062003@gmail.com) lOMoAR cPSD| 48704538 Phân tích mô tả. Phân tích chuẩn đoán. Phân tích dự đoán Phân tích đề xuất
84. Mô hình Mapreduce thuộc lớp nào. Lớp lưu trữ dữ liệu.
Lớp thứ thập dữ liệu.
Lớp phân tích dữ liệu. Lớp xử lý dữ liệu
85. Công cụ nào hỗ trợ tích hợp dữ liệu. Dell Boomi. Snaplogic. Sap Data Services. Tất cả
86. Kiểu phân tích dữ liệu nào chuẩn đoán lý do cho kết quả Descriptive Analysis. Diagnostic Analysis. Predictive Analysis. Prescriptive Annalysis
87. Kiểu phân tích nào để hỗ trợ đưa ra quyết định. Prescriptive Analysis. Diagnostic Analysis Downloaded by ANhh Trân (Anhhtrann14062003@gmail.com) lOMoAR cPSD| 48704538 Predictive Analysis. Descriptive Analysis
88. Kiểu phân tích nào mô tả dữ liệu và trình bày thông tin về dữ liệu một cách tổng quan mà
không cố gắng giải thích hoặc dự đoán gì? Descriptive Analysis Prescriptive Analysis. Diagnostic Analysis. Predictive Analysis.
89. Kiểu phân tích nào sử dụng dữ liệu và thông tin từ quá khứ để dự đoán hoặc ước tính các sự kiện tương lai? Predictive Analysis. Prescriptive Analysis. Diagnostic Analysis. Descriptive Analysis
90. Ứng dụng phân tích dữ liệu lớn hỗ trợ ngành Y tế:
Tăng việc khai thác tối ưu hóa máy móc
Tăng doanh thu từ phần mềm y tế
Tăng tính chính xác của chuẩn đoán Tất cả
91. Phân tích chuẩn đoán sử dụng kỹ thuật nào? Lấy mẫu dữ liệu Tương quan phân bổ Khai phá dữ liệu
Downloaded by ANhh Trân (Anhhtrann14062003@gmail.com) lOMoAR cPSD| 48704538 Thu thập dữ liệu
92. hoạt động của Map Reduce bao gồm :
Trộn & sắp xếp-Map-Reduce
Reduce- Map- Trộn & sắp xếp
Map- Trộn & sắp xếp Reduce
Sắp xếp- Trộn & Map Reduce
93. Đâu không phải là chế độ hoạt động của Hadoop ?
Chế độ phân phối toàn cầu
Chế độ phân phối giả Chế độ độc lập
Chế độ phân phối hoàn toàn
94. Mô hình MapReduce thuộc lớp nào ? Lớp lưu trữ dữ liệu Lớp xử lý dữ liệu Lớp thu thập dữ liệu Downloaded by ANhh Trân (Anhhtrann14062003@gmail.com) lOMoAR cPSD| 48704538 Lớp phân tích dữ liệu
Phân tích mô tả không phù hợp sử dụng để ? Xây dựng các báo cáo
Lập bảng số liệu truyền thông
Mô hình hóa dữ liệu quá khứ Phân tích tương quan
Loại phân tích dữ liệu nào kết quả thu được cho ta bi
ết làm thế nào để nó xảy ra ? Phân tích đề xuất Phân tích chuẩn đoán Phân tích dự án Phân tích mô tả
Downloaded by ANhh Trân (Anhhtrann14062003@gmail.com) lOMoAR cPSD| 48704538 Downloaded by ANhh Trân (Anhhtrann14062003@gmail.com)