
Preview text:
lOMoAR cPSD| 58702377
MỘT SỐ CÂU HỎI ÔN TẬP THI GIỮA KỲ MÔN
NHẬP MÔN DỮ LIỆU LỚN HKI 2020 – 2021 Phần lý thuyết 1. Big Data là gì?
2. Các đặc trưng của Big Data.
3. Giới thiệu về hệ thống Hadoop. Các thành phần của hệ sinh thái Hadoop.
4. Giới thiệu về hệ thống Spark. 5. So sánh Hadoop và Spark.
6. HDFS là gì? Kiến trúc HDFS?
7. NameNode là gì? DataNode là gì? Vai trò của chúng?
8. Mô hình MapReduce là gì? Hoạt động MapReduce? Phần thực hành
Mỗi nhóm (2-3 SV) thực hiện các chức năng sau:
1. Hoàn thiện tất cả các bài lab đã làm trên lớp 2. Trả
lời vấn đáp các câu hỏi liên quan đến các bài lab
Một số nguồn tham khảo: [1]
Tài liệu GV đã cung cấp [2]
https://topdev.vn/blog/hadoop-la-gi/ [3]
https://iot1995.wordpress.com/2018/04/13/hdfs-la-gi/ [4]
https://blog.itnavi.com.vn/mapreduce-nhung-uu-diem-va-cach-thuc-hoat- dongcua-nen-tang-nay/ [5]
https://data-flair.training/blogs/big-data-hadoop-quiz-part-1/ [6]
https://data-flair.training/blogs/apache-spark-online-quiz-part-1/ [7] Google