
Preview text:
  lOMoAR cPSD| 58702377
MỘT SỐ CÂU HỎI ÔN TẬP THI GIỮA KỲ MÔN 
NHẬP MÔN DỮ LIỆU LỚN  HKI 2020 – 2021  Phần lý thuyết  1. Big Data là gì? 
2. Các đặc trưng của Big Data. 
3. Giới thiệu về hệ thống Hadoop. Các thành phần của hệ sinh thái Hadoop. 
4. Giới thiệu về hệ thống Spark.  5. So sánh Hadoop và Spark. 
6. HDFS là gì? Kiến trúc HDFS? 
7. NameNode là gì? DataNode là gì? Vai trò của chúng? 
8. Mô hình MapReduce là gì? Hoạt động MapReduce?  Phần thực hành 
Mỗi nhóm (2-3 SV) thực hiện các chức năng sau: 
1. Hoàn thiện tất cả các bài lab đã làm trên lớp 2. Trả 
lời vấn đáp các câu hỏi liên quan đến các bài lab 
 Một số nguồn tham khảo:  [1] 
Tài liệu GV đã cung cấp  [2] 
https://topdev.vn/blog/hadoop-la-gi/  [3] 
https://iot1995.wordpress.com/2018/04/13/hdfs-la-gi/  [4] 
https://blog.itnavi.com.vn/mapreduce-nhung-uu-diem-va-cach-thuc-hoat- dongcua-nen-tang-nay/  [5] 
https://data-flair.training/blogs/big-data-hadoop-quiz-part-1/  [6] 
https://data-flair.training/blogs/apache-spark-online-quiz-part-1/  [7]  Google