











Preview text:
ĐẠI HỌC BÁCH KHOA HÀ NỘI 
TRƯỜNG CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG            BÁO CÁO 
Lưu trữ và xử lý dữ liệu lớn  LAB 03          Nhóm HDSD 
Sinh viên thực hiện   Mã sinh viên  Nguyễn Trọng Hải   20183730  Võ Việt Dũng   20183723  Lê Hữu Tiến Dũng   20183719  Ngô Đình Sáng   20183819     
Giảng viên: TS. Đào Thành Chung          Hà Nội, 11 – 2021 
 Lưu trữ và xử lý dữ liệu lớn    Nhóm HDSD    MỤC LỤC 
MỤC LỤC ................................................................................................................ 2  1. 
Tải và bật dịch vụ ElasticSearch .................................................................... 3  2. 
Cấu hình file elasticsearch.yml ...................................................................... 3  3. 
Chạy ElasticSearch và kiểm tra dịch vụ trên các node ............................... 7  4. 
Tải và cấu hình Kibana ................................................................................... 8  5. 
Giao diện quản lý các Node của Kibana ..................................................... 10  6. 
Đẩy dữ liệu mẫu và quan sát sự phân tán của dữ liệu tại 2 DataNode .... 10        2 | P a g e   
Lưu trữ và xử lý dữ liệu lớn    Nhóm HDSD 
1. Tải và bật dịch vụ ElasticSearch     
2. Cấu hình file elasticsearch.yml 
• Tại MasterNode (IP: 192.168.56.2/24):  3 | P a g e   
Lưu trữ và xử lý dữ liệu lớn    Nhóm HDSD    4 | P a g e   
Lưu trữ và xử lý dữ liệu lớn    Nhóm HDSD   
• Tại DataNode 1 (IP: 192.168.56.3/24):  5 | P a g e   
Lưu trữ và xử lý dữ liệu lớn    Nhóm HDSD     
• Tại DataNode 2 (IP: 192.168.56.4/24):  6 | P a g e   
Lưu trữ và xử lý dữ liệu lớn    Nhóm HDSD   
3. Chạy ElasticSearch và kiểm tra dịch vụ trên các node  • Tại MasterNode:    • Tại DataNode 1:  7 | P a g e   
Lưu trữ và xử lý dữ liệu lớn    Nhóm HDSD    • Tại DataNode 2:   
• Trạng thái của Cluster:   
4. Tải và cấu hình Kibana  • Tải Kibana:  8 | P a g e   
Lưu trữ và xử lý dữ liệu lớn    Nhóm HDSD     
• Cấu hình file kibana.yml:    9 | P a g e   
Lưu trữ và xử lý dữ liệu lớn    Nhóm HDSD 
5. Giao diện quản lý các Node của Kibana     
6. Đẩy dữ liệu mẫu và quan sát sự phân tán của dữ liệu tại 2 DataNode 
• Quan sát giao diện quản lý dữ liệu được đẩy vào:  10 | P a g e   
Lưu trữ và xử lý dữ liệu lớn    Nhóm HDSD   
• Quan sát sự phân tán của dữ liệu tại 2 DataNode:      11 | P a g e   
Lưu trữ và xử lý dữ liệu lớn    Nhóm HDSD     
 Có thể quan sát thấy dữ liệu đã được phân tán trên DataNode 1 
(192.168.56.3) và DataNode 2 (192.168.56.4)              12 | P a g e