3470 tài liệu
-
Đề trắc nghiệm BigData và đáp án| Môn Lưu trữ và xử lý dữ liệu lớn| Trường Đại học Bách Khoa Hà Nội
401 201 lượt tải 11 trang-
Bản chất DStream:
a, là một chuỗi liên tục RDD
b, Là một chuỗi liên tục DataFrame
c, Là một chuỗi liên tục DataSet
d, ko có đáp án đúng
Danh mục: Đại học Bách Khoa Hà NộiMôn: Lưu trữ và xử lý dữ liệu lớnDạng: Đề thi, Đáp ánTác giả: Trịnh Thảo Anh1 năm trước -
-
BigData Storage & Processing| Môn Lưu trữ và xử lý dữ liệu lớn| Trường Đại học Bách Khoa Hà Nội
345 173 lượt tải 11 trangLec2: Hadoop Ecosystem
1. BTVN (HDFS, chạy Ví dụ về Hadoop)
Hadoop hình thành từ 2008 do Yahooh phát triển
Apache Hadoop thân thiện hơn MapReduce (của Google)
MapReduce là mô thức xử lý dữ liệu mặc định trong Hadoop
- Mục tiêu chính
Lưu trữ dự liệu khả mở (scalability), tin cậy (reliability)
Powerfull data processing
(Efficient visualization)
Danh mục: Đại học Bách Khoa Hà NộiMôn: Lưu trữ và xử lý dữ liệu lớnDạng: Đề cương, Đáp ánTác giả: Trịnh Thảo Anh1 năm trước -
Ôn thi BigData| Môn Lưu trữ và xử lý dữ liệu lớn| Trường Đại học Bách Khoa Hà Nội
373 187 lượt tải 40 trang1. How big is big data?
(Hadoop và Spark)
Big Data 5V
Velocity (speed of generating data) – Variety (types and forms of data) – Value(potential for ...) – Veracity (level of quality, accuracy and uncertainty) – Volume (vast amouns of data, how large can scale?)Danh mục: Đại học Bách Khoa Hà NộiMôn: Lưu trữ và xử lý dữ liệu lớnDạng: Đề cương, Đáp ánTác giả: Trịnh Thảo Anh1 năm trước -
PowerPoint BTL IT4931 nhóm 31| BT môn Lưu trữ và xử lý dữ liệu lớn| Trường Đại học Bách Khoa Hà Nội
323 162 lượt tải 21 trangHệ thống cho thấy những lợi ích mà một hệ thống Big Data đem lại như:
-
khả năng lưu trữ, tìm kiếm
-
biểu diễn lượng lớn dữ liệu
-
khả năng mở rộng khi lượng tài nguyên hiện tại không đủ,
-
khả năng chịu lỗi trong một mạng phân tán khi có những thành phần trong mạng gặp trục trặc.
Danh mục: Đại học Bách Khoa Hà NộiMôn: Lưu trữ và xử lý dữ liệu lớnDạng: Bài tậpTác giả: Trịnh Thảo Anh1 năm trước -
-
Báo cáo BTL IT4931 nhóm 31| BT môn Lưu trữ và xử lý dữ liệu lớn| Trường Đại học Bách Khoa Hà Nội
640 320 lượt tải 24 trangTrước đây, khi mạng Internet còn chưa phát triển, lượng dữ liệu con người sinh ra khá nhỏ giọt và thưa thớt, nhìn chung, lượng dữ liệu này vẫn nằm trong khả năng xử lý của con người dù bằng tay hay bằng máy tính. Tuy nhiên trong kỷ nguyên số, khi mà sự bùng nổ công nghệ truyền thông đã dẫn tới sự bùng nổ dữ liệu người dùng, lượng dữ liệu được tạo ra vô cùng lớn và đa dạng, đòi hỏi một hệ thống đủ mạnh để phân tích và xử lý những dữ liệu đó.
Danh mục: Đại học Bách Khoa Hà NộiMôn: Lưu trữ và xử lý dữ liệu lớnDạng: Báo cáoTác giả: Trịnh Thảo Anh1 năm trước -
BTVN và HDSD_Lab05| BT môn Lưu trữ và xử lý dữ liệu lớn| Trường Đại học Bách Khoa Hà Nội
155 78 lượt tải 12 trangBTVN và HDSD_Lab05| BT môn Lưu trữ và xử lý dữ liệu lớn| Trường Đại học Bách Khoa Hà Nội. Tài liệu gồm 12 trang giúp bạn ôn tập và đạt kết quả cao trong kỳ thi sắp tới. Mời bạn đọc đón xem.
Danh mục: Đại học Bách Khoa Hà NộiMôn: Lưu trữ và xử lý dữ liệu lớnDạng: Bài tập, Đáp ánTác giả: Trịnh Thảo Anh1 năm trước -
BTVN và HDSD_Lab04| BT môn Lưu trữ và xử lý dữ liệu lớn| Trường Đại học Bách Khoa Hà Nội
225 113 lượt tải 11 trangBTVN và HDSD_Lab04| BT môn Lưu trữ và xử lý dữ liệu lớn| Trường Đại học Bách Khoa Hà Nội. Tài liệu gồm 11 trang giúp bạn ôn tập và đạt kết quả cao trong kỳ thi sắp tới. Mời bạn đọc đón xem.
Danh mục: Đại học Bách Khoa Hà NộiMôn: Lưu trữ và xử lý dữ liệu lớnDạng: Bài tập, Đáp ánTác giả: Trịnh Thảo Anh1 năm trước -
BTVN và HDSD_Lab03| BT môn Lưu trữ và xử lý dữ liệu lớn| Trường Đại học Bách Khoa Hà Nội
105 53 lượt tải 12 trangBTVN và HDSD_Lab03| BT môn Lưu trữ và xử lý dữ liệu lớn| Trường Đại học Bách Khoa Hà Nội. Tài liệu gồm 12 trang giúp bạn ôn tập và đạt kết quả cao trong kỳ thi sắp tới. Mời bạn đọc đón xem.
Danh mục: Đại học Bách Khoa Hà NộiMôn: Lưu trữ và xử lý dữ liệu lớnDạng: Bài tập, Đáp ánTác giả: Trịnh Thảo Anh1 năm trước -
BTVN và HDSD _Lab02| BT môn Lưu trữ và xử lý dữ liệu lớn| Trường Đại học Bách Khoa Hà Nội
193 97 lượt tải 9 trangBTVN và HDSD _Lab02| BT môn Lưu trữ và xử lý dữ liệu lớn| Trường Đại học Bách Khoa Hà Nội. Tài liệu gồm 9 trang giúp bạn ôn tập và đạt kết quả cao trong kỳ thi sắp tới. Mời bạn đọc đón xem.
Danh mục: Đại học Bách Khoa Hà NộiMôn: Lưu trữ và xử lý dữ liệu lớnDạng: Bài tập, Đáp ánTác giả: Trịnh Thảo Anh1 năm trước -
BTVN và HDSD_Lab01| BT môn Lưu trữ và xử lý dữ liệu lớn| Trường Đại học Bách Khoa Hà Nội
236 118 lượt tải 16 trangĐề bài: cài đặt cụm HDFS trên nhiều máy tính (ít nhất 3 máy)
-
Trong đó một máy là Namenode, 2 máy còn lại là Datanode.
-
Cấu hình để 2 bản sao (replication)
-
Lưu trữ 1GB dữ liệu
Danh mục: Đại học Bách Khoa Hà NộiMôn: Lưu trữ và xử lý dữ liệu lớnDạng: Bài tập, Đáp ánTác giả: Trịnh Thảo Anh1 năm trước -