Lưu trữ và xử lý dữ liệu lớn
Danh sách Tài liệu
-
Xây dựng luồng dữ liệu lưu trữ, xử lý và phân tích giá bất động sản tại Anh từ 1995 | Môn Lưu trữ và xử lý dữ liệu lớn - Đại học Bách Khoa Hà Nội
21 11 lượt tải 23 trangĐề tài “Xây dựng hệ thống lưu trữ, xử lý và phân tích dữ liệu bất động sản” tập trung vào hệ thống xử lý và phân tích theo lô dữ liệu bất động sản được cung cấp từ các nền tảng trực tuyến hoặc cơ sở dữ liệu bất động sản. Tài liệu được sưu tầm gồm 23 trang, giúp bạn ôn tập tốt hơn. Mời các bạn đón xem.
Danh mục: Đại học Bách Khoa Hà NộiMôn: Lưu trữ và xử lý dữ liệu lớnDạng: Tài liệuTác giả: Linh Giang2 tuần trước -
TOP câu hỏi trắc nghiệm Môn Lưu trữ và xử lý dữ liệu lớn | Đại học Bách Khoa Hà Nội
20 10 lượt tải 21 trangTOP câu hỏi trắc nghiệm Môn Lưu trữ và xử lý dữ liệu lớn. Tài liệu được sưu tầm gồm 21 trang, giúp bạn ôn tập tốt hơn. Mời các bạn đón xem.
Danh mục: Đại học Bách Khoa Hà NộiMôn: Lưu trữ và xử lý dữ liệu lớnDạng: Trắc nghiệmTác giả: Linh Giang2 tuần trước -
Lưu trữ và xử lý, phân tích dữ liệu phim | Môn Lưu trữ và xử lý dữ liệu lớn - Đại học Bách Khoa Hà Nội
18 9 lượt tải 28 trangApache Kafka là một kho dữ liệu phân tán được tối ưu hóa để thu nạp và xử lý dữ liệu truyền phát theo thời gian thực. Dữ liệu truyền phát là dữ liệu được tạo ra liên tục từ hàng nghìn nguồn dữ liệu khác nhau, các nguồn này thường gửi các bản ghi dữ liệu đồng thời. Tài liệu được sưu tầm gồm 28 trang, giúp bạn ôn tập tốt hơn. Mời các bạn đón xem.
Danh mục: Đại học Bách Khoa Hà NộiMôn: Lưu trữ và xử lý dữ liệu lớnDạng: Báo cáoTác giả: Linh Giang2 tuần trước -
Đề trắc nghiệm BigData và đáp án| Môn Lưu trữ và xử lý dữ liệu lớn| Trường Đại học Bách Khoa Hà Nội
483 242 lượt tải 3 trangCâu 1: Đầu vào dữ liệu cho chương trình Spark có thể là:
A. Local file
B. HDFS, NFS
C. Amazon S3, Elasticsearch
D. Cả 3 phương án trênDanh mục: Đại học Bách Khoa Hà NộiMôn: Lưu trữ và xử lý dữ liệu lớnDạng: Đề thi, Đáp ánTác giả: Trịnh Thảo Anh1 năm trước -
Quiz Big Data storage and processing| Môn Lưu trữ và xử lý dữ liệu lớn| Trường Đại học Bách Khoa Hà Nội
495 248 lượt tải 50 trangCâu hỏi: AVRO là gì?
A - Avro là một thư viện tuần tự hóa java.
B - Avro là một thư viện nén java.
C - Avro là một thư viện java tạo các tệp bảng chia nhỏ.
D - Không câu trả lời nào đúng.Danh mục: Đại học Bách Khoa Hà NộiMôn: Lưu trữ và xử lý dữ liệu lớnDạng: Đề thi, Đáp ánTác giả: Trịnh Thảo Anh1 năm trước -
Đề trắc nghiệm BigData và đáp án| Môn Lưu trữ và xử lý dữ liệu lớn| Trường Đại học Bách Khoa Hà Nội
605 303 lượt tải 9 trangCâu 1: Đâu là kỹ thuật có thể được dùng để thích nghi các giải thuật học máy cho dữ liệu lớn?
A. Sub-sampling, principal component analysis, feature extraction và feature selection
B. Song song hóa trên Mapreduce hay Spark
C. Các kiến trúc mới xử lý luồng liên tục như mini-batch, complex event processing
D. Tất cả các ý (1), (2), (3)
E. Các ý (2) và (3)Danh mục: Đại học Bách Khoa Hà NộiMôn: Lưu trữ và xử lý dữ liệu lớnDạng: Đề thi, Đáp ánTác giả: Trịnh Thảo Anh1 năm trước -
BT trắc nghiệm BigData và đáp án| Môn Lưu trữ và xử lý dữ liệu lớn| Trường Đại học Bách Khoa Hà Nội
1 K 488 lượt tải 11 trangDữ liệu của Big Data là loại nào ?
A. Structured Data
B. Semi-Structured Data
C. Unstructured Data
D. Tất cảDanh mục: Đại học Bách Khoa Hà NộiMôn: Lưu trữ và xử lý dữ liệu lớnDạng: Đề thi, Đáp ánTác giả: Trịnh Thảo Anh1 năm trước -
Đề 128 câu trắc nghiệm BigData và đáp án| Môn Lưu trữ và xử lý dữ liệu lớn| Trường Đại học Bách Khoa Hà Nội
1.4 K 700 lượt tải 29 trangCâu 1: Trong NameNode, lượng bộ nhớ cần thiết là
A. Tương tự như của node chính
B. Phải có ít nhất một nửa node chính
C. Phải gấp đôi node chính
D. Chỉ phụ thuộc vào số lượng node dữ liệu mà nó sẽ xử lýDanh mục: Đại học Bách Khoa Hà NộiMôn: Lưu trữ và xử lý dữ liệu lớnDạng: Đề thi, Đáp ánTác giả: Trịnh Thảo Anh1 năm trước -
Đề trắc nghiệm BigData và đáp án| Môn Lưu trữ và xử lý dữ liệu lớn| Trường Đại học Bách Khoa Hà Nội
428 214 lượt tải 11 trang-
Bản chất DStream:
a, là một chuỗi liên tục RDD
b, Là một chuỗi liên tục DataFrame
c, Là một chuỗi liên tục DataSet
d, ko có đáp án đúng
Danh mục: Đại học Bách Khoa Hà NộiMôn: Lưu trữ và xử lý dữ liệu lớnDạng: Đề thi, Đáp ánTác giả: Trịnh Thảo Anh1 năm trước -
-
BigData Storage & Processing| Môn Lưu trữ và xử lý dữ liệu lớn| Trường Đại học Bách Khoa Hà Nội
374 187 lượt tải 11 trangLec2: Hadoop Ecosystem
1. BTVN (HDFS, chạy Ví dụ về Hadoop)
Hadoop hình thành từ 2008 do Yahooh phát triển
Apache Hadoop thân thiện hơn MapReduce (của Google)
MapReduce là mô thức xử lý dữ liệu mặc định trong Hadoop
- Mục tiêu chính
Lưu trữ dự liệu khả mở (scalability), tin cậy (reliability)
Powerfull data processing
(Efficient visualization)
Danh mục: Đại học Bách Khoa Hà NộiMôn: Lưu trữ và xử lý dữ liệu lớnDạng: Đề cương, Đáp ánTác giả: Trịnh Thảo Anh1 năm trước