



















Preview text:
lOMoAR cPSD| 58968691
100 CÂU HỎI TRẮC NGHIỆM TỪ FILE 1.BIGDATA_TONGQUAN
Câu 1. Theo định nghĩa của Gartner, Big Data là:
• A. Một tập hợp dữ liệu nhỏ, xử lý dễ dàng bằng các công cụ truyền thống
• B. Hệ thống lưu trữ phân tán tốc độ cao
• C. Tài sản thông tin có khối lượng lớn, tốc độ cao và đa dạng cần công nghệ mới để xử lý hiệu quả ✅
• D. Một kiểu lưu trữ đám mây quy mô lớn
Câu 2. Ba đặc điểm cơ bản nhất của Big Data (3V’s) là:
• A. Volume, Variety, Velocity ✅
• B. Value, Visualization, Virality
• C. Veracity, Variety, Visualization D. Volume, View, Virtualization
Câu 3. Tính ‘Variety’ trong Big Data thể hiện điều gì?
• A. Khối lượng dữ liệu rất lớn
• B. Tốc độ xử lý dữ liệu
• C. Sự đa dạng về định dạng và loại dữ liệu ✅ D. Độ chính xác của dữ liệu
Câu 4. Dữ liệu phi cấu trúc là:
• A. Dữ liệu được lưu trữ với lược đồ cố định
• B. Tệp XML có thể phân tích dễ dàng
• C. Dữ liệu không có mô hình rõ ràng như video, ảnh, văn bản tự do ✅ D. Email có định dạng chuẩn
Câu 5. Một ví dụ về dữ liệu bán cấu trúc là: lOMoAR cPSD| 58968691 A. Hình ảnh từ camera
B. Cơ sở dữ liệu quan hệ
• C. File JSON hoặc XML ✅ D. Văn bản giấy
Câu 6. Mục tiêu chính của giai đoạn phân tích dữ liệu lớn là:
• A. Lưu trữ dữ liệu lâu dài
• B. Tính toán và trích xuất thông tin giá trị ✅
• C. Tối ưu hoá định dạng file D. Nén dữ liệu hiệu quả
Câu 7. Công nghệ nào KHÔNG được đề cập là nền tảng cho Big Data? • A. Tính toán song song • B. Lưu trữ phân tán
• C. Giao thức Bluetooth ✅
• D. Học máy (Machine Learning)
Câu 8. Quy trình xử lý dữ liệu lớn bao gồm các bước:
• A. Trích xuất – Mã hoá – Lưu trữ
• B. Thu thập – Lưu trữ – Phân tích ✅
• C. Lưu trữ – Xoá – Truy xuất
• D. Phân tích – Đào tạo – Tái cấu trúc
Câu 9. Tính ‘Velocity’ trong Big Data đề cập đến:
• A. Tốc độ tạo và xử lý dữ liệu ✅
• B. Tốc độ truyền file zip
• C. Độ dài dòng dữ liệu D. Dung lượng ổ đĩa
Câu 10. Một trong các ứng dụng của Big Data là: lOMoAR cPSD| 58968691
A. Vẽ bản đồ nhiệt độ môi trường
B. Xác định vị trí xe buýt
C. Dự đoán xu hướng bệnh cúm với Google Flu Trends ✅
• D. Tạo sơ đồ cây phân cấp
Câu 11. Trong Big Data, dữ liệu cảm biến và thiết bị IoT được xếp vào loại:
• A. Dữ liệu có cấu trúc
• B. Dữ liệu phi cấu trúc
• C. Dữ liệu bán cấu trúc ✅ D. Dữ liệu thời gian thực
Câu 12. Công nghệ phân tán trong Big Data giúp:
• A. Lưu trữ dữ liệu nhỏ hiệu quả hơn
• B. Tăng độ chính xác xử lý hình ảnh
• C. Phân chia xử lý dữ liệu lớn song song trên nhiều nút ✅ D. Giao tiếp giữa thiết bị ngoại vi
Câu 13. Dữ liệu lớn có thể đến từ nguồn nào sau đây? • A. Máy in và bàn phím
• B. Báo cáo văn bản thủ công
• C. Mạng xã hội, cảm biến, thiết bị y tế ✅ D. Ổ cứng di động
Câu 14. Big Data giúp các doanh nghiệp:
• A. Giảm thời gian tải ứng dụng
• B. Phân tích hành vi khách hàng và ra quyết định tốt hơn ✅
• C. Tăng chi phí lưu trữ D. Loại bỏ dữ liệu cũ
Câu 15. Hệ thống xử lý Big Data phải đảm bảo: lOMoAR cPSD| 58968691
• A. Có cấu trúc bảng dữ liệu đơn giản
B. Lưu trữ được tối thiểu 1 TB
C. Có khả năng mở rộng và xử lý phân tán ✅
D. Tương thích với hệ điều hành di động
Câu 16. Một công cụ mã nguồn mở nổi bật để xử lý Big Data là: • A. Apache Hadoop ✅ • B. Microsoft Excel • C. Oracle SQL • D. Adobe Photoshop
Câu 17. Tính Veracity trong Big Data đề cập đến:
• A. Dung lượng dữ liệu
• B. Tính chính xác và đáng tin cậy của dữ liệu ✅ • C. Tốc độ lưu trữ
• D. Định dạng file chuẩn
Câu 18. Big Data KHÔNG đặc trưng bởi yếu tố nào sau đây? • A. Volume • B. Velocity
• C. Virtualization ✅ D. Variety
Câu 19. Big Data ngày nay chủ yếu được xử lý trong môi trường:
• A. Đơn nhiệm (single thread)
• B. Tập trung (centralized)
• C. Phân tán (distributed) ✅
• D. Văn phòng nhỏ (local office) lOMoAR cPSD| 58968691
Câu 20. Lợi ích của Big Data đối với y tế là:
• A. Quản lý mạng không dây
• B. Dự đoán dịch bệnh và cá nhân hóa điều trị ✅
C. Sản xuất thuốc thủ công
D. Lưu trữ hồ sơ bệnh án giấy lOMoAR cPSD| 58968691
Câu 21. Dữ liệu bán cấu trúc thường được lưu dưới dạng: • A. File nhị phân • B. Văn bản ASCII • C. JSON, XML ✅ • D. CSV truyền thống
Câu 22. Một đặc điểm của dữ liệu lớn là gì?
• A. Tĩnh và ít thay đổi
• B. Tăng trưởng nhanh và liên tục ✅
• C. Chỉ tồn tại trong thiết bị cá nhân D. Luôn có cấu trúc rõ ràng
Câu 23. Ví dụ nào sau đây KHÔNG phải là ứng dụng của Big Data?
• A. Dự đoán hành vi tiêu dùng
• B. Cá nhân hóa quảng cáo
• C. Quản lý mật khẩu mạng xã hội ✅ D. Phát hiện gian lận tài chính
Câu 24. Dữ liệu lớn mang lại giá trị thực tế khi:
• A. Chỉ lưu trữ mà không phân tích
• B. Được phân tích để hỗ trợ ra quyết định ✅
• C. Được sao chép trên nhiều đĩa D. Giảm băng thông hệ thống
Câu 25. Hệ thống Big Data cần xử lý dữ liệu:
• A. Theo nhóm người dùng
• B. Một chiều duy nhất
• C. Theo thời gian thực và theo lô ✅
• D. Qua các thiết bị di động
Câu 26. Đơn vị nào sau đây thường KHÔNG dùng để đo lượng dữ liệu lớn? • A. Petabyte • B. Terabyte • C. Gigabyte lOMoAR cPSD| 58968691 • D. Megabyte ✅
Câu 27. Big Data có thể ứng dụng trong giáo dục bằng cách:
• A. Dự đoán kết quả học tập và tối ưu hóa lộ trình học ✅
• B. Lưu trữ sách giấy
• C. Tăng thời lượng giảng dạy D. In giáo trình tự động
Câu 28. Dữ liệu có cấu trúc thường được lưu trữ trong: • A. Ảnh JPEG
• B. Cơ sở dữ liệu quan hệ ✅ • C. Văn bản Word • D. File âm thanh MP3
Câu 29. Ví dụ về dữ liệu phi cấu trúc là:
• A. Dữ liệu log hệ thống ✅
• B. File Excel có công thức
• C. Bảng SQL với khóa chính D. Biểu đồ tần suất
Câu 30. Việc thu thập dữ liệu trong Big Data cần đảm bảo yếu tố nào?
• A. Độ lớn và sự đồng nhất
• B. Đúng thời điểm, đủ và đáng tin cậy ✅ • C. Nguồn từ file CSV
• D. Tập trung vào tốc độ mạng
Câu 31. Dữ liệu lớn yêu cầu công nghệ gì để phân tích hiệu quả? A. Công cụ bảng tính B. Phân tích định tính
• C. Công nghệ tính toán song song và phân tán ✅ D. Máy tính cá nhân lOMoAR cPSD| 58968691
Câu 32. Thách thức lớn khi xử lý Big Data là:
• A. Thiếu bộ nhớ tạm
• B. Tốc độ tải internet
• C. Đảm bảo độ tin cậy và bảo mật của dữ liệu ✅ D. Khó tạo bảng báo cáo
Câu 33. Đặc điểm nào sau đây mô tả đúng về Big Data?
• A. Được thu thập một lần rồi lưu mãi
• B. Luôn được tổ chức có cấu trúc
• C. Thường xuyên thay đổi và mở rộng nhanh chóng ✅ D. Có thể xử lý hoàn toàn bằng Excel
Câu 34. Nền tảng điện toán đám mây giúp ích gì cho Big Data?
• A. Giảm kích thước tệp dữ liệu
• B. Lưu trữ dữ liệu ngoại tuyến
• C. Mở rộng khả năng lưu trữ và tính toán linh hoạt ✅ D. Cố định cấu trúc dữ liệu
Câu 35. Big Data có thể giúp chính phủ:
• A. Xử lý hành chính chậm hơn
• B. Theo dõi, phân tích giao thông và y tế ✅
• C. Tăng chi phí vận hành
• D. Quản lý lương nhân viên
Câu 36. Một trong những yếu tố quyết định giá trị của Big Data là:
A. Dữ liệu có được thu từ người nổi tiếng không lOMoAR cPSD| 58968691
B. Dữ liệu được chia sẻ qua mạng xã hội
C. Dữ liệu mang lại thông tin hữu ích cho ra quyết định ✅
• D. Dữ liệu có chứa biểu tượng đặc biệt
Câu 37. Trong phân tích Big Data, 'Descriptive Analytics' có vai trò:
• A. Dự đoán tương lai
• B. Hiển thị cảm xúc người dùng
• C. Mô tả dữ liệu đã xảy ra ✅ D. Sinh dữ liệu mới
Câu 38. Một ví dụ về ứng dụng Big Data trong thương mại điện tử là:
• A. Quản lý đường dây nóng
• B. Đề xuất sản phẩm theo hành vi mua sắm ✅
• C. Tạo hóa đơn thủ công D. In mã vạch
Câu 39. Đơn vị đo dữ liệu thường dùng cho Big Data là: • A. Byte
• B. Terabyte hoặc Petabyte ✅ • C. Megabit • D. Kilobyte
Câu 40. Mục tiêu cuối cùng của xử lý Big Data là:
• A. Tạo hệ thống backup dữ liệu
• B. Tạo báo cáo dạng bảng
• C. Khai phá thông tin để hỗ trợ ra quyết định ✅ D. Lưu trữ trong các ổ SSD tốc độ cao lOMoAR cPSD| 58968691
Câu 41. Một hệ thống Big Data tốt cần khả năng mở rộng như thế nào?
A. Chỉ mở rộng chiều ngang
B. Mở rộng cả chiều ngang và chiều dọc ✅ C. Không cần mở rộng
D. Mở rộng khi đầy bộ nhớ RAM
Câu 42. Đặc điểm nào sau đây là yêu cầu quan trọng của hệ thống Big Data?
• A. Giao diện đồ họa đẹp
• B. Tốc độ truyền internet cao
• C. Khả năng xử lý song song và dữ liệu phân tán ✅ D. Hệ điều hành Windows
Câu 43. Tính năng nào làm cho Big Data khác biệt với dữ liệu truyền thống?
• A. Dữ liệu ít thay đổi
• B. Cần xử lý real-time ✅
• C. Có cấu trúc rõ ràng D. Lưu trữ cục bộ
Câu 44. Một trong những nguồn sinh ra dữ liệu lớn hiện nay là:
• A. Thiết bị quét mã QR
• B. Điện thoại di động thông minh và ứng dụng mạng xã hội ✅ • C. Máy in văn phòng
• D. Máy tính bảng không kết nối mạng
Câu 45. Big Data được xem là cách mạng công nghệ vì:
• A. Giúp tiết kiệm điện năng
• B. Làm cho dữ liệu nhỏ hơn lOMoAR cPSD| 58968691
• C. Tạo ra phương pháp tiếp cận mới để phân tích và ra quyết định ✅ D. Đơn
giản hóa mô hình toán học
Câu 46. Để xử lý dữ liệu Big Data dạng batch, ta cần công nghệ: A. Spark Streaming B. Apache Hadoop ✅ C. Apache Kafka D. Tableau
Câu 47. Hadoop sử dụng mô hình xử lý nào? • A. Publish-Subscribe • B. Master-Slave • C. MapReduce ✅ • D. Request-Response
Câu 48. Big Data đóng vai trò gì trong lĩnh vực tài chính?
• A. Tăng tốc độ in sao kê
• B. Dự đoán rủi ro và phát hiện gian lận ✅
• C. Quản lý máy tính văn phòng D. Tăng tốc độ WiFi
Câu 49. Sự phát triển của cảm biến và IoT góp phần tạo ra:
• A. Dữ liệu nhỏ nhưng quan trọng
• B. Dữ liệu tập trung
• C. Dữ liệu thời gian thực và liên tục ✅ D. Dữ liệu đã qua xử lý
Câu 50. Lý do dữ liệu lớn cần hệ thống lưu trữ đặc biệt là: lOMoAR cPSD| 58968691
• A. Dữ liệu khó đọc
• B. Dữ liệu dễ biến mất
• C. Dữ liệu rất lớn và phức tạp ✅
• D. Dữ liệu không có định dạng
Câu 51. Khi dữ liệu có tốc độ sinh ra quá nhanh, điều này liên quan đến yếu tố nào trong Big Data? A. Volume B. Variety C. Velocity ✅ lOMoAR cPSD| 58968691 D. Veracity
Câu 52. Phân tích dữ liệu lớn mang lại lợi ích gì cho doanh nghiệp?
• A. Phát hiện lỗi phần cứng
• B. Tăng chi phí quản lý
• C. Hỗ trợ ra quyết định chính xác hơn ✅ D. Làm giảm hiệu suất mạng
Câu 53. Phân tích dự đoán (Predictive Analytics) trong Big Data nhằm mục tiêu:
• A. Xem lại dữ liệu cũ
• B. Dự đoán xu hướng tương lai dựa vào dữ liệu hiện tại ✅
• C. Mô tả sự kiện trong quá khứ D. Nén dữ liệu
Câu 54. Loại dữ liệu nào sau đây KHÔNG phải là dữ liệu phi cấu trúc?
• A. Ảnh từ camera giám sát • B. Tệp âm thanh
• C. Email không định dạng
• D. Cơ sở dữ liệu quan hệ ✅
Câu 55. Big Data giúp cải thiện dịch vụ khách hàng bằng cách:
• A. Tự động thay đổi chính sách bảo hành
• B. Phân tích hành vi để cá nhân hoá dịch vụ ✅
• C. Giảm lương nhân viên
• D. Tăng thời gian phản hồi
Câu 56. Công nghệ đám mây (Cloud) hỗ trợ Big Data như thế nào? lOMoAR cPSD| 58968691
• A. Không liên quan đến Big Data
B. Hạn chế dung lượng lưu trữ
C. Tăng chi phí triển khai
D. Cung cấp khả năng mở rộng lưu trữ và xử lý dữ liệu ✅
Câu 57. Yếu tố ‘Veracity’ đề cập đến:
• A. Định dạng tệp dữ liệu
• B. Tính đúng đắn và đáng tin cậy của dữ liệu ✅ • C. Tốc độ xử lý
• D. Kích thước dữ liệu
Câu 58. Một hệ thống Big Data lý tưởng cần đảm bảo các yếu tố:
• A. Giao diện đồ họa đẹp, dễ dùng
• B. Có thể hoạt động offline lâu dài
• C. Volume, Variety, Velocity, Veracity, và Value ✅ D. Tốc độ mạng cao và máy chủ mạnh
Câu 59. Big Data giúp tổ chức y tế như thế nào?
• A. Lưu hồ sơ sức khỏe dạng giấy
• B. Tối ưu quy trình chăm sóc, phân tích bệnh lý và dự đoán dịch ✅
• C. Tăng thời gian chờ khám D. Giảm số lượng bác sĩ
Câu 60. Khối lượng dữ liệu tăng lên nhanh chóng thường do: • A. Quảng cáo TV
• B. Tốc độ mạng tăng
• C. Mạng xã hội, thiết bị IoT và cảm biến ✅ D. Dữ liệu máy in
Câu 61. Một đặc điểm quan trọng của dữ liệu lớn là:
• A. Được cập nhật hàng năm
• B. Có thể lưu trữ trên USB
• C. Tăng trưởng theo cấp số nhân ✅
• D. Chỉ tồn tại trong văn bản lOMoAR cPSD| 58968691
Câu 62. Big Data cho phép doanh nghiệp cải thiện hiệu quả bằng cách nào?
• A. Giảm số lượng sản phẩm
• B. Tự động hóa tất cả các quy trình
• C. Phân tích và dự đoán hành vi khách hàng ✅ D. Dừng việc phân tích số liệu
Câu 63. Trong Big Data, dữ liệu streaming được xử lý:
• A. Sau khi lưu trữ đầy đủ
• B. Một lần duy nhất mỗi tháng
• C. Gần như ngay lập tức khi dữ liệu đến ✅ D. Sau khi sao lưu dữ liệu
Câu 64. Big Data giúp phát hiện gian lận bằng cách:
• A. Lọc email tự động
• B. Theo dõi các hành vi bất thường trong dữ liệu lớn ✅
• C. Giảm chất lượng dữ liệu D. Chặn truy cập internet
Câu 65. Việc khai phá dữ liệu lớn đòi hỏi kỹ thuật nào sau đây?
• A. Soạn văn bản tự động
• B. Quản lý thiết bị ngoại vi
• C. Học máy (Machine Learning) ✅ D. Thiết kế giao diện web
Câu 66. Mô hình dữ liệu trong Big Data thường là: • A. Tĩnh và cố định
• B. Đa dạng và linh hoạt ✅ • C. Dạng bảng Excel
• D. Tập trung duy nhất một kiểu
Câu 67. Các ngành công nghiệp sử dụng Bing Dắt nhiều nhất gồm: lOMoAR cPSD| 58968691
A. In ấn và sản xuất giấy
B. Thời trang và nội thất
• C. Tài chính, y tế, bán lẻ ✅
• D. Nông nghiệp truyền thống
Câu 68. Một vấn đề khi làm việc với Big Data là: • A. Không thể sao lưu
• B. Dễ bị lặp dữ liệu và khó làm sạch ✅
• C. Thiếu định dạng chuẩn D. Không thể mã hóa
Câu 69. Trong phân tích Big Data, 'Prescriptive Analytics' dùng để:
• A. Đưa ra hành động tối ưu hóa trong tương lai ✅
• B. Dự đoán dịch bệnh
• C. Mô tả lịch sử dữ liệu D. Tạo file backup
Câu 70. Việc tích hợp dữ liệu từ nhiều nguồn đòi hỏi hệ thống có khả năng: • A. Lưu trữ offline
• B. Kết nối trực tiếp với người dùng
• C. Xử lý dữ liệu không đồng nhất và đa định dạng ✅ D. Tăng kích thước RAM máy chủ
Câu 71. Dữ liệu cảm biến trong Big Data thường có đặc điểm:
• A. Cập nhật định kỳ hàng tháng
• B. Dạng văn bản đơn giản
• C. Sinh liên tục và theo thời gian thực ✅ D. Chỉ lưu trữ nội bộ
Câu 72. Big Data có thể giúp cải thiện chăm sóc sức khỏe như thế nào? lOMoAR cPSD| 58968691 A. Tăng chi phí thuốc
B. Cá nhân hóa điều trị và chẩn đoán chính xác hơn ✅
C. Cắt giảm nhân sự y tế
• D. Tạo mã QR bệnh án
Câu 73. Dữ liệu phi cấu trúc có thể là:
• A. Hình ảnh, video, văn bản tự do ✅
• B. Bảng cơ sở dữ liệu quan hệ
• C. File Excel chuẩn hóa D. File XML chuẩn
Câu 74. Việc lựa chọn công cụ xử lý Big Data phụ thuộc vào:
• A. Sở thích người dùng
• B. Định dạng tệp trình bày • C. Tốc độ mạng
• D. Kiểu dữ liệu và yêu cầu phân tích ✅
Câu 75. Khả năng xử lý dữ liệu theo thời gian thực giúp:
• A. Tối ưu hóa quyết định ngay lập tức ✅
• B. Giảm số lượng bản ghi
• C. Tăng thời gian xử lý
• D. Bảo mật dữ liệu tốt hơn
Câu 76. Nguồn dữ liệu chủ động thường đến từ:
• A. Người dùng nhập liệu, khảo sát ✅ • B. Camera an ninh
• C. Máy quét nhiệt độ
• D. Thiết bị theo dõi nhịp tim lOMoAR cPSD| 58968691
Câu 77. Giá trị (Value) trong Big Data đề cập đến: A. Tỷ lệ nén dữ liệu
B. Ý nghĩa thông tin thu được từ dữ liệu ✅ C. Giá trị số học
D. Mức độ bảo mật dữ liệu
Câu 78. Một ví dụ thực tế ứng dụng Big Data trong giao thông là:
• A. Quản lý lịch học
• B. Phát hiện kẹt xe qua dữ liệu cảm biến và GPS ✅ • C. Bán vé tàu giấy
• D. Tăng tốc độ wifi trên tàu
Câu 79. Một thách thức trong lưu trữ Big Data là:
• A. Không tìm được ổ cứng tương thích
• B. Chi phí lưu trữ và yêu cầu mở rộng liên tục ✅ • C. Không thể sao lưu • D. Phải lưu trong RAM
Câu 80. Trong Big Data, dữ liệu từ mạng xã hội thường là:
• A. Có cấu trúc rõ ràng
• B. Dữ liệu bán cấu trúc
• C. Dữ liệu phi cấu trúc ✅ D. Dữ liệu dòng sự kiện chuẩn hóa
Câu 81. Một mục tiêu của Big Data là:
• A. Lưu trữ dữ liệu vĩnh viễn
• B. Tối ưu hóa quá trình ra quyết định ✅
• C. Giảm tốc độ xử lý dữ liệu D. Loại bỏ dữ liệu cũ lOMoAR cPSD| 58968691
Câu 82. Big Data có thể hỗ trợ việc dạy và học bằng cách: • A. Giảm số môn học
B. Cá nhân hóa nội dung học tập dựa trên hành vi người học ✅ C. Xoá bài tập về nhà lOMoAR cPSD| 58968691
D. Rút ngắn thời lượng kỳ thi
Câu 83. Công nghệ Hadoop được thiết kế để:
• A. Xử lý dữ liệu hình ảnh
• B. Lưu trữ tạm thời dữ liệu trong RAM
• C. Xử lý dữ liệu lớn theo mô hình phân tán ✅ D. Thay thế cơ sở dữ liệu quan hệ
Câu 84. Tốc độ xử lý dữ liệu lớn được cải thiện nhờ vào: • A. Máy tính để bàn
• B. Cơ sở dữ liệu quan hệ
• C. Kiến trúc xử lý song song và phân tán ✅ D. Tăng bộ nhớ máy in
Câu 85. Một hệ thống Big Data phải có khả năng:
• A. In báo cáo nhanh chóng
• B. Lưu trữ dữ liệu ở định dạng .docx
• C. Mở rộng dễ dàng khi dữ liệu tăng ✅ D. Bảo vệ chống lại virus máy tính
Câu 86. Yếu tố nào trong Big Data thể hiện độ tin cậy của dữ liệu? • A. Volume • B. Velocity • C. Variety • D. Veracity ✅
Câu 87. Dữ liệu từ cảm biến và thiết bị IoT thường mang tính:
• A. Cấu trúc và chuẩn hóa