



















Preview text:
lOMoAR cPSD| 59561309
Ôn Nhập môn khoa học dữ liệu và trí tuệ nhân tạo
Câu 1: Đáp án đầy đủ nhất khi nói về khía cạnh chính của khoa học dữ liệu?
A. Tiền sử lí dữ liệu B. Phân tích dữ liệu
C. Tất cả các lựa chọn còn lại D. Thu thập dữ liệu
Câu 2. Đại lượng nào sau đây KHÔNG được coi là đặc trưng thống kê về cân nặng
của gà trong một trang trại?
a. Giá trị trung vị (median)
b. Giá trị trung bình (mean) c. Phương sai (Variance) d. Tên chủ trang trại Câu 3. a. 0.00 b. -0,97 c. 1.00 lOMoAR cPSD| 59561309 d. -1.00
Câu 4. Mục đích của trực quan trong dữ liệu trong khoa học dữ liệu là gì?
a. Để chuẩn bị dữ liệu cho việc xây dựng các thuật toán học máy
b. Để tìm kiếm các quy luật trong dữ liệu
c. Để làm sạch và xử lí dữ liệu
d. Để thực hiện việc trình bày thông tin bằng ngôn ngữ hình ảnh phục vụ việc
trao đổi thông điệp và dữ liệu với các bên liên quan.
Câu 5. Việc chuẩn hoá dữ liệu là gì?
a. Là quá trình biến đổi dữ liệu theo phân phối Gaussian
b. Là quá trình biến đổi dữ liệu sang một định dạng(format) chuẩn
c. Là quá trình loại bỏ những điểm những dữ liệu bất thường
d. Là quá trình thay đổi lại thnag đo của các đại lượng trong tập dữ liệu để dùng trong học máy
Câu 6. Cho tập dữ liệu sau
X= [ -1.444, - 1,467, - 1.224, -1.151, - 1.402]
Giá trị độ lệch chuẩn (std) của tập dữ liệu trên là? a. 0.712 b. 0.127 c. -0.127 d. 0.712
Câu 7. Cho tập dữ liệu sau:
X=[-0.044, -0,314, -0.03,-0.01, -0.205]
Giá trị trung vị (median) của tập dữ liệu trên là? a. -0.044 b. -0.030 c. -0.205 lOMoAR cPSD| 59561309 d. -0.314
Câu 8. Cho tập dữ liệu sau:
X=[-0.426,-0.428,-0.464, -0.207,-0.276]
Giá trị trung vị(median) của tập dữ liệu trên là? a. -0.426 b. -0.207 c. 0.428 d. -0.276
Câu 9. Một hãng oto muốn nghiên cứu khả năng mua một loại xe mới của khách
hàng, đối tượng nghiên cứu phù hợp nhất là: a.
Tất cả các công nhân Việt Nam b.
Những người trưởng thành có độ tuổ từ 18 đến 60 c.
Tất cả người dân sông tại TPHCM d.
Tất cả những người dân sống tại TP HN Câu 10. Cho tập dữ liệu sau:
X=[0.929, -1,656, -2.281, -4.177, 1.712]
Giá trị trung bình của tập dữ liệu trên là a. 1.095 b. -1.095 c. -0.995 d. 2.092
Câu 11. Mệnh đề nào sau đây ĐÚNG trong các mệnh đề sau:
A. Trí tuệ nhân tạo là khả năng thích nghi của các loài động vật
B. Trí tuệ nhân tạo là khả năng của con người có thể xây dựng các chương trình máy tính có thể học.
C. Trí tuệ nhân tạo có thể được xem như một chương trình máy tính có thể khái
quát hoá tri thức từ dữ liệu để thực hiện một chức năng nào đó giống con người.
D. Trí tuệ nhân tạo là trí tuệ tự nhiên của con người.
Câu 12. Biểu đồ tần suất(histogram) là gì? lOMoAR cPSD| 59561309
A. Là biểu đồ thể hiên sự phân phối của các điểm
B. Là biểu đồ thể hiện tần suất xuất hiện của các điểm dữ liệu
C. Là biểu đồ thể hiện giá trị trung bình của tập dữ liệu
D. Là biểu đồ thể hiện mối quan hệ giữa các biến Câu 13. Cho tập dữ liệu sau:
X=[-0.703, -0.344,-0.669, -0.636,-0.913]
Giá trị trung bình của tập dữ liệu trên là? A. 0.653 B. -0.365 C. 0.365 D. -0.635
Câu 14. Cho tập dữ liệu sau:
X=[-1.217, -2.059, -0.868, -0.341, -1.237] giá trị trung bình A. -0.615 B. -0.651 C. 0.615 D. -1.1444
Câu 15. Phát biêu nào sau đây không chính xác
A. Giá trị trung bình của một tập dữ liệu luôn lớn hơn giá trị nhỏ nhất
B. Phương sai là đại lượng đặc trưng cho độ phân tán của tập dữ liệu
C. Giá trị trung bình của một tập dữ liệu luôn nhỏ hơn giá trị lớn nhất
D. Phương sai là đại lượng đo lường dữ liệu
Câu 16. Đặc trưng thuộc tính của dữ liệu là gì
A. Vector có số thành phần bằng tổng số điểm dữ liệu và số thuộc tính
B. Là số đối tượng nghiên cứu trong tập dữ liệu
C. Vector trong không gian 3 chiều
D. Là tập hợp các thuộc tính của các đối tượng nghiên cứu lOMoAR cPSD| 59561309 Câu 17. A. -1.00 B. 1.00 C. -0.64 D. +0.64 lOMoAR cPSD| 59561309 Câu 18. A. Bar chart B. Pie chart C. Line plot D. Scatter plot lOMoAR cPSD| 59561309 Câu 19. A. Histogram B. Bar plot C. Line plot D. Pie plot lOMoAR cPSD| 59561309 Câu 20. A. 0.00 B. -0.97 C. 1.00 D. -1.00 lOMoAR cPSD| 59561309 Câu 21 A. 0.58 B. 1.00 C. -1.00 D. -0.58 Câu 22 . lOMoAR cPSD| 59561309 BIỂU ĐỒ HỘP Câu 23 TYPE 3
Câu 24. Một tập dữ liệu là gì
A. Tập hợp các thuật toán lOMoAR cPSD| 59561309
B. Tập hợp các công cụ để lưu trữ dữ liệu
C. Tập hợp các mô hình toán học
D. Tập hợp thông tin nguyên thuỷ của các đối tượng thoả mãn một điều kiện nghiên cứu nào đó.
Câu 25. Một tập dữ liệu thường được coi là một bảng, trong đó:
A. Số hàng bằng số điểm dữ liệu, số cột là số thuộc tính của các đối tượng dữ liệu
B. Số hàng luôn bằng số cột và bằng số điểm dữ liệu
C. Số hàng bằng số điểm dữ liệu , số cột là một đặc trưng(thuộc tính) của các điểm dữ liệu.
D. Số hàng bằng số cột
Câu 26. Để nghiên cứu khả năng mua hàng của một khách hàng thì các đặc trưng
nào về khách hàng là phù hợp với đối tượng nghiên cứu?
A. Tuổi, giới tính, thu nhập, địa chỉ, nghề nghiệp
B. Địa chỉ, địa chỉ email, chiều cao, cân nặng C. Địa chỉ, số điện
thoại, nhóm máu, nghề nghiệp
D. Địa chỉ email, tên, giới tính, nhóm máu.
Câu 27. Cho tập dữ liệu sau:
X=[-1.217, -2.059, -0.868, -0.342, -1.237]
Giá trị độ lệch chuẩn (std) của tập dữ liệu trên là A. -0.615 B. -0.651 C. 0.615 D. 0.561
Câu 28. Cho tập dữ liệu sau
X=[-1.444, -1,467, -1.224, -1.151,-1.402]
Giá trị độ lệch chuẩn của tập dữ liệu A. 0.712 B. 0.127 C. -0.127 D. 0.712 lOMoAR cPSD| 59561309
Câu 29. Mục đích chính của khoa học dữ liệu là gì
A. Nghiên cứu để trích xuất các giá trị ấn trong dữ liệu phục vụ việc đưa ra các
quyết định để giải quyết một bài toán nghiệp vụ nào đó.
B. Tất cả các đáp án khác đều đúng
C. Nghiên cứu để lưu trữ và quản lí dữ liệu
D. Để trực quan hoá dữ liệu và xây dựng báo cáo
Câu 30. Phần mềm nào sau đây Không phải là công cụ chính của khoa học dữ liệu? A. Ngôn ngữ lập trình R
B. Các phần mềm xử lý bảng tính (spreadsheet – Excel) C. Microsoft Word
D. Ngôn ngữ lập trình Python
Câu 31. Định nghĩa của khoa học dữ liệu là gì
A. Là việc sử dụng các mô hình thống kê để phân tích dữ liệu
B. Là quá trình thu thập lưu trữ và quản lý dữ liệu
C. Là lĩnh vực nghiên cứu liên ngành kết hợp toán thống kê khoa học dữ liệu và
một số kiến thức chuyên môn sâu của dữ liệu để tìm kiếm các quy luật từ các tập dữ liệu.
D. Là việc tạo ra các biểu đồ trực quan hoá dữ liệu để trình bày các quy luật trong dữ liệu .
Câu 32. Vai trò của nhà khoa học dữ liệu là gì?
A. Xây dựng các mô hình dự báo và thuật toán
B. Tất cả các phương án khác
C. Thu thập và làm sạch dữ liệu
D. Xây dựng các phương thức trao đổi thông tin tóm tắt bản chất của dữ liệu liên quan
Câu 33. Mục đích chính trong công việc của các nhà khoa học dữ liệu là gì?
A. Cung cấp các gợi ý cho việc phát triển sản phẩm và dịch vụ mới
B. Cải tiến quá trình xây dựng các quyết định trong kinh doanh
C. Tất cả các phương pháp nghiên cứu
D. Hỗ trợ các nghiên cứu khoa học
Câu 34. Các kĩ năng cần có để thực thi một nhà phân tích dữ liệu cần có?
A. Kỹ năng phân tích thống kê dữ liệu lOMoAR cPSD| 59561309 B. Kỹ năng lập trình
C. Kỹ năng giao tiếp và trình bày
D. Tất cả các kĩ năng được liệt kê
Câu 35. Các hàng trong một bảng dữ liệu thường chứa các thông tin gì?
A. Là một tập con thuộc các thuộc tính của một dữ liệu
B. Là một tập con của các trường thông tin
C. Là một trường thông tin chứa giá trị của một thuộc tính của các mẫu (đối tượng) dữ liệu
D. Là các mẫu ( đối tượng) trong tập dữ liệu
Câu 36. Một đặc trưng của các mẫu (đối tượng) trong tập dữ liệu là gì? A.
Là một thuộc tính của các mẫu dữ liệu B.
Là một đối tượng trong tập dữ liệu C.
Là một hàng trong bảng dữ liệu D.
Là một tập hợp các đối tượng được nghiên cứu Câu 37. Phát biểu nào
sau đây là KHÔNG chính xác?
A. Giá trị trung bình của một tập dữ liệu luôn lớn giá trị nhỏ nhất
B. Phương sai là đại lượng đặc trưng cho độ phân tán của tập dữ liệu
C. Giá trị trung bình của một tập dữ liệu luôn nhỏ hơn giá trị lớn nhất
D. Phương sai là đại lượng đo lường dữ liệu
Câu 38. Đại lượng nào sau đây KHÔNG được coi là đặc trưng thống kê về cân nặng
của đàn gà trong một trang trại? A. Giá trị trung vị B. Phương sai C. Giá trị trung bình D. Tên người chủ trại
Câu 39. Công cụ nào sau đây không dùng để biểu diễn trực quan hoá dữ liệu?
A. Các mô hình hồi qui tuyến tính B. Box plot C. Bar plot D. Scatter plot
Câu 40. Đại lượng trung vị là gì? A.
Là đại lượng chia đôi tập dữ liệu lOMoAR cPSD| 59561309 B.
Là trung bình cộng của tập dữ liệu C.
Là giá trị có tần suất xuất hiện nhiều nhất D.
Là giá trị trung bình của tập dữ liệu Câu 41. Một tập dữ liệu là gì? A. Tập các thuật toán
B. Tập hợp thông tin nguyên thuỷ của các đối tượng thoả mãn một điều kiện nghiên cứu nào đó
C. Tập hợp các công cụ để lưu trữ dữ liệu
D. Tập hợp các mô hình toán học
Câu 42. Bước đầu tiên trong một quá trình làm khoa học dữ liệu A. Phân tích dữ liệu
B. Trực quan hoá dữ liệu C. Làm sạch dữ liệu D. Thu thập dữ liệu
Câu 43. Mục tiêu chính của việc làm sạch dữ liệu là gì?
A. Để loại bỏ những điểm dữ liệu bị thiếu và không phù hợp
B. Để bảo đảm tính chính xác và tương thích của dữ liệu C. Cả 2 đáp án trên
Câu 44. Một tập dữ liệu được coi là môt bảng:
A. Số hàng bằng số điểm dữ liệu số cột là một đặc trưng (thuộc tính) của điểm dữ liệu
B. Số hàng bằng số cột
C. Số hàng luôn bằng số cột và bằng số điểm dữ liệu
D. Số hàng bằng số mẫu (đối tượng) của tập dữ liệu số cột là số thuộc tính của
các mẫu (đối tượng) dữ liệu
Câu 45. Chương trình máy tính nào sau đây KHÔNG được coi là một ứng dụng của trí tuệ nhân tạo ?
A. Chương trình điều khiển xe tự lái
B. Chương trình quản lý sinh viên
C. Chương trình gợi ý các sản phẩm hoặc dịch vụ cho khách hàng
D. Chương trình nhận diện khuôn mặt
Câu 46. Đặc trưng thuộc tính của tập dữ liệu là gì? lOMoAR cPSD| 59561309 A.
Là tập hợp các thuộc tính (giá trị thuộc tính) của các đối tượng nghiên cứu B.
Chính là số đối tượng nghiên cứu trong tập dữ liệu C.
Vector có số thành phần bằng tổng số điểm dữ liệu và số thuộc tính D.
Vector trong không gian 3 chiều Câu 47. Mệnh đề nào sau đây ĐÚNG?
A. Trí tuệ nhân tạo là trí tuệ của con người
B. Trí tuệ nhân tạo là khả năng thích nghi của các loài động vật
C. Trí nhân tạo có thể được xem như một chương trình máy tính có thể khái
quát hoá tri thức từ dữ liệu để thực hiện một chức năng nào đó giống như
một chuyên gia trong lĩnh vực đó.
D. Trí tuệ nhân tạo là khả năng của con người có thể xây dựng các chương trình máy tính có thể học.
Câu 48. Hệ số tương quan của 2 biến là gì?
A. Là đại lượng biểu diễn mối quan hệ giữa các giá trị trung bình của hai biến được chuẩn hoá
B. Là đại lượng biểu diễn mối quan hệ giữa các giá trị của hai biến đã được chuẩn hoá.
C. Là đại lượng biểu diễn mối quan hệ giữa các giá trị trung bình của hai biến
D. Là đại lượng biểu diễn mối quan hệ giữa hai biến.
Câu 49. Chức năng của tập huấn luyện trong học máy là gì
A. Dùng để huấn luyện mô hình
B. Dùng để so sánh với các mô hình khác
C. Dùng để đánh giá mô hình
D. Dùng để kiểm tra độ chính xác của mô hình.
Câu 50. Quá trình xây dựng một mô hình học máy thường gồm các bước nào?
A. Tiền sử lý dữ liệu B. Huấn luyện mô hình C. Thu nhập dữ liệu
D. Tất cả các bước trên.
Câu 51. Trong quá trình kiểm định một mô hình học máy phần trăm dữ liệu dành
cho tập kiểm tra thường là bao nhiêu? lOMoAR cPSD| 59561309 A. 10-20% B. 40-50% C. 30-40% D. 20-30%
Câu 52. Một mô hình hồi quy tuyến tính thường được sử dụng để làm gì?
A. Tìm ra mối quan hệ phi tuyến tính giữa các biến
B. Tìm ra các mẫu trong tập dữ liệu
C. Dự đoán một biến phụ thuộc từ một hoặc nhiều biến độc lập
D. Phân loại các điểm dữ liệu vào các nhóm khác nhau
Câu 53. Hệ số hồi quy trong một mô hình hồi quy tuyến tính thể hiện điều gì?
A. Mối quan hệ giữa biến phụ thuộc khi biến độc lập thay đổi
B. Mức độ biến động của biến phụ thuộc khi biến độc lập thay đổi
C. Giá trị trung bình của biến phụ thuộc
D. Giá trị trung bình của biến độc lập
Câu 54. Phát biểu nào sau đây đúng về quá trình tiền xử lí dữ liệu
A. Là bước không quan trọng trong quá trình làm khoa học dữ liệu
B. Là bước cuối cùng trong quá trình làm khoa học dữ liệu
C. Là bước đầu tiên trong quá trình làm khoa học dữ liệu
D. Là bước có thể bỏ qua trong quá trình làm khoa học dữ liệu
Câu 55. Mô hình hồi quy tuyến tính có thể được kiểm tra bằng cách nào? A.
Bằng cách kiểm tra giá trị trung bình của biến phụ thuộc B.
Bằng cách kiểm tra số tương quan giữa giá trị thực và giá trị dự đoán C.
Bằng cách kiểm tra phương sai của các biến độc lập D.
Bằng cách kiểm tra hệ số hồi quy của các biến độc lập Câu 56.
Độ chính xác của một mô hình học máy tính là gì?
A. Độ lệch chuẩn của các giá trị dự đoán
B. Tỷ lệ phần trăm các dự đoán đúng so với tổng số dự đoán
C. Tỷ lệ phần trăm các dự đoán so với tổng số dự đoán D. Sai số trung bình giữa
các giá trị thực và giá trị dự đoán.
Câu 57. Phương pháp nào sau đây được sử dụng để kiểm định độ chính xác của một mô hình học máy? lOMoAR cPSD| 59561309 A. K-fold validation B.
Tất cả các phương pháp trên C. Holdout validation D.
Cross-validation Câu 58. Với mô hình: y = 2x + 3 Hệ số góc là số nào? A. 2 B. 3 C. 4 D. 5 Câu 59. MAE là gì?
A. Giá trị trung bình của absolute error B. Bình phương của error C. Căn bậc 2 của lỗi
D. Không có phương án trả lời đúng
Câu 60. TÍnh phương sai chuỗi số: 7, 3, 9, 2, 8, 6 A. 0 B. 6.75 C. 6.5 D. 6.47
Câu 61. Mục tiêu chính của Data Science là gì?
A. Tạo ra các mô hình 3D chân thực
B. Thiết kế các trang web hấp dẫn
C. Khám phá các khuôn mẫu (patterns), thông tin hữu ích và đưa ra quyết định dựa trên dữ liệu
D. Phát triển các ứng dụng di động
Câu 62. Quá trình Data Science bao gồm các bước nào
A. Thiết kế đồ họa, tạo hoạt ảnh
B. Quảng cáo, bán hàng, tiếp thị
C. Thu thập dữ liệu, làm sạch dữ liệu, phân tích dữ liệu, trực quan hóa dữ liệu lOMoAR cPSD| 59561309
D. Lập trình, gỡ lỗi, triển khai
Câu 63. Ứng dụng của Data Science trong lĩnh vực chăm sóc sức khỏe là gì?
A. Chẩn đoán bệnh, phát hiện thuốc mới, y học cá nhân hóa
B. Thiết kế các công trình kiến trúc
C. Phát triển trò chơi điện tử
D. Tạo hiệu ứng hình ảnh cho phim
Câu 64. Loại AI nào tập trung vào việc thực hiện các nhiệm vụ cụ thể? A. AI hẹp (Narrow AI) B. AI siêu việt (Super AI)
C. AI đa nhiệm (Multitask AI)
D. AI tổng quát (General AI)
Câu 65. Phương pháp học có giám sát (supervised learning) có đặc điểm gì? A. Chỉ yêu cầu output
B. Yêu cầu cả input và output label C. Chỉ yêu cầu input
D. Tự học được theo thời gian
Câu 66. Phương pháp học AI nào sau đây có đặc điểm là dễ thu thập dữ liệu huấn luyện nhất A. Supervised learning B. Reinforcement learning C. Unsupervised learning
Câu 67. Công nghệ nhận diện khuôn mặt trong ứng dụng chuyển tiền ngân hàng thuộc phân loại AI nào? A. Generative AI B. Narrow AI
C. Artificial Superintelligence
Câu 68. Dữ liệu âm thanh thuộc loại là dữ liệu gì? A. Phi cấu trúc B. Bán cấu trúc C. Có cấu trúc
Câu 69. Dữ liệu điểm danh lớp học là loại dữ liệu gì? lOMoAR cPSD| 59561309 A. Có cấu trúc B. Bán cấu trúc C. Phi cấu trúc
Câu 70. Phần mềm nào sau đây ít có khả năng được sử dụng nhất trong khoa học dữ liệu?
A. Ngôn ngữ lập trình Python B. Phần mềm excel C. Phần mềm Photoshop D. Ngôn ngữ lập trình C
Câu 71. Mục đích của việc của làm khoa học dữ liệu là gì? A.
Hỗ trợ nghiên cứu khoa học B.
Hỗ trợ trong đưa ra quyết định trong kinh doanh C. Tất cả các phương án D.
Cung cấp gợi ý cho việc phát triển sản phẩm Câu 72. Một mẫu trong cơ sở dữ liệu là gì? A. Một ô trong bảng B. Một hàng trong bảng C. Một cột trong bảng D. Một bảng dữ liệu
Câu 73. Thuộc tính của mẫu dữ liệu là gì? A. Là hàng trong bảng
B. Là thông tin về cột trong bảng
C. Là ô giá trị trong bảng D. Là bảng dữ liệu
Câu 74. Câu nào sau đây đúng?
A. Hồi quy tuyến tính mô hình hóa mối quan hệ giữa 1 biến phụ thuộc và 1
hoặc nhiều biến độc lập
B. Hồi quy tuyến tính mô hình hóa mối quan hệ giữa 1 biến phụ thuộc và 1 biến độc lập
C. Hồi quy tuyến tính mô hình hóa mối quan hệ giữa 1 biến độc lập và nhiều biến phụ thuộc
D. Hồi quy tuyến tính mô hình hóa mối quan hệ giữa nhiều biến phụ thuộc
Câu 75. Logic mệnh đề là gì? lOMoAR cPSD| 59561309
A. Công cụ toán học logic, trong đó có các mệnh đề và các biểu thức.
B. Tập các ký hiệu và tập các luật xây dựng công thức
C. Xác định ngữ nghĩa của các công thức trong thế giới hiện thực.
D. Biểu diễn tri thức về thế giới với các đối tượng.
Câu 76. Câu nào dưới đây KHÔNG là một mệnh đề.
A. An là sinh viên khoa CNTT
B. An không phải học Trí Tuệ Nhân Tạo
C. X là sinh viên không phải học Trí tuệ nhân tạo.
D. An là sinh viên CNTT nhưng không phải học Trí tuệ nhân tạo.
Câu 77. Có mấy phép kết nối logic trong mệnh đề A. 2 B. 3 C. 4 D. 5
Câu 78. Ai là người đề ra thuật ngữ “Trí tuệ nhân tạo” A. John McCarthy B. Alan Turing C. Elon Musk D. Bill Gates Câu 79. Turing test là
A. Bài toán kiểm tra khả năng trí tuệ của máy tính
B. Bài toán kiểm tra khả năng giải thuật
C. Bộ câu hỏi lý thuyết về trí tuệ nhân tạo
D. Bộ câu hỏi lý thuyết về khoa học máy tính
Câu 80. Những mô hình tính toán có cách thức suy nghĩ giống con người được gọi là. A. Mô hình mạng nơ- ron
B. Mô hình hồi quy tuyến tính
C. Mô hình cây lí thuyết
D. Mô hình hồi quy logistic
Câu 81. Đâu là ứng dụng của trí tuệ nhân tạo A. Thị giác máy tính
B. Xử lý ngôn ngữ tự nhiên C. Học máy D. Tất cả đáp án trên
Câu 82. Hàm đánh giá dùng để
A. Tính toán mức độ tốt/xấu, khả năng về đích của trạng thái