







Preview text:
lOMoAR cPSD| 59561309 BÀI I:
Trí tuệ nhân tạo (AI) là gì?
A. Hệ thống máy tính có khả năng thực hiện công việc cần đến trí tuệ con
ngườiA ....................................................... Lỗi! Thẻ đánh dấu không được xác định.
B ..................................................................................................................................... 6
C ..................................................................................................................................... 6
D ..................................................................................................................................... 6
B. Một loại phần mềm xử lý văn bản
C. Một loại công nghệ phần cứng
D. Một phương pháp xử lý dữ liệu truyền thống
Ví dụ nào sau đây không phải là ứng dụng của trí tuệ nhân tạo? A. Robot
B. Cảnh báo lỗi chính tả trong văn bản C. Sinh giọng nói D. Nhận diện giọng nói
AI được chia thành bao nhiêu loại chính?
Trong các loại AI, AI nào có khả năng thực hiện các tác vụ mà chỉ con người có thể làm được? A. Generative AI
B. ANI (Artificial Narrow Intelligence)
C. AGI (Artificial General Intelligence) D. Cả A và B
Machine Learning làm AI trở nên phổ biến như thế nào? A.
Dựa trên các quy tắc được định nghĩa tường minh bởi con người B.
Cho phép máy tính phân tích dữ liệu và cải thiện hiệu suất mà không cần lập trình rõ ràng C.
Dựa trên việc xử lý dữ liệu một cách thủ công D.
Dựa trên việc sử dụng các công cụ phần cứng tiên tiến Học máy (Machine Learning) là gì? lOMoAR cPSD| 59561309
A. Một phần mềm quản lý cơ sở dữ liệu
B. Một loại ngôn ngữ lập trình
C. Một công cụ phân tích dữ liệu thủ công
D. Một phương pháp cho phép máy tính học từ dữ liệu và cải thiện theo thời gian
Large Language Models (LLMs) hoạt động như thế nào? A.
Bằng cách phân tích dữ liệu hình ảnh B.
Bằng cách sử dụng thuật toán không có giám sát C.
Bằng cách dự đoán tuần tự các từ tiếp theo trong một câu D.
Bằng cách tương tác trực tiếp với con người Big Data có các tính chất nào?
A. Variety, Value, Velocity, Veracity
B. Volume, Velocity, Variability, Visibility
C. Volume, Velocity, Variety, Variability
D. Volume, Value, Velocity, Veracity
Dữ liệu lớn (Big Data) là gì?
A. Dữ liệu có khối lượng lớn, bao gồm cả dữ liệu có cấu trúc và không có cấu trúc
B. Dữ liệu chỉ được thu thập từ internet
C. Dữ liệu được lưu trữ trong cơ sở dữ liệu quan hệ
D. Dữ liệu có khối lượng nhỏ
Những ví dụ nào dưới đây là dữ liệu bán cấu trúc? A. JSON, XML, CSV B. ERP, CRM, Database
C. Image, Sensor data, Radar info D. Video, Audio, Document
Khoa học dữ liệu (Data Science) làm gì?
A. Áp dụng các phương pháp khoa học để phân tích dữ liệu và hỗ trợ ra quyết định
B. Chỉ phân tích dữ liệu có cấu trúc
C. Chỉ lưu trữ dữ liệu mà không phân tích
D. Quản lý hệ thống máy chủ dữ liệu
Công việc của một Data Scientist thường liên quan đến những gì?
A. Quản lý cơ sở dữ liệu lOMoAR cPSD| 59561309 B. Lập trình web
C. Xử lý văn bản và tạo ra báo cáo
D. Phân tích thống kê và biểu diễn dữ liệu
Trí tuệ nhân tạo (AI) trong ngành công nghiệp ô tô có thể ứng dụng trong lĩnh vực nào?
A. Hệ thống lái tự động B. Xử lý văn bản C. Quản lý tài chính D. Thiết kế website
Dữ liệu trong Khoa học dữ liệu có thể đến từ đâu?
A. Chỉ từ các ứng dụng di động
B. Chỉ từ máy tính cá nhân
C. Chỉ từ các hệ thống quản lý doanh nghiệp
D. Từ nhiều nguồn như điện thoại, internet, và các thiết bị cảm biến
Học máy (Machine Learning) cho phép hệ thống làm gì theo thời gian? A.
Tự cải thiện hiệu suất khi được cung cấp thêm dữ liệu B.
Tự động tạo ra các dữ liệu mới C.
Tự động quản lý hệ thống mạng D.
Tự động hóa các tác vụ văn phòng Generative AI là gì?
A. Một loại AI có khả năng sáng tạo và tạo ra các nội dung mới
B. Một phương pháp tối ưu hóa dữ liệu
C. Một phần mềm quản lý cơ sở dữ liệu
D. Một công cụ phân tích dữ liệu thủ công
Ứng dụng của AI trong ngành ngân hàng và tài chính là gì?
A. Quản lý hệ thống mạng
B. Thiết kế giao diện người dung
C. Phân tích rủi ro và phát hiện gian lận D. Quản lý kho hang
Cơ hội nghề nghiệp trong lĩnh vực Khoa học dữ liệu bao gồm những vị trí nào?
A. Sales manager, Marketing Coordinator, Customer service representative
B. Content writer, Graphic designer, SEO specialist
C. Data analyst, Machine learning engineer, Data scientist
D. Network administrator, Web developer, System engineer lOMoAR cPSD| 59561309
Nguyên lý hoạt động của các mô hình ngôn ngữ lớn (LLMs) như thế nào?
A. Sử dụng học máy không có giám sát để phân tích hình ảnh
B. Dùng các thuật toán tối ưu hóa để tìm kiếm thông tin
C. Sử dụng học máy có giám sát để dự đoán tuần tự các từ tiếp theo
D. Dùng các quy tắc định nghĩa sẵn để xử lý văn bản
Các bài toán trong học máy thường bao gồm những loại nào? A.
Bài toán tìm kiếm, bài toán sắp xếp, bài toán tối ưu hóa B.
Bài toán hồi quy, bài toán phân loại dữ liệu, bài toán phân cụm dữ liệu C.
Bài toán xử lý hình ảnh, bài toán xử lý âm thanh, bài toán xử lý văn bản D.
Bài toán quản lý cơ sở dữ liệu, bài toán quản lý hệ thống mạng, bài toán lập trình BÀI II:
Những bước nào sau đây là một phần của quá trình phát triển sản phẩm AI/KHDL? A.
Thu thập dữ liệu, Tiền xử lý dữ liệu, Chuẩn bị dữ liệu B.
Phân tích yêu cầu người dùng, Kiểm thử phần mềm, Triển khai phần mềm C.
Thiết kế giao diện người dùng, Tạo báo cáo, Lập kế hoạch dự án D.
Đánh giá hiệu suất hệ thống, Bảo trì phần mềm, Phát triển phần mềm Định
nghĩa bài toán AI/KHDL bao gồm những yếu tố nào?
A. Xác định dữ liệu đầu vào và đầu ra, Phân tích yêu cầu kinh doanh, Đánh giá rủi ro dự án
B. Xác định trường thông tin (features) và biến dự đoán (label), Xác định chiến lược
thu thập dữ liệu, Đánh giá tính khả thi của sử dụng học máy
C. Lập kế hoạch dự án, Tạo mô hình dữ liệu, Xác định mục tiêu kinh doanh
D. Đánh giá hiệu quả dự án, Tạo mẫu thử nghiệm, Thu thập dữ liệu người dùng
Những vai trò nào sau đây thường tham gia trong một dự án AI/KHDL?
A. Nhà thiết kế UX/UI, Kỹ sư phần mềm, Quản lý dự án
B. Nhà phân tích thị trường, Chuyên gia tài chính, Nhân viên bán hang
C. Kỹ sư hệ thống, Chuyên gia bảo mật, Kế toán viên
D. Chuyên gia về lĩnh vực, Nhà khoa học dữ liệu, Kỹ sư dữ liệu
Quá trình ETL trong xử lý dữ liệu bao gồm các bước nào? A.
Lưu trữ dữ liệu, Phân tích dữ liệu, Tạo báo cáo từ dữ liệu B.
Trích xuất dữ liệu, Biến đổi dữ liệu, Tải dữ liệu vào hệ thống lưu trữ C.
Trích xuất dữ liệu thô, Lọc dữ liệu, Phân loại dữ liệu lOMoAR cPSD| 59561309 D.
Tải dữ liệu vào hệ thống, Biến đổi dữ liệu, Trích xuất dữ liệu từ nguồn Khi
gặp dữ liệu thiếu trong quá trình tiền xử lý, bạn nên làm gì?
A. Thêm dữ liệu giả định để thay thế cho dữ liệu thiếu
B. Thay thế dữ liệu thiếu bằng giá trị 0 hoặc giá trị trung bình
C. Bỏ qua dữ liệu thiếu và tiếp tục với dữ liệu hiện có
D. Loại bỏ tất cả các hàng có dữ liệu thiếu
Tại sao việc xác định mục tiêu kinh doanh lại quan trọng trong dự án AI/KHDL?
A. Nó giúp tiết kiệm chi phí phát triển phần mềm
B. Nó đảm bảo rằng dự án sẽ hoàn thành đúng thời hạn
C. Nó giúp xác định rõ ràng vấn đề cần giải quyết và cách đánh giá thành công
D. Nó giúp xác định các yêu cầu kỹ thuật của hệ thống
Trong một dự án AI, ai là người chịu trách nhiệm chính về việc thu thập và xử lý dữ liệu
A. Nhà khoa học dữ liệu
B. Chuyên gia về lĩnh vực C. Kỹ sư phần mềm D. Kỹ sư dữ liệu
Biến mục tiêu (target) trong bài toán nhận diện gian lận bảo hiểm thường là gì?
A. Số tiền yêu cầu bồi thường
B. Loại bảo hiểm mà khách hàng đã mua
C. Liệu yêu cầu bảo hiểm có phải là gian lận hay không (1: Có, 0: Không)
D. Độ tuổi của khách hàng
Dữ liệu nào sau đây thường được sử dụng để phát hiện gian lận bảo hiểm?
A. Lịch sử yêu cầu bồi thường, Hành vi bất thường, Điểm tín dụng
B. Địa điểm của khách hàng, Loại bảo hiểm, Tình trạng hôn nhân
C. Nghề nghiệp của khách hàng, Thời gian kể từ khi hợp đồng được cấp, Tần suất giao dịch
D. Tất cả các câu trên đều đúng
Khi nào bạn cần sử dụng quá trình ELT thay vì ETL
A. Khi dữ liệu có cấu trúc và cần được phân tích ngay lập tức
B. Khi dữ liệu không có cấu trúc hoặc có cấu trúc và cần tải vào dạng thô trước khi biến đổi
C. Khi dữ liệu cần biến đổi trước khi tải vào hệ thống
D. Khi dữ liệu cần được lưu trữ trong cơ sở dữ liệu quan hệ BÀI III:
Giá trị Mode của dãy số [4, 4, 6, 6, 7, 8, 9] là gì? lOMoAR cPSD| 59561309 A. 4 và 6 B. 6 C. 4 D. 7
Giá trị trung vị (Median) của dãy số [10, 20, 30, 40, 50] là gì? A. 30 B. 20 C. 40 D. 25
Giá trị trung bình (Mean) của dãy số [10, 20, 30, 40, 50] là gì? A. 30 B. 20 C. 40 D. 25
Hiệp phương sai (Covariance) giữa hai biến số X và Y với X = [1, 2, 3, 4, 5] và Y = [2, 4, 6, 8, 10] là gì? A. 4.0 B. 2.5 C. 3.0 D. 5.0
Hệ số tương quan (Correlation coefficient) giữa hai biến số X và Y với X = [1, 2, 3, 4, 5]
và Y = [2, 4, 6, 8, 10] là gì? A. 1.0 B. 0.8 C. 0.9 D. 0.7
Standard deviation (Độ lệch chuẩn) của dãy số [3, 7, 5, 9, 2] là gì? A. 3.16 B. 2.83 C. 2.91 D. 3.00
Phương sai (Variance) của dãy số [3, 7, 5, 9, 2] là gì? A. 8.0 B. 6.8 C. 7.2 D. 6.0
Giá trị Mode của dãy số [3, 3, 7, 5, 9, 2, 3] là gì? lOMoAR cPSD| 59561309 A. 3 B. 2 C. 5 D. 7
Giá trị trung vị (Median) của dãy số [3, 7, 5, 9, 2] là gì? A. 5 B. 6 C. 7 D. 3
Giá trị trung bình (Mean) của dãy số [3, 7, 5, 9, 2] là gì? A. 5.2 B. 4.2 C. 5.2 D. 6.0 BÀI IV:
Biểu đồ nào sau đây tốt nhất để hiển thị xu hướng theo thời gian? A. Biểu đồ đường B. Biểu đồ tròn C. Biểu đồ thanh D. Biểu đồ tán xạ
Biểu đồ nào thường được sử dụng để so sánh tỉ lệ của các danh mục khác nhau? A. Biểu đồ tròn B. Biểu đồ histogram C. Biểu đồ đường D. Biểu đồ hộp
Biểu đồ nào tốt nhất để hiển thị phân bố của một biến đơn? A. Biểu đồ histogram B. Biểu đồ hộp C. Biểu đồ đường D. Biểu đồ tròn
Trong biểu đồ tán xạ, mỗi điểm dữ liệu đại diện cho gì?
A. Quan hệ giữa hai biến
B. Giá trị trung bình của dữ liệu lOMoAR cPSD| 59561309
C. Tần suất của một danh mục
D. Phân bố của dữ liệu
Biểu đồ hộp hiển thị những gì?
A. Trung vị hoặc/và phân bố của dữ liệu
B. Tần suất của một tập hợp dữ liệu
C. Xu hướng theo thời gian
D. Tỷ lệ của các danh mục
Biểu đồ nhiệt (heatmap) được sử dụng để làm gì?
A. Biểu thị mật độ hoặc cường độ của dữ liệu B. So sánh tỉ lệ
C. Hiển thị dữ liệu phân cấp
D. Hiển thị dữ liệu thời gian
Biểu đồ nào thường được sử dụng để hiển thị dữ liệu phân cấp?
A. Là một loại biểu đồ khác B. Biểu đồ đường C. Biểu đồ tròn D. Biểu đồ tán xạ
Biểu đồ nào tốt nhất để hiển thị mối quan hệ giữa hai biến liên tục? A. Biểu đồ tán xạ B. Biểu đồ thanh C. Biểu đồ tròn D. Biểu đồ đường
Dữ liệu dạng nào thường được biểu diễn tốt nhất bằng biểu đồ thanh? A. Dữ liệu phân loại
B. Dữ liệu thời gian C. Dữ liệu liên tục D. Dữ liệu phân cấp
Biểu đồ nào thường được sử dụng để hiển thị tổng tích lũy theo thời gian?
A. Biểu đồ vùng (area chart) B. Biểu đồ đường C. Biểu đồ thanh D. Biểu đồ tròn