Xác định các yếu tố cơ bản của Machine Learning như tác vụ (task) T, hiệu năng (performance) P, và kinh nghiệm (experience) E | Bài tập môn Applied Machine Learning

1. Xây dựng một hệ thống Machine Learning để lọc các thư rác (spam email). T: Dự đoán (để lọc) những thư điện tử nào là thư rác (spam email); P: Tỉ lệ (%) số lượng các thư điện tử gửi đến được phân loại chính xác. E: Một tập các thư điện tử (mẫu), mỗi mẫu gồm nội dụng và được gắn với nhãn tương ứng (thư thường / thư rác); Loại học: Có giám sát (cụ thể: phân loại). Tài liệu giúp bạn tham khảo, ôn tập và đạt kết quả cao. Mời bạn đọc đón xem!

BÀI TẬP 01
MSSV: 030137210494
Họ và tên:Thái Thị Thu Thúy
Lớp: D02
Xác định các yếu tố bản của Machine Learning như tác vụ (task) T, hiệu năng
(performance) P, kinh nghiệm (experience) E cho biết loại thuật toán được sử
dụng (có giám sát hoặc không giám sát) trong các tình huống sau:
1. Xây dựng một hệ thống Machine Learning để lọc các thư rác (spam email).
T: Dự đoán (để lọc) những thư điện tử nào là thư rác (spam email)
P: Tỉ lệ (%) số lượng các thư điện tử gửi đến được phân loại chính xác.
E: Một tập các thư điện tử (mẫu), mỗi mẫu gồm nội dụng và được gắn với nhãn tương ứng
(thư thường / thư rác)
Loại học: Có giám sát (cụ thể: phân loại)
2. Xây dựng một hệ thống Machine Learning để phát hiện các giao dịch tài chính gian lận
dựa trên lịch sử giao dịch và các đặc trưng khác.
T: Dự đoán phát hiện các giao dịch tài chính nào là gian lận
P: Tỉ lệ % hệ thống phát hiện giao dịch tài chính gian lận một cách chính xác
E: Một tập lịch sử giao dịch(mẫu), mỗi mẫu gồm nội dung giao dịch được gắn nhãn tương
ứng (bình thường/gian lận)
Loại học: có giám sát (phân loại)
3. Xây dựng một hệ thống Machine Learning để gom nhóm các văn bản dựa trên nội dung
chung của chúng.
T: để gom nhóm các văn bản có chung nội dung
P: tỉ lệ % hệ thống gom các nhóm văn bản giống nhau về nội dung
E: Mỗi nhóm văn bản gồm nội dung từng văn bản được gắn nhãn( giống nội dung/khác
nội dung)
Loại học:không giám sát(phân cụm)
4. Xây dựng một mô hình Machine Learning để dự đoán giới tính của người dựa trên tên của
họ.
T: dự đoán giới tính của người .
P: tỉ lệ % hệ thống giới tính của người được đoán đúng dựa trên tên của họ
E:Một tập tên, mỗi tên gồm giới tính được gắn nhãn(nam/nữ)
Loại học:có giám sát(phân loại)
5. Xây dựng một mô hình Machine Learning để dự đoán số lượt xem cho video trên mạng xã
hội dựa trên các đặc trưng như thời lượng, thể loại, và số lượng like, share.
T:dự đoán số lượt xem cho video trên mạng xã hội dựa trên các đặc trưng như thời lượng,
thể loại, và số lượng like, share.
P: Tỉ lệ % số lượt xem video trên mạng xã hội được dự doán đúng (hoặc gần đúng với sai
số nhỏ) .
E: bộ dữ liệu về lượt xem các video trên mạng hội có các đặc trưng tương tự như thời
lượng, thể loại, và số lượng like, share.
Loại hoc:không giám sát(phân cụm)
6. Xây dựng một hình Machine Learning để dự đoán thời tiết (ví dụ: mưa, nắng, gió,
không gió) dựa trên dữ liệu lịch sử thời tiết và các đặc trưng như nhiệt độ, độ ẩm, áp suất
không khí.
T: dự đoán thời tiết (ví dụ: mưa, nắng, có gió, không gió)
P: tỉ lệ % dự đoán thời tiết chính xác
E: bộ dữ liệu lịch sử thời tiết với các đặc trưng như nhiệt độ, độ ẩm, áp suất không khí
được gắn nhãn nắng, mưa, có gió hay hông gió
Loại học: có giám sát(phân loại)
7. Xây dựng một hình Machine Learning để dự đoán xem một dự án thành công hay
không dựa trên các đặc trưng như mục tiêu kêu gọi vốn, thời gian kêu gọi, và mô tả dự án.
T:dự đoán một dự án có thành công hay không .
P:tỉ lệ % dự án được dự đoán chính xác
E: bộ dữ liệu lịch sử các dự án đươc dự đoán dựa trên các đặc trưng như mục tiêu kêu gọi
vốn, thời gian kêu gọi, và mô tả dự án, được gắn nhãn thành công hay không thành công
Loại học: có giám sát(phân loại)
8. Xây dựng một hình Machine Learning để dự đoán sự cố trong hệ thống máy tính dựa
trên các thông số về tài nguyên hệ thống như CPU, RAM, và bộ nhớ lưu trữ.
T: dự đoán sự cố trong hệ thống máy tính có xảy ra hay không
P: tỉ lệ % dự đoán sự cố hệ thống máy tính một cách chinh xác
E:bộ dữ liệu lịch sử sự cố hệ thống máy tính dựa trên các thông số về tài nguyên hệ thống
như CPU, RAM, và bộ nhớ lưu trữ được gắn nhãn có sự cố hay bình thường
Loại học:có giám sát(phân loại)
9. Xây dựng một hình Machine Learning để dự đoán lưu lượng giao thông trên một
tuyến đường dựa trên dữ liệu lịch sử các đặc trưng như thời tiết, ngày trong tuần,
giờ trong ngày.
T: dự đoán lưu lượng giao thông trên một tuyến đường nhiều hay ít.
P:tỉ lệ % dự đoán lưu lượng giao thông được dự đoán gần đúng nhất với thực tế
E:bộ dữ liệu lịch sử lưu lượng giao thông trên một tuyến đường với các đặc trưng như thời
tiết, ngày trong tuần, và giờ trong ngày.
Loại học: không giám sát(phân cụm)
10. Xây dựng một mô hình Machine Learning để dự đoán điểm tổng kết của học sinh dựa trên
dữ liệu về điểm số các môn học và các yếu tố khác như thời gian học tập, giờ ngủ, và thời
gian dành cho giải trí.
T: để dự đoán điểm tổng kết của học sinh
P: tỉ lệ % dự đoán điểm tổng kết của học sinh chính xác hoặc gần chính xác
E: dữ liệu về điểm số các môn học các yếu tố khác như thời gian học tập, giờ ngủ,
thời gian dành cho giải trí.
Loại hoc:có giám sát(hồi quy)
11. Xây dựng một mô hình Machine Learning để dự đoán độ tuổi của người dựa trên hình ảnh
khuôn mặt của họ.
T:dự đoán độ tuổi của người
P:Tỉ lệ % dự đoán độ tuổi người chính xác hoặc gần chính xác
E:bộ dữ liệu về hình ảnh khuôn mặt người được gắn nhãn nhóm độ tuổi
Loại học: có giám sát(hồi quy)
12. Xây dựng một hình Machine Learning để dự đoán giá cổ phiếu của một công ty dựa
trên dữ liệu lịch sử giá cổ phiếu và các chỉ số tài chính.
T:dự đoán giá cổ phiếu của một công ty
P: Tỉ lệ % dự đoán giá cổ phiếu của một công ty một cách chính xác
E: dựa trên dữ liệu được gắn nhãn về lịch sử giá cổ phiếu và các chỉ số tài chính
Loại học: có giám sát(hồi quy)
13. Xây dựng một hệ thống Machine Learning để phân loại các hình ảnh y học thành các loại
khác nhau, ví dụ: phân loại hình ảnh X-quang thành các loại bệnh hoặc không bệnh.
T:để phân loại các hình ảnh y học cái nào là bệnh hoặc không bệnh
P:tỉ lệ % dự đoán hình ảnh y học đó bệnh hay không một cách chính xác
E: bộ dữ liệu các hình ảnh y học đã được gắn nhãn bệnh hay không bệnh
Loại học:có giám sát(phân loại)
14. Một ngân hàng muốn xây dựng hình Machine Learning dự đoán khả năng trả nợ của
người vay dựa trên lịch sử tín dụng, thu nhập và thông tin cá nhân.
T:dự đoán khả năng trả nợ của người vay
P: Tỉ lệ % dự đoán khả năng trả nợ có người vay chính xác
E: bộ dữ liệu lịch sử tín dụng, thu nhập thông tin nhân được gắn nhãn khả năng
trả nợ hay không
Loại học:có giám sát(phân loại)
15. Một trường đại học muốn dự đoán điểm cuối kỳ học của sinh viên dựa trên điểm trung
bình các bài kiểm tra trước đó và thời gian dành cho học tập.
T:dự đoán điểm cuối kỳ học của sinh viên
P: Tỉ lệ % dự đoán điểm cuối kỳ của sinh viên một cách chính xác
E: bộ dữ liệu điểm trung bình các bài kiểm tra trước đó và thời gian dành cho học tập
Loại học: có giám sát(hồi quy)
16. Một website muốn xây dựng hệ thống tự động phân loại các bài viết được đăng vào c
diễn đàn phù hợp để tạo sự thuận tiện cho người dùng khi tìm kiếm bài viết.
T:xây dựng hệ thống tự động phân loại các bài viết được đăng vào các diễn đàn phù hợp
P: tỉ lệ % phân loại các bài viết một cách phù hợp
E: bộ dữ liệu các nội dung chính, từ khóa điểm chung người dùng tìm kiếm
trong một diễn đàn
Loại học:không giám sát(phân cụm)
17. Một trường đại học muốn xây dựng một mô hình Machine Learning để dự đoán xem một
sinh viên sẽ m việc trong lĩnh vực trái ngành (không phải lĩnh vực học) sau khi tốt
nghiệp dựa trên thông tin về chương trình học, GPA, và sở thích cá nhân.
T: dự đoán xem một sinh viên sẽ làm việc trong lĩnh vực trái ngành (không phải lĩnh vực
học) sau khi tốt nghiệp
P: Tỉ lệ %dự đoán lĩnh vực trái ngành chính xác
E: dựa trên bộ dữ liệu thông tin về chương trình học, GPA, và sở thích cá nhân.
Loại học:không giám sát(phân cụm)
18. Một công ty bất động sản muốn dự đoán giá nhà dựa trên diện tích, vị trí và tiện ích xung
quanh.
T:dự đoán giá nhà
P: Tỉ lệ % dự đoán giá nhà chính xác
E:dựa trên bộ dữ liệu về diện tích, vị trí và tiện ích xung quanh.
Loại học :có giám sát(hồi quy)
19. Một công ty muốn phân chia khách hàng của họ thành các nhóm dựa trên hành vi mua
sắm và mẫu mực tiêu dùng của họ.
T:phân chia khách hàng của một công ty thành các nhóm
P: Tỉ lệ % phân chia các nhóm khách hàng có cùng hành vi mua sắm một các phù hợp
E: dựa trên bộ dữ liệu về hành vi mua sắm và mẫu mực tiêu dùng của khách hàng.
Loại học:không giám sát(phân cụm)
20. Một thư viện trực tuyến muốn tự động phân loại các tài liệu văn bản mới vào các danh
mục tương ứng để tạo sự thuận tiện cho người dùng khi tìm kiếm tài liệu cải thiện tổ
chức thư viện.
T:tự động phân loại các tài liệu văn bản mới vào các danh mục tương ứng
P:Tỉ lệ % phân loại tự động các tài liệu văn bản mới vào các danh mục tương ứng một
cách phù hợp
E:bộ dữ liệu là mỗi điểm chung tương xứng với mỗi danh mục
Loại học:không giám sát(phân cụm)
| 1/5

Preview text:

BÀI TẬP 01 MSSV: 030137210494
Họ và tên:Thái Thị Thu Thúy Lớp: D02
Xác định các yếu tố cơ bản của Machine Learning như tác vụ (task) T, hiệu năng
(performance) P, và kinh nghiệm (experience) E và cho biết loại thuật toán được sử
dụng (có giám sát hoặc không giám sát) trong các tình huống sau:
1. Xây dựng một hệ thống Machine Learning để lọc các thư rác (spam email).
T: Dự đoán (để lọc) những thư điện tử nào là thư rác (spam email)
P: Tỉ lệ (%) số lượng các thư điện tử gửi đến được phân loại chính xác.
E: Một tập các thư điện tử (mẫu), mỗi mẫu gồm nội dụng và được gắn với nhãn tương ứng (thư thường / thư rác)
Loại học: Có giám sát (cụ thể: phân loại)
2. Xây dựng một hệ thống Machine Learning để phát hiện các giao dịch tài chính gian lận
dựa trên lịch sử giao dịch và các đặc trưng khác.
T: Dự đoán phát hiện các giao dịch tài chính nào là gian lận
P: Tỉ lệ % hệ thống phát hiện giao dịch tài chính gian lận một cách chính xác
E: Một tập lịch sử giao dịch(mẫu), mỗi mẫu gồm nội dung giao dịch được gắn nhãn tương
ứng (bình thường/gian lận)
Loại học: có giám sát (phân loại)
3. Xây dựng một hệ thống Machine Learning để gom nhóm các văn bản dựa trên nội dung chung của chúng.
T: để gom nhóm các văn bản có chung nội dung
P: tỉ lệ % hệ thống gom các nhóm văn bản giống nhau về nội dung
E: Mỗi nhóm văn bản gồm nội dung từng văn bản được gắn nhãn( giống nội dung/khác nội dung)
Loại học:không giám sát(phân cụm)
4. Xây dựng một mô hình Machine Learning để dự đoán giới tính của người dựa trên tên của họ.
T: dự đoán giới tính của người .
P: tỉ lệ % hệ thống giới tính của người được đoán đúng dựa trên tên của họ
E:Một tập tên, mỗi tên gồm giới tính được gắn nhãn(nam/nữ)
Loại học:có giám sát(phân loại)
5. Xây dựng một mô hình Machine Learning để dự đoán số lượt xem cho video trên mạng xã
hội dựa trên các đặc trưng như thời lượng, thể loại, và số lượng like, share.
T:dự đoán số lượt xem cho video trên mạng xã hội dựa trên các đặc trưng như thời lượng,
thể loại, và số lượng like, share.
P: Tỉ lệ % số lượt xem video trên mạng xã hội được dự doán đúng (hoặc gần đúng với sai số nhỏ) .
E: bộ dữ liệu về lượt xem các video trên mạng xã hội có các đặc trưng tương tự như thời
lượng, thể loại, và số lượng like, share.
Loại hoc:không giám sát(phân cụm)
6. Xây dựng một mô hình Machine Learning để dự đoán thời tiết (ví dụ: mưa, nắng, có gió,
không gió) dựa trên dữ liệu lịch sử thời tiết và các đặc trưng như nhiệt độ, độ ẩm, áp suất không khí.
T: dự đoán thời tiết (ví dụ: mưa, nắng, có gió, không gió)
P: tỉ lệ % dự đoán thời tiết chính xác
E: bộ dữ liệu lịch sử thời tiết với các đặc trưng như nhiệt độ, độ ẩm, áp suất không khí
được gắn nhãn nắng, mưa, có gió hay hông gió
Loại học: có giám sát(phân loại)
7. Xây dựng một mô hình Machine Learning để dự đoán xem một dự án có thành công hay
không dựa trên các đặc trưng như mục tiêu kêu gọi vốn, thời gian kêu gọi, và mô tả dự án.
T:dự đoán một dự án có thành công hay không .
P:tỉ lệ % dự án được dự đoán chính xác
E: bộ dữ liệu lịch sử các dự án đươc dự đoán dựa trên các đặc trưng như mục tiêu kêu gọi
vốn, thời gian kêu gọi, và mô tả dự án, được gắn nhãn thành công hay không thành công
Loại học: có giám sát(phân loại)
8. Xây dựng một mô hình Machine Learning để dự đoán sự cố trong hệ thống máy tính dựa
trên các thông số về tài nguyên hệ thống như CPU, RAM, và bộ nhớ lưu trữ.
T: dự đoán sự cố trong hệ thống máy tính có xảy ra hay không
P: tỉ lệ % dự đoán sự cố hệ thống máy tính một cách chinh xác
E:bộ dữ liệu lịch sử sự cố hệ thống máy tính dựa trên các thông số về tài nguyên hệ thống
như CPU, RAM, và bộ nhớ lưu trữ được gắn nhãn có sự cố hay bình thường
Loại học:có giám sát(phân loại)
9. Xây dựng một mô hình Machine Learning để dự đoán lưu lượng giao thông trên một
tuyến đường dựa trên dữ liệu lịch sử và các đặc trưng như thời tiết, ngày trong tuần, và giờ trong ngày.
T: dự đoán lưu lượng giao thông trên một tuyến đường nhiều hay ít.
P:tỉ lệ % dự đoán lưu lượng giao thông được dự đoán gần đúng nhất với thực tế
E:bộ dữ liệu lịch sử lưu lượng giao thông trên một tuyến đường với các đặc trưng như thời
tiết, ngày trong tuần, và giờ trong ngày.
Loại học: không giám sát(phân cụm)
10. Xây dựng một mô hình Machine Learning để dự đoán điểm tổng kết của học sinh dựa trên
dữ liệu về điểm số các môn học và các yếu tố khác như thời gian học tập, giờ ngủ, và thời gian dành cho giải trí.
T: để dự đoán điểm tổng kết của học sinh
P: tỉ lệ % dự đoán điểm tổng kết của học sinh chính xác hoặc gần chính xác
E: dữ liệu về điểm số các môn học và các yếu tố khác như thời gian học tập, giờ ngủ, và
thời gian dành cho giải trí.
Loại hoc:có giám sát(hồi quy)
11. Xây dựng một mô hình Machine Learning để dự đoán độ tuổi của người dựa trên hình ảnh khuôn mặt của họ.
T:dự đoán độ tuổi của người
P:Tỉ lệ % dự đoán độ tuổi người chính xác hoặc gần chính xác
E:bộ dữ liệu về hình ảnh khuôn mặt người được gắn nhãn nhóm độ tuổi
Loại học: có giám sát(hồi quy)
12. Xây dựng một mô hình Machine Learning để dự đoán giá cổ phiếu của một công ty dựa
trên dữ liệu lịch sử giá cổ phiếu và các chỉ số tài chính.
T:dự đoán giá cổ phiếu của một công ty
P: Tỉ lệ % dự đoán giá cổ phiếu của một công ty một cách chính xác
E: dựa trên dữ liệu được gắn nhãn về lịch sử giá cổ phiếu và các chỉ số tài chính
Loại học: có giám sát(hồi quy)
13. Xây dựng một hệ thống Machine Learning để phân loại các hình ảnh y học thành các loại
khác nhau, ví dụ: phân loại hình ảnh X-quang thành các loại bệnh hoặc không bệnh.
T:để phân loại các hình ảnh y học cái nào là bệnh hoặc không bệnh
P:tỉ lệ % dự đoán hình ảnh y học đó bệnh hay không một cách chính xác
E: bộ dữ liệu các hình ảnh y học đã được gắn nhãn bệnh hay không bệnh
Loại học:có giám sát(phân loại)
14. Một ngân hàng muốn xây dựng mô hình Machine Learning dự đoán khả năng trả nợ của
người vay dựa trên lịch sử tín dụng, thu nhập và thông tin cá nhân.
T:dự đoán khả năng trả nợ của người vay
P: Tỉ lệ % dự đoán khả năng trả nợ có người vay chính xác
E: bộ dữ liệu lịch sử tín dụng, thu nhập và thông tin cá nhân được gắn nhãn có khả năng trả nợ hay không
Loại học:có giám sát(phân loại)
15. Một trường đại học muốn dự đoán điểm cuối kỳ học của sinh viên dựa trên điểm trung
bình các bài kiểm tra trước đó và thời gian dành cho học tập.
T:dự đoán điểm cuối kỳ học của sinh viên
P: Tỉ lệ % dự đoán điểm cuối kỳ của sinh viên một cách chính xác
E: bộ dữ liệu điểm trung bình các bài kiểm tra trước đó và thời gian dành cho học tập
Loại học: có giám sát(hồi quy)
16. Một website muốn xây dựng hệ thống tự động phân loại các bài viết được đăng vào các
diễn đàn phù hợp để tạo sự thuận tiện cho người dùng khi tìm kiếm bài viết.
T:xây dựng hệ thống tự động phân loại các bài viết được đăng vào các diễn đàn phù hợp
P: tỉ lệ % phân loại các bài viết một cách phù hợp
E: bộ dữ liệu là các nội dung chính, từ khóa có điểm chung mà người dùng tìm kiếm trong một diễn đàn
Loại học:không giám sát(phân cụm)
17. Một trường đại học muốn xây dựng một mô hình Machine Learning để dự đoán xem một
sinh viên sẽ làm việc trong lĩnh vực trái ngành (không phải lĩnh vực học) sau khi tốt
nghiệp dựa trên thông tin về chương trình học, GPA, và sở thích cá nhân.
T: dự đoán xem một sinh viên sẽ làm việc trong lĩnh vực trái ngành (không phải lĩnh vực học) sau khi tốt nghiệp
P: Tỉ lệ %dự đoán lĩnh vực trái ngành chính xác
E: dựa trên bộ dữ liệu thông tin về chương trình học, GPA, và sở thích cá nhân.
Loại học:không giám sát(phân cụm)
18. Một công ty bất động sản muốn dự đoán giá nhà dựa trên diện tích, vị trí và tiện ích xung quanh. T:dự đoán giá nhà
P: Tỉ lệ % dự đoán giá nhà chính xác
E:dựa trên bộ dữ liệu về diện tích, vị trí và tiện ích xung quanh.
Loại học :có giám sát(hồi quy)
19. Một công ty muốn phân chia khách hàng của họ thành các nhóm dựa trên hành vi mua
sắm và mẫu mực tiêu dùng của họ.
T:phân chia khách hàng của một công ty thành các nhóm
P: Tỉ lệ % phân chia các nhóm khách hàng có cùng hành vi mua sắm một các phù hợp
E: dựa trên bộ dữ liệu về hành vi mua sắm và mẫu mực tiêu dùng của khách hàng.
Loại học:không giám sát(phân cụm)
20. Một thư viện trực tuyến muốn tự động phân loại các tài liệu văn bản mới vào các danh
mục tương ứng để tạo sự thuận tiện cho người dùng khi tìm kiếm tài liệu và cải thiện tổ chức thư viện.
T:tự động phân loại các tài liệu văn bản mới vào các danh mục tương ứng
P:Tỉ lệ % phân loại tự động các tài liệu văn bản mới vào các danh mục tương ứng một cách phù hợp
E:bộ dữ liệu là mỗi điểm chung tương xứng với mỗi danh mục
Loại học:không giám sát(phân cụm)