Giải SGK Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu
Xin gửi tới quý thày cô và các em học sinh Giải SGK Tin học 12 Chân trời sáng tạo Bài F16: Máy tính, thuật toán và Khoa học dữ liệu có đáp án chi tiết cho từng câu hỏi chương trình sách mới. Thông qua đây các em học sinh đối chiếu với lời giải của mình, hoàn thành bài tập hiệu quả và ôn tập đạt kết quả cao. Mời bạn đọc đón xem!
Chủ đề: Chủ đề F: Giải quyết vấn đề với sự trợ giúp của máy tính (CTST 12)
Môn: Tin học 12
Sách: Chân trời sáng tạo
Thông tin:
Tác giả:
Preview text:
Bài: Máy tính, thuật toán và Khoa học dữ liệu
1. Vai trò của máy tính đối với sự phát triển của Khoa học dữ liệu
2. Tính ưu việt của sử dụng máy tính và thuật toán trong xử lý dữ liệu lớn
Khởi động trang 151 Tin học 12: Theo em, những khả năng nổi bật
nào đã giúp cho máy tính dần trở thành một thiết bị được sử dụng
thường xuyên trong việc xử lý dữ liệu? Lời giải:
Nội dung đang được cập nhật ...
1. Vai trò của máy tính đối với sự phát triển của Khoa học dữ liệu
Hoạt động trang 153 Tin học 12: Theo em, điện toán đám mây có vai
trò như nào trong Khoa học dữ liệu? Lời giải:
Khoa học dữ liệu sử dụng internet, điện toán đám mây để lưu trữ và
quản lí khối lượng lớn dữ liệu, cho phép sử dụng nguồn lực tính toán
mạnh mẽ để xử lí dữ liệu lớn.
2. Tính ưu việt của sử dụng máy tính và thuật toán trong xử lý dữ liệu lớn
Hoạt động trang 155 Tin học 12 Thảo luận với bạn và cho biết một số
ưu điểm khi sử dụng máy tính và thuật toán để xử lý dữ liệu. Lời giải:
Sử dụng máy tính và thuật toán trong xử lí dữ liệu lớn có nhiều ưu điểm
như tăng tốc độ xử lý, khả năng tự động hoá, tính đa dạng, tính chính
xác, khả năng mở rộng, khả năng lưu trữ, tiết kiệm thời gian,.. Luyện tập
Luyện tập 1 trang 155 Tin học 12: Trình bày các yếu tố chính của dữ liệu lớn. Lời giải:
Các yếu tố chính của dữ liệu lớn: Dữ liệu lớn bao gồm năm yếu tố
chính, thường được gọi là 5V, bao gồm: Khối lượng (Volume) đề cập tới
khối lượng dữ liệu rất lớn; Tốc độ (Velocity) đề cập tới dữ liệu được tạo
ra rất nhanh; Đa dạng (Variety) đề cập tới các loại dữ liệu khác nhau,
bao gồm dữ liệu có cấu trúc (cơ sở dữ liệu quan hệ), bán cấu trúc (XML,
JSON) và phi cấu trúc (email, bài đăng trên mạng xã hội, âm thanh, hình
ảnh, video); Độ tin cậy hay độ xác thực (Veracity) đề cập đến độ tin cậy
và chất lượng của dữ liệu; Giá trị (Value) đề cập tới giá trị mà dữ liệu mang lại.
Luyện tập 2 trang 155 Tin học 12: Nêu ví dụ minh hoạ tính ưu việt của
máy tính khi xử lý dữ liệu lớn. Lời giải:
Ví dụ 1: Vào năm 2020, GPT-3 của OpenAI đã thu thập khoảng 45 TB
dữ liệu thô từ sách, tạp chí, trang web,... với nhiều chủ đề khác nhau.
Sau đó, dữ liệu thô được xử lí để tạo ra 570 GB dữ liệu vào cho mô hình
học máy. Lượng dữ liệu thô thu thập dùng cho GPT-3 tương đương
khoảng 200 000 giờ video Ful HD hoặc 15 triệu giờ âm thanh định dạng
MP3. Các phiên bản khác nhau của GPT-3 sử dụng từ 125 triệu đến 175
tỉ tham số (phụ thuộc vào số tầng trong mạng học sâu của mô hình).
Theo ước tính, việc đào tạo mô hình GPT-3 với 175 tỉ tham số cần hàng
trăm năm với 1 GPU V100. Để giảm thời huấn luyện mô hình học máy,
OpenAI đã sử dụng 1024 GPU NVIDIA A100 để huấn luyện mô hình GPT-3 trong 34 ngày.
Ví dụ 2: Protein là nhân tố thiết yếu cho sự sống được hình thành từ các
amino axit, sau đó trải qua quá trình gấp xoắn để hình thành cấu trúc 3D
phức tạp. Chức năng của protein phụ thuộc chủ yếu vào cấu trúc 3D
của nó. Trong nhiều thập kỉ, các nhà nghiên cứu đã giải mã cấu trúc 3D
của protein bằng cách sử dụng các kĩ thuật như tinh thể học tia X (X-ray
crystal ography) hoặc kính hiển vi điện tử lạnh (Cryogenic electron
microscopy viết tắt là Cryo-EM) và đã giải được cấu trúc của 170 000
protein trong số khoảng 200 triệu protein. Theo ước tính, để dự đoán
cấu trúc một protein dựa trên phương pháp tinh thể học tia X cần từ vài tháng đến hàng năm. Vận dụng
Vận dụng 1 trang 155 Tin học 12: Cho biết dữ liệu tạo ra từ mạng xã
hội có các tính chất của dữ liệu lớn bằng không. Lời giải:
Dữ liệu tạo ra từ mạng xã hội có các tính chất của dữ liệu lớn bằng
không. Vì: Sử dụng dữ liệu lớn có nhiều ưu điểm như tăng tốc độ xử lí,
khả năng tự động hóa, tính đa dạng, tính chính xác, khả năng mở rộng,
khả năng lưu trữ, tiết kiệm thời gian.
Vận dụng 2 trang 155 Tin học 12: Tìm hiểu và trình bày sơ lược vai trò
của tự động hóa trong Khoa học dữ liệu. Lời giải:
Vai trò của tự động hóa trong Khoa học dữ liệu: Thuật toán giúp tự động
hóa nhiều quy trình xử lý dữ liệu, giảm bớt sự phụ thuộc vào các quá
trình thủ công. Ví dụ, sử dụng các thuật toán để tự động hóa các nhiệm
vụ có tính chất lặp lại như làm sạch dữ liệu, đồng bộ hóa dữ liệu giữa
các nguồn lưu trữ khác nhau.