












Preview text:
TỔNG HỢP ĐỀ THI & GIẢI CHI TIẾT Ngày 11 tháng 1 năm 2026 Mục lục I
Phương pháp & công thức (STEP-BY-STEP) 2 1
Tính Xác suất & Phân phối 2 2
Ước lượng Khoảng tin cậy (KTC) 3 3
Kiểm định Giả thuyết (Hypothesis Testing) 4 4
Hồi quy tuyến tính đơn 7 II
Đề bài & lời giải (STEP-BY-STEP) 7 5
Ước lượng & Kiểm định tham số (Trung bình) 9 6
Ước lượng & Kiểm định tham số (Tỷ lệ) 11 7
Hồi quy tuyến tính đơn 12 1 Phần I
Phương pháp & công thức (STEP-BY-STEP) 1
Tính Xác suất & Phân phối
� QUY TRÌNH GIẢI CHI TIẾT
Dạng 1: Phân phối Chuẩn X ∼ N(µ, σ2)
• Bước 1: Xác định trung bình (µ) và độ lệch chuẩn (σ).
• Bước 2: Xác định yêu cầu (ví dụ: P (X > a) hoặc P (a < X < b)).
• Bước 3: Chuyển về biến chuẩn tắc Z bằng công thức: X − µ Z = σ
• Bước 4: Tra bảng phân phối chuẩn Φ(z).
P (a < X < b) = Φ(Zb) − Φ(Za)
Dạng 2: Phân phối mẫu (Định lý giới hạn trung tâm)
• Bước 1: Xác định cỡ mẫu n. Kiểm tra điều kiện (Tổng thể chuẩn hoặc n ≥ 30).
• Bước 2: Xác định tham số cho trung bình mẫu ¯ X: σ µ ¯ √ X = µ; SE = n
• Bước 3: Chuẩn hóa Z: ¯ X − µ Z = √ σ/ n
• Bước 4: Tra bảng tương tự Dạng 1. 2 2
Ước lượng Khoảng tin cậy (KTC)
� QUY TRÌNH GIẢI CHI TIẾT
Quy trình chung: 1. Tính đặc trưng mẫu (¯ x, s, ˆ
f ). 2. Tìm giá trị tới hạn (Z1−α/2, t1−α/2).
3. Tính sai số ε. 4. Kết luận: (Thống kê − ε; Thống kê + ε).
1. KTC cho Trung bình (µ)
• TH1: Đã biết σ (hoặc n ≥ 30): Dùng phân phối Chuẩn (Z).
ε = Z1−α/2 · σ √
(Nếu chưa có σ thì dùng s) n
• TH2: Chưa biết σ và n < 30: Dùng phân phối Student (t).
ε = t(n−1) · s √ 1−α/2 n
2. KTC cho Tỷ lệ (p)
• Điều kiện: n đủ lớn. Luôn dùng phân phối Chuẩn (Z). √ ˆ f (1 − ˆ f )
ε = Z1−α/2 · n 3 3
Kiểm định Giả thuyết (Hypothesis Testing)
� QUY TRÌNH GIẢI CHI TIẾT
Để giải quyết mọi bài toán kiểm định giả thuyết (Trung bình, Tỷ lệ...), sinh viên cần
tuân thủ tuyệt đối quy trình 4 bước sau:
BƯỚC 1: Thiết lập giả thuyết thống kê (H0, H1)
• H0 (Giả thuyết không): Luôn chứa dấu bằng (=, ≤, ≥). Thường là khẳng định
”không đổi”, ”bằng nhau”.
• H1 (Đối thuyết): Mệnh đề đối lập H0, chứa điều nghi ngờ cần chứng minh (̸=, > , <).
• Lưu ý: Dấu của H1 quyết định miền bác bỏ (2 phía, phía phải, hay phía trái).
BƯỚC 2: Xác định Miền bác bỏ (Wα)
• Dựa vào mức ý nghĩa α và loại phân phối (Z hoặc Student), tra bảng tìm Giá trị tới hạn (C).
• Xác định miền bác bỏ Wα dựa vào dấu của H1 (Xem bảng chi tiết ở các phần sau).
BƯỚC 3: Tính Thống kê kiểm định (Kqs)
• Chọn công thức phù hợp (Kiểm định Z hay T).
• Thay số liệu từ mẫu vào để tính ra một con số cụ thể.
BƯỚC 4: So sánh và Kết luận
• Nếu Kqs ∈ Wα: Bác bỏ H0, chấp nhận H1. • Nếu Kqs /
∈ Wα: Chấp nhận H0 (Chưa đủ cơ sở bác bỏ). 4
� QUY TRÌNH GIẢI CHI TIẾT
I. QUY TẮC XÁC ĐỊNH MIỀN BÁC BỎ (Wα)
Gọi Kqs là giá trị thống kê kiểm định. C là giá trị tới hạn tra bảng (Zα hoặc tα).
Đối thuyết (H1) Loại kiểm định
Miền bác bỏ (Wα) θ ̸= θ0 Hai phía
(−∞; −C1−α/2) ∪ (C1−α/2; +∞)
(Bác bỏ nếu |Kqs| > C1−α/2) θ > θ0 Phía phải
(C1−α; +∞)
(Bác bỏ nếu Kqs > C1−α) θ < θ0 Phía trái
(−∞; −C1−α)
(Bác bỏ nếu Kqs < −C1−α)
II. CÁC CÔNG THỨC THỐNG KÊ KIỂM ĐỊNH (Kqs)
1. Kiểm định Trung bình 1 mẫu (µ)
• Biết σ (hoặc n ≥ 30): Dùng Z. Giá trị tới hạn tra bảng Z. ¯ x − µ K 0 √
qs = Z = σ/ n
Đối thuyết H1
Miền bác bỏ Wα Quy tắc tra bảng
µ ̸= µ0 (2 phía) (−∞; −Z1−α/2) ∪ (Z1−α/2; +∞) Tra Z1−α/2 µ > µ0 (Phải)
(Z1−α; +∞) Tra Z1−α µ < µ0 (Trái)
(−∞; −Z1−α) Tra Z1−α
• Chưa biết σ, n < 30: Dùng T . Giá trị tới hạn tra bảng Student (n − 1). ¯ x − µ K 0 √
qs = T = s/ n
Đối thuyết H1
Miền bác bỏ Wα Quy tắc tra bảng µ ̸= µ0
(−∞; −t1−α/2) ∪ (t1−α/2; +∞) Tra Student t(n−1) 1−α/2 µ > µ0
(t1−α; +∞)
Tra Student t(n−1) 1−α µ < µ0
(−∞; −t1−α)
Tra Student t(n−1) 1−α
2. Kiểm định Tỷ lệ 1 mẫu (p) • Luôn dùng Z. ˆ f − p K 0 √ qs = Z = p0(1−p0) n
Đối thuyết H1
Miền bác bỏ Wα Quy tắc tra bảng p ̸= p0
(−∞; −Z1−α/2) ∪ (Z1−α/2; +∞) Tra Z1−α/2 p > p0
(Z1−α; +∞) Tra Z1−α p < p0
(−∞; −Z1−α) Tra Z1−α 5
� QUY TRÌNH GIẢI CHI TIẾT
3. Kiểm định So sánh 2 Trung bình (µ1 − µ2)
• TH1: Biết σ1, σ2: Dùng Z. ¯ x K 1 − ¯ x2 √ qs = Z = σ2 1 + σ22 n1 n2
Bảng tra miền bác bỏ giống hệt Kiểm định Z 1 mẫu (Mục 1, TH1).
• TH2: Chưa biết σ, nhưng n1, n2 ≥ 30 (Mẫu lớn): (Thay thế trường hợp Pooled
theo yêu cầu). Do mẫu lớn, s ≈ σ, ta dùng kiểm định Z. ¯ x K 1 − ¯ x2 √ qs = Z = s2 1 + s22 n1 n2
Bảng tra miền bác bỏ giống hệt Kiểm định T 1 mẫu (Mục 1, TH2).
• TH3: Chưa biết σ, n < 30, σ1 ̸= σ2 (Welch): ¯ x K 1 − ¯ x2 √ qs = T = s2 1 + s22 n1 n2
(Bậc tự do tính theo công thức Satterthwaite) Bảng tra miền bác bỏ dùng phân
phối Student với df vừa tính.
4. Kiểm định So sánh 2 Tỷ lệ (p1 = p2) • Tính tỷ lệ chung ¯
f = k1+k2 . Dùng Z. n1+n2 ˆ f K 1 − ˆ f2 √ qs = Z = ¯ f (1 − ¯ f )( 1 + 1 ) n1 n2
Đối thuyết H1
Miền bác bỏ Wα Tra bảng p1 ̸= p2
(−∞; −Z1−α/2) ∪ (Z1−α/2; +∞) Z1−α/2 p1 > p2
(Z1−α; +∞) Z1−α p1 < p2
(−∞; −Z1−α) Z1−α 6 4
Hồi quy tuyến tính đơn
� QUY TRÌNH GIẢI CHI TIẾT Mô hình: ˆ
y = b0 + b1x ∑ ∑ ∑ ∑ ∑
• Bước 1: Lập bảng tính các tổng: x, y, x2, y2, xy.
• Bước 2: Tính các tổng sai lệch: ∑ ∑ ∑ ∑ x)2 ∑ x)( y) Sxx = x2 − ( ; Sxy = xy − ( n n ∑ ∑ y)2 Syy =
y2 − ( n
• Bước 3: Tính các hệ số hồi quy: S Hệ số góc: b xy 1 = Sxx
Hệ số chặn: b0 = ¯ y − b1¯ x
• Bước 4: Đánh giá mô hình (Hệ số tương quan & Xác định): S r = xy √ ; R2 = r2 SxxSyy Phần II
Đề bài & lời giải (STEP-BY-STEP)
Bài 1: Chi tiêu của sinh viên
Đề bài: Trong năm 2023, chi tiêu trung bình hàng tháng của sinh viên là 4.800.000 đồng với
độ lệch chuẩn là 600.000 đồng. Giả sử mức chi tiêu này tuân theo phân phối chuẩn.
(a) Tính xác suất để một sinh viên có mức chi tiêu hàng tháng trên 5.500.000 đồng.
(b) Chọn ngẫu nhiên 200 sinh viên. Tính xác suất để có từ 30 đến 40 sinh viên có mức chi
tiêu hàng tháng trên 5.500.000 đồng.
(c) Khảo sát một mẫu gồm 25 sinh viên. Tính xác suất để mức chi tiêu trung bình của các
sinh viên này nằm trong khoảng từ 4.900.000 đồng đến 5.100.000 đồng. 7 � Lưu ý
Nhận diện dạng toán:
• Câu a: Tính xác suất cho 1 phần tử (Chuẩn hóa Z).
• Câu b: Xấp xỉ phân phối Nhị thức bằng phân phối Chuẩn (do n = 200 lớn).
• Câu c: Phân phối của trung bình mẫu ( ¯
X). Thường sai lầm khi quên chia độ lệch √ chuẩn cho n (sai số chuẩn).
Lời giải chi tiết & Phân tích
Gọi X là mức chi tiêu hàng tháng (đơn vị: triệu đồng). Ta có: X ∼ N(µ = 4, 8; σ = 0, 6).
a) Xác suất một sinh viên chi tiêu > 5,5 triệu: ( )
5, 5 − 4, 8
P (X > 5, 5) = P Z >
= P (Z > 1, 17) 0, 6
= 1 − Φ(1, 17) = 1 − 0, 8790 = 0, 1210
b) Trong 200 sinh viên (n = 200): Gọi Y là số SV thỏa mãn. Đây là bài toán Bernoulli
với p = 0, 1210. Các tham số xấp xỉ chuẩn:
• µY = n · p = 200 · 0, 121 = 24, 2 √ √ • σY =
n · p · (1 − p) =
200 · 0, 121 · 0, 879 ≈ 4, 612
Cần tính P (30 ≤ Y ≤ 40). Chuẩn hóa Z: 30 − 24, 2 40 − 24, 2 Z1 =
≈ 1, 26; Z2 = ≈ 3, 43 4, 612 4, 612
P ≈ Φ(3, 43) − Φ(1, 26) = 0, 9997 − 0, 8962 = 0, 1035
c) Với mẫu n = 25 (Trung bình mẫu ¯
X): Độ lệch chuẩn của trung bình mẫu (Sai số
chuẩn): SE = σ √ = 0,6 √ = 0, 12. n 25 ( )
4, 9 − 4, 8
P (4, 9 ≤ ¯
X ≤ 5, 1) = P
≤ Z ≤ 5, 1 − 4, 8 0, 12 0, 12
= P (0, 83 ≤ Z ≤ 2, 50) = Φ(2, 50) − Φ(0, 83) = 0, 9938 − 0, 7967 = 0, 1971 8 5
Ước lượng & Kiểm định tham số (Trung bình)
Bài 2: Nồng độ Oxy hòa tan
Đề bài: Khu A (n = 16) và Khu B (n = 16) có độ lệch chuẩn tổng thể σ = 0, 2 mg/l. Kết quả tính toán từ mẫu: ¯
xA = 6, 9625; ¯ xB = 6, 2625.
(a) Tìm khoảng tin cậy 97% cho µA.
(b) Cần lấy bao nhiêu mẫu để sai số ước lượng câu (a) không quá 0, 05?
(c) Kiểm định ý kiến µA > 6, 9 với mức ý nghĩa 3%.
(d) Kiểm định sự khác biệt giữa µA và µB với mức ý nghĩa 3%. � Lưu ý
Điểm nhấn: Dù mẫu nhỏ (n = 16 < 30) nhưng đề bài đã cho độ lệch chuẩn tổng thể
(σ = 0, 2), nên bắt buộc dùng kiểm định Z (Chuẩn), tuyệt đối không dùng Student (t).
Rất hay nhầm lẫn chỗ này. 9
Lời giải chi tiết & Phân tích
a) Khoảng tin cậy 97% (α = 0, 03 ⇒ Z0,015 ≈ 2, 17): Sai số ước lượng:
ε = 2, 17 · 0, 2 √
= 2, 17 · 0, 05 = 0, 1085 16
Khoảng tin cậy: (6, 9625 ± 0, 1085) = (6, 854; 7, 071).
b) Cỡ mẫu để sai số ≤ 0, 05: ( ) ( ) Z 2 2 α/2 · σ
2, 17 · 0, 2 n ≥ =
= (8, 68)2 ≈ 75, 34 ε0 0, 05
Làm tròn lên: n = 76.
c) Kiểm định µA > 6, 9 (Mức ý nghĩa α = 0, 03):
• Bước 1: Thiết lập giả thuyết:
H0 : µA = 6, 9;
H1 : µA > 6, 9 (Kiểm định phía phải)
• Bước 2: Miền bác bỏ: Tra bảng Z0,03 ≈ 1, 88. Miền bác bỏ Wα = (1, 88; +∞).
• Bước 3: Tính thống kê kiểm định: ¯ x
6, 9625 − 6, 9 0, 0625 Z A − µ0 √ √ qs = = = = 1, 25 σ/ n 0, 2/ 16 0, 05
• Bước 4: Kết luận: Vì 1, 25 < 1, 88 ⇒ Zqs /
∈ Wα ⇒ Chấp nhận H0. Chưa đủ cơ
sở để khẳng định nồng độ oxy lớn hơn 6,9.
d) So sánh 2 khu vực (Mức ý nghĩa α = 0, 03):
• Bước 1: Thiết lập giả thuyết:
H0 : µA = µB;
H1 : µA ̸= µB (Kiểm định 2 phía)
• Bước 2: Miền bác bỏ: Tra bảng Zα/2 = Z0,015 ≈ 2, 17. Miền bác bỏ Wα =
(−∞; −2, 17) ∪ (2, 17; +∞).
• Bước 3: Tính thống kê kiểm định:
6, 9625 − 6, 2625 0, 7 Z √ √ qs = = ≈ 9, 9 0,22 0, 005 + 0,22 16 16
• Bước 4: Kết luận: Vì 9, 9 > 2, 17 ⇒ Zqs ∈ Wα ⇒ Bác bỏ H0. Có sự khác biệt có
ý nghĩa thống kê giữa nồng độ oxy hai khu vực. 10 6
Ước lượng & Kiểm định tham số (Tỷ lệ)
Bài 3: Xét nghiệm vi khuẩn E. coli Đề bài:
• Trung tâm X: n1 = 180, dương tính k1 = 160.
• Trung tâm Y: n2 = 150, dương tính k2 = 120.
(a) Tìm khoảng tin cậy 98% cho tỷ lệ dương tính tại X.
(b) Kiểm định xem tỷ lệ dương tính tại X có lớn hơn 0, 85 không (α = 2%).
(c) Kiểm định sự khác biệt tỷ lệ giữa hai trung tâm (α = 2%).
Lời giải chi tiết & Phân tích
Tỷ lệ mẫu: f1 = 160 ≈ 0, 8889; f = 0, 8. 180 2 = 120 150
a) Khoảng tin cậy 98% (α = 0, 02 ⇒ Z0,01 ≈ 2, 33):
√0,8889(1 −0,8889)
ε = 2, 33 ·
≈ 2, 33 · 0, 0234 ≈ 0, 0545 180
KTC: (0, 8889 ± 0, 0545) = (0, 8344; 0, 9434).
b) Kiểm định pX > 0, 85 (α = 0, 02):
• Bước 1: Giả thuyết: H0 : p = 0, 85;
H1 : p > 0, 85.
• Bước 2: Miền bác bỏ: Z0,02 ≈ 2, 05. Wα = (2, 05; +∞).
• Bước 3: Thống kê (p0 = 0, 85):
0, 8889 − 0, 85 0, 0389 Z = √ = ≈ 1, 46
0,85·0,15 0, 0266 180
• Bước 4: Kết luận: 1, 46 < 2, 05 ⇒ Chấp nhận H0.
c) So sánh 2 tỷ lệ (α = 0, 02):
• Bước 1: Giả thuyết: H0 : p1 = p2;
H1 : p1 ̸= p2.
• Bước 2: Miền bác bỏ: Z0,01 ≈ 2, 33. Wα = (−∞; −2, 33) ∪ (2, 33; +∞).
• Bước 3: Thống kê: Tỷ lệ chung: ¯
f = 160+120 ≈ 0, 8485. 180+150
0, 8889 − 0, 8 Z = √ ≈ 2, 24
0, 8485 · 0, 1515 · ( 1 + 1 ) 180 150
• Bước 4: Kết luận: |Z| = 2, 24 < 2, 33 ⇒ Chấp nhận H0. Chưa đủ bằng chứng
để nói tỷ lệ 2 nơi khác nhau. 11 7
Hồi quy tuyến tính đơn
Bài 4: Nhiệt độ và Tốc độ tăng trưởng vi khuẩn ∑ ∑ ∑ ∑
Đề bài: Cho n = 10. Các tổng đã tính: x = 200; y = 400; x2 = 5100; y2 = ∑ 20500; xy = 10100. � Lưu ý
Nhận diện: Đây là dạng bài cơ bản nhất. Cần thuộc công thức tính Sxx, Syy, Sxy từ các ∑ ∑
tổng đã cho. Lưu ý: Tránh nhầm lẫn giữa
x2 (tổng bình phương) và ( x)2 (bình phương của tổng).
Lời giải chi tiết & Phân tích
Bước 1: Tính các giá trị trung gian Trung bình mẫu: ¯ x = 200/10 = 20; ¯ y = 400/10 =
40. Các tổng bình phương sai lệch: ∑ Sxx = x2 − n(¯
x)2 = 5100 − 10(202) = 1100 ∑ Syy = y2 − n(¯
y)2 = 20500 − 10(402) = 4500 ∑ Sxy = xy − n(¯ x¯
y) = 10100 − 10(20)(40) = 2100
a) Phương trình hồi quy ˆ y = ˆ β0 + ˆ β1x: ˆ S 2100 β xy 1 = = ≈ 1, 9091 Sxx 1100 ˆ β0 = ¯ y − ˆ β1 ¯
x = 40 − 1, 9091(20) ≈ 1, 8182
⇒ Phương trình: ^y = 1, 8182 + 1, 9091x
b) Ý nghĩa hệ số góc & Dự báo:
• Khi nhiệt độ tăng 1◦C, tốc độ tăng trưởng vi khuẩn tăng trung bình ≈ 1, 91 đơn vị.
• Tại x = 30◦C: ˆ
y = 1, 8182 + 1, 9091(30) ≈ 59, 09.
c) Hệ số xác định R2: (S 21002 R2 = xy )2 =
≈ 0, 8909 SxxSyy 1100 · 4500
Ý nghĩa: Khoảng 89,09% sự biến thiên của tốc độ tăng trưởng được giải thích bởi nhiệt
độ. Mô hình rất phù hợp. 12
Bài 5: Thể tích não và Chỉ số IQ
Đề bài: Dựa vào bảng số liệu thô của 11 người tình nguyện (n = 11).
• Biến độc lập (x): Thể tích não (cm3).
• Biến phụ thuộc (y): Chỉ số IQ. � Lưu ý
Kỹ năng: Sinh viên cần nhập liệu vào máy tính bỏ túi (Chế độ STAT) để tìm hệ số
r, A, B. Lỗi thường gặp: Nhập ngược cột x (Thể tích) và y (IQ). Kết quả R2 thấp là
cơ hội để giảng về việc ”Tương quan không đồng nghĩa với Nhân quả”.
Lời giải chi tiết & Phân tích
a) Hệ số tương quan: Sử dụng máy tính bỏ túi, ta tính được:
r ≈ 0, 441
Nhận xét: Tương quan dương nhưng ở mức trung bình yếu (r < 0, 5).
b) Phương trình hồi quy: Các hệ số ước lượng: ˆ
β1 ≈ 0, 047; ˆ
β0 ≈ 47, 01
⇒ ^y = 47, 01 + 0, 047x
Giải thích: Thể tích não tăng 1cm3, chỉ số IQ trung bình tăng 0,047 điểm.
c) Dự báo với x = 1200: ˆ
y = 47, 01 + 0, 047(1200) ≈ 103, 4
d) Hệ số xác định R2 = 0, 1947: Chỉ có khoảng 19,47% sự thay đổi của IQ được giải
thích bởi thể tích não. Phần lớn sự thay đổi của IQ do các yếu tố khác. Mô hình này
có độ chính xác thấp, không đủ tin cậy để dự báo IQ chỉ dựa trên kích thước não. 13