2025-05-12
1
Bài 4
TNG QUAN V XÁC SUT
VÀ ĐNH LÝ GII HN TRUNG TÂM
NI DUNG CHÍNH
4.1
Tổng
xác sut
4.2
Định lý
giới hạn
trung
m
1
2
2025-05-12
2
4.1. Tng quan v xác sut
Khái nim v xác sut và biến ngu nhiên
4.1.1
Phân phi xác sut ca biến ngu nhiên liên tc
4.1.2
Xác sut là gì
c sut là kh năng tương đi mt biến c có th xy ra
Giá tr nm trong khong [0, 1]
Công thc tính: 𝑃 𝐴 =
ư
ư
VD: Trong 1 ngày, mt siêu th có 100 khách hàng, trong đó có 30 ngưi mua
sn phm A. Tính xác sut mt khách đưc chn ngu nhiên mua sn phm A
𝑃
𝐴 =
30
100
= 0.3 hay 30%
3
4
2025-05-12
3
Ti sao chúng ta cn hc xác sut và phân phi xác sut?
Biến ngu nhiên và Xác sut
X là biến ngu nhiên nếu giá tr của X=x là
hoàn toàn ngẫu nhiên.
Xác suất đ X nhận giá tr x là p(x)=P(X=x).
Nếu mt biến ngu X nhận giá tr x
i
, khi đó
1. 0 1 for all
2. 1
i
i i
i
x
p x x
p x
5
6
2025-05-12
4
PHÂN PHI CHUẨN
Dng hình chuông, đi xứng qua giá tr trung
tâm µ, có đnh ti x
đ th tim cn 0 khi x±∞.
TÍNH CHT
1. E(X) = µ; V(X) = σ².
2. Din tích dưới đường cong = 1
3. Kí hiu: X~N(µ, σ²).
4. Giá tr trung bình khác nhau vị trí thay đổi
dọc theo trc x
5. Phương sai khác nhau đồ thị nhn hoc
thoải
7
8
2025-05-12
5
Giá tr TB khác nhau
0
0.5
f(x)
x
Phương sai khác nhau
0
1
-4 -2 0 2 4
x
f(x)
σ=1
σ=0.5
σ=2
9
10
2025-05-12
6
Tính xác sut t PPC
Tính P(X<a)
Hoc tính P(a<X<b)
Có nghĩa là cn tính din tích dưi đưng cong
Toán học, cn ly tích phân :
Không dễ!
DT = f x
a
b
ò
dx
1
s
2
p
e
-
1
2
x-
m
s
æ
è
ç
ö
ø
÷
2
dx
a
b
ò
.
11
12
2025-05-12
7
Chun hóa (1)
Là quá trình chuyn mt biến phân phi chun v
phân phi chun hóa
Nếu X~N(μ,σ²), s dng công thc dưi đây đ
chun hóa:
S dng bng Z đ tra X/S
~ (0,1)
X
Z N
m
s
-
Quy tc tính xác sut
Quy tc đi xng
P(Z<-a) = P(Z>a)
P(Z>a) = 1 P(Z<a)
P(a<Z<b) = P(Z<b) P(Z<a)
13
14
2025-05-12
8
Quy tc 3 sigma
Đối vi phân phi chun:
Khong 68.26% các quan sát nm trong phm vi (+) và (-) 1 ln đ lch
chun so vi trung bình
Khong 95.44% các quan sát nm trong phm vi (+) và (-) 2 ln đ lch
chun so vi trung bình
Khong 99.74% các quan sát nm trong
khong (+) và (-) 3 ln đ lch chun so
vi trung bình
Bài tp áp dng
Tính xác sut da vào Quy tc 3 Sigma: Bài 9, 10, 11, 12 (trang 219)
Tính Z và xác sut: Bài 13, 14, 15, 16 (trang 223)
Bài 17 22 (trang 225)
Bài 23 30 (trang 228)
15
16
2025-05-12
9
4.2. ĐỊNH GIỚI HẠN TRUNG TÂM
Phân phi ca mu
Phân phi ca trung bình mu
Định lý gii hn trung tâm
PHÂN PHI CA MU
Ly một mẫu gm 50 quan sát (obs) t d liu thng kê v
thi gian giao Pizza, có đ th và thng kê t cho dưi
đây
262422201816141210
10
5
0
Pizza time
Frequency
Variable N Mean Median SD
Pizza time 50 17.256 17.041 3.743
17
18
2025-05-12
10
Một mu 50 obs khác; 1000 obs cũng t tổng
thể trên
Variable N Mean Median SD
Pizza time 50 17.585 17.374 3.872
Pizza time 1000 17.934 17.627 4.009
26242220181614121086
10
5
0
Pizza time
Frequency
302010
100
50
0
Pizza time
Frequency
Tăng c mu lên đến 10,000 obs t tng th đó
Variable N Mean Median SD
Pizza time 10000 18.046 17.744 4.006
10 20 30 40
0
100
200
300
400
500
600
Pizza time
Frequency
Khi c mẫu tăng lên (đc bit tăng đến vô hn và tim cn vi quy
ca tng th), phân phi ca mẫu s tim cn v phân phi chun.
19
20
2025-05-12
11
PHÂN PHI CA CÁC TRUNG BÌNH MU
Ly 1000 mẫu khác nhau, mỗi mẫu gm 10 quan sát. Tính
trung bình và đ lch chun ca mỗi mẫu ri biu din đ
th dưi đây.
Thng kê N Mean SD
Trung bình chung các mu
1000 18.007 1.231
S.D chung các mu
1000 3.8183 0.9505
22212019181716151413
90
80
70
60
50
40
30
20
10
0
average
Frequency
7654321
90
80
70
60
50
40
30
20
10
0
stdev
Frequency
Tăng c mu
Ly 1000 mu khác vi c mu 25
15.5 16.5 17.5 18.5 19.5 20.5
0
10
20
30
40
50
60
70
80
90
100
average
Frequency
Thng kê N Mean SD
TB chung các mu 1000 17.991 0.814
S.D chung các mu 1000 3.964 0.605
65432
70
60
50
40
30
20
10
0
stdev
Frequency
21
22
2025-05-12
12
Bt k biến ngu nhiên ban đu có dng phân
phi như thế nào, khi c mu tăng lên phân
phi ca các trung bình mu tim cn v phân
phi chun.
Bt k biến ngu nhiên ban đu có dng phân
phi như thế nào, vi mt c mu n, đ lch
chun ca các trung bình mu (sai s bình quân
chn mu) bng , kí hiu là SE (Standard
error of the mean).
NHẬN T
s
/
n
Bt k tng th có phân phi thế nào (chun hay
không chun), khi c mu đ ln phân phi ca
các trung bình mu s tuân theo quy lut phân
phi chun và chúng ta có th s dng thng kê Z
đ tính xác sut cho bt k giá tr trung bình nào
Ý NGA
23
24
2025-05-12
13
Định lý gii hn trung tâm
Nếu là mt biến ngu nhiên có giá tr trung X
bình là µ và phương sai là σ², thì
2
,
~ 0,1 as .
X N
n
X
Z N n
n
s
m
m
s
æ ö
ç ÷
è ø
-
C mu như thế nào là đ ln?
Nếu tng th có phân phi chun, quy mô mẫu có th nhn bt
k giá tr nào.
Nếu không biết hình dng phân phi ca tng th, quy mẫu
rt quan trng. Phân phi ca các trung bình mẫu s tim cn v
phân phi chun khi c mẫu tăng lên vô hn. Trên thc tế, phân
phi ca các trung bình mẫu s gn ging vi phân phi chun
khi c mẫu ít nht là 30 đơn v.
Xác đnh c mẫu đ cp bài 5.
25
26
2025-05-12
14
Thank you!
27

Preview text:

2025-05-12 Bài 4 TỔNG QUAN VỀ XÁC SUẤT
VÀ ĐỊNH LÝ GIỚI HẠN TRUNG TÂM 1 NỘI DUNG CHÍNH 4.1 4.2 Tổng Định lý quan về giới hạn xác suất trung tâm 2 1 2025-05-12
4.1. Tổng quan về xác suất 4.1.1
Khái niệm về xác suất và biến ngẫu nhiên 4.1.2
Phân phối xác suất của biến ngẫu nhiên liên tục 3 Xác suất là gì
Xác suất là khả năng tương đối một biến cố có thể xảy ra •
Giá trị nằm trong khoảng [0, 1] •
Công thức tính: 𝑃 𝐴 = ố ườ ợ ậ ợ ổ ố ườ ợ
VD: Trong 1 ngày, một siêu thị có 100 khách hàng, trong đó có 30 người mua
sản phẩm A. Tính xác suất một khách được chọn ngẫu nhiên mua sản phẩm A 30 𝑃 𝐴 = = 0.3 hay 30% 100 4 2 2025-05-12
Tại sao chúng ta cần học xác suất và phân phối xác suất? 5
Biến ngẫu nhiên và Xác suất
• X là biến ngẫu nhiên nếu giá trị của X=x là hoàn toàn ngẫu nhiên.
• Xác suất để X nhận giá trị x là p(x)=P(X=x).
• Nếu một biến ngẫu X nhận giá trị x i, khi đó 1. 0 p x 1 for all x i i 2. p x 1 i i x 6 3 2025-05-12 PHÂN PHỐI CHUẨN
• Dạng hình chuông, đối xứng qua giá trị trung
tâm µ, có đỉnh tại x=µ
• đồ thị tiệm cận 0 khi x→±∞. 7 TÍNH CHẤT 1. E(X) = µ; V(X) = σ².
2. Diện tích dưới đường cong = 1 3. Kí hiệu: X~N(µ, σ²).
4. Giá trị trung bình khác nhau – vị trí thay đổi dọc theo trục x
5. Phương sai khác nhau – đồ thị nhọn hoặc thoải 8 4 2025-05-12 Giá trị TB khác nhau 0.5 x) f( 0 x 9 Phương sai khác nhau 1 σ=1 σ=0.5 σ=2 f(x) 0 -4 -2 0 2 4 x 10 5 2025-05-12 Tính xác suất từ PPC •
Tính P(X• Hoặc tính P(a11
Có nghĩa là cần tính diện tích dưới đường cong
• Toán học, cần lấy tích phân : 2 b b 1 1 x æ - mö - DT = f x ò dx e 2èç s ø÷ dx ò . a s 2p a • Không dễ! 12 6 2025-05-12 Chuẩn hóa (1)
• Là quá trình chuyển một biến phân phối chuẩn về phân phối chuẩn hóa
• Nếu X~N(μ,σ²), sử dụng công thức dưới đây để chuẩn hóa: X - m Z ~ N(0,1) s
Sử dụng bảng Z để tra X/S 13 Quy tắc tính xác suất • Quy tắc đối xứng P(Z<-a) = P(Z>a) P(Z>a) = 1 – P(Z• P(a14 7 2025-05-12 Quy tắc 3 sigma
Đối với phân phối chuẩn:
Khoảng 68.26% các quan sát nằm trong phạm vi (+) và (-) 1 lần độ lệch chuẩn so với trung bình
Khoảng 95.44% các quan sát nằm trong phạm vi (+) và (-) 2 lần độ lệch chuẩn so với trung bình
Khoảng 99.74% các quan sát nằm trong
khoảng (+) và (-) 3 lần độ lệch chuẩn so với trung bình 15 Bài tập áp dụng
Tính xác suất dựa vào Quy tắc 3 Sigma: Bài 9, 10, 11, 12 (trang 219) Tính Z và xác suất:
Bài 13, 14, 15, 16 (trang 223) Bài 17 – 22 (trang 225) Bài 23 – 30 (trang 228) 16 8 2025-05-12
4.2. ĐỊNH LÝ GIỚI HẠN TRUNG TÂM Phân phối của mẫu
Phân phối của trung bình mẫu
Định lý giới hạn trung tâm 17 PHÂN PHỐI CỦA MẪU
• Lấy một mẫu gồm 50 quan sát (obs) từ dữ liệu thống kê về
thời gian giao Pizza, có đồ thị và thống kê mô tả cho dưới đây 10 5 requency F 0 10 12 14 16 18 20 22 24 26 Pizza time Variable N Mean Median SD
Pizza time 50 17.256 17.041 3.743 18 9 2025-05-12
Một mẫu 50 obs khác; 1000 obs cũng từ tổng thể trên 100 10 50 5 requency requency F F 0 0 6 8 10 12 14 16 18 20 22 24 26 10 20 30 Pizza time Pizza time Variable N Mean Median SD
Pizza time 50 17.585 17.374 3.872
Pizza time 1000 17.934 17.627 4.009 19
Tăng cỡ mẫu lên đến 10,000 obs từ tổng thể đó 600 500 400 300 Frequency 200 100 0 10 20 30 40 Pizza time Variable N Mean Median SD
Pizza time 10000 18.046 17.744 4.006
Khi cỡ mẫu tăng lên (đặc biệt tăng đến vô hạn và tiệm cận với quy mô
của tổng thể), phân phối của mẫu sẽ tiệm cận về phân phối chuẩn. 20 10 2025-05-12
PHÂN PHỐI CỦA CÁC TRUNG BÌNH MẪU
• Lấy 1000 mẫu khác nhau, mỗi mẫu gồm 10 quan sát. Tính
trung bình và độ lệch chuẩn của mỗi mẫu rồi biểu diễn ở đồ thị dưới đây. Thống kê N Mean SD Trung bình chung các mẫu 1000 18.007 1.231 S.D chung các mẫu 1000 3.8183 0.9505 90 80 90 80 70 70 60 60 50 50 40 40 Frequency 30 Frequency 30 20 20 10 10 0 0 13 14 15 16 17 18 19 20 21 22 1 2 3 4 5 6 7 average stdev 21 Tăng cỡ mẫu
• Lấy 1000 mẫu khác với cỡ mẫu 25 100 70 90 60 80 50 70 60 40 50 uency 30 40 Freq Frequency 20 30 10 20 10 0 0 2 3 4 5 6 15.5 16.5 17.5 18.5 19.5 20.5 stdev average Thống kê N Mean SD TB chung các mẫu 1000 17.991 0.814 S.D chung các mẫu 1000 3.964 0.605 22 11 2025-05-12 NHẬN XÉT
• Bất kể biến ngẫu nhiên ban đầu có dạng phân
phối như thế nào, khi cỡ mẫu tăng lên phân
phối của các trung bình mẫu tiệm cận về phân phối chuẩn. Và
• Bất kể biến ngẫu nhiên ban đầu có dạng phân
phối như thế nào, với một cỡ mẫu n, độ lệch
chuẩn của các trung bình mẫu (sai số bình quân
chọn mẫu) bằng s / ,nkí hiệu là SE (Standard error of the mean). 23 Ý NGHĨA
Bất kể tổng thể có phân phối thế nào (chuẩn hay
không chuẩn), khi cỡ mẫu đủ lớn phân phối của
các trung bình mẫu sẽ tuân theo quy luật phân
phối chuẩn và chúng ta có thể sử dụng thống kê Z
để tính xác suất cho bất kỳ giá trị trung bình nào 24 12 2025-05-12
Định lý giới hạn trung tâm
• Nếu X là một biến ngẫu nhiên có giá trị trung
bình là µ và phương sai là σ², thì 2 æ s ö X N , m ç ÷ è nø X - m Z ~ N 0,1 as n . s n 25
Cỡ mẫu như thế nào là đủ lớn?
• Nếu tổng thể có phân phối chuẩn, quy mô mẫu có thể nhận bất kỳ giá trị nào.
• Nếu không biết hình dạng phân phối của tổng thể, quy mô mẫu
rất quan trọng. Phân phối của các trung bình mẫu sẽ tiệm cận về
phân phối chuẩn khi cỡ mẫu tăng lên vô hạn. Trên thực tế, phân
phối của các trung bình mẫu sẽ gần giống với phân phối chuẩn
khi cỡ mẫu ít nhất là 30 đơn vị.
• Xác định cỡ mẫu đề cập ở bài 5. 26 13 2025-05-12 Thank you! 27 14