CHƯƠNG 3
MỘT SỐ QUY LUT PHÂN PHI XÁC SUT TNG DỤNG
1. Quy luật phân phối của BNN ri rạc
Phân phối nh thức
Phân phối siêu hình học
Phân phối Poisson
2. Quy luật phân phối của BNN liên tục
Phân phối đều (giới thiệu sv tự học)
Phân phối (giới thiệu sv tự học)
Phân phối chuẩn
Phân phối Chi bình phương, Student, Fisher (giới thiệu sv tự học)
1. Sử dụng phn mềm R
hvnh.edu.vn
1
1. Quy luật phân phối cho biến ngẫu nhiên rời rac
1.1. Quy luật phân phối nhị thức B(n,p) (Binomial
Distribution)
Gieo một đồng xu 10 lần. Gọi X là số ln xuất hiện mặt xấp;
Vi mỗi y công cụ bmòn sẽ tạo ra 1% b phận blỗi. Gọi X
số b phn blỗi trong 20 lần sản xuất các b phận tiếp theo;
Trong tất cả các bit đưc truyền qua kênh truyền hình kỹ thuật
số, 10% nhn được do lỗi. Gi X số bít bị lỗi trong 5 bit tiếp
theo;
Mt bài kiểm tra trc nghiệm gồm 10 u hỏi, mỗi câu hỏi có 4
lựa chọn, ch 1 đáp án đúng. Gọi X là số câu hỏi được tr lời
đúng.
hvnh.edu.vn
2
Phân phối nh thức 3 yếu tố cốt lõi:
y n phép thử độc lập;
Mỗi phép thử ch 2 kết cục;
Xác suất xuất hiện kết cục ta quan tâm không đổi qua các phép
thử.
Tt cả các nh huống của các dụ trên đều thoả mãn.
Một dãy n phép thử thoả mãn 3 điều kiện trên được gọi
Lược đồ Bernoulli
hvnh.edu.vn
3
Đinh nghĩa: Nếu n phép thử độc lập, thoả mãn dãy phép thử
Bernoulli. X số lần xuất hiện kết qu ta quan m. Thì X sẽ
được gọi tuân theo quy luật nh thức vi số pp thử n, xác
suất xuất hin biến cố quan m (thành công) p, hiệu X ~ B(n,
p) (Binomial Distribution)
Khi đó:
󰇛󰇜

󰉵
hvnh.edu.vn
4
dụ 1: Khi nghiên cứu ô nhiễm chất hữu ca nguồn ớc,
ta các thông tin sau đây:
Mi mẫu nước 10% chứa một chất ô nhiễm ũ cụ thể
nào đó. Gi sử các mẫu ớc đc lập khi liên quan tới sự ô
nhiễm này. Tìm xác suất để:
a.Trong 18 mẫu đúng 2 mẫu chứa chất ô nhiễm hu cơ?
b.Trong 18 mẫu ti thiểu 4 mẫu chứa chất ô nhiễm hữu cơ?
c. Số mẫu ô nhiễm ũ thuộc [3,7)?
hvnh.edu.vn
5
Để tính kvọng và pơng sai của biến ngẫu nhiên X tuân theo quy luật nhị
thức, ta thể pn tích X thành tổng của n biến ngẫu nhn độc lập có dng
sau:
󰇫
 󰉦󰉿󰉽
 󰉦󰉿󰉽󰉙󰉗
với mọi i = 1..n
Khi đó: X = X
1
+ X
2
+ … + X
n
; c X
i
độc lp toàn phần với nhau.
Ta có E(X
i
) = 1. p + 0.(1-p) = p; V(X
i
) = p p
2
= p(1-p)
Ta dễ ng kết quả sau:
Định lý 1: Nếu X ~ B(n, p), thì EX = np;
VX = np(1-p)
Cý: thể dùng excel đnh P(X <= k) với k >>
hvnh.edu.vn
6
Ví d 2: Mt ngân ng trin khai chiến dịch tiếp thqua email để gii
thiệu sản phẩm th n dụng mới đến 500 khách hàng tiềm ng. Dựa
trên dữ liu lch sử, xác sut một kch ng m email và đăng ký thẻ là
4%. Gi scác kháchng phản hồi đc lập vi nhau.
1. Tính xác sut đúng 25 kch ng đăng ký th sau chiến dch.
2. Tính xác sut t20 đến 30 khách hàng đăng ký thẻ.
3. Ngân hàng đặt ch tiêu: nếu ít nhất 20 khách hàng đăng ký t
chiến dch được coi là thành công. Tính xác sut chiến dch thành
công.
4. Tính k vng và độ lệch chuẩn của s khách hàng đăng ký.
5. Giả sử ngân hàng chi phí 10.000 đồng cho mi email gửi đi, thu về
lợi nhuận trung bình 1.200.000 đng cho mi kch hàng đăng ký.
n thực hiện chiến dịch này?
hvnh.edu.vn
7
Chú ý: Nếu X
1
~ B(n
1
,p), X
2
~B(n
2
,p), các bnn độc lập, thì X
1
+ X
2
~B(n
1
+ n
2
, p).
1.2. Quy luật phân phối Poisson P(λ): λ>0
Khi nghiên cứu các sự kiện xảy ra một ch ngẫu nhiên trong thời gian hoặc không
gian, n số cuộc gọi đến trung m chăm sóc khách hàng trong một giờ, hoặc số
lỗi phát sinh trên một đoạn p quang, ta cần một hình đặc biệt để tả tần
suất xuất hiện c sự kiện hiếm y. Phân phối Poisson chính công cụ tưởng
để hình hóa c biến cố tn suất thấp, xảy ra độc lập đều đặn theo thời
gian hoặc không gian. Trong bài hôm nay, chúng ta sẽ cùng khám p bản chất,
công thức ứng dụng quan trọng của quy luật pn phối Poisson.
Nếu X tn theo quy luật nh thức với n 20 p 0.1 t X tuân theo quy luật
Poison với λ = np; X ~ P( λ)
Nếu dòng vào ca một hệ thng phc vụ trong một chu kỳ thời gian
nhất định ta thường dùng phân phối Poisson cho số quan sát vi điều
kiện không tồn tại số quan sát cực đại.
X = số quan t trong chu kỳ thời gian T, với số quan t trung bình trong khoảng
thời gian T λ, thì X sẽ tuân theo quy luật Poison vơí tham số λ.
hvnh.edu.vn
8
Định : Nếu X ~ P( λ) thì


Trong đó λ số cho tớc bằng gía trị trung bình của X trong
chu kỳ thời gian ta quan tâm.
Định : Nếu X ~ P( λ) thì E(X) = V(X) = λ;
mod X số nguyên thoả mãn: λ - 1 mod (X) λ
Chú ý: Nếu X tuân theo phân phối Poisson, vi tham số λ,
thì λ chính giá trị trung bình của X xuất hiện trong chu
kỳ thời gian ta quanm.
hvnh.edu.vn
9
dụ 7: Gi sử trung bình trong 1 ngày N nước tiêu huỷ 10 triu
đồng tiền , phát hành 12 triệu đồng tin mới. Việc phát hành
tiền mới tiêu huỷ tiền độc lập vi nhau. nh xác sut để
trong 1 ngày nào đó để số tiền bị huỷ số tiền phát hành đều 10
triệu đồng.
Do: E(X) = λ,
X = số tin bị huỷ trong 1 ngày: X ~ P(10);
Y = số tiền phát hành mới trong 1 ngày: Y ~ P(12)
Cần tính : P(X=10)P(Y=10)?
hvnh.edu.vn
10
dụ 8: Một ga ra 4 chiếc ô cho thuê. Số ngưi đến thuê ô
một gara vào cuối tuần trung bình 2 người. Mỗi cuối tuần mỗi ô
phải đóng thuế 8 USD, nếu cho thuê ợc thì mỗi ô thu
được 20 USD/cuối tuần. Hãy tìm xác suất để:
a. Không phải tất cả 4 chiếc ô đều được thuê?
b. Tất cả 4 ô đều được thuê?
c. Ga ra không đáp ứng được nhu cầu của thị trường?
d. Ga ra cần tối thiểu bao nhiêu ô để xác suất không đáp ng
được nhu cầu thuê xe <0.02
e. nh số tiền lãi trung bình trong một dịp cuối tuần của gara?
P(X > n) < 0.02 hay P(X n) > 0.98
hvnh.edu.vn
11
Bài tp: Qun ri ro h thống giao dịch trực tuyến của ngân
hàng
Ngân hàng A vậnnh một hệ thống giao dịch trực tuyến, trong đó
trung bình mi gixy ra khoảng 2 lỗi k thuật nghiêm trng làm
gián đoạn giao dịch của khách hàng. Giả ss li trong mỗi giờ tuân
theo phân phi Poisson với tham s λ=2, và các li xảy ra đc lp
theo c khong thời gian.
1. Tính xác sut trong một giờ có không li o xy ra.
2. Tính xác sut trong một ny m việc 8 giờ, tổng s lỗi nghiêm
trng không vượt quá 10 li.
3. Ngân hàng mun thiết lập một hệ thống cảnh báo khi trong 3 giờ
liên tiếp xy ra ít nhất 5 li nghiêm trọng. Tính xác suất xy ra s
kiện y.
4. Dựa trên kết qu tn, ngân ng n n nhắc các phương án
png ngừa ra sao đ đm bảo chất lượng dch v?
hvnh.edu.vn
12
1.3. Quy luật Phân phối siêu hình học (Hyper geometric Distribution)
Trong thực tế, nhiều tình huống chọn mẫu không hoàn lại từ một quần thể
hữu hạn chẳng hn như kiểm tra chất lượng sản phẩm trong kho, hoặc t xác
suất rút trúng thẻ ưu đãi trong một bộ thẻ số lượng giới hạn. Khi đó, hình
phân phối nhị thức không còn phù hợp, các ln chọn không còn độc lp. Để xử
các tình huống như vậy, chúng ta sử dụng phân phối siêu hình học, một quy
luật xác suất rt quan trọng trong việc hình hóa các pp chọn không hoàn li.
Hôm nay, chúng ta sẽ cùng tìm hiểu công thức, c đặc trưng, ứng dụng thực tế
của phân phối y.
Xét tp hợp gồm N đối tượng, trong đó M đối tượng tính chất F, N-M đối
tượng không tính chất F. Chọn ngẫu nhiên ra n đối ợng theo kiểu không
hoàn lại. Ta n phép th ngẫu nhiên P(A) P(Ā) thay đổi qua mỗi phép th,
với A biến cố lấy đư phần tử tính chất F.
X = số phần tử tính chất F trong n phần tử lấy ra.
Thì X đgl tuân theo quy luật siêu bội với c tham số N, M, n. hiệu X ~ H(N, M,
n)
hvnh.edu.vn
13
Định : Nếu X ~ H(N,M,n) thì

0 𝑖 n.
 



= np(1-p).


hvnh.edu.vn
14
dụ 9: Để thanh tn 1 triệu đồng tiền hàng, một khách hàng gian
lận đã xếp lẫn 5 tờ 50 ngàn tiền giả o tập 15 tờ 50 ngàn tiền thật.
Chủ cửa hàng t ngẫu nhiên 4 tờ tin đi kiểm tra giao hẹn: nếu
phát hin bc giả tcứ mỗi tờ giả khách hàng phải đền 2 tờ tiền
thật. nh số tiền phạt (Trung bình) khách hàng thể phải tr.
X = số tờ tiền giả trong 3 tờ mang đi kiểm tra;
X ~ H(20, 5, 4)
Số tờ tin gi trung bình: E(X) = np = 4.5/20 = 1;
Số tiền bị phạt trung bình: E(X).100 (ngàn).
hvnh.edu.vn
15
dụ 10: Trong 500 số bán ra 50 trúng thưởng. Một ngưi
mua 20 . nh
a. c suất để anh ta 3 trúng thưởng?
b. Trung bình số trúng thưởng?
X- số trúng thưởng;
X phân phối siêu bội vi tham số (500, 50, 20)
X = số trúng thưởng; X ~ H(500,50,20)
a. P(X=3)?
b. E(X) =?
hvnh.edu.vn
16
Chú ý: Khi n là rất b so với N thi luật phân phối trong phương pháp lấy
không hoàn lại lấy hoàn lại hầu như không khác nhau.
dụ 11: Trong thành phố A 10000 người, trong đó 6500 người thích
xem bóng đá. Chọn ngu nhiên 12 người.nh xác suất để trong đó 5 người
thích xem bóng đá?
X = số người thích xem bóng đá; X ~ H(10000, 6500, 12)
Ta



󰇛


󰇜
󰇛


󰇜

Chữa bài tập (các quy luật phân phối của bnn rời rạc)
hvnh.edu.vn
17
Bài tập: Kiểm tra tỷ l nợ xấu trong danh mục cho vay
Ngân hàng A một danh mục gồm 200 khoản vay, trong đó có 20 khon
vay được đánh gián xấu (rủi ro cao). Nn hàng muốn tiếnnh kiểm
tra ngẫu nhiên 15 khoản vay trong danh mục để đánh giá chất ng tín
dụng.
Giả s việc chọn mẫu là không hoàn lại các khon vay đưc lựa chọn
ngu nhn.
1. Tính xác suất rằng trong 15 khoản vay được kiểm tra, có đúng 3 khoản
vay là nxấu.
2. Tính xác suất ít nht có 2 khoản vay nxấu trong mẫu 15 khoản vay.
3. Ngân hàng muốn biếtc suất mẫu kiểm tra không có khoản nợ xấu
nào để đảm bo rủi ro thấp. Tính xác suất này.
4. Dựa trên kết qu, nn hàng đánh giá thếo về rủi ro có thể đưa ra
khuyến nghị gì cho chiến lược kiểm soát tín dụng?
hvnh.edu.vn
18
2.3. Phân phối chuẩn
Phân phối chuẩn một trong nhng quy luật xác suất quan trọng phổ biến
nht trong thống khoa học dữ liu. Nhiều hiện ợng kinh tế, i chính
hội n thu nhp, lợi nhuận đu tư, sai số đo lường hay biến động giá cả
đều xp xỉ tuân theo pn phối chuẩn. Đây cũng nền tảng cho nhiều hình
phân tích định lượng, như kiểm định giả thuyết, ước lượng tham số hay
thuyết danh mục đu . Ngoài ra, theo định giới hạn trung tâm, tổng hoặc
trung bình của nhiều biến ngẫu nhiên độc lập sẽ khuynh ớng pn phối
chuẩn. Nhờ đó, pn phối chuẩn không chỉ công cụ tính tn, còn cầu
nối giữa thuyết thực tin. Vic hiểu sâu quy luật y giúp sinh viên tiếp cận
dễ dàng hơn với các pơng pháp pn ch dữ liệu hiện đại. vậy, đây một
chủ đề mang tính nền tảng trong cả thống ứng dụng ln kinh tế lượng.
hvnh.edu.vn
19
.
hvnh.edu.vn
20

Preview text:

CHƯƠNG 3
MỘT SỐ QUY LUẬT PHÂN PHỐI XÁC SUẤT THÔNG DỤNG 1.
Quy luật phân phối của BNN rời rạc
Phân phối nhị thức
Phân phối siêu hình học
Phân phối Poisson
2. Quy luật phân phối của BNN liên tục
Phân phối đều (giới thiệu sv tự học)
Phân phối mũ (giới thiệu sv tự học)
Phân phối chuẩn
Phân phối Chi bình phương, Student, Fisher (giới thiệu sv tự học) 1.
Sử dụng phần mềm R hvnh.edu.vn 1
1. Quy luật phân phối cho biến ngẫu nhiên rời rac
1.1. Quy luật phân phối nhị thức – B(n,p) (Binomial Distribution)
 Gieo một đồng xu 10 lần. Gọi X là số lần xuất hiện mặt xấp;
 Với mỗi máy công cụ bị mòn sẽ tạo ra 1% bộ phận bị lỗi. Gọi X là
số bộ phận bị lỗi trong 20 lần sản xuất các bộ phận tiếp theo;
 Trong tất cả các bit được truyền qua kênh truyền hình kỹ thuật
số, 10% nhận được do lỗi. Gọi X là số bít bị lỗi trong 5 bit tiếp theo;
 Một bài kiểm tra trắc nghiệm gồm 10 câu hỏi, mỗi câu hỏi có 4
lựa chọn, chỉ có 1 đáp án đúng. Gọi X là số câu hỏi được trả lời đúng. hvnh.edu.vn 2
Phân phối nhị thức có 3 yếu tố cốt lõi:
 Dãy n phép thử độc lập;
 Mỗi phép thử chỉ có 2 kết cục;
 Xác suất xuất hiện kết cục ta quan tâm không đổi qua các phép thử.
Tất cả các tình huống của các ví dụ trên đều thoả mãn.
Một dãy n phép thử thoả mãn 3 điều kiện ở trên được gọi
là Lược đồ Bernoulli hvnh.edu.vn 3
Đinh nghĩa: Nếu có n phép thử độc lập, thoả mãn là dãy phép thử
Bernoulli. X là số lần xuất hiện kết quả mà ta quan tâm. Thì X sẽ
được gọi là tuân theo quy luật nhị thức với số phép thử là n, xác
suất xuất hiện biến cố quan tâm (thành công) là p, ký hiệu X ~ B(n, p) (Binomial Distribution)
Khi đó: 𝑷 𝑿 = 𝒌 = 𝑪𝒌𝒏. 𝒑𝒌(𝟏 − 𝒑)𝒏−𝒌 𝒗ớ𝒊 𝒌 = 𝟎. . 𝒏 hvnh.edu.vn 4
Ví dụ 1: Khi nghiên cứu ô nhiễm chất hữu cơ của nguồn nước,
ta có các thông tin sau đây:
Mỗi mẫu nước có 10% chứa một chất ô nhiễm hưũ cơ cụ thể
nào đó. Giả sử các mẫu nước là độc lập khi liên quan tới sự ô
nhiễm này. Tìm xác suất để:
a.Trong 18 mẫu có đúng 2 mẫu có chứa chất ô nhiễm hữu cơ?
b.Trong 18 mẫu tối thiểu 4 mẫu có chứa chất ô nhiễm hữu cơ?
c. Số mẫu có ô nhiễm hưũ cơ thuộc [3,7)? hvnh.edu.vn 5
Để tính kỳ vọng và phương sai của biến ngẫu nhiên X tuân theo quy luật nhị
thức, ta có thể phân tích X thành tổng của n biến ngẫu nhiên độc lập có dạng sau:
1: 𝑛ế𝑢 𝑝ℎé𝑝 𝑡ℎử 𝑡ℎứ 𝑖 𝑡ℎà𝑛ℎ 𝑐ô𝑛𝑔 𝑋𝑖 = ቊ với mọi i = 1..n 0:
𝑛ế𝑢 𝑝ℎé𝑝 𝑡ℎử 𝑡ℎứ 𝑖 𝑡ℎấ𝑡 𝑏ạ𝑖
Khi đó: X = X1 + X2 + … + Xn; các Xi là độc lập toàn phần với nhau.
Ta có E(Xi) = 1. p + 0.(1-p) = p; V(Xi) = p – p2 = p(1-p)
Ta dễ dàng có kết quả sau:
Định lý 1: Nếu X ~ B(n, p), thì EX = np; 𝜎2 = VX = np(1-p)
Chú ý: có thể dùng excel để tính P(X <= k) với k >> hvnh.edu.vn 6
Ví dụ 2: Một ngân hàng triển khai chiến dịch tiếp thị qua email để giới
thiệu sản phẩm thẻ tín dụng mới đến 500 khách hàng tiềm năng. Dựa
trên dữ liệu lịch sử, xác suất một khách hàng mở email và đăng ký thẻ là
4%. Giả sử các khách hàng phản hồi độc lập với nhau.
1. Tính xác suất có đúng 25 khách hàng đăng ký thẻ sau chiến dịch.
2. Tính xác suất có từ 20 đến 30 khách hàng đăng ký thẻ.
3. Ngân hàng đặt chỉ tiêu: nếu có ít nhất 20 khách hàng đăng ký thì
chiến dịch được coi là thành công. Tính xác suất chiến dịch thành công.
4. Tính kỳ vọng và độ lệch chuẩn của số khách hàng đăng ký.
5. Giả sử ngân hàng chi phí 10.000 đồng cho mỗi email gửi đi, và thu về
lợi nhuận trung bình 1.200.000 đồng cho mỗi khách hàng đăng ký. Có
nên thực hiện chiến dịch này? hvnh.edu.vn 7
Chú ý: Nếu X1 ~ B(n1,p), X2 ~B(n2,p), là các bnn độc lập, thì X1 + X2 ~B(n1 + n2, p).
1.2. Quy luật phân phối Poisson – P(λ): λ>0
Khi nghiên cứu các sự kiện xảy ra một cách ngẫu nhiên trong thời gian hoặc không
gian, như số cuộc gọi đến trung tâm chăm sóc khách hàng trong một giờ, hoặc số
lỗi phát sinh trên một đoạn cáp quang, ta cần một mô hình đặc biệt để mô tả tần
suất xuất hiện các sự kiện hiếm này. Phân phối Poisson chính là công cụ lý tưởng
để mô hình hóa các biến cố có tần suất thấp, xảy ra độc lập và đều đặn theo thời
gian hoặc không gian. Trong bài hôm nay, chúng ta sẽ cùng khám phá bản chất,
công thức và ứng dụng quan trọng của quy luật phân phối Poisson.
 Nếu X tuân theo quy luật nhị thức với n ≥ 20 và p ≤ 0.1 thì X tuân theo quy luật
Poison với λ = np; X ~ P( λ)
Nếu có dòng vào của một hệ thống phục vụ trong một chu kỳ thời gian
nhất định ta thường dùng phân phối Poisson cho số quan sát với điều
kiện không tồn tại số quan sát cực đại.
X = số quan sát trong chu kỳ thời gian T, với số quan sát trung bình trong khoảng
thời gian T là λ, thì X sẽ tuân theo quy luật Poison vơí tham số λ. hvnh.edu.vn 8 𝜆k
Định lý: Nếu X ~ P( λ) thì 𝑃 X = K = e−𝜆 k!
Trong đó λ là số cho trước bằng gía trị trung bình của X trong
chu kỳ thời gian ta quan tâm.
Định lý: Nếu X ~ P( λ) thì E(X) = V(X) = λ;
mod X là số nguyên thoả mãn: λ - 1 ≤ mod (X) ≤ λ
Chú ý: Nếu X tuân theo phân phối Poisson, với tham số λ,
thì λ chính là giá trị trung bình của X xuất hiện trong chu
kỳ thời gian mà ta quan tâm.
hvnh.edu.vn 9
Ví dụ 7: Giả sử trung bình trong 1 ngày Nhà nước tiêu huỷ 10 triệu
đồng tiền cũ, phát hành 12 triệu đồng tiền mới. Việc phát hành
tiền mới và tiêu huỷ tiền cũ là độc lập với nhau. Tính xác suất để
trong 1 ngày nào đó để số tiền bị huỷ và số tiền phát hành đều là 10 triệu đồng. Do: E(X) = λ,
X = số tiền bị huỷ trong 1 ngày: X ~ P(10);
Y = số tiền phát hành mới trong 1 ngày: Y ~ P(12) Cần tính : P(X=10)P(Y=10)? hvnh.edu.vn 10
Ví dụ 8: Một ga ra có 4 chiếc ô tô cho thuê. Số người đến thuê ô tô ở
một gara vào cuối tuần trung bình là 2 người. Mỗi cuối tuần mỗi ô
tô phải đóng thuế là 8 USD, nếu cho thuê dược thì mỗi ô tô thu
được 20 USD/cuối tuần. Hãy tìm xác suất để:
a. Không phải tất cả 4 chiếc ô tô đều được thuê?
b. Tất cả 4 ô tô đều được thuê?
c. Ga ra không đáp ứng được nhu cầu của thị trường?
d. Ga ra cần có tối thiểu bao nhiêu ô tô để xác suất không đáp ứng
được nhu cầu thuê xe <0.02
e. Tính số tiền lãi trung bình trong một dịp cuối tuần của gara?
P(X > n) < 0.02 hay P(X ≤ n) > 0.98 hvnh.edu.vn 11
Bài tập: Quản lý rủi ro hệ thống giao dịch trực tuyến của ngân hàng
Ngân hàng A vận hành một hệ thống giao dịch trực tuyến, trong đó
trung bình mỗi giờ xảy ra khoảng 2 lỗi kỹ thuật nghiêm trọng làm
gián đoạn giao dịch của khách hàng. Giả sử số lỗi trong mỗi giờ tuân
theo phân phối Poisson với tham số λ=2, và các lỗi xảy ra độc lập
theo các khoảng thời gian.
1. Tính xác suất trong một giờ có không lỗi nào xảy ra.
2. Tính xác suất trong một ngày làm việc 8 giờ, tổng số lỗi nghiêm
trọng không vượt quá 10 lỗi.
3. Ngân hàng muốn thiết lập một hệ thống cảnh báo khi trong 3 giờ
liên tiếp xảy ra ít nhất 5 lỗi nghiêm trọng. Tính xác suất xảy ra sự kiện này.
4. Dựa trên kết quả trên, ngân hàng nên cân nhắc các phương án
phòng ngừa ra sao để đảm bảo chất lượng dịch vụ? hvnh.edu.vn 12
1.3. Quy luật Phân phối siêu hình học (Hyper geometric Distribution)
Trong thực tế, có nhiều tình huống chọn mẫu không hoàn lại từ một quần thể
hữu hạn — chẳng hạn như kiểm tra chất lượng sản phẩm trong kho, hoặc xét xác
suất rút trúng thẻ ưu đãi trong một bộ thẻ có số lượng giới hạn. Khi đó, mô hình
phân phối nhị thức không còn phù hợp, vì các lần chọn không còn độc lập. Để xử
lý các tình huống như vậy, chúng ta sử dụng phân phối siêu hình học, một quy
luật xác suất rất quan trọng trong việc mô hình hóa các phép chọn không hoàn lại.
Hôm nay, chúng ta sẽ cùng tìm hiểu công thức, các đặc trưng, và ứng dụng thực tế của phân phối này.
Xét tập hợp gồm N đối tượng, trong đó có M đối tượng có tính chất F, N-M đối
tượng không có tính chất F. Chọn ngẫu nhiên ra n đối tượng theo kiểu không
hoàn lại. Ta có n phép thử ngẫu nhiên mà P(A) và P(Ā) thay đổi qua mỗi phép thử,
với A là biến cố lấy đượ phần tử có tính chất F.
X = số phần tử có tính chất F trong n phần tử lấy ra.
Thì X đgl tuân theo quy luật siêu bội với các tham số N, M, n. Ký hiệu X ~ H(N, M, n) hvnh.edu.vn 13 Ci Cn−i
Định lý: Nếu X ~ H(N,M,n) thì P X = i = M N − M Cn N 0 ≤ 𝑖 ≤ n. M M N−M N−n N−n 𝑬 X = n. = np; V X = n. . . = np(1-p). N N N N −𝟏 N−𝟏 hvnh.edu.vn 14
Ví dụ 9: Để thanh toán 1 triệu đồng tiền hàng, một khách hàng gian
lận đã xếp lẫn 5 tờ 50 ngàn tiền giả vào tập 15 tờ 50 ngàn tiền thật.
Chủ cửa hàng rút ngẫu nhiên 4 tờ tiền đi kiểm tra và giao hẹn: nếu
phát hiện có bạc giả thì cứ mỗi tờ giả khách hàng phải đền 2 tờ tiền
thật. Tính số tiền phạt (Trung bình) mà khách hàng có thể phải trả.
X = số tờ tiền giả trong 3 tờ mang đi kiểm tra; X ~ H(20, 5, 4)
Số tờ tiền giả trung bình: E(X) = np = 4.5/20 = 1;
Số tiền bị phạt trung bình: E(X).100 (ngàn). hvnh.edu.vn 15
Ví dụ 10: Trong 500 vé số bán ra có 50 vé trúng thưởng. Một người mua 20 vé. Tính
a. Xác suất để anh ta có 3 vé trúng thưởng?
b. Trung bình số vé trúng thưởng? X- số vé trúng thưởng;
X – phân phối siêu bội với tham số (500, 50, 20)
X = số vé trúng thưởng; X ~ H(500,50,20) a. P(X=3)? b. E(X) =? hvnh.edu.vn 16 •
Chú ý: Khi n là rất bé so với N thì luật phân phối trong phương pháp lấy
không hoàn lại và lấy có hoàn lại hầu như không khác nhau.
Ví dụ 11: Trong thành phố A có 10000 người, trong đó có 6500 người thích
xem bóng đá. Chọn ngẫu nhiên 12 người. Tính xác suất để trong đó có 5 người thích xem bóng đá?
X = số người thích xem bóng đá; X ~ H(10000, 6500, 12) C6 C7 6500 6500
Ta có P X = 5 = 6500 3500 = C5 ( )5(1 − )7≈ 0.0591 C12 12 10000 10000 10000
Chữa bài tập (các quy luật phân phối của bnn rời rạc) hvnh.edu.vn 17
Bài tập: Kiểm tra tỷ lệ nợ xấu trong danh mục cho vay
Ngân hàng A có một danh mục gồm 200 khoản vay, trong đó có 20 khoản
vay được đánh giá là nợ xấu (rủi ro cao). Ngân hàng muốn tiến hành kiểm
tra ngẫu nhiên 15 khoản vay trong danh mục để đánh giá chất lượng tín dụng.
Giả sử việc chọn mẫu là không hoàn lại và các khoản vay được lựa chọn ngẫu nhiên.
1. Tính xác suất rằng trong 15 khoản vay được kiểm tra, có đúng 3 khoản vay là nợ xấu.
2. Tính xác suất ít nhất có 2 khoản vay nợ xấu trong mẫu 15 khoản vay.
3. Ngân hàng muốn biết xác suất mẫu kiểm tra không có khoản nợ xấu
nào để đảm bảo rủi ro thấp. Tính xác suất này.
4. Dựa trên kết quả, ngân hàng đánh giá thế nào về rủi ro và có thể đưa ra
khuyến nghị gì cho chiến lược kiểm soát tín dụng? hvnh.edu.vn 18
2.3. Phân phối chuẩn
 Phân phối chuẩn là một trong những quy luật xác suất quan trọng và phổ biến
nhất trong thống kê và khoa học dữ liệu. Nhiều hiện tượng kinh tế, tài chính và
xã hội – như thu nhập, lợi nhuận đầu tư, sai số đo lường hay biến động giá cả –
đều xấp xỉ tuân theo phân phối chuẩn. Đây cũng là nền tảng cho nhiều mô hình
phân tích định lượng, như kiểm định giả thuyết, ước lượng tham số hay lý
thuyết danh mục đầu tư. Ngoài ra, theo định lý giới hạn trung tâm, tổng hoặc
trung bình của nhiều biến ngẫu nhiên độc lập sẽ có khuynh hướng phân phối
chuẩn. Nhờ đó, phân phối chuẩn không chỉ là công cụ tính toán, mà còn là cầu
nối giữa lý thuyết và thực tiễn. Việc hiểu sâu quy luật này giúp sinh viên tiếp cận
dễ dàng hơn với các phương pháp phân tích dữ liệu hiện đại. Vì vậy, đây là một
chủ đề mang tính nền tảng trong cả thống kê ứng dụng lẫn kinh tế lượng. hvnh.edu.vn 19 . hvnh.edu.vn 20