



















Preview text:
CHƯƠNG 3
MỘT SỐ QUY LUẬT PHÂN PHỐI XÁC SUẤT THÔNG DỤNG 1.
Quy luật phân phối của BNN rời rạc
Phân phối nhị thức
Phân phối siêu hình học
Phân phối Poisson
2. Quy luật phân phối của BNN liên tục
Phân phối đều (giới thiệu sv tự học)
Phân phối mũ (giới thiệu sv tự học)
Phân phối chuẩn
Phân phối Chi bình phương, Student, Fisher (giới thiệu sv tự học) 1.
Sử dụng phần mềm R hvnh.edu.vn 1
1. Quy luật phân phối cho biến ngẫu nhiên rời rac
1.1. Quy luật phân phối nhị thức – B(n,p) (Binomial Distribution)
Gieo một đồng xu 10 lần. Gọi X là số lần xuất hiện mặt xấp;
Với mỗi máy công cụ bị mòn sẽ tạo ra 1% bộ phận bị lỗi. Gọi X là
số bộ phận bị lỗi trong 20 lần sản xuất các bộ phận tiếp theo;
Trong tất cả các bit được truyền qua kênh truyền hình kỹ thuật
số, 10% nhận được do lỗi. Gọi X là số bít bị lỗi trong 5 bit tiếp theo;
Một bài kiểm tra trắc nghiệm gồm 10 câu hỏi, mỗi câu hỏi có 4
lựa chọn, chỉ có 1 đáp án đúng. Gọi X là số câu hỏi được trả lời đúng. hvnh.edu.vn 2
Phân phối nhị thức có 3 yếu tố cốt lõi:
Dãy n phép thử độc lập;
Mỗi phép thử chỉ có 2 kết cục;
Xác suất xuất hiện kết cục ta quan tâm không đổi qua các phép thử.
Tất cả các tình huống của các ví dụ trên đều thoả mãn.
Một dãy n phép thử thoả mãn 3 điều kiện ở trên được gọi
là Lược đồ Bernoulli hvnh.edu.vn 3
Đinh nghĩa: Nếu có n phép thử độc lập, thoả mãn là dãy phép thử
Bernoulli. X là số lần xuất hiện kết quả mà ta quan tâm. Thì X sẽ
được gọi là tuân theo quy luật nhị thức với số phép thử là n, xác
suất xuất hiện biến cố quan tâm (thành công) là p, ký hiệu X ~ B(n, p) (Binomial Distribution)
Khi đó: 𝑷 𝑿 = 𝒌 = 𝑪𝒌𝒏. 𝒑𝒌(𝟏 − 𝒑)𝒏−𝒌 𝒗ớ𝒊 𝒌 = 𝟎. . 𝒏 hvnh.edu.vn 4
Ví dụ 1: Khi nghiên cứu ô nhiễm chất hữu cơ của nguồn nước,
ta có các thông tin sau đây:
Mỗi mẫu nước có 10% chứa một chất ô nhiễm hưũ cơ cụ thể
nào đó. Giả sử các mẫu nước là độc lập khi liên quan tới sự ô
nhiễm này. Tìm xác suất để:
a.Trong 18 mẫu có đúng 2 mẫu có chứa chất ô nhiễm hữu cơ?
b.Trong 18 mẫu tối thiểu 4 mẫu có chứa chất ô nhiễm hữu cơ?
c. Số mẫu có ô nhiễm hưũ cơ thuộc [3,7)? hvnh.edu.vn 5
Để tính kỳ vọng và phương sai của biến ngẫu nhiên X tuân theo quy luật nhị
thức, ta có thể phân tích X thành tổng của n biến ngẫu nhiên độc lập có dạng sau:
1: 𝑛ế𝑢 𝑝ℎé𝑝 𝑡ℎử 𝑡ℎứ 𝑖 𝑡ℎà𝑛ℎ 𝑐ô𝑛𝑔 𝑋𝑖 = ቊ với mọi i = 1..n 0:
𝑛ế𝑢 𝑝ℎé𝑝 𝑡ℎử 𝑡ℎứ 𝑖 𝑡ℎấ𝑡 𝑏ạ𝑖
Khi đó: X = X1 + X2 + … + Xn; các Xi là độc lập toàn phần với nhau.
Ta có E(Xi) = 1. p + 0.(1-p) = p; V(Xi) = p – p2 = p(1-p)
Ta dễ dàng có kết quả sau:
Định lý 1: Nếu X ~ B(n, p), thì EX = np; 𝜎2 = VX = np(1-p)
Chú ý: có thể dùng excel để tính P(X <= k) với k >> hvnh.edu.vn 6
Ví dụ 2: Một ngân hàng triển khai chiến dịch tiếp thị qua email để giới
thiệu sản phẩm thẻ tín dụng mới đến 500 khách hàng tiềm năng. Dựa
trên dữ liệu lịch sử, xác suất một khách hàng mở email và đăng ký thẻ là
4%. Giả sử các khách hàng phản hồi độc lập với nhau.
1. Tính xác suất có đúng 25 khách hàng đăng ký thẻ sau chiến dịch.
2. Tính xác suất có từ 20 đến 30 khách hàng đăng ký thẻ.
3. Ngân hàng đặt chỉ tiêu: nếu có ít nhất 20 khách hàng đăng ký thì
chiến dịch được coi là thành công. Tính xác suất chiến dịch thành công.
4. Tính kỳ vọng và độ lệch chuẩn của số khách hàng đăng ký.
5. Giả sử ngân hàng chi phí 10.000 đồng cho mỗi email gửi đi, và thu về
lợi nhuận trung bình 1.200.000 đồng cho mỗi khách hàng đăng ký. Có
nên thực hiện chiến dịch này? hvnh.edu.vn 7
Chú ý: Nếu X1 ~ B(n1,p), X2 ~B(n2,p), là các bnn độc lập, thì X1 + X2 ~B(n1 + n2, p).
1.2. Quy luật phân phối Poisson – P(λ): λ>0
Khi nghiên cứu các sự kiện xảy ra một cách ngẫu nhiên trong thời gian hoặc không
gian, như số cuộc gọi đến trung tâm chăm sóc khách hàng trong một giờ, hoặc số
lỗi phát sinh trên một đoạn cáp quang, ta cần một mô hình đặc biệt để mô tả tần
suất xuất hiện các sự kiện hiếm này. Phân phối Poisson chính là công cụ lý tưởng
để mô hình hóa các biến cố có tần suất thấp, xảy ra độc lập và đều đặn theo thời
gian hoặc không gian. Trong bài hôm nay, chúng ta sẽ cùng khám phá bản chất,
công thức và ứng dụng quan trọng của quy luật phân phối Poisson.
Nếu X tuân theo quy luật nhị thức với n ≥ 20 và p ≤ 0.1 thì X tuân theo quy luật
Poison với λ = np; X ~ P( λ)
Nếu có dòng vào của một hệ thống phục vụ trong một chu kỳ thời gian
nhất định ta thường dùng phân phối Poisson cho số quan sát với điều
kiện không tồn tại số quan sát cực đại.
X = số quan sát trong chu kỳ thời gian T, với số quan sát trung bình trong khoảng
thời gian T là λ, thì X sẽ tuân theo quy luật Poison vơí tham số λ. hvnh.edu.vn 8 𝜆k
Định lý: Nếu X ~ P( λ) thì 𝑃 X = K = e−𝜆 k!
Trong đó λ là số cho trước bằng gía trị trung bình của X trong
chu kỳ thời gian ta quan tâm.
Định lý: Nếu X ~ P( λ) thì E(X) = V(X) = λ;
mod X là số nguyên thoả mãn: λ - 1 ≤ mod (X) ≤ λ
Chú ý: Nếu X tuân theo phân phối Poisson, với tham số λ,
thì λ chính là giá trị trung bình của X xuất hiện trong chu
kỳ thời gian mà ta quan tâm. hvnh.edu.vn 9
Ví dụ 7: Giả sử trung bình trong 1 ngày Nhà nước tiêu huỷ 10 triệu
đồng tiền cũ, phát hành 12 triệu đồng tiền mới. Việc phát hành
tiền mới và tiêu huỷ tiền cũ là độc lập với nhau. Tính xác suất để
trong 1 ngày nào đó để số tiền bị huỷ và số tiền phát hành đều là 10 triệu đồng. Do: E(X) = λ,
X = số tiền bị huỷ trong 1 ngày: X ~ P(10);
Y = số tiền phát hành mới trong 1 ngày: Y ~ P(12) Cần tính : P(X=10)P(Y=10)? hvnh.edu.vn 10
Ví dụ 8: Một ga ra có 4 chiếc ô tô cho thuê. Số người đến thuê ô tô ở
một gara vào cuối tuần trung bình là 2 người. Mỗi cuối tuần mỗi ô
tô phải đóng thuế là 8 USD, nếu cho thuê dược thì mỗi ô tô thu
được 20 USD/cuối tuần. Hãy tìm xác suất để:
a. Không phải tất cả 4 chiếc ô tô đều được thuê?
b. Tất cả 4 ô tô đều được thuê?
c. Ga ra không đáp ứng được nhu cầu của thị trường?
d. Ga ra cần có tối thiểu bao nhiêu ô tô để xác suất không đáp ứng
được nhu cầu thuê xe <0.02
e. Tính số tiền lãi trung bình trong một dịp cuối tuần của gara?
P(X > n) < 0.02 hay P(X ≤ n) > 0.98 hvnh.edu.vn 11
Bài tập: Quản lý rủi ro hệ thống giao dịch trực tuyến của ngân hàng
Ngân hàng A vận hành một hệ thống giao dịch trực tuyến, trong đó
trung bình mỗi giờ xảy ra khoảng 2 lỗi kỹ thuật nghiêm trọng làm
gián đoạn giao dịch của khách hàng. Giả sử số lỗi trong mỗi giờ tuân
theo phân phối Poisson với tham số λ=2, và các lỗi xảy ra độc lập
theo các khoảng thời gian.
1. Tính xác suất trong một giờ có không lỗi nào xảy ra.
2. Tính xác suất trong một ngày làm việc 8 giờ, tổng số lỗi nghiêm
trọng không vượt quá 10 lỗi.
3. Ngân hàng muốn thiết lập một hệ thống cảnh báo khi trong 3 giờ
liên tiếp xảy ra ít nhất 5 lỗi nghiêm trọng. Tính xác suất xảy ra sự kiện này.
4. Dựa trên kết quả trên, ngân hàng nên cân nhắc các phương án
phòng ngừa ra sao để đảm bảo chất lượng dịch vụ? hvnh.edu.vn 12
1.3. Quy luật Phân phối siêu hình học (Hyper geometric Distribution)
Trong thực tế, có nhiều tình huống chọn mẫu không hoàn lại từ một quần thể
hữu hạn — chẳng hạn như kiểm tra chất lượng sản phẩm trong kho, hoặc xét xác
suất rút trúng thẻ ưu đãi trong một bộ thẻ có số lượng giới hạn. Khi đó, mô hình
phân phối nhị thức không còn phù hợp, vì các lần chọn không còn độc lập. Để xử
lý các tình huống như vậy, chúng ta sử dụng phân phối siêu hình học, một quy
luật xác suất rất quan trọng trong việc mô hình hóa các phép chọn không hoàn lại.
Hôm nay, chúng ta sẽ cùng tìm hiểu công thức, các đặc trưng, và ứng dụng thực tế của phân phối này.
Xét tập hợp gồm N đối tượng, trong đó có M đối tượng có tính chất F, N-M đối
tượng không có tính chất F. Chọn ngẫu nhiên ra n đối tượng theo kiểu không
hoàn lại. Ta có n phép thử ngẫu nhiên mà P(A) và P(Ā) thay đổi qua mỗi phép thử,
với A là biến cố lấy đượ phần tử có tính chất F.
X = số phần tử có tính chất F trong n phần tử lấy ra.
Thì X đgl tuân theo quy luật siêu bội với các tham số N, M, n. Ký hiệu X ~ H(N, M, n) hvnh.edu.vn 13 Ci Cn−i
Định lý: Nếu X ~ H(N,M,n) thì P X = i = M N − M Cn N 0 ≤ 𝑖 ≤ n. M M N−M N−n N−n 𝑬 X = n. = np; V X = n. . . = np(1-p). N N N N −𝟏 N−𝟏 hvnh.edu.vn 14
Ví dụ 9: Để thanh toán 1 triệu đồng tiền hàng, một khách hàng gian
lận đã xếp lẫn 5 tờ 50 ngàn tiền giả vào tập 15 tờ 50 ngàn tiền thật.
Chủ cửa hàng rút ngẫu nhiên 4 tờ tiền đi kiểm tra và giao hẹn: nếu
phát hiện có bạc giả thì cứ mỗi tờ giả khách hàng phải đền 2 tờ tiền
thật. Tính số tiền phạt (Trung bình) mà khách hàng có thể phải trả.
X = số tờ tiền giả trong 3 tờ mang đi kiểm tra; X ~ H(20, 5, 4)
Số tờ tiền giả trung bình: E(X) = np = 4.5/20 = 1;
Số tiền bị phạt trung bình: E(X).100 (ngàn). hvnh.edu.vn 15
Ví dụ 10: Trong 500 vé số bán ra có 50 vé trúng thưởng. Một người mua 20 vé. Tính
a. Xác suất để anh ta có 3 vé trúng thưởng?
b. Trung bình số vé trúng thưởng? X- số vé trúng thưởng;
X – phân phối siêu bội với tham số (500, 50, 20)
X = số vé trúng thưởng; X ~ H(500,50,20) a. P(X=3)? b. E(X) =? hvnh.edu.vn 16 •
Chú ý: Khi n là rất bé so với N thì luật phân phối trong phương pháp lấy
không hoàn lại và lấy có hoàn lại hầu như không khác nhau.
Ví dụ 11: Trong thành phố A có 10000 người, trong đó có 6500 người thích
xem bóng đá. Chọn ngẫu nhiên 12 người. Tính xác suất để trong đó có 5 người thích xem bóng đá?
X = số người thích xem bóng đá; X ~ H(10000, 6500, 12) C6 C7 6500 6500
Ta có P X = 5 = 6500 3500 = C5 ( )5(1 − )7≈ 0.0591 C12 12 10000 10000 10000
Chữa bài tập (các quy luật phân phối của bnn rời rạc) hvnh.edu.vn 17
Bài tập: Kiểm tra tỷ lệ nợ xấu trong danh mục cho vay
Ngân hàng A có một danh mục gồm 200 khoản vay, trong đó có 20 khoản
vay được đánh giá là nợ xấu (rủi ro cao). Ngân hàng muốn tiến hành kiểm
tra ngẫu nhiên 15 khoản vay trong danh mục để đánh giá chất lượng tín dụng.
Giả sử việc chọn mẫu là không hoàn lại và các khoản vay được lựa chọn ngẫu nhiên.
1. Tính xác suất rằng trong 15 khoản vay được kiểm tra, có đúng 3 khoản vay là nợ xấu.
2. Tính xác suất ít nhất có 2 khoản vay nợ xấu trong mẫu 15 khoản vay.
3. Ngân hàng muốn biết xác suất mẫu kiểm tra không có khoản nợ xấu
nào để đảm bảo rủi ro thấp. Tính xác suất này.
4. Dựa trên kết quả, ngân hàng đánh giá thế nào về rủi ro và có thể đưa ra
khuyến nghị gì cho chiến lược kiểm soát tín dụng? hvnh.edu.vn 18
2.3. Phân phối chuẩn
Phân phối chuẩn là một trong những quy luật xác suất quan trọng và phổ biến
nhất trong thống kê và khoa học dữ liệu. Nhiều hiện tượng kinh tế, tài chính và
xã hội – như thu nhập, lợi nhuận đầu tư, sai số đo lường hay biến động giá cả –
đều xấp xỉ tuân theo phân phối chuẩn. Đây cũng là nền tảng cho nhiều mô hình
phân tích định lượng, như kiểm định giả thuyết, ước lượng tham số hay lý
thuyết danh mục đầu tư. Ngoài ra, theo định lý giới hạn trung tâm, tổng hoặc
trung bình của nhiều biến ngẫu nhiên độc lập sẽ có khuynh hướng phân phối
chuẩn. Nhờ đó, phân phối chuẩn không chỉ là công cụ tính toán, mà còn là cầu
nối giữa lý thuyết và thực tiễn. Việc hiểu sâu quy luật này giúp sinh viên tiếp cận
dễ dàng hơn với các phương pháp phân tích dữ liệu hiện đại. Vì vậy, đây là một
chủ đề mang tính nền tảng trong cả thống kê ứng dụng lẫn kinh tế lượng. hvnh.edu.vn 19 . hvnh.edu.vn 20