Chương 4
Thống kê. Ước lượng tham số
TUẦN 11
4.1 Lý thuyết mẫu
Thống toán bộ môn toán học nghiên cứu quy luật của các hiện tượng ngẫu nhiên
tính chất số lớn trên sở thu thập xử lý số liệu thống các kết quả quan sát v những
hiện tượng ngẫu nhiên y. Nếu ta thu thập được các số liệu liên quan đến tất cả đối tượng
cần nghiên cứu thì ta thể biết được đối tượng y (phương pháp toàn bộ). Tuy nhiên trong
thực tế điều đó không thể thực hiện được quy của các đối tượng cần nghiên cứu quá
lớn hoặc trong quá trình nghiên cứu đối tượng nghiên cứu bị phá hủy. vậy cần lấy mẫu để
nghiên cứu.
Mục này giới thiệu về phương pháp lấy mẫu ngẫu nhiên các thống thường gặp của
mẫu ngẫu nhiên.
4.1.1 Tổng thể mẫu
Khái niệm tổng thể
Khi nghiên cứu các vấn đề về kinh tế - hội, cũng như nhiều vấn đề thuộc các lĩnh vực vật
, sinh vật, quân sự ... thường dẫn đến khảo sát một hay nhiều dấu hiệu (định tính hoặc định
lượng) thể hiện bằng số lượng trên nhiều phần tử. Tập hợp tất cả các phần tử này gọi tổng
thể hay đám đông (population). Số phần tử trong tổng thể thể hữu hạn hoặc hạn. Cần
nhấn mạnh rằng ta không nghiên cứu trực tiếp bản thân tổng thể chỉ nghiên cứu dấu hiệu
nào đó của nó.
Ký hiệu N số phần tử của tổng thể; X dấu hiệu cần khảo sát.
dụ 4.1. (a) Muốn điều tra thu nhập bình quân của các hộ gia đình Nội thì tập hợp
cần nghiên cứu các hộ gia đình Nội, dấu hiệu nghiên cứu thu nhập của từng
hộ gia đình (dấu hiệu định lượng).
96
CuuDuongThanCong.com https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy3SAMI-HUST
(b) Một doanh nghiệp muốn nghiên cứu các khách hàng của mình v dấu hiệu định tính
thể mức độ hài lòng của khách hàng đối với sản phẩm hoặc dịch vụ của doanh nghiệp,
còn dấu hiệu định lượng số lượng sản phẩm của doanh nghiệp khách hàng nhu
cầu được đáp ứng.
Một số do không thể khảo sát toàn bộ tổng thể
(a) Do quy của tập hợp cần nghiên cứu quá lớn nên việc nghiên cứu toàn bộ sẽ đòi hỏi
nhiều chi phí về vật chất và thời gian, thể không kiểm soát được dẫn đến bị chồng
chéo hoặc bỏ sót.
(b) Trong nhiều trường hợp không thể nắm được toàn bộ các phần tử của tập hợp cần nghiên
cứu, do đó không thể tiến hành toàn bộ được.
(c) thể trong quá trình điều tra sẽ phá hủy đối tượng nghiên cứu. . .
Do đó thay khảo sát tổng thể, ta chỉ cần chọn ra một tập nhỏ để khảo sát đưa ra quyết
định.
Khái niệm tập mẫu
Tập mẫu (sample) tập con của tổng thể và tính chất tương tự như tổng thể. Số phần tử
của tập mẫu được gọi kích thước mẫu (cỡ mẫu), hiệu .n
Chương 4 và Chương 5 sẽ nghiên cứu tổng thể thông qua mẫu. Nói nghiên cứu tổng thể
nghĩa nghiên cứu một hoặc một số đặc trưng nào đó của tổng thể. Khi đó, ta không thể
đem tất cả các phần tử trong tổng thể ra nghiên cứu chỉ lấy một số phần tử trong tổng thể
ra nghiên cứu làm sao qua việc nghiên cứu y thể kết luận được v một hoặc một số
đặc trưng của tổng thể ta quan tâm ban đầu.
Một số cách chọn mẫu bản
Một câu hỏi đặt ra làm sao chọn được tập mẫu tính chất tương tự như tổng thể để các
kết luận của tập mẫu thể dùng cho tổng thể?
Ta sử dụng một trong những cách chọn mẫu sau:
1. Chọn mẫu ngẫu nhiên hoàn lại: Lấy ngẫu nhiên một phần tử từ tổng thể khảo sát
nó. Sau đó trả phần tử đó lại tổng thể trước khi lấy một phần tử khác. Tiếp tục như thế
n lần ta thu được một mẫu hoàn lại gồm n phần tử.
2. Chọn mẫu ngẫu nhiên không hoàn lại: Lấy ngẫu nhiên một phần tử từ tổng thể khảo
sát rồi để qua một bên, không trả lại tổng thể. Sau đó lấy ngẫu nhiên một phần tử
khác, tiếp tục như thế n lần ta thu được một mẫu không hoàn lại gồm n phần tử.
4.1. thuyết mẫu 97
CuuDuongThanCong.com https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy3SAMI-HUST
3. Chọn mẫu phân nhóm: Đầu tiên ta chia tập nền thành các nhóm tương đối thuần nhất,
từ mỗi nhóm đó chọn ra một mẫu ngẫu nhiên. Tập hợp tất cả mẫu đó cho ta một mẫu
phân nhóm. Phương pháp này dùng khi trong tập nền những sai khác lớn. Hạn chế
phụ thuộc vào việc chia nhóm.
4. Chọn mẫu suy luận: Dựa trên ý kiến của chuyên gia về đối tượng nghiên cứu để chọn
mẫu.
4.1.2 Mẫu ngẫu nhiên
Biến ngẫu nhiên quy luật phân phối gốc
Giả sử ta cần nghiên cứu dấu hiệu X của tổng thể E(X) = µ V(X) = σ
2
(µ chưaσ
biết). Ta thể hình hóa dấu hiệu X bằng một biến ngẫu nhiên. Thật vậy, nếu lấy ngẫu
nhiên từ tổng thể ra một phần tử và gọi X giá trị của dấu hiệu X đo được trên phần tử lấy
ra thì X biến ngẫu nhiên bảng phân phối xác suất
X x
1
x
2
.. . x
n
P P(X X= x x
1
) P(X =
2
) .. . P( = x
n
)
Như vậy dấu hiệu X ta nghiên cứu được hình hóa bởi biến ngẫu nhiên , còn X
cấu của tổng thể theo dấu hiệu X (tập hợp các xác suất) chính quy luật phân phối xác suất
của .X
Biến ngẫu nhiên X được gọi biến ngẫu nhiên gốc. Quy luật phân phối xác suất của X
quy luật phân phối gốc, đồng thời .E(X) = µ, V(X) = σ
2
Các đặc trưng của tổng thể
Xét tổng thể về mặt định lượng: tổng thể được đặc trưng bởi dấu hiệu X được hình hóa
bởi biến ngẫu nhiên X. Ta các tham số đặc trưng sau đây:
(a) Trung bình tổng thể: .E(X) = µ
(b) Phương sai tổng thể: .V(X) = σ
2
(c) Độ lệch chuẩn của tổng thể: .σ(X) = σ
Xét tổng thể về mặt định tính: tổng thể kích thước N, trong đó M phần tử tính chất
A
. Khi đó p =
M
N
gọi tÿ lệ tính chất A của tổng thể.
4.1. thuyết mẫu 98
CuuDuongThanCong.com https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy3SAMI-HUST
Khái niệm mẫu ngẫu nhiên
Giả sử tiến hành n phép thử độc lập. Gọi X
i
"giá trị của dấu hiệu đo lường được trênX
phần tử thứ i của mẫu" i = 1, 2, . . . , n. Khi đó, X
1
, X
2
, . . . , X
n
n biến ngẫu nhiên độc lập
cùng quy luật phân phối xác suất với .X
Định nghĩa 4.1 (Mẫu ngẫu nhiên). Cho biến ngẫu nhiên X hàm phân phối xác suất F
X
(x).
Một mẫu ngẫu nhiên cỡ n được thành lập từ biến ngẫu nhiên X n biến ngẫu nhiên độc lập
cùng quy luật phân phối xác suất F
X
(x) với biến ngẫu nhiên .X
Ký hiệu mẫu ngẫu nhiên: .W
X
= (X X
1
,
2
, . . . , X
n
)
Thực hiện một phép thử đối với mẫu ngẫu nhiên W
X
tức thực hiện một phép thử đối
với mỗi thành phần X
i
của mẫu. Giả sử X
1
nhận giá trị nhận giá trịx
1
, X
2
x
2
, .. . , X
n
nhận giá
trị x
n
ta thu được một mẫu cụ thể .W
x
= (x
1
, x
2
, . . . , x
n
)
dụ 4.2. Gọi X "số chấm xuất hiện khi gieo một con xúc xắc". X biến ngẫu nhiên
bảng phân phối xác suất
X 1 2 3 4 5 6
p
1
6
1
6
1
6
1
6
1
6
1
6
Nếu gieo con xúc xắc 3 lần gọi X
i
"số chấm xuất hiện lần gieo thứ i", i = 1, 2, 3 thì ta
3 biến ngẫu nhiên độc lập cùng quy luật phân phối xác suất với X. Vậy ta một mẫu
ngẫu nhiên W
X
= (X X
1
,
2
, X
3
) cỡ n = 3 được xây dựng từ biến ngẫu nhiên gốc X. Thực hiện
một phép thử đối với mẫu ngẫu nhiên này (tức gieo 3 lần một con xúc xắc). Giả sử lần thứ
nhất xuất hiện mặt 6, lần thứ hai xuất hiện mặt 2, lần thứ ba xuất hiện mặt 1 thì ta một giá
trị của mẫu ngẫu nhiên .W
x
= (6, 3, 1)
4.1.3 tả giá tr của mẫu ngẫu nhiên
Phân loại dữ liệu
T tổng thể ta trích ra tập mẫu n phần tử. Ta n số liệu.
(a) Dạng liệt kê: Các số liệu thu được được ghi lại thành dãy .x x
1
,
2
, . . . , x
n
(b) Dạng rút gọn: Số liệu thu được sự lặp đi lặp lại một số giá trị thì ta dạng rút gọn
sau:
(b1) Dạng tần số: ( )n
1
+ n
2
+ . . . + n
k
= n
Giá trị x x
1 2
. . . x
k
Tần số n
1
n
2
. . . n
k
4.1. thuyết mẫu 99
CuuDuongThanCong.com https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy3SAMI-HUST
(b2) Dạng tần suất: ( )f
k
= n
k
/n
Giá trị x x
1 2
. . . x
k
Tần suất f f
1 2
. . . f
k
(c) Dạng khoảng: Dữ liệu thu được nhận giá trị trong (a, b). Ta chia (a, b) thành k miền con
bởi các điểm chia: .a
0
= a < a a
1
<
2
< ··· < a
k1
< a
k
= b
(c1) Dạng tần số: ( )n
1
+ n
2
+ . . . + n
k
= n
Giá trị (a a
0
1
] (a
1
a
2
] . . . (a a
k1
k
]
Tần số n
1
n
2
. . . n
k
(c2) Dạng tần suất: ( )f
k
= n
k
/n
Giá trị (a
0
, a
1
] (a a
1
,
2
] . . . (a
k1
, a
k
]
Tần suất f
1
f
2
. . . f
k
Chú ý, thông thường, độ dài các khoảng chia bằng nhau. Khi đó ta thể chuyển về dạng
rút gọn:
Giá trị x x
1 2
. . . x
k
Tần số n
1
n
2
. . . n
k
trong đó x
i
điểm đại diện cho (a
i1
, a
i
] thường được xác định trung điểm của đoạn
đó:
x
i
=
1
2
(a
i1
+
a
i
).
Phân phối thực nghiệm
Đặt w
i
tần số tích lũy của x
i
F
n
(x
i
) tần suất tích lũy của x
i
, ta sẽ
w
i
=
x
j
<x
i
n
j
; F
n
(x
i
) =
w
i
n
=
x
j
<x
i
f
j
thì F
n
(x
i
) một hàm của x
i
được gọi hàm phân phối thực nghiệm của mẫu hay hàm
phân phối mẫu. Chú ý rằng theo luật số lớn (Định Béc-nu-li) F
n
(x) hội tụ theo xác suất về
F
X
(x) = P(X < x), trong đó X biến ngẫu nhiên gốc cảm sinh ra tổng thể (và cả tập mẫu).
Như vậy hàm phân phối mẫu thể dùng để xấp xỉ luật phân phối của tổng thể.
Biểu diễn dữ liệu
Thông thường ta biểu diễn phân phối tần số, tần suất bằng đồ thị. hai dạng biểu diễn đồ
thị hay dùng biểu đồ đa giác tần số (sinh viên tự đọc).
4.1. thuyết mẫu 100
CuuDuongThanCong.com https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy3SAMI-HUST
4.1.4 Đại lượng thống các đặc trưng của mẫu ngẫu nhiên
Để nghiên cứu mẫu ngẫu nhiên gốc X, nếu dừng lại mẫu ngẫu nhiên W
X
= ( )X
1
, X
2
, . . . , X
n
thì ràng chưa giải quyết được vấn đề gì, bởi các biến ngẫu nhiên cùng quy luật phânX
i
phối xác suất với X ta chưa biết hoàn toàn. vy ta phải liên kết hay tổng hợp các biến
ngẫu nhiên X
1
, X
2
, . . . , X
n
lại sao cho biến ngẫu nhiên mới thu được những tính chất mới,
thể đáp ứng được yêu cầu giải những bài toán khác nhau về biến ngẫu nhiên gốc .X
Định nghĩa thống
Định nghĩa 4.2 (Thống kê). Trong thống toán việc tổng hợp mẫu W
X
= (X
1
, X
2
, . . . , X
n
)
được thực hiện dưới dạng hàm của các biến ngẫu nhiên X
1
, X
2
, . . . , X
n
. Ký hiệu
G = f (X
1
, X
2
, . . . , X
n
) (4.1)
đây f một hàm nào đó G được gọi một thống kê.
Khi mẫu cụ thể W
x
= (x
1
, x
2
, . . . , x
2
), ta tính được giá trị cụ thể của G, hiệu
g = f (x x
1
,
2
, . . . , x
n
), còn gọi giá trị quan sát của thống kê.
Nhận xét 4.1. Thống G một hàm của các biến ngẫu nhiên X
1
, X
2
, . . . , X
n
nên cũng một
biến ngẫu nhiên. Do đó ta thể xét các đặc trưng của thống này.
Trung bình mẫu ngẫu nhiên
Cho mẫu ngẫu nhiên W
X
= (X X
1
,
2
, . . . , X
n
). Trung bình mẫu của mẫu ngẫu nhiên W
X
của
biến ngẫu nhiên gốc X được định nghĩa hiệu
X
=
1
n
n
i=1
X
i
(4.2)
Nếu biến ngẫu nhiên gốc kỳ vọng E(X) = µ, phương sai V(X) = σ
2
t theo Tính chất
2.4(c) và Tính chất 2.5(c) của kỳ vọng và phương sai, thống X kỳ vọng E(X) = µ và
phương sai
V(X) =
σ
2
n
nhỏ hơn phương sai của biến ngẫu nhiên gốc n lần, nghĩa các giá
trị thể của X ổn định quanh kỳ vọng µ hơn các giá trị thể của .X
Phương sai mẫu ngẫu nhiên
Phương sai mẫu của mẫu ngẫu nhiên W
X
của biến ngẫu nhiên gốc được hiệu địnhX
nghĩa
ˆ
S
2
=
1
n
n
i=1
(
X
i
X)
2
=
1
n
n
i=1
X
2
i
(X)
2
(4.3)
4.1. thuyết mẫu 101
CuuDuongThanCong.com https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy3SAMI-HUST
Độ lệch chuẩn mẫu ngẫu nhiên được hiệu xác định bởi
ˆ
S
=
p
ˆ
S
2
=
s
1
n
n
i=1
(X
i
X)
2
(4.4)
Sử dụng Tính chất 2.4(c) của kỳ vọng, ta
E
(
ˆ
S
2
) =
n 1
n
σ
2
.
Để kỳ vọng của phương sai mẫu ngẫu nhiên trùng với phương sai của biến ngẫu nhiên
gốc ta cần một sự hiệu chỉnh. Đó phương sai hiệu chỉnh mẫu ngẫu nhiên.
Phương sai hiệu chỉnh mẫu ngẫu nhiên
Phương sai hiệu chỉnh mẫu của mẫu ngẫu nhiên W
X
của biến ngẫu nhiên gốc được hiệuX
và định nghĩa
S
2
=
1
n 1
n
i=1
(
X
i
X)
2
=
n
n 1
ˆ
S
2
(4.5)
Độ lệch chuẩn hiệu chỉnh mẫu ngẫu nhiên được hiệu và xác định bởi
S
=
S
2
=
s
1
n 1
n
i=1
(X
i
X)
2
(4.6)
Theo Tính chất 2.4(c) của kỳ vọng ta nhận được
E
(S
2
) = σ
2
.
Tần suất mẫu ngẫu nhiên
Trường hợp cần nghiên cứu một dấu hiệu định tính A nào đó mỗi thể của tổng thể
thể hoặc không, giả sử p tần suất dấu hiệu A của tổng thể. Nếu thể dấu hiệu A
ta cho nhận giá trị 1, trường hợp ngược lại ta cho nhận giá trị 0. Lúc đó dấu hiệu nghiên cứu
thể xem biến ngẫu nhiên X phân phối Béc-nu-li tham số p kỳ vọng E(X) = p và
phương sai .V(X) = p(1 p)
Lấy mẫu ngẫu nhiên W
X
= (X X
1
,
2
, . . . , X
n
) trong đó X
1
, X
2
, .. . X
n
các biến ngẫu nhiên
độc lập cùng phân phối Béc-nu-li với tham số p. Tần số xuất hiện A trong mẫu
m =
n
i=1
X
i
.
Khi đó tần xuất mẫu một thống hiệu và xác định bởi
f
=
m
n
=
1
n
n
i=1
X
i
= X (4.7)
4.1. thuyết mẫu 102
CuuDuongThanCong.com https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy3SAMI-HUST
Như vậy tần suất mẫu trung bình mẫu của biến ngẫu nhiên X phân bố Béc-nu-li tham
số p. Ngoài ra theo Tính chất 2.4(c) Tính chất 2.5(c), ta
E
( f ) = p, V( f ) =
p(1 p)
n
(4.8)
4.1.5 Cách tính giá tr cụ thể của trung bình mẫu phương sai mẫu
Giả sử ta mẫu cụ thể W
x
= (x x
1
,
2
, . . . , x
n
) cỡ .n
(a) Mẫu cho dưới dạng liệt kê. (Tần số của các x
i
bằng 1)
(a1) Trung bình mẫu:
x
=
1
n
n
i=1
x
i
(4.9)
(a2) Phương sai mẫu:
ˆ
s
2
=
1
n
n
i=1
(
x
i
x)
2
=
1
n
n
i=1
x
2
i
1
n
n
i=1
x
i
2
(4.10)
(a3) Phương sai hiệu chỉnh mẫu:
s
2
=
n
n
1
ˆ
s
2
(4.11)
(a4) Các độ lệch chuẩn:
ˆ
s
=
ˆ
s
2
; s =
s
2
(4.12)
Để tính các công thức (4.9)3(4.12), ta lập bảng tính toán
x
i
x
2
i
x
1
x
2
1
x
2
x
2
2
. . . . . .
x
n
x
2
n
n
i
=1
x
i
n
i
=1
x
2
i
(b) Mẫu cho dạng rút gọn. (Tần số của các x
i
n
i
> 1,
k
i
=1
n
i
= n)
4.1. thuyết mẫu 103
CuuDuongThanCong.com https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy3SAMI-HUST
(b1) Trung bình mẫu:
x
=
1
n
k
i=1
n
i
x
i
(4.13)
(b2) Phương sai mẫu:
ˆ
s
2
=
1
n
k
i=1
n
i
(x
i
x)
2
=
1
n
k
i=1
n
i
x
2
i
1
n
k
i=1
n
i
x
i
2
(4.14)
(b3) Phương sai hiệu chỉnh mẫu:
s
2
=
n
n
1
ˆ
s
2
(4.15)
(b4) Các độ lệch chuẩn:
ˆ
s
=
ˆ
s
2
; s =
s
2
(4.16)
Để tính các công thức (4.13)3(4.16), ta lập bảng tính toán
x
i
n
i
n n
i
x
i i
x
2
i
x x
1
n
1
n
1 1
n
1
x
2
1
x x
2
n
2
n
2 2
n
2
x
2
2
. . . . . . . . . . . .
x
k
n
k
n n
k
x
k k
x
2
k
k
i
=1
n
i
= n
k
i
=1
n
i
x
i
k
i
=1
n
i
x
2
i
(c) Phương pháp đổi biến. (Trong trường hợp độ dài các khoảng bằng nhau)
(c1) Trung bình mẫu:
x
= x x
0
+ hu =
0
+
h
n
k
i=1
n u
i i
(4.17)
(c2) Phương sai mẫu:
ˆ
s
2
= h
2
1
n
k
i=1
n
i
u
2
i
1
n
k
i=1
n u
i i
2
= h
2
ˆ
s
2
u
(4.18)
trong đó
x
i
điểm giữa của khoảng thứ i, i = 1, 2, . . . , k;
4.1. thuyết mẫu 104
CuuDuongThanCong.com https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy3SAMI-HUST
u
i
=
x
i
x
0
h
, h độ dài các khoảng;
x
0
= x
i
ứng với n
i
lớn nhất.
Để tính các công thức (4.17)3(4.18), ta lập bảng tính toán
x
i
n u n u n
i i i i i
u
2
i
x
1
n n
1
u
1 1
u
1
n u
1
2
1
x
2
n n
2
u
2 2
u
2
n u
2
2
2
. . . . . . . . . . . . . . .
x
k
n u n u
k k k k
n
k
u
2
k
k
i
=1
n
i
= n
k
i
=1
n
i
u
i
k
i
=1
n
i
u
2
i
Tính tham số đặc trưng mẫu trên máy tính CASIO FX570VN PLUS
Bước 1 Chuyển đổi máy tính về chương trình thống MODE 3 AC
Bước 2 Bật chức năng cột tần số/tần suất SHIFT MODE Mũi tên đi xuống 4(STAT)
1(ON)
Bước 3 Bật chế độ màn hình để nhập dữ liệu, Nhập số liệu SHIFT 1 1(TYPE) 1(1-
VAR)
Chú ý nhập xong số liệu thì bấm AC để thoát.
Bước 4 Xem kết quả:
Trung bình mẫu (x): SHIFT 1 4(VAR) 2
Độ lệch tiêu chuẩn mẫu hiệu chỉnh (s): SHIFT 4 1 4
dụ 4.3. một địa điểm thu mua vải, kiểm tra một số vải thấy kết quả sau
Số khuyết tật mỗi đơn vị 0 1 2 3 4 5 6
Số đơn vị kiểm tra (10m) 8 20 12 40 30 25 15
y tính kỳ vọng mẫu độ lệch chuẩn hiệu chỉnh mẫu của mẫu trên.
Lời giải dụ 4.3
Cách 1: Gọi X số khuyết tật mỗi đơn vị. Lập bảng tính toán
4.1. thuyết mẫu 105
CuuDuongThanCong.com https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy3SAMI-HUST
x
i
n n
i
n
i
x
i i
x
2
i
0 8 0 0
1 20 20 20
2 12 24 48
3 40 120 360
4 30 120 480
5 25 125 625
6 15 90 540
n = 150
i
n
i
x
i
= 499
i
n
i
x
2
i
= 2073
Suy ra
x =
499
150
= 3, 3267; x
2
=
2073
150
= 13, 82;
ˆ
s
2
= x
2
(x)
2
= 13, 82 (3, 3267 2, 7531)
2
= ;
s
2
=
150
149
×2, 7531 2, 7715= ; s =
2, 7715 1, 6648= .
Cách 2: Sử dụng y tính CASIO FX570VN PLUS tính được x = 3, 3267; s = 1, 6648.
4.1.6 Phân phối xác suất của các thống kê trung bình mẫu, phương sai mẫu,
tần suất mẫu ngẫu nhiên
Giả sử dấu hiệu nghiên cứu trong tổng thể thể xem như một biến ngẫu nhiên phânX
phối chuẩn N(µ, σ
2
) với kỳ vọng E(X) = µ và phương sai V(X) = σ
2
. Các tham số này
thể đã biết hoặc chưa biết. T tổng thể rút ra một mẫu ngẫu nhiên cỡW
X
= (X X
1
,
2
, . . . , X
n
)
n. Các biến ngẫu nhiên thành phần X
i
, i = 1, . . . , n, độc lập cùng quy luật phân phối chuẩn
N(µ, σ
2
) như .X
Chú ý rằng mọi tổ hợp tuyến tính của các biến ngẫu nhiên phân phối chuẩn biến
ngẫu nhiên phân phối chuẩn. Vì vậy ta các kết quả sau.
Phân phối của thống trung bình mẫu
Thống trung bình mẫu
X =
1
n
n
i
=1
X
i
phân phối chuẩn N
µ;
σ
2
n
và do đó thống
U
=
X µ
σ
n phân phối chuẩn tắc (xem Định giới hạn trung tâm)
X
N
µ,
σ
2
n
, U =
X µ
σ
n N(0, 1) (4.19)
dụ 4.4. Một công ty điện sản xuất bóng đèn tuổi thọ biến ngẫu nhiên phân phối xấp
xỉ chuẩn, với tuổi thọ trung bình 800 giờ độ lệch chuẩn 40 giờ. Tìm xác suất để một
mẫu ngẫu nhiên gồm 16 bóng đèn sẽ tuổi thọ trung bình dưới 775 giờ.
4.1. thuyết mẫu 106
CuuDuongThanCong.com https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy3SAMI-HUST
Lời giải Ví dụ 4.4 Gọi X tuổi thọ của bóng đèn. X N(800, 40
2
). Khi đó, tuổi thọ trung bình
của mẫu ngẫu nhiên
X phân phối xấp xỉ chuẩn với µ
X
= 800 và σ
X
= 40/
16 = 10. Xác
suất cần tính diện tích của vùng bóng mờ trong Hình 4.1.
Hình 4.1: Minh họa của dụ 4.4
X N(800, 10
2
), nên
P
(X < 775) = 0, 5 + φ
775 800
10
= 0, 5 0, 5+ φ(2.5) = 0, 49379 0.00621,=
trong đó φ(2, 5 0, 49379) = tra từ bảng giá trị hàm số Láp-la-xơ (Phụ lục 2).
Phân phối của thống phương sai mẫu
Thống
χ
2
=
n
ˆ
S
2
σ
2
=
(
n 1)S
2
σ
2
phân phối khi bình phương với n 1 bậc tự do
n
ˆ
S
2
σ
2
=
(
n 1)S
2
σ
2
χ
2
(
n1)
(4.20)
Hình 4.2: Phân phối khi bình phương
(sinh viên tự đọc phân phối y).
4.1. thuyết mẫu 107
CuuDuongThanCong.com https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy3SAMI-HUST
Phân phối của thống
T =
X µ
S
n hoặc T =
X µ
ˆ
S
n 1
Thống
T =
X µ
S
n =
X µ
ˆ
S
n 1 phân phối Student với n 1 bậc tự do.
T
=
X µ
S
n =
X µ
ˆ
S
n 1 T
(
n1)
(4.21)
Nhận xét 4.2. (a)
Phân phối Student (của thống T T= =
X µ
S
n) cùng dạng tính
đối xứng như phân phối chuẩn (của thống
U =
X µ
σ
n) nhưng phản ánh tính
biến đổi của phân phối sâu sắc hơn (do thực tế giá trị T phụ thuộc vào sự biến động
của hai đại lượng X và S
2
, trong khi U chỉ phụ thuộc vào những thay đổi của X từ mẫu
y sang mẫu khác).
(b) Phân phối chuẩn không thể dùng để xấp xỉ phân phối khi mẫu kích thước nhỏ. Trong
trường hợp này ta dùng phân phối Student.
(c) Khi bậc tự do n tăng lên (n 30) thì phân phối Student tiến nhanh v phân phối chuẩn.
Do đó khi ta thể dùng phân phối chuẩn thay thế cho phân phối Student.n 30
Hình 4.3: Phân phối Student với số bậc tự do ν = 2, 5
Chú ý 4.1. Trong thực hành khi n 30 ta thể không cần đến giả thiết chuẩn của biến ngẫu
nhiên gốc, thống
T =
X µ
S
n xấp xỉ phân phối chuẩn tắc .N(0, 1)
Nếu
T T (n) t P(T < t
(n)
α
) = α. Giá trị t
(n)
α
được tra từ bảng phân phối Student (Phụ
lục 4). Chẳng hạn với
n = 10, α = 0, 5 thì t
(n)
1
α/2
= t
(10)
1
0,025
= t
(10)
0,975
= 2, 228.
4.1. thuyết mẫu 108
CuuDuongThanCong.com https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy3SAMI-HUST
Phân phối của thống kê tần suất mẫu
Khi
n đủ lớn (np 5 n(1 p) 5) thì thống U =
f p
p
p(1 p)
n phân phối xấp xỉ
phân phối chuẩn tắc
U
=
f p
p
p(1 p)
n N(0, 1) (4.22)
4.2 Ước điểm cho kỳ vọng, phương sai tÿ lệ
Phương pháp ước lượng điểm chủ trương dùng giá trị quan sát của một thống để ước
lượng một tham số (véc tham số) nào đó theo các tiêu chuẩn: vững, không chệch, hiệu quả.
4.2.1 Ước lượng điểm
Khái niệm ước lượng điểm
Cho biến ngẫu nhiên gốc X thể đã biết hoặc chưa biết quy luật phân phối xác suất dạng
tổng quát, nhưng chưa biết tham số θ nào đó. Hãy ước lượng θ bằng phương pháp mẫu. Vì θ
một hằng số nên thể dùng một nào đó để ước lượng θ. Ướ lượng như vậy gọi ước
lượng điểm.
Phương pháp hàm ước lượng
- Giả sử cần ước lượng tham số θ của biến ngẫu nhiên X. T X ta lập mẫu ngẫu nhiên
W
X
= (X X
1
,
2
, . . . , X
n
) cỡ n. Chọn thống G = f (X
1
, X
2
, . . . , X
n
). Một trong những
cách chọn dạng hàm f tương ứng thống đặc trưng của mẫu ngẫu nhiên với tham
số cần ước lượng của biến ngẫu nhiên.
- Tiến hành lập mẫu cụ thể W
x
= (x
1
, x
2
, . . . , x
n
). Tính giá trị cụ thể của G ứng với mẫu
y, tức g = f (x x
1
,
2
, . . . , x
n
). Đây ước lượng điểm của .θ
- Thống G = f (X X
1
,
2
, . . . , X
n
) hàm ước lượng của .θ
4.2.2 Các tiêu chuẩn lựa chọn hàm ước lượng
Cùng một mẫu ngẫu nhiên thể xây dựng nhiều thống G khác nhau để ước lượng cho
tham số θ. Vì vậy ta cần lựa chọn thống tốt nhất để ước lượng cho tham số θ dựa vào các
tiêu chuẩn sau.
4.2. Ước điểm cho kỳ vọng, phương sai tÿ lệ 109
CuuDuongThanCong.com https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy3SAMI-HUST
Ước lượng không chệch (unbiased estimator)
Thống G được gọi ước lượng không chệch của nếuθ
E(G) = θ với mọi (4.23)θ
Nếu E(G) 6= θ thì G ước lượng chệch của .θ
Điều kiện (4.23) của ước lượng không chệch nghĩa trung bình các giá trị của bằngG
θ. Tuy nhiên, không nghĩa mọi giá trị của G đều trùng khít với θ từng giá trị của G
thể sai lệch rất lớn so với θ. vậy ta tìm ước lượng không chệch sao cho độ sai lệch trung
bình nhất.
Ước lượng hiệu quả (efficient estimator)
Thống G được gọi ước lượng hiệu quả (hay ước lượng phương sai nhất) của θ nếu G
ước lượng không chệch của θ phương sai của G nhỏ hơn bất kỳ phương sai của một hàm
ước lượng không chệch nào khác.
Để xét xem ước lượng không chệch G phải ước lượng hiệu quả của θ hay không ta
cần phải tìm một cận dưới của phương sai của các ước lượng không chệch so sánh phương
sai của G với cận dưới này. Điều y được giải quyết bằng bất đẳng thức Cramer3Rao phát
biểu như sau: Cho mẫu ngẫu nhiên W
X
= (X
1
, X
2
, . . . , X
n
) cỡ n được lấy từ tổng thể dấu hiệu
nghiên cứu được hình hóa bởi biến ngẫu nhiên X hàm mật độ xác suất (nếu biến ngẫu nhi
liên tục) hay bảng phân phối xác suất (nếu biến ngẫu nhiên rời rạc) thỏa mãn một số điều kiện n
định (thường được thỏa mãn trong thực tế, ít ra các phân phối xác suất đã xét trong Chương 2)
G ước lượng không chệch bất kỳ của θ thì
V
(G)
1
nE
(ln f (X,θ))
∂θ
2
(4.24)
Ước lượng vững (consistent estimator)
Thống G được gọi ước lượng vững của tham số θ nếu G hội tụ theo xác suất đến khiθ
n +.
4.2.3 Ước lượng điểm cho kỳ vọng, phương sai xác suất
- Chọn hàm
G =
1
n
n
i
=1
X
i
= X nếu ước lượng kỳ vọng E(X) = µ. K vọng mẫu ngẫu
nhiên X ước lượng không chệch, hiệu quả vững của kỳ vọng E(X) = µ của biến
ngẫu nhiên gốc của tổng thể.
4.2. Ước điểm cho kỳ vọng, phương sai tÿ lệ 110
CuuDuongThanCong.com https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy3SAMI-HUST
- Chọn
G =
1
n
1
n
i
=1
(X
i
X)
2
= S
2
nếu ước lượng phương sai V(X) = σ
2
. Phương sai
hiệu chỉnh mẫu ngẫu nhiên S
2
ước lượng không chệch, hiệu quả vững của phương
sai V(X) = σ
2
của biến ngẫu nhiên gốc của tổng thể.
- Chọn
G =
m
n
= f nếu ước lượng cho xác suất p. Tần suất mẫu ngẫu nhiên f ước
lượng không chệch, hiệu quả vững của xác suất của tổng thể.p
dụ 4.5. Trong đợt vận động bầu cử tổng thống người ta phỏng vấn ngẫu nhiên 1600 cử tri
thì được biết 960 người sẽ bỏ phiếu cho ứng cử viên A. y chỉ ra ước lượng điểm cho tÿ lệ
phiếu thực ứng cử viên A sẽ thu được.
Lời giải dụ
4.5 Ước lượng điểm cần tìm f =
960
1600
= 0, 6 = 60%.
4.2.4 Một số phương pháp tìm ước lượng điểm
(a) Phương pháp hợp lý cực đại (maximum-likelihood estimation)
(b) Phương pháp men (moment estimation)
(c) Phương pháp Bayes, phương pháp minimax, phương pháp bootstrap . ..
(Sinh viên tự đọc).
4.2. Ước điểm cho kỳ vọng, phương sai tÿ lệ 111
CuuDuongThanCong.com https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy3SAMI-HUST
TUẦN 12
4.3 Phương pháp ước lượng bằng khoảng tin cậy
Phương pháp ước lượng điểm nói trên nhược điểm khi kích thước mẫu thì ước lượng
điểm thể sai lệch rất nhiều so với giá trị của tham số cần ước lượng. Mặt khác phương pháp
trên cũng không thể đánh giá được khả năng mắc sai lầm khi ước lượng bao nhiêu. Do đó
khi kích thước mẫu người ta thường dùng phương pháp ước lượng khoảng tin cậy cho
trường hợp một tham số.
Khái niệm ước lượng khoảng
Giả sử chưa biết đặc trưng θ nào đó của biến ngẫu nhiên X. Ước lượng khoảng của θ chỉ ra
một khoảng số (g g
1
,
2
) nào đó chứa θ, tức thể ước lượng .g g
1
< θ <
2
Phương pháp khoảng ước lượng tin cậy
Để ước lượng tham số θ của biến ngẫu nhiên X, từ biến ngẫu nhiên y ta lập mẫu ngẫu nhiên
W
X
= (X X
1
,
2
, . . . , X
n
) cỡ n. Chọn thống G(X, θ) sao cho mặc chưa biết giá trị của ,θ
quy luật phân phối xác suất của G vẫn hoàn toàn xác định. Do đó, với xác suất α khá ta
tìm được P(G G
1
< θ <
2
) = 1 α. α khá bé, nên γ = 1 α khá lớn (thông thường yêu
cầu 1 α = γ 0, 95 để thể áp dụng nguyên xác suất lớn cho sự kiện ).(G G
1
< θ <
2
)
Khi đó, sự kiện (G G
1
< θ <
2
) hầu như chắc chắn xảy ra trong một phép thử. Thực hiện một
phép thử đối với mẫu ngẫu nhiên W
X
ta thu được mẫu cụ thể W
x
= (x x
1
,
2
, . . . , x
n
), từ đó tính
được các giá trị của G G
1
,
2
, hiệu g
1
, g
2
. Như vậy thể kết luận: với độ tin cậy 1 α = γ
tham số θ nằm trong khoảng .(g g
1
,
2
)
(a) (G G
1
,
2
) được gọi khoảng tin cậy của θ với độ tin cậy .γ = 1 α
(b) 1 α = γ được gọi độ tin cậy của ước lượng.
(c) I = G G
2
1
được gọi độ dài khoảng tin cậy.
4.3.1 Khoảng tin cậy của kỳ vọng của biến ngẫu nhiên phân phối chuẩn
Bài toán 4.1. Giả sử biến ngẫu nhiên X tuân theo luật phân phối chuẩn N(µ, σ
2
) với kỳ vọng
E(X) = µ chưa biết. y ước lượng .E(X)
Các bước tiến hành: T tổng thể, ta lập mẫu ngẫu nhiên W
X
= (X
1
, X
2
, . . . , X
n
) cỡ n xét
các trường hợp sau.
4.3. Phương pháp ưc lượng bằng khoảng tin cậy 112
CuuDuongThanCong.com https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy3SAMI-HUST
Trường hợp đã biết phương sai V(X) = σ
2
Bước 1 Chọn thống
U
=
X µ
σ
n (4.25)
Theo Mục 4.1.6, thống U phân phối chuẩn tắc .N(0; 1)
Bước 2 Chọn cặp số không âm α
1
, α
2
thỏa mãn α α α
1
+
2
= , tìm các phân vị chuẩn tắc
u
α
1
, u
1α
2
sao cho P(U U< u
α
1
) = α
1
; P( < u
1α
2
) = 1 α
2
. Do tính chất của phân
phối chuẩn tắc u
α
1
= u
1α
1
, suy ra
P(u
1α
1
< U < u u
1α
2
) = P(u
α
1
< U <
1α
2
)
= P(U < u
1α
2
) P(U < u
α
1
) = 1 α
2
α
1
= 1 α.
Như vậy,
1
α = P(u
1α
1
< U < u
1α
2
) = P
u
1α
1
<
X µ
σ
n < u
1α
2
=
P
X u
1α
2
σ
n
< µ < X + u
1α
1
σ
n
.
Bước 3 Lập mẫu cụ thể W
X
= (x
1
, x
2
, . . . , x
n
), tính được giá trị cụ thể x của X, khi đó khoảng
tin cậy cho µ với độ tin cậy là:γ = 1 α
x u
1α
2
σ
n
; x + u
1α
1
σ
n
(4.26)
Như vậy, với độ tin cậy γ = 1 α cho trước, số khoảng tin cậy cho µ số cặp
α
1
, α α α
2
thỏa mãn α
1
+
2
= . đây ta chỉ xét một số trường hợp đặc biệt.
(a) Khoảng tin cậy đối xứng (α α
1
=
2
= α/2)
x u
1
α
2
σ
n
; x + u
1
α
2
σ
n
(4.27)
trong đó u
1
α
2
được xác định từ bảng giá trị hàm phân phối chuẩn tắc (Phụ lục 3) từ hệ
thức
Φ(u
1
α
2
) = 1
α
2
(4.28)
Sai số của ước lượng
ược gọi sai số (độ chính xác) của ước lượng. Với
phương sai σ
2
đã biết không đổi độ tin cậy γ không đổi t giá trị u
1
α
2
không đổi, do
đó sai số của ước lượng chỉ phụ thuộc vào kích thước mẫu n. Khi n càng lớn thì càngε
bé, do đó khoảng ước lượng càng chính xác.
4.3. Phương pháp ưc lượng bằng khoảng tin cậy 113
CuuDuongThanCong.com https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy3SAMI-HUST
Tìm kích thước mẫu: Nếu muốn ước lượng kỳ vọng với độ chính xác ε
0
độ tin cậy choγ
trước, kích thước mẫu cần thiết số tự nhiên n nhỏ nhất thỏa mãn:
n
σ
2
u
2
1
α
2
ε
2
0
(4.29)
(b) Khoảng tin cậy trái (α α
1
= , α
2
= 0):
; x + u
1α
σ
n
(4.30)
trong đó u
1α
được xác định từ bảng giá trị hàm phân phối chuẩn tắc (Phụ lục 3) từ hệ
thức
Φ(u
1α
) = 1 α . (4.31)
(c) Khoảng tin cậy phải (α
1
= 0, α
2
= α):
x u
1α
σ
n
; +
(4.32)
dụ 4.6. Trọng lượng của một loại sản phẩm biến ngẫu nhiên tuân theo luật phân phối
chuẩn với độ lệch tiêu chuẩn 1 gam. Cân thử 25 sản phẩm loại này ta thu được kết quả sau:
Trọng lượng (gam) 18 19 20 21
Số sản phẩm 3 5 15 2
(a) Với độ tin cậy 1 α = 95%, y tìm khoảng tin cậy đối xứng của trọng lượng trung bình
của loại sản phẩm nói trên.
(b) Không cần tính toán, nếu độ tin cậy 99% thì khoảng ước lượng trung bình sẽ rộng hơn,
hẹp hơn hay bằng như trong ý (a)?
(c) Nếu muốn độ chính xác của ước lượng tăng lên gấp đôi, độ tin cậy không đổi t cần
nghiên cứu mẫu kích thước bao nhiêu?
Lời giải dụ 4.6
(a) Gọi X trọng lượng sản phẩm, X N(µ, σ
2
) với σ = 1. Trọng lượng trung bình của sản
phẩm E(X) = µ chưa biết cần ước lượng.
Bước 1:
Chọn thống U =
X µ
σ
n. Thống U N(0; 1).
4.3. Phương pháp ưc lượng bằng khoảng tin cậy 114
CuuDuongThanCong.com https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy3SAMI-HUST
Bước 2:
Áp dụng khoảng tin cậy đối xứng
x u
1
α
2
σ
n
; x + u
1
α
2
σ
n
!
.
Với α = 0, 05, Φ(u
1
α
2
) = 1
0,05
2
= 0, 975, tra bảng giá trị hàm phân phối chuẩn tắc
(Phụ lục 3) nhận được u
1
α
2
= 1, 96.
Bước 3: T số liệu đã cho ta n = 25, σ = 1 tính được x = 19, 64, suy ra khoảng
tin cậy đối xứng của
E(X) = µ
19, 64 1, 96 ×
1
25
19, 64
+ 1, 96 ×
1
25
hay
(19, 248 ; 20, 032).
Bước 4: Kết luận, với độ tin cậy 95%, trọng lượng trung bình của loại sản phẩm nói trên từ
19,248 gam đến 20,032 gam.
(b) Nếu độ tin cậy 1 α tăng từ 95% lên 99% thì khoảng ước lượng sẽ rộng hơn khoảng ước
lượng xét trong ý (a), do giá trị của u
1α/2
tăng từ 1, 96 lên .2, 58
(c) Theo ý (a), độ chính xác của ước lượng ε = u
1
α
2
σ
n
= 0, 392. Để độ chính xác tăng lên
gấp đôi, tức
ε
0
=
0,392
2
= 0, 196. Theo (4.29) ta cần mẫu kích thước nhỏ nhất
2 2
=
1
2
×( )1, 96
2
(
0, 19 )
2
' 100.
Chú ý 4.2. (a) Chú ý rằng không thể viết P(19, 248 < X < 20, 032) = 0, 95 độ tin cậy
gắn với khoảng tin cậy ngẫu nhiên chứ không gắn với mẫu cụ thể. Hơn nữa µ
một hằng số nên chỉ thể thuộc hoặc không thuộc khoảng (19,248; 20,032) nên
(19, 248 < µ < 20, 032) không phải sự kiện ngẫu nhiên.
(b) Ta thể xác định u
1
α
2
= 1, 96 ý dụ 4.6(a) từ bảng giá trị hàm Láp-la-xơ (Phụ lục 2)
từ hệ thức
φ(u
1α
) =
1 α
2
.
(c) T (4.29) ta nhận thấy khi kích thước mẫu tăng độ tin cậy giữ nguyên thì ε giảm hay
ước lượng chính xác hơn; nếu tăng độ tin cậy giữ nguyên kích thước mẫu, do giá trị
phân vị chuẩn tăng nên sai số của ước lượng tăng.ε
Trường hợp chưa biết phương sai, cỡ mẫu n < 30
Do σ chưa biết nên ta thay thế bằng S và chọn thống
T
=
X µ
S
n (4.33)
Như đã biết (Mục 4.1.6) thống T phân phối Student với n 1 bậc tự do. Ta các kết
luận sau đây.
4.3. Phương pháp ưc lượng bằng khoảng tin cậy 115
CuuDuongThanCong.com https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy3SAMI-HUST
(a) Khoảng tin cậy đối xứng
x t
(n1)
1
α
2
s
n
; x + t
(n1)
1
α
2
s
n
(4.34)
Sai số của ước lượng
ε = t
(n1)
1
α
2
s
n
. Kích thước mẫu được suy từ sai số hay độ chính
xác của ước lượng, số tự nhiên n nhỏ nhất thỏa mãn:
n
t
(n1)
1
α
2
2
×
s
2
ε
2
(4.35)
(b) Khoảng tin cậy trái
; x + t
(n1)
1α
s
n
(4.36)
(c) Khoảng tin cậy phải
x t
(n1)
1α
s
n
; +
(4.37)
trong đó
t
(n1)
1
α
2
, t
(n1)
1
α
được xác định từ bảng phân phối Student với n 1 bậc tự do (Phụ
lục 4).
dụ 4.7. Theo dõi mức xăng hao phí (X) cho một loại ô đi từ A đến B thu được bảng số
liệu sau:
Mức xăng hao phí (lít) 19-19,5 19,5-20,0 20,0-20,5 20,5-21,0
Số lần đi 2 10 8 5
Với độ tin cậy 1 α = 95% y tính mức xăng hao phí trung bình tối thiểu khi đi từ A đến B
biết X tuân theo luật phân phối chuẩn.
Lời giải dụ 4.7 Gọi X lượng xăng hao phí của loại ô trên đoạn đường AB, X N(µ, σ
2
)
với phương sai σ
2
chưa biết. Mức xăng hao phí trung bình E(X) = µ chưa biết, cần ước
lượng.
Bước 1:
phương sai chưa biết n = 25 < 30, chọn thống T =
X µ
S
n. Thống T
phân phối Student với n 1 bậc tự do.
Bước 2: Sử dụng khoảng tin cậy phải cho :E(X) = µ
x t
(n1)
1α
s
n
; +
trong đó
t
(n1)
1
α
= t
(24)
0,95
= 1, 711 được xác định từ bảng phân phối Student (Phụ lục 4).
4.3. Phương pháp ưc lượng bằng khoảng tin cậy 116
CuuDuongThanCong.com https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy3SAMI-HUST
Bước 3: T số liệu của đầu bài, tính được n = 25, x = 20, 07, s = 0, 45. Suy ra khoảng tin cậy
phải của
µ
20, 07 1, 711 ×
0, 45
25
< <
µ +
hay .(19, 92 < µ < +)
Bước 4: Kết luận mức xăng hao phí trung bình tối thiểu khi đi từ 19,92 lít với độA đến B
tin cậy 95%.
Trường hợp chưa biết phương sai, cỡ mẫu n 30
Khi n 30 thống T trong (4.33) sẽ phân phối tiệm cận chuẩn tắc N(0, 1). Hay thống
U
=
X µ
S
n N(0, 1) (4.38)
Do đó,
(a) Khoảng tin cậy đối xứng
x u
1
α
2
s
n
; x + u
1
α
2
s
n
(4.39)
Sai số của ước lượng ε = u
1
α
2
s
n
. Kích thước mẫu được suy từ sai số hay độ chính
xác của ước lượng, số tự nhiên n nhỏ nhất thỏa mãn:
n
u
1
α
2
2
×
s
2
ε
2
(4.40)
(b) Khoảng tin cậy trái
; x + u
1α
s
n
(4.41)
(c) Khoảng tin cậy phải
x u
1α
s
n
; +
(4.42)
dụ 4.8. Để ước lượng trọng lượng trung bình của loại trái cây A tại một vùng, người ta thu
hoạch ngẫu nhiên 100 trái cây A của vùng đó thu được kết quả sau
Trọng lượng (gam) 40-42 42-44 44-46 46-48 48-50 50-52
Số trái 7 13 25 35 15 5
y ước lượng trọng lượng trung bình của loại trái y trong vùng bằng khoảng tin cậy đốiA
xứng với độ tin cậy 95%. Cho biết trọng lượng loại trái cây A biến ngẫu nhiên tuân theo
luật phân phối chuẩn.
4.3. Phương pháp ưc lượng bằng khoảng tin cậy 117
CuuDuongThanCong.com https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy3SAMI-HUST
Lời giải Ví dụ 4.8 Gọi X trọng lượng loại trái cây A, X N(µ, σ
2
) với phương sai chưaσ
2
biết. Trọng lượng trung bình của loại trái cây A E(X) = µ chưa biết, cần ước lượng.
Bước 1:
Chọn thống U =
X µ
S
n. n = 100 > 30 nên thống .U N(0, 1)
Bước 2:
Khoảng tin cậy đối xứng cho E(X) = µ
x u
1
α
2
s
n
; x + u
1
α
2
s
n
!
trong đó,
với α = 0, 05, u
1
α
2
= u
0,975
= 1, 96 được tra từ bảng giá trị hàm phân phối chuẩn tắc
(Phụ lục 3).
Bước 3: T số liệu đã cho tính được n = 100, x = 46, 06, s = 2, 48. Suy ra khoảng tin cậy đối
xứng của
µ
46, 06 1, 96 ×
2, 48
100
; 46, 06
+ 1, 96 ×
2, 48
100
hay (45, 573 ; 46, 546).
Bước 4: Kết luận, với độ tin cậy 95%, trọng lượng trung bình của loại trái cây A vùng trên
từ 45,573 gam đến 46,546 gam.
4.3.2 Ước lượng khoảng cho tÿ lệ
Bài toán 4.2. . Do không biết p nên người ta thực hiện
, cùng điều kiện, Khi đó
ước lượng điểm không chệch cho p. Với độ tin cậy γ = 1 α y ước lượng khoảng
cho .p
Phương pháp tiến hành
Bước 1
Chọn thống Z =
f p
p
p(1 p)
n. Theo Mục 4.1.6, Z phân phối chuẩn tắc .N(0; 1)
Trong trường hợp n khá lớn ta thể dùng f để thay thế cho p. Khi đó,
Z
=
f p
p
f (1 f )
n N(0; 1) (4.43)
Bước 2: Khi mẫu cụ thể W
x
= (x x
1
,
2
, . . . , x
n
), ta tính được giá trị cụ thể của suy raf
khoảng ước lượng cho p với độ tin cậy là:γ = 1 α
f u
1α
2
f f(1 )
n
; f + u
1α
1
f (1 f )
n
(4.44)
với .α = α
1
+ α
2
Các trường hợp ước lượng hay dùng:
4.3. Phương pháp ưc lượng bằng khoảng tin cậy 118
CuuDuongThanCong.com https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy3SAMI-HUST
(a) Khoảng tin cậy đối xứng
f u
1
α
2
f f(1 )
n
; f + u
1
α
2
f f(1 )
n
(4.45)
Độ chính xác của ước lượng ε = u
1
α
2
f (1 f )
n
. Với độ tin cậy γ = 1 α và độ chính
xác ε
0
cho trước thì kích thước mẫu cần thiết số tự nhiên nhỏ nhất thỏa mãn:n
n
u
1
α
2
2
× f × (1 f )
ε
2
0
(4.46)
(b) Khoảng tin cậy trái
; f + u
1α
f (1 f )
n
(4.47)
(c) Khoảng tin cậy phải
f u
1α
f (1 f )
n
+
(4.48)
Chú ý 4.3. (a) Do tÿ lệ chỉ nhận giá trị từ 0 đến 1 nên ta thể thay giá trị bằng 0 +
bằng 1 trong khoảng tin cậy trái (phải).
(b) Các khoảng tin cậy trên được y dựng khi kích thước mẫu n đủ lớn thỏa mãn n f 5
n(1 f ) 5.
dụ 4.9. Điều tra nhu cầu tiêu dùng loại hàng A trong 100 hộ gia đình khu dân B thấy
60 hộ gia đình nhu cầu loại hàng trên. Với độ tin cậy 1 α = 95% hãy tìm khoảng tin cậy
đối xứng của tÿ lệ hộ gia đình nhu cầu loại hàng đó.
Lời giải dụ 4.9 Gọi p tÿ lệ hộ gia đình khu dân B nhu cầu mặt hàng A. Kiểm tra
điều kiện n f = 100 ×0, 6 = 60 > 5 .n(1 f ) = 100 ×0, 4 = 40 > 5
Bước 1:
Chọn thống Z =
f p
p
f (1 f )
n. Thống .Z N(0, 1)
Bước 2: Khoảng tin cậy đối xứng của xác suất p
f u
1
α
2
f (1 f )
n
; f + u
1
α
2
f f(1 )
n
trong đó u
1
α
2
= u
0,975
= 1, 96 được tra từ bảng giá trị hàm phân phối chuẩn tắc (Phụ
lục 3).
4.3. Phương pháp ưc lượng bằng khoảng tin cậy 119
CuuDuongThanCong.com https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG Nguyễn Thị Thu Thủy3SAMI-HUST
Bước 3:
Với n = 100, m = 60, f =
m
n
= 0, 6, suy ra khoảng tin cậy đối xứng của p
0, 6 1, 96
0, 6 0, 4×
100
; 0, 6 1, 96
0, 6 0, 4×
100
= (0, 504 ; 0, 696 .)
Bước 4: Kết luận, tÿ lệ hộ gia đình khu dân B nhu cầu loại hàng A từ 50,4% đến
69,6% với độ tin cậy 95%.
4.3. Phương pháp ưc lượng bằng khoảng tin cậy 120
CuuDuongThanCong.com https://fb.com/tailieudientucntt

Preview text:

Chương 4
Thống kê. Ước lượng tham số TUẦN 11 4.1 Lý thuyết mẫu
Thống kê toán là bộ môn toán học nghiên cứu quy luật của các hiện tượng ngẫu nhiên có
tính chất số lớn trên cơ sở thu thập và xử lý số liệu thống kê các kết quả quan sát về những
hiện tượng ngẫu nhiên này. Nếu ta thu thập được các số liệu liên quan đến tất cả đối tượng
cần nghiên cứu thì ta có thể biết được đối tượng này (phương pháp toàn bộ). Tuy nhiên trong
thực tế điều đó không thể thực hiện được vì quy mô của các đối tượng cần nghiên cứu quá
lớn hoặc trong quá trình nghiên cứu đối tượng nghiên cứu bị phá hủy. Vì vậy cần lấy mẫu để nghiên cứu.
Mục này giới thiệu về phương pháp lấy mẫu ngẫu nhiên và các thống kê thường gặp của mẫu ngẫu nhiên.
4.1.1 Tổng thể và mẫu
Khái niệm tổng thể
Khi nghiên cứu các vấn đề về kinh tế - xã hội, cũng như nhiều vấn đề thuộc các lĩnh vực vật
lý, sinh vật, quân sự . . . thường dẫn đến khảo sát một hay nhiều dấu hiệu (định tính hoặc định
lượng) thể hiện bằng số lượng trên nhiều phần tử. Tập hợp tất cả các phần tử này gọi là tổng
thể hay đám đông (population). Số phần tử trong tổng thể có thể là hữu hạn hoặc vô hạn. Cần
nhấn mạnh rằng ta không nghiên cứu trực tiếp bản thân tổng thể mà chỉ nghiên cứu dấu hiệu nào đó của nó.
Ký hiệu N là số phần tử của tổng thể; X là dấu hiệu cần khảo sát.
Ví dụ 4.1. (a) Muốn điều tra thu nhập bình quân của các hộ gia đình ở Hà Nội thì tập hợp
cần nghiên cứu là các hộ gia đình ở Hà Nội, dấu hiệu nghiên cứu là thu nhập của từng
hộ gia đình (dấu hiệu định lượng). 96 CuuDuongThanCong.com
https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG
Nguyễn Thị Thu Thủy3SAMI-HUST
(b) Một doanh nghiệp muốn nghiên cứu các khách hàng của mình về dấu hiệu định tính có
thể là mức độ hài lòng của khách hàng đối với sản phẩm hoặc dịch vụ của doanh nghiệp,
còn dấu hiệu định lượng là số lượng sản phẩm của doanh nghiệp mà khách hàng có nhu cầu được đáp ứng.
Một số lý do không thể khảo sát toàn bộ tổng thể
(a) Do quy mô của tập hợp cần nghiên cứu quá lớn nên việc nghiên cứu toàn bộ sẽ đòi hỏi
nhiều chi phí về vật chất và thời gian, có thể không kiểm soát được dẫn đến bị chồng chéo hoặc bỏ sót.
(b) Trong nhiều trường hợp không thể nắm được toàn bộ các phần tử của tập hợp cần nghiên
cứu, do đó không thể tiến hành toàn bộ được.
(c) Có thể trong quá trình điều tra sẽ phá hủy đối tượng nghiên cứu.. .
Do đó thay vì khảo sát tổng thể, ta chỉ cần chọn ra một tập nhỏ để khảo sát và đưa ra quyết định.
Khái niệm tập mẫu
Tập mẫu (sample) là tập con của tổng thể và có tính chất tương tự như tổng thể. Số phần tử
của tập mẫu được gọi là kích thước mẫu (cỡ mẫu), ký hiệu là n.
Chương 4 và Chương 5 sẽ nghiên cứu tổng thể thông qua mẫu. Nói nghiên cứu tổng thể
có nghĩa là nghiên cứu một hoặc một số đặc trưng nào đó của tổng thể. Khi đó, ta không thể
đem tất cả các phần tử trong tổng thể ra nghiên cứu mà chỉ lấy một số phần tử trong tổng thể
ra nghiên cứu và làm sao qua việc nghiên cứu này có thể kết luận được về một hoặc một số
đặc trưng của tổng thể mà ta quan tâm ban đầu.
Một số cách chọn mẫu cơ bản
Một câu hỏi đặt ra là làm sao chọn được tập mẫu có tính chất tương tự như tổng thể để các
kết luận của tập mẫu có thể dùng cho tổng thể?
Ta sử dụng một trong những cách chọn mẫu sau:
1. Chọn mẫu ngẫu nhiên có hoàn lại: Lấy ngẫu nhiên một phần tử từ tổng thể và khảo sát
nó. Sau đó trả phần tử đó lại tổng thể trước khi lấy một phần tử khác. Tiếp tục như thế
n lần ta thu được một mẫu có hoàn lại gồm n phần tử.
2. Chọn mẫu ngẫu nhiên không hoàn lại: Lấy ngẫu nhiên một phần tử từ tổng thể và khảo
sát nó rồi để qua một bên, không trả lại tổng thể. Sau đó lấy ngẫu nhiên một phần tử
khác, tiếp tục như thế n lần ta thu được một mẫu không hoàn lại gồm n phần tử. 4.1. Lý thuyết mẫu 97 CuuDuongThanCong.com
https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG
Nguyễn Thị Thu Thủy3SAMI-HUST
3. Chọn mẫu phân nhóm: Đầu tiên ta chia tập nền thành các nhóm tương đối thuần nhất,
từ mỗi nhóm đó chọn ra một mẫu ngẫu nhiên. Tập hợp tất cả mẫu đó cho ta một mẫu
phân nhóm. Phương pháp này dùng khi trong tập nền có những sai khác lớn. Hạn chế
là phụ thuộc vào việc chia nhóm.
4. Chọn mẫu có suy luận: Dựa trên ý kiến của chuyên gia về đối tượng nghiên cứu để chọn mẫu.
4.1.2 Mẫu ngẫu nhiên
Biến ngẫu nhiên và quy luật phân phối gốc
Giả sử ta cần nghiên cứu dấu hiệu X của tổng thể có E(X ) = µ và V(X ) = σ2 (µ σ chưa
biết). Ta có thể mô hình hóa dấu hiệu X bằng một biến ngẫu nhiên. Thật vậy, nếu lấy ngẫu
nhiên từ tổng thể ra một phần tử và gọi X là giá trị của dấu hiệu X đo được trên phần tử lấy
ra thì X là biến ngẫu nhiên có bảng phân phối xác suất là X x1 x2 . . . xn P P(X = x1) P(X = x2) . . . P(X = xn)
Như vậy dấu hiệu X mà ta nghiên cứu được mô hình hóa bởi biến ngẫu nhiên X, còn cơ
cấu của tổng thể theo dấu hiệu X (tập hợp các xác suất) chính là quy luật phân phối xác suất của X.
Biến ngẫu nhiên X được gọi là biến ngẫu nhiên gốc. Quy luật phân phối xác suất của X là
quy luật phân phối gốc, đồng thời E(X) = µ, V(X) = σ2.
Các đặc trưng của tổng thể
Xét tổng thể về mặt định lượng: tổng thể được đặc trưng bởi dấu hiệu X được mô hình hóa
bởi biến ngẫu nhiên X. Ta có các tham số đặc trưng sau đây:
(a) Trung bình tổng thể: E(X) = µ.
(b) Phương sai tổng thể: V(X) = σ2.
(c) Độ lệch chuẩn của tổng thể: σ(X) = σ.
Xét tổng thể về mặt định tính: tổng thể có kích thước N, trong đó có M phần tử có tính chất M A. Khi đó p =
gọi là tÿ lệ tính chất A của tổng thể. N 4.1. Lý thuyết mẫu 98 CuuDuongThanCong.com
https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG
Nguyễn Thị Thu Thủy3SAMI-HUST
Khái niệm mẫu ngẫu nhiên
Giả sử tiến hành n phép thử độc lập. Gọi Xi là "giá trị của dấu hiệu X đo lường được trên
phần tử thứ i của mẫu" i = 1, 2, . . . , n. Khi đó, X1, X2, . . . , Xn là n biến ngẫu nhiên độc lập có
cùng quy luật phân phối xác suất với X.
Định nghĩa 4.1 (Mẫu ngẫu nhiên). Cho biến ngẫu nhiên X có hàm phân phối xác suất FX(x).
Một mẫu ngẫu nhiên cỡ n được thành lập từ biến ngẫu nhiên X là n biến ngẫu nhiên độc lập
có cùng quy luật phân phối xác suất FX(x) với biến ngẫu nhiên X.
Ký hiệu mẫu ngẫu nhiên: WX = (X1, X2, . . . , Xn).
Thực hiện một phép thử đối với mẫu ngẫu nhiên WX tức là thực hiện một phép thử đối
với mỗi thành phần Xi của mẫu. Giả sử X1 nhận giá trị x1, X2 nhận giá trị x2, . . . , Xn nhận giá
trị xn ta thu được một mẫu cụ thể Wx = (x1, x2, . . . , xn).
Ví dụ 4.2. Gọi X là "số chấm xuất hiện khi gieo một con xúc xắc". X là biến ngẫu nhiên có
bảng phân phối xác suất X 1 2 3 4 5 6 p 1 1 1 1 1 1 6 6 6 6 6 6
Nếu gieo con xúc xắc 3 lần và gọi Xi là "số chấm xuất hiện ở lần gieo thứ i", i = 1, 2, 3 thì ta
có 3 biến ngẫu nhiên độc lập có cùng quy luật phân phối xác suất với X. Vậy ta có một mẫu
ngẫu nhiên WX = (X1, X2, X3) cỡ n = 3 được xây dựng từ biến ngẫu nhiên gốc X. Thực hiện
một phép thử đối với mẫu ngẫu nhiên này (tức là gieo 3 lần một con xúc xắc). Giả sử lần thứ
nhất xuất hiện mặt 6, lần thứ hai xuất hiện mặt 2, lần thứ ba xuất hiện mặt 1 thì ta có một giá
trị của mẫu ngẫu nhiên Wx = (6, 3, 1).
4.1.3 Mô tả giá trị của mẫu ngẫu nhiên
Phân loại dữ liệu
Từ tổng thể ta trích ra tập mẫu có n phần tử. Ta có n số liệu.
(a) Dạng liệt kê: Các số liệu thu được được ghi lại thành dãy x1, x2, . . . , xn.
(b) Dạng rút gọn: Số liệu thu được có sự lặp đi lặp lại một số giá trị thì ta có dạng rút gọn sau:
(b1) Dạng tần số: (n1 + n2 + . . . + nk = n) Giá trị x1 x2 . . . xk Tần số n1 n2 . . . nk 4.1. Lý thuyết mẫu 99 CuuDuongThanCong.com
https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG
Nguyễn Thị Thu Thủy3SAMI-HUST
(b2) Dạng tần suất: ( fk = nk/n) Giá trị x1 x2 . . . xk Tần suất f1 f2 . . . fk
(c) Dạng khoảng: Dữ liệu thu được nhận giá trị trong (a, b). Ta chia (a, b) thành k miền con
bởi các điểm chia: a0 = a < a1 < a2 < · · · < ak . −1 < ak = b
(c1) Dạng tần số: (n1 + n2 + . . . + nk = n)
Giá trị (a0 − a1] (a1 − a2] . . . (ak a −1 − k] Tần số n1 n2 . . . nk
(c2) Dạng tần suất: ( fk = nk/n) Giá trị
(a0, a1] (a1, a2] . . . (ak−1, ak] Tần suất f1 f2 . . . fk
Chú ý, thông thường, độ dài các khoảng chia bằng nhau. Khi đó ta có thể chuyển về dạng rút gọn: Giá trị x1 x2 . . . xk Tần số n1 n2 . . . nk
trong đó xi là điểm đại diện cho (ai−1, ai] thường được xác định là trung điểm của đoạn 1 đó: xi = (a 2 i−1 + ai).
Phân phối thực nghiệm
Đặt wi là tần số tích lũy của xi và Fn(xi) là tần suất tích lũy của xi, ta sẽ có w w i i = ∑ nj; Fn(xi) = = ∑ fj x n
jxjthì Fn(xi) là một hàm của xi và được gọi là hàm phân phối thực nghiệm của mẫu hay hàm
phân phối mẫu. Chú ý rằng theo luật số lớn (Định lý Béc-nu-li) Fn(x) hội tụ theo xác suất về
FX(x) = P(X < x), trong đó X là biến ngẫu nhiên gốc cảm sinh ra tổng thể (và cả tập mẫu).
Như vậy hàm phân phối mẫu có thể dùng để xấp xỉ luật phân phối của tổng thể.
Biểu diễn dữ liệu
Thông thường ta biểu diễn phân phối tần số, tần suất bằng đồ thị. Có hai dạng biểu diễn đồ
thị hay dùng là biểu đồ và đa giác tần số (sinh viên tự đọc). 4.1. Lý thuyết mẫu 100 CuuDuongThanCong.com
https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG
Nguyễn Thị Thu Thủy3SAMI-HUST
4.1.4 Đại lượng thống kê và các đặc trưng của mẫu ngẫu nhiên
Để nghiên cứu mẫu ngẫu nhiên gốc X, nếu dừng lại ở mẫu ngẫu nhiên WX = (X1, X2, . . . , Xn)
thì rõ ràng chưa giải quyết được vấn đề gì, bởi các biến ngẫu nhiên Xi có cùng quy luật phân
phối xác suất với X mà ta chưa biết hoàn toàn. Vì vậy ta phải liên kết hay tổng hợp các biến
ngẫu nhiên X1, X2, . . . , Xn lại sao cho biến ngẫu nhiên mới thu được có những tính chất mới,
có thể đáp ứng được yêu cầu giải những bài toán khác nhau về biến ngẫu nhiên gốc X.
Định nghĩa thống kê
Định nghĩa 4.2 (Thống kê). Trong thống kê toán việc tổng hợp mẫu WX = (X1, X2, . . . , Xn)
được thực hiện dưới dạng hàm của các biến ngẫu nhiên X1, X2, . . . , Xn. Ký hiệu G = f (X1, X2, . . . , Xn) (4.1)
ở đây f là một hàm nào đó và G được gọi là một thống kê.
Khi có mẫu cụ thể Wx = (x1, x2, . . . , x2), ta tính được giá trị cụ thể của G, ký hiệu là
g = f (x1, x2, . . . , xn), còn gọi là giá trị quan sát của thống kê.
Nhận xét 4.1. Thống kê G là một hàm của các biến ngẫu nhiên X1, X2, . . . , Xn nên cũng là một
biến ngẫu nhiên. Do đó ta có thể xét các đặc trưng của thống kê này.
Trung bình mẫu ngẫu nhiên
Cho mẫu ngẫu nhiên WX = (X1, X2, . . . , Xn). Trung bình mẫu của mẫu ngẫu nhiên WX của
biến ngẫu nhiên gốc X được định nghĩa và ký hiệu 1 n X = ∑ X n i (4.2) i=1
Nếu biến ngẫu nhiên gốc có kỳ vọng E(X) = µ, phương sai V(X) = σ2 thì theo Tính chất
2.4(c) và Tính chất 2.5(c) của kỳ vọng và phương sai, thống kê X có kỳ vọng E(X) = µ và phương sai σ2 V(X) =
nhỏ hơn phương sai của biến ngẫu nhiên gốc n lần, nghĩa là các giá n
trị có thể có của X ổn định quanh kỳ vọng µ hơn các giá trị có thể có của X.
Phương sai mẫu ngẫu nhiên
Phương sai mẫu của mẫu ngẫu nhiên WX của biến ngẫu nhiên gốc X được ký hiệu và định nghĩa 1 n 1 n ˆ S2 = ∑(X ∑ X2 n i − X)2 = n i − (X)2 (4.3) i=1 i=1 4.1. Lý thuyết mẫu 101 CuuDuongThanCong.com
https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG
Nguyễn Thị Thu Thủy3SAMI-HUST
Độ lệch chuẩn mẫu ngẫu nhiên được ký hiệu và xác định bởi n ˆ s ∑(X p i − X)2 (4.4) 1n i=1 S = ˆS2 =
Sử dụng Tính chất 2.4(c) của kỳ vọng, ta có n − 1 E( ˆ S2) = σ2. n
Để kỳ vọng của phương sai mẫu ngẫu nhiên trùng với phương sai của biến ngẫu nhiên
gốc ta cần một sự hiệu chỉnh. Đó là phương sai hiệu chỉnh mẫu ngẫu nhiên.
Phương sai hiệu chỉnh mẫu ngẫu nhiên
Phương sai hiệu chỉnh mẫu của mẫu ngẫu nhiên WX của biến ngẫu nhiên gốc X được ký hiệu và định nghĩa 1 n n S2 = ∑(X ˆ S2 (4.5) n − 1 i − X)2 = n − 1 i=1
Độ lệch chuẩn hiệu chỉnh mẫu ngẫu nhiên được ký hiệu và xác định bởi n s ∑(Xi − X)2 (4.6) √ 1 n − 1 i=1 S = S2 =
Theo Tính chất 2.4(c) của kỳ vọng ta nhận được E(S2) = σ2.
Tần suất mẫu ngẫu nhiên
Trường hợp cần nghiên cứu một dấu hiệu định tính A nào đó mà mỗi cá thể của tổng thể có
thể có hoặc không, giả sử p là tần suất có dấu hiệu A của tổng thể. Nếu cá thể có dấu hiệu A
ta cho nhận giá trị 1, trường hợp ngược lại ta cho nhận giá trị 0. Lúc đó dấu hiệu nghiên cứu
có thể xem là biến ngẫu nhiên X có phân phối Béc-nu-li tham số p có kỳ vọng E(X) = p và
phương sai V(X) = p(1 − p).
Lấy mẫu ngẫu nhiên WX = (X1, X2, . . . , Xn) trong đó X1, X2, .. . Xn là các biến ngẫu nhiên
độc lập có cùng phân phối Béc-nu-li với tham số p. Tần số xuất hiện A trong mẫu là n m = ∑ Xi. i=1
Khi đó tần xuất mẫu là một thống kê ký hiệu và xác định bởi m 1 n f = = ∑ X n n i = X (4.7) i=1 4.1. Lý thuyết mẫu 102 CuuDuongThanCong.com
https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG
Nguyễn Thị Thu Thủy3SAMI-HUST
Như vậy tần suất mẫu là trung bình mẫu của biến ngẫu nhiên X có phân bố Béc-nu-li tham
số p. Ngoài ra theo Tính chất 2.4(c) và Tính chất 2.5(c), ta có p(1 − p) E( f ) = p, V( f ) = (4.8) n
4.1.5 Cách tính giá trị cụ thể của trung bình mẫu và phương sai mẫu
Giả sử ta có mẫu cụ thể Wx = (x1, x2, . . . , xn) cỡ n.
(a) Mẫu cho dưới dạng liệt kê. (Tần số của các xi bằng 1) (a1) Trung bình mẫu: 1 n x = ∑ x n i (4.9) i=1 (a2) Phương sai mẫu: 1 n 1 n n ˆs2 = ∑(x ∑ x2 ∑ (4.10) n i − x)2 = n 2 i=1 i=1 1 n i=1x i − i
(a3) Phương sai hiệu chỉnh mẫu: n s2 = ˆs2 (4.11) n − 1
(a4) Các độ lệch chuẩn: √ √ ˆs = ˆ s2; s = s2 (4.12)
Để tính các công thức (4.9)3(4.12), ta lập bảng tính toán xi x2i x1 x21 x2 x22 . . . . . . xn x2n ∑ni=1 xi ∑ni=1 x2i
(b) Mẫu cho ở dạng rút gọn. (Tần số của các xi là ni > 1, ∑ki=1 ni = n) 4.1. Lý thuyết mẫu 103 CuuDuongThanCong.com
https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG
Nguyễn Thị Thu Thủy3SAMI-HUST (b1) Trung bình mẫu: 1 k x = ∑ n n i xi (4.13) i=1 (b2) Phương sai mẫu: 1 k 1 k k ˆ s2 = ∑ n ∑ n ∑ (4.14) n i(xi − x)2 = n i x2 2 i=1 i=1 1 n i=1n i − i xi
(b3) Phương sai hiệu chỉnh mẫu: n s2 = ˆs2 (4.15) n − 1
(b4) Các độ lệch chuẩn: √ √ ˆs = ˆ s2; s = s2 (4.16)
Để tính các công thức (4.13)3(4.16), ta lập bảng tính toán xi ni nixi nix2i x1 n1 n1x1 n1x21 x2 n2 n2x2 n2x22 . . . . . . . . . . . . xk nk nkxk nkx2k
∑ki=1 ni = n ∑ki=1 nixi ∑ki=1 nix2i
(c) Phương pháp đổi biến. (Trong trường hợp độ dài các khoảng bằng nhau) (c1) Trung bình mẫu: h k x = x0 + hu = x0 + ∑ niu n i (4.17) i=1 (c2) Phương sai mẫu: k k ˆ ∑ niu2 ∑ s2 (4.18) 2 u 1 n i=1 1 n i=1 s2 = h2 niu = h2 ˆ i − i trong đó
xi là điểm giữa của khoảng thứ i, i = 1, 2, . . . , k; 4.1. Lý thuyết mẫu 104 CuuDuongThanCong.com
https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG
Nguyễn Thị Thu Thủy3SAMI-HUST x u i − x0 , i =
h là độ dài các khoảng; h
x0 = xi ứng với ni lớn nhất.
Để tính các công thức (4.17)3(4.18), ta lập bảng tính toán xi ni ui niui niu2i x 2 1 n1 u1 n1u1 n1u1 x 2 2 n2 u2 n2u2 n2u2 . . . . . . . . . . . . . . . xk nk uk nkuk nku2k ∑ki=1 ni = n ∑ki=1 niui ∑ki=1 niu2i
Tính tham số đặc trưng mẫu trên máy tính CASIO FX570VN PLUS
Bước 1 Chuyển đổi máy tính về chương trình thống kê MODE 3 AC
Bước 2 Bật chức năng cột tần số/tần suất SHIFT MODE Mũi tên đi xuống 4(STAT)1(ON)
Bước 3 Bật chế độ màn hình để nhập dữ liệu, Nhập số liệu SHIFT 1 1(TYPE) 1(1- VAR)
Chú ý nhập xong số liệu thì bấm AC để thoát.
Bước 4 Xem kết quả:
• Trung bình mẫu (x): SHIFT 1 4(VAR) 2
• Độ lệch tiêu chuẩn mẫu hiệu chỉnh (s): SHIFT 1 4 4
Ví dụ 4.3. Ở một địa điểm thu mua vải, kiểm tra một số vải thấy kết quả sau
Số khuyết tật ở mỗi đơn vị 0 1 2 3 4 5 6
Số đơn vị kiểm tra (10m) 8 20 12 40 30 25 15
Hãy tính kỳ vọng mẫu và độ lệch chuẩn hiệu chỉnh mẫu của mẫu trên. Lời giải Ví dụ 4.3
Cách 1: Gọi X là số khuyết tật ở mỗi đơn vị. Lập bảng tính toán 4.1. Lý thuyết mẫu 105 CuuDuongThanCong.com
https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG
Nguyễn Thị Thu Thủy3SAMI-HUST xi ni nixi nix2i 0 8 0 0 1 20 20 20 2 12 24 48 3 40 120 360 4 30 120 480 5 25 125 625 6 15 90 540 ∑ n = 150
∑i nixi = 499 ∑i nix2 = 2073 i 499 2073 Suy ra x = = 3, 3267; x2 =
= 13, 82; ˆs2 = x2 − (x)2 = 13, 82 − (3, 3267)2 = 2, 7531; 150 150 150 √ s2 =
× 2, 7531 = 2, 7715; s = 2, 7715 = 1, 6648. 149
Cách 2: Sử dụng máy tính CASIO FX570VN PLUS tính được x = 3, 3267; s = 1, 6648.
4.1.6 Phân phối xác suất của các thống kê trung bình mẫu, phương sai mẫu,
tần suất mẫu ngẫu nhiên
Giả sử dấu hiệu nghiên cứu trong tổng thể có thể xem như một biến ngẫu nhiên X có phân
phối chuẩn N (µ, σ2) với kỳ vọng E(X) = µ và phương sai V(X) = σ2. Các tham số này có
thể đã biết hoặc chưa biết. Từ tổng thể rút ra một mẫu ngẫu nhiên WX = (X1, X2, . . . , Xn) cỡ
n. Các biến ngẫu nhiên thành phần Xi, i = 1, . . . , n, độc lập có cùng quy luật phân phối chuẩn
N (µ, σ2) như X.
Chú ý rằng mọi tổ hợp tuyến tính của các biến ngẫu nhiên có phân phối chuẩn là biến
ngẫu nhiên có phân phối chuẩn. Vì vậy ta có các kết quả sau.
Phân phối của thống kê trung bình mẫu 1
Thống kê trung bình mẫu X = ∑n n σ2 X − µ
i=1 Xi có phân phối chuẩn N µ; và do đó thống kê U =
n có phân phối chuẩn tắc (xem Định lý giới hạn trung tâ n m) σ √n ∼ N(0,1) (4.19) σ2 X − σ µ X ∼ N µ, , U = n
Ví dụ 4.4. Một công ty điện sản xuất bóng đèn có tuổi thọ là biến ngẫu nhiên phân phối xấp
xỉ chuẩn, với tuổi thọ trung bình là 800 giờ và độ lệch chuẩn là 40 giờ. Tìm xác suất để một
mẫu ngẫu nhiên gồm 16 bóng đèn sẽ có tuổi thọ trung bình dưới 775 giờ. 4.1. Lý thuyết mẫu 106 CuuDuongThanCong.com
https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG
Nguyễn Thị Thu Thủy3SAMI-HUST
Lời giải Ví dụ 4.4 Gọi X là tuổi thọ của bóng đèn. X ∼ N (800, 402). Khi đó, tuổi thọ trung bình √
của mẫu ngẫu nhiên X có phân phối xấp xỉ chuẩn với µ = 800 và = 40/ 16 = 10. Xác X σX
suất cần tính là diện tích của vùng bóng mờ trong Hình 4.1.
Hình 4.1: Minh họa của Ví dụ 4.4 Vì X ∼ N (800, 102), nên 775 800 −
P(X < 775) = 0, 5 + φ = 0, 5 + φ( 0, 5 −2.5) = − 0, 49379 = 0.00621, 10
trong đó φ(−2, 5) = 0, 49379 −
tra từ bảng giá trị hàm số Láp-la-xơ (Phụ lục 2).
Phân phối của thống kê phương sai mẫu Thống kê n ˆ S2 (n − 1)S2 χ2 = =
có phân phối khi bình phương với n − 1 bậc tự do σ2 σ2 n ˆ S2 (n − 1)S2 = ∼ χ2 (4.20) σ2 σ2 (n−1)
Hình 4.2: Phân phối khi bình phương
(sinh viên tự đọc phân phối này). 4.1. Lý thuyết mẫu 107 CuuDuongThanCong.com
https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG
Nguyễn Thị Thu Thủy3SAMI-HUST
Phân phối của thống kê X − µ √ X − µ√ T = n hoặc T = n − 1 S ˆ S √ √ Thống kê X − µ X − µ T = n =
n − 1 có phân phối Student với n − 1 bậc tự do. S ˆ S X − µ√ X − µ √ T = n = n − 1 ∼ T (n−1) (4.21) S ˆ S
Nhận xét 4.2. (a) Phân phối Student (của thống kê X − µ√ T = T = n) có cùng dạng và tính S
đối xứng như phân phối chuẩn (của thống kê X − µ √ U =
n) nhưng nó phản ánh tính σ
biến đổi của phân phối sâu sắc hơn (do thực tế là giá trị T phụ thuộc vào sự biến động
của hai đại lượng X và S2, trong khi U chỉ phụ thuộc vào những thay đổi của X từ mẫu này sang mẫu khác).
(b) Phân phối chuẩn không thể dùng để xấp xỉ phân phối khi mẫu có kích thước nhỏ. Trong
trường hợp này ta dùng phân phối Student.
(c) Khi bậc tự do n tăng lên (n ≥ 30) thì phân phối Student tiến nhanh về phân phối chuẩn.
Do đó khi n ≥ 30 ta có thể dùng phân phối chuẩn thay thế cho phân phối Student.
Hình 4.3: Phân phối Student với số bậc tự do ν = 2, 5 và ∞
Chú ý 4.1. Trong thực hành khi n ≥ 30 ta có thể không cần đến giả thiết chuẩn của biến ngẫu √ nhiên gốc, thống kê X − µ T =
n xấp xỉ phân phối chuẩn tắc N (0, 1). S Nếu ( (n) T ∼ T (n) thì P(T n)
< tα ) = α. Giá trị t α
được tra từ bảng phân phối Student (Phụ lục 4). Chẳng hạn với ( (10)
n = 10, α = 0, 5 thì t n) = t = (10) t = 2, 228. 1−α/2 1−0,025 0,975 4.1. Lý thuyết mẫu 108 CuuDuongThanCong.com
https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG
Nguyễn Thị Thu Thủy3SAMI-HUST
Phân phối của thống kê tần suất mẫu Khi f − p
n đủ lớn (n p ≥ 5 và n(1 − p) ≥ 5) thì thống kê U = √ p n có phân phối xấp xỉ p(1 − p) phân phối chuẩn tắc f − p √ U = p n ∼ N (0, 1) (4.22) p(1 − p)
4.2 Ước điểm cho kỳ vọng, phương sai và tÿ lệ
Phương pháp ước lượng điểm chủ trương dùng giá trị quan sát của một thống kê để ước
lượng một tham số (véc tơ tham số) nào đó theo các tiêu chuẩn: vững, không chệch, hiệu quả.
4.2.1 Ước lượng điểm
Khái niệm ước lượng điểm
Cho biến ngẫu nhiên gốc X có thể đã biết hoặc chưa biết quy luật phân phối xác suất dạng
tổng quát, nhưng chưa biết tham số θ nào đó. Hãy ước lượng θ bằng phương pháp mẫu. Vì θ
là một hằng số nên có thể dùng một ố nào đó để ước lượng θ. Ướ lượng như vậy gọi là ước lượng điểm.
Phương pháp hàm ước lượng
- Giả sử cần ước lượng tham số θ của biến ngẫu nhiên X. Từ X ta lập mẫu ngẫu nhiên
WX = (X1, X2, . . . , Xn) cỡ n. Chọn thống kê G = f (X1, X2, . . . , Xn). Một trong những
cách chọn dạng hàm f là tương ứng thống kê đặc trưng của mẫu ngẫu nhiên với tham
số cần ước lượng của biến ngẫu nhiên.
- Tiến hành lập mẫu cụ thể Wx = (x1, x2, . . . , xn). Tính giá trị cụ thể của G ứng với mẫu
này, tức là g = f (x1, x2, . . . , xn). Đây là ước lượng điểm của θ.
- Thống kê G = f (X1, X2, . . . , Xn) là hàm ước lượng của θ.
4.2.2 Các tiêu chuẩn lựa chọn hàm ước lượng
Cùng một mẫu ngẫu nhiên có thể xây dựng nhiều thống kê G khác nhau để ước lượng cho
tham số θ. Vì vậy ta cần lựa chọn thống kê tốt nhất để ước lượng cho tham số θ dựa vào các tiêu chuẩn sau.
4.2. Ước điểm cho kỳ vọng, phương sai và tÿ lệ 109 CuuDuongThanCong.com
https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG
Nguyễn Thị Thu Thủy3SAMI-HUST
Ước lượng không chệch (unbiased estimator)
Thống kê G được gọi là ước lượng không chệch của θ nếu E(G) = θ với mọi θ (4.23)
Nếu E(G) 6= θ thì G là ước lượng chệch của θ.
Điều kiện (4.23) của ước lượng không chệch có nghĩa là trung bình các giá trị của G bằng
θ. Tuy nhiên, không có nghĩa là mọi giá trị của G đều trùng khít với θ mà từng giá trị của G
có thể sai lệch rất lớn so với θ. Vì vậy ta tìm ước lượng không chệch sao cho độ sai lệch trung bình là bé nhất.
Ước lượng hiệu quả (efficient estimator)
Thống kê G được gọi là ước lượng hiệu quả (hay ước lượng phương sai bé nhất) của θ nếu G
là ước lượng không chệch của θ và phương sai của G nhỏ hơn bất kỳ phương sai của một hàm
ước lượng không chệch nào khác.
Để xét xem ước lượng không chệch G có phải là ước lượng hiệu quả của θ hay không ta
cần phải tìm một cận dưới của phương sai của các ước lượng không chệch và so sánh phương
sai của G với cận dưới này. Điều này được giải quyết bằng bất đẳng thức Cramer3Rao phát
biểu như sau: Cho mẫu ngẫu nhiên WX = (X1, X2, . . . , Xn) cỡ n được lấy từ tổng thể có dấu hiệu
nghiên cứu được mô hình hóa bởi biến ngẫu nhiên X mà hàm mật độ xác suất (nếu là biến ngẫu nhi
liên tục) hay bảng phân phối xác suất (nếu là biến ngẫu nhiên rời rạc) thỏa mãn một số điều kiện n
định (thường được thỏa mãn trong thực tế, ít ra là các phân phối xác suất đã xét trong Chương 2)
G là ước lượng không chệch bất kỳ của θ thì 1 V(G) ≥ (4.24) 2 ∂θ
nE (ln f (X,θ))
Ước lượng vững (consistent estimator)
Thống kê G được gọi là ước lượng vững của tham số θ nếu G hội tụ theo xác suất đến θ khi n → +∞.
4.2.3 Ước lượng điểm cho kỳ vọng, phương sai và xác suất 1 - Chọn hàm G = ∑n n
i=1 Xi = X nếu ước lượng kỳ vọng E(X) = µ. Kỳ vọng mẫu ngẫu
nhiên X là ước lượng không chệch, hiệu quả và vững của kỳ vọng E(X) = µ của biến
ngẫu nhiên gốc của tổng thể.
4.2. Ước điểm cho kỳ vọng, phương sai và tÿ lệ 110 CuuDuongThanCong.com
https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG
Nguyễn Thị Thu Thủy3SAMI-HUST 1 - Chọn G = ∑n (X n − 1 i=1
i − X)2 = S2 nếu ước lượng phương sai V(X) = σ2. Phương sai
hiệu chỉnh mẫu ngẫu nhiên S2 là ước lượng không chệch, hiệu quả và vững của phương
sai V(X) = σ2 của biến ngẫu nhiên gốc của tổng thể. - Chọn m G =
= f nếu ước lượng cho xác suất p. Tần suất mẫu ngẫu nhiên f là ước n
lượng không chệch, hiệu quả và vững của xác suất p của tổng thể.
Ví dụ 4.5. Trong đợt vận động bầu cử tổng thống người ta phỏng vấn ngẫu nhiên 1600 cử tri
thì được biết 960 người sẽ bỏ phiếu cho ứng cử viên A. Hãy chỉ ra ước lượng điểm cho tÿ lệ
phiếu thực mà ứng cử viên A sẽ thu được. 960
Lời giải Ví dụ 4.5 Ước lượng điểm cần tìm là f = = 0, 6 = 60%. 1600
4.2.4 Một số phương pháp tìm ước lượng điểm
(a) Phương pháp hợp lý cực đại (maximum-likelihood estimation)
(b) Phương pháp mô men (moment estimation)
(c) Phương pháp Bayes, phương pháp minimax, phương pháp bootstrap . .. (Sinh viên tự đọc).
4.2. Ước điểm cho kỳ vọng, phương sai và tÿ lệ 111 CuuDuongThanCong.com
https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG
Nguyễn Thị Thu Thủy3SAMI-HUST TUẦN 12
4.3 Phương pháp ước lượng bằng khoảng tin cậy
Phương pháp ước lượng điểm nói trên có nhược điểm là khi kích thước mẫu bé thì ước lượng
điểm có thể sai lệch rất nhiều so với giá trị của tham số cần ước lượng. Mặt khác phương pháp
trên cũng không thể đánh giá được khả năng mắc sai lầm khi ước lượng là bao nhiêu. Do đó
khi kích thước mẫu bé người ta thường dùng phương pháp ước lượng khoảng tin cậy cho
trường hợp một tham số.
Khái niệm ước lượng khoảng
Giả sử chưa biết đặc trưng θ nào đó của biến ngẫu nhiên X. Ước lượng khoảng của θ là chỉ ra
một khoảng số (g1, g2) nào đó chứa θ, tức là có thể ước lượng g1 < θ < g2.
Phương pháp khoảng ước lượng tin cậy
Để ước lượng tham số θ của biến ngẫu nhiên X, từ biến ngẫu nhiên này ta lập mẫu ngẫu nhiên
WX = (X1, X2, . . . , Xn) cỡ n. Chọn thống kê G(X, θ) sao cho mặc dù chưa biết giá trị của θ,
quy luật phân phối xác suất của G vẫn hoàn toàn xác định. Do đó, với xác suất α khá bé ta
tìm được P(G1 < θ < G2) = 1 − α. Vì α khá bé, nên γ = 1 − α khá lớn (thông thường yêu
cầu 1 − α = γ ≥ 0, 95 để có thể áp dụng nguyên lý xác suất lớn cho sự kiện (G1 < θ < G2)).
Khi đó, sự kiện (G1 < θ < G2) hầu như chắc chắn xảy ra trong một phép thử. Thực hiện một
phép thử đối với mẫu ngẫu nhiên WX ta thu được mẫu cụ thể Wx = (x1, x2, . . . , xn), từ đó tính
được các giá trị của G1, G2, ký hiệu là g1, g2. Như vậy có thể kết luận: với độ tin cậy 1 − α = γ
tham số θ nằm trong khoảng (g1, g2).
(a) (G1, G2) được gọi là khoảng tin cậy của θ với độ tin cậy γ = 1 − α.
(b) 1 − α = γ được gọi là độ tin cậy của ước lượng.
(c) I = G2 − G1 được gọi là độ dài khoảng tin cậy.
4.3.1 Khoảng tin cậy của kỳ vọng của biến ngẫu nhiên phân phối chuẩn
Bài toán 4.1. Giả sử biến ngẫu nhiên X tuân theo luật phân phối chuẩn N (µ, σ2) với kỳ vọng
E(X) = µ chưa biết. Hãy ước lượng E(X).
Các bước tiến hành: Từ tổng thể, ta lập mẫu ngẫu nhiên WX = (X1, X2, . . . , Xn) cỡ n và xét các trường hợp sau.
4.3. Phương pháp ước lượng bằng khoảng tin cậy 112 CuuDuongThanCong.com
https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG
Nguyễn Thị Thu Thủy3SAMI-HUST
Trường hợp đã biết phương sai V(X) = σ2
Bước 1 Chọn thống kê X − µ √ U = n (4.25) σ
Theo Mục 4.1.6, thống kê U có phân phối chuẩn tắc N (0; 1).
Bước 2 Chọn cặp số không âm α1, α2 thỏa mãn α1 + α2 = α, tìm các phân vị chuẩn tắc uα , u
sao cho P(U < uα ) = α1; P(U < u ) = 1 − α 1 1−α2 1 1−α2 2. Do tính chất của phân
phối chuẩn tắc uα = −u , suy ra 1 1−α1
P(−u1−α < U < u1 ) = P(uα < U < u ) 1 −α2 1 1−α2
= P(U < u1−α ) − P(U < u ) = 1 − α2 − α 2 α1 1 = 1 − α. Như vậy, X − µ√ 1 − α = P(−u n < u 1−α < U < u ) = P σ − u < 1−α 1 1−α2 1−α σ 1 σ 2 √ < µ < X + u1 n −α1 = P X − u1−α √ . 2 n
Bước 3 Lập mẫu cụ thể WX = (x1, x2, . . . , xn), tính được giá trị cụ thể x của X, khi đó khoảng
tin cậy cho µ với độ tin cậy γ = 1 − α là: σ σ √ ; x + u1 n −α1 x − u (4.26) 1−α √ 2 n
Như vậy, với độ tin cậy γ = 1 − α cho trước, có vô số khoảng tin cậy cho µ vì có vô số cặp
α1, α2 thỏa mãn α1 + α2 = α. Ở đây ta chỉ xét một số trường hợp đặc biệt.
(a) Khoảng tin cậy đối xứng (α1 = α2 = α/2) σ σ √ ; x + u1−α 2 n 2 x − u1−α √ (4.27) n
trong đó u1−α được xác định từ bảng giá trị hàm phân phối chuẩn tắc (Phụ lục 3) từ hệ 2 thức α Φ(u (4.28) 1− α ) = 1 − 2 2
Sai số của ước lượng
ược gọi là sai số (độ chính xác) của ước lượng. Với
phương sai σ2 đã biết không đổi và độ tin cậy γ không đổi thì giá trị u không đổi, do 1− α2
đó sai số của ước lượng chỉ phụ thuộc vào kích thước mẫu n. Khi n càng lớn thì ε càng
bé, do đó khoảng ước lượng càng chính xác.
4.3. Phương pháp ước lượng bằng khoảng tin cậy 113 CuuDuongThanCong.com
https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG
Nguyễn Thị Thu Thủy3SAMI-HUST
Tìm kích thước mẫu: Nếu muốn ước lượng kỳ vọng với độ chính xác ε0 và độ tin cậy γ cho
trước, kích thước mẫu cần thiết là số tự nhiên n nhỏ nhất thỏa mãn: σ2u21−α n ≥ 2 (4.29) ε20
(b) Khoảng tin cậy trái (α1 = α, α2 = 0): σ
− ∞ ; x + u1−α √ (4.30) n
trong đó u1−α được xác định từ bảng giá trị hàm phân phối chuẩn tắc (Phụ lục 3) từ hệ thức
Φ(u1−α) = 1 − α . (4.31)
(c) Khoảng tin cậy phải (α1 = 0, α2 = α): σ x − u1−α√ ; +∞ (4.32) n
Ví dụ 4.6. Trọng lượng của một loại sản phẩm là biến ngẫu nhiên tuân theo luật phân phối
chuẩn với độ lệch tiêu chuẩn là 1 gam. Cân thử 25 sản phẩm loại này ta thu được kết quả sau:
Trọng lượng (gam) 18 19 20 21 Số sản phẩm 3 5 15 2
(a) Với độ tin cậy 1 − α = 95%, hãy tìm khoảng tin cậy đối xứng của trọng lượng trung bình
của loại sản phẩm nói trên.
(b) Không cần tính toán, nếu độ tin cậy 99% thì khoảng ước lượng trung bình sẽ rộng hơn,
hẹp hơn hay bằng như trong ý (a)?
(c) Nếu muốn độ chính xác của ước lượng tăng lên gấp đôi, độ tin cậy không đổi thì cần
nghiên cứu mẫu có kích thước là bao nhiêu? Lời giải Ví dụ 4.6
(a) Gọi X là trọng lượng sản phẩm, X ∼ N (µ, σ2) với σ = 1. Trọng lượng trung bình của sản
phẩm là E(X) = µ chưa biết cần ước lượng. X √ Bước 1: Chọn thống kê − µ U = n. Thống kê U ∼ N (0; 1). σ
4.3. Phương pháp ước lượng bằng khoảng tin cậy 114 CuuDuongThanCong.com
https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG
Nguyễn Thị Thu Thủy3SAMI-HUST σ σ √ ; x + u1 ! 2 n − α2
Bước 2: Áp dụng khoảng tin cậy đối xứng x − u1−α √ . Với α = 0, 05, Φ(u ) = 1
= 0, 975, tra bảng giá trị hà n m phân phối chuẩn tắc 1− α − 0,05 2 2
(Phụ lục 3) nhận được u1−α = 1, 96. 2
Bước 3: Từ số liệu đã cho ta có n = 25, σ = 1 và tính được x = 19, 64, suy ra khoảng 1 √ 19, 64 + 1, 96 × 125 ti ( n 19 c , ậ 2 y 48đ;ối 2 x 0, ứ 0 n 3 g 2).của E(X) = µ là 19, 64 − 1, 96 × √ hay 25
Bước 4: Kết luận, với độ tin cậy 95%, trọng lượng trung bình của loại sản phẩm nói trên từ 19,248 gam đến 20,032 gam.
(b) Nếu độ tin cậy 1 − α tăng từ 95% lên 99% thì khoảng ước lượng sẽ rộng hơn khoảng ước
lượng xét trong ý (a), do giá trị của u1−α/2 tăng từ 1, 96 lên 2, 58.
(c) Theo ý (a), độ chính xác của ước lượng là σ
ε = u1−α √ = 0, 392. Để độ chính xác tăng lên 2 n
gấp đôi, tức là ε0 = 0,392 = 0, 196. Theo (4.29) ta cần mẫu có kích thước nhỏ nhất là 2 2 2 12 × (1, 96)2 = ' 100. (0, 19 )2
Chú ý 4.2. (a) Chú ý rằng không thể viết P(19, 248 < X < 20, 032) = 0, 95 vì độ tin cậy
gắn với khoảng tin cậy ngẫu nhiên chứ không gắn với mẫu cụ thể. Hơn nữa vì µ
một hằng số nên nó chỉ có thể thuộc hoặc không thuộc khoảng (19,248; 20,032) nên
(19, 248 < µ < 20, 032) không phải là sự kiện ngẫu nhiên.
(b) Ta có thể xác định u1−α = 1, 96 ở ý Ví dụ 4.6(a) từ bảng giá trị hàm Láp-la-xơ (Phụ lục 2) 2 1 từ hệ thức − α φ(u1−α) = . 2
(c) Từ (4.29) ta nhận thấy khi kích thước mẫu tăng và độ tin cậy giữ nguyên thì ε giảm hay
ước lượng chính xác hơn; nếu tăng độ tin cậy và giữ nguyên kích thước mẫu, do giá trị
phân vị chuẩn tăng nên sai số của ước lượng ε tăng.
Trường hợp chưa biết phương sai, cỡ mẫu n < 30
Do σ chưa biết nên ta thay thế bằng S và chọn thống kê X − µ √ T = n (4.33) S
Như đã biết (Mục 4.1.6) thống kê T có phân phối Student với n − 1 bậc tự do. Ta có các kết luận sau đây.
4.3. Phương pháp ước lượng bằng khoảng tin cậy 115 CuuDuongThanCong.com
https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG
Nguyễn Thị Thu Thủy3SAMI-HUST
(a) Khoảng tin cậy đối xứng s s √ ( ; x + t n−1) 1− α 1 2 n − α2 x − t(n−1) √ (4.34) n
Sai số của ước lượng là ( s
ε = t n−1) √ . Kích thước mẫu được suy từ sai số hay độ chính 1− α2 n
xác của ước lượng, là số tự nhiên n nhỏ nhất thỏa mãn: × s2 1− α 2 ( (4.35) t n−1)ε2 2 n ≥
(b) Khoảng tin cậy trái s 1−α − ∞ ; x + t(n−1)√ (4.36) n
(c) Khoảng tin cậy phải s 1−α x − t(n−1) √ ; +∞ (4.37) (n (n−1) n trong đó t −1), t
được xác định từ bảng phân phối Student với n − 1 bậc tự do (Phụ 1− α 1−α 2 lục 4).
Ví dụ 4.7. Theo dõi mức xăng hao phí (X) cho một loại ô tô đi từ A đến B thu được bảng số liệu sau:
Mức xăng hao phí (lít) 19-19,5 19,5-20,0 20,0-20,5 20,5-21,0 Số lần đi 2 10 8 5
Với độ tin cậy 1 − α = 95% hãy tính mức xăng hao phí trung bình tối thiểu khi đi từ A đến B
biết X tuân theo luật phân phối chuẩn.
Lời giải Ví dụ 4.7 Gọi X là lượng xăng hao phí của loại ô tô trên đoạn đường AB, X ∼ N (µ, σ2)
với phương sai σ2 chưa biết. Mức xăng hao phí trung bình là E(X) = µ chưa biết, cần ước lượng. X √
Bước 1: Vì phương sai chưa biết và − µ
n = 25 < 30, chọn thống kê T = n. Thống kê T S
có phân phối Student với n − 1 bậc tự do.
Bước 2: Sử dụng khoảng tin cậy phải cho E(X) = µ: s 1−α x − t(n−1) √ ; +∞ (n−1) (24) n trong đó t = t
= 1, 711 được xác định từ bảng phân phối Student (Phụ lục 4). 1−α 0,95
4.3. Phương pháp ước lượng bằng khoảng tin cậy 116 CuuDuongThanCong.com
https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG
Nguyễn Thị Thu Thủy3SAMI-HUST
Bước 3: Từ số liệu của đầu bài, tính được n = 25, x = 20, 07, s = 0, 45. Suy ra khoảng tin cậy √ 0, 4 2 5
phải của µ là 20, 07 − 1, 711 × < < µ +∞
hay (19, 92 < µ < +∞).
Bước 4: Kết luận mức xăng hao phí trung bình tối thiểu khi đi từ A đến B là 19,92 lít với độ tin cậy 95%.
Trường hợp chưa biết phương sai, cỡ mẫu n ≥ 30
Khi n ≥ 30 thống kê T trong (4.33) sẽ có phân phối tiệm cận chuẩn tắc N (0, 1). Hay thống kê X − µ√ U = n ∼ N (0, 1) (4.38) S Do đó,
(a) Khoảng tin cậy đối xứng s s √ ; x + u1−α 2 n 2 x − u1−α √ (4.39) s n
Sai số của ước lượng là ε = u
. Kích thước mẫu được suy từ sai số hay độ chính 1− α √ 2 n
xác của ước lượng, là số tự nhiên n nhỏ nhất thỏa mãn: × s2 2 (4.40) u1−α2ε2 n ≥
(b) Khoảng tin cậy trái s − ∞ ; x + u (4.41) 1−α √n
(c) Khoảng tin cậy phải s x − u1−α√ ; +∞ (4.42) n
Ví dụ 4.8. Để ước lượng trọng lượng trung bình của loại trái cây A tại một vùng, người ta thu
hoạch ngẫu nhiên 100 trái cây A của vùng đó và thu được kết quả sau
Trọng lượng (gam) 40-42 42-44 44-46 46-48 48-50 50-52 Số trái 7 13 25 35 15 5
Hãy ước lượng trọng lượng trung bình của loại trái cây A trong vùng bằng khoảng tin cậy đối
xứng với độ tin cậy 95%. Cho biết trọng lượng loại trái cây A là biến ngẫu nhiên tuân theo luật phân phối chuẩn.
4.3. Phương pháp ước lượng bằng khoảng tin cậy 117 CuuDuongThanCong.com
https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG
Nguyễn Thị Thu Thủy3SAMI-HUST
Lời giải Ví dụ 4.8 Gọi X là trọng lượng loại trái cây A, X ∼ N (µ, σ2) với phương sai σ2 chưa
biết. Trọng lượng trung bình của loại trái cây A là E(X) = µ chưa biết, cần ước lượng. X √ Bước 1: Chọn thống kê − µ U =
n. Vì n = 100 > 30 nên thống kê U ∼ N (0, 1). S s s √ ; x + u1−α ! 2 n 2
Bước 2: Khoảng tin cậy đối xứng cho E(X) = µ là x − u1
= u0,975 = 1, 96 được tra từ bảng − α √ trong đó, với α = 0, 05, u
giá trị hàm phân phối chuẩn tắc 1− α2 n (Phụ lục 3).
Bước 3: Từ số liệu đã cho tính được n = 100, x = 46, 06, s = 2, 48. Suy ra khoảng tin cậy đối 2, 48 √ ; 46, 06 + 1, 96 × 2, 4 1 8 00
xứng của µ là 46, 06 − 1, 96 × √ hay (45, 573 ; 46, 546).
Bước 4: Kết luận, với độ tin cậy 95%, trọng lượng trung bìn 1 h00
của loại trái cây A ở vùng trên
từ 45,573 gam đến 46,546 gam.
4.3.2 Ước lượng khoảng cho tÿ lệ Bài toán 4.2.
. Do không biết p nên người ta thực hiện , cùng điều kiện, Khi đó
là ước lượng điểm không chệch cho p. Với độ tin cậy γ = 1 − α hãy ước lượng khoảng cho p.
Phương pháp tiến hành
Bước 1 Chọn thống kê f − p Z = √ p
n. Theo Mục 4.1.6, Z có phân phối chuẩn tắc N (0; 1). p(1 − p)
Trong trường hợp n khá lớn ta có thể dùng f để thay thế cho p. Khi đó, f − p Z = √ p n ∼ N (0; 1) (4.43) f (1 − f )
Bước 2: Khi có mẫu cụ thể Wx = (x1, x2, . . . , xn), ta tính được giá trị cụ thể của f và suy ra
khoảng ước lượng cho p với độ tin cậy γ = 1 − α là: f (1 − f ) f (1 − f ) f − u1−α ; f + u (4.44) 2 n 1−α1 n
với α = α1 + α2.
Các trường hợp ước lượng hay dùng:
4.3. Phương pháp ước lượng bằng khoảng tin cậy 118 CuuDuongThanCong.com
https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG
Nguyễn Thị Thu Thủy3SAMI-HUST
(a) Khoảng tin cậy đối xứng ; f + u1−α f (1 − n f ) f (1 − f ) f − u (4.45) 1− α2 2 n
Độ chính xác của ước lượng ε = u . Với độ tin cậy 1− α
γ = 1 − α và độ chính f (1 − n f )
xác ε0 cho trước thì kích thước mẫu cần thiết là số tự nhiên n nhỏ nhất thỏa mãn: 2 × f × (1 − f ) 2 (4.46) u1−α2 ε20 n ≥
(b) Khoảng tin cậy trái f (1 − f ) − ∞ ; f + u1−α (4.47) n
(c) Khoảng tin cậy phải f (1 − f ) f − u1−α +∞ (4.48) n
Chú ý 4.3. (a) Do tÿ lệ chỉ nhận giá trị từ 0 đến 1 nên ta có thể thay giá trị −∞ bằng 0 và +∞
bằng 1 trong khoảng tin cậy trái (phải).
(b) Các khoảng tin cậy trên được xây dựng khi kích thước mẫu n đủ lớn thỏa mãn n f ≥ 5 và n(1 − f ) ≥ 5.
Ví dụ 4.9. Điều tra nhu cầu tiêu dùng loại hàng A trong 100 hộ gia đình ở khu dân cư B thấy
60 hộ gia đình có nhu cầu loại hàng trên. Với độ tin cậy 1 − α = 95% hãy tìm khoảng tin cậy
đối xứng của tÿ lệ hộ gia đình có nhu cầu loại hàng đó.
Lời giải Ví dụ 4.9 Gọi p là tÿ lệ hộ gia đình ở khu dân cư B có nhu cầu mặt hàng A. Kiểm tra
điều kiện n f = 100 × 0, 6 = 60 > 5 và n(1 − f ) = 100 × 0, 4 = 40 > 5. f Bước 1: Chọn thống kê − p Z = √ p n. Thống kê Z ∼ N (0, 1). f (1 − f )
Bước 2: Khoảng tin cậy đối xứng của xác suất p là ; f + u1−α f (1 − n f ) f (1 − f ) f − u1−α2 2 n
trong đó u1−α = u0,975 = 1, 96 được tra từ bảng giá trị hàm phân phối chuẩn tắc (Phụ 2 lục 3).
4.3. Phương pháp ước lượng bằng khoảng tin cậy 119 CuuDuongThanCong.com
https://fb.com/tailieudientucntt
MI2020-KỲ 201923TÓM TẮT BÀI GIẢNG
Nguyễn Thị Thu Thủy3SAMI-HUST m
Bước 3: Với n = 100, m = 60, f = = 0, 6, suy ra khoảng tin cậy đối xứng của p là n … … 0, 6 0, 4 × 0, 6 0, 4 × 0, 6 1, 96 − ; 0, 6 − 1, 96 = (0, 504 ; 0, 696). 100 100
Bước 4: Kết luận, tÿ lệ hộ gia đình ở khu dân cư B có nhu cầu loại hàng A là từ 50,4% đến
69,6% với độ tin cậy 95%.
4.3. Phương pháp ước lượng bằng khoảng tin cậy 120 CuuDuongThanCong.com
https://fb.com/tailieudientucntt