136 trang 480 lượt tải

Bài giảng "Lý thuyết xác xuất và thống kê toán"

1 K

Bài giảng "Lý thuyết xác xuất và thống kê toán" giúp sinh viên củng cố kiến thức và đạt điểm cao trong bài thi kết thúc học phần.

Môn: Toán cao cấp c1 10 tài liệu

Trường: Đại học Duy Tân 2 K tài liệu

Tác giả:

VietJack

2 năm trước

Tải xuống Báo cáo

Danh sách Quiz

ĐẠI HỌC DUY TÂN

KHOA KHOA HỌC TỰ NHIÊN

BỘ MÔN XÁC SUẤT THỐNG KÊ

BÀI GIẢNG

LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN

(Lưu hành nội bộ)

Đà Nẵng, năm 2018

Downloaded by Di?p DN - Chuyên Viên R&D (diepdn@bibabo.vn)

lOMoARcPSD|36212343

Lời mở đầu

Trong khoa học cũng như trong đời sống hàng ngày, chúng ta rất thường gặp các

hiện tượng ngẫu nhiên (toán học gọi là biến cố ngẫu nhiên). Đó là các biến cố mà ta

không thể dự báo một cách chắc chắn rằng chúng xảy ra hay không xảy ra.

Lí thuyết xác suất là bộ môn toán học nghiên cứu nhằm tìm ra các quy luật chi phối

và đưa ra các phương pháp tính toán xác suất của các hiện tượng ngẫu nhiên. Ngày

nay lý thuyết xác suất đã trở thành một ngành toán học quan trọng cả về phương

diện lý thuyết và ứng dụng. Nó là công cụ không thể thiếu được mỗi khi ta nói đến

dự báo, bảo hiểm, mỗi khi cần đánh giá các cơ may, các nguy cơ rủi ro. Nhà toán

học Pháp Laplace ở thế kỷ 19 đã tiên đoán rằng: ‘Môn khoa học này hứa hẹn trở

thành một trong những đối tượng quan trọng nhất của tri thức nhân loại. Rất

nhiều những vấn đề quan trọng nhất của đời sống thực tế thuộc về những bài

toán của lý thuyết xác suất’.

Lí thuyết xác suất và thống kê toán học là môn học cơ bản được giảng dạy ở hầu hết

các trường Đại học.

Ngoài tập bài giảng này ra, giảng viên khuyến khích sinh viên khi học môn học xác

suất và thống kê nên có ít nhất 1 tài liệu khác để đọc thêm, bất cứ cuốn sách nào về

xác suất thống kê có trên thị trường đều tốt. Nó sẽ bổ sung kiến thức cho bạn.

Trong quá trình soạn bài giảng này, giảng viên đã tham khảo nhiều ý kiến của các

đồng nghiệp, và giảng viên cũng cố gắng rất lớn trong quá trình biên soạn nhưng do

hạn chế về nhiều mặt nên không thể tránh được sai sót. Rất mong nhận được sự phê

bình và sự đóng góp ý kiến của các đồng nghiệp và các bạn sinh viên.

Xin chân thành cảm ơn.

Biên soạn: Nguyễn Quang Thi

Mục lục

Lời mở đầu ....................................................................................................... 3

Mục lục ............................................................................................................. v

Chương I.

Các khái niệm cơ bản trong lí thuyết xác suất. ...................... 1

1. Nhắc lại một số công thức giải tích tổ hợp. ..........................................................1

1.1. Quy tắc cộng và quy tắc nhân........................................................................1

1.2. Hoán vị. ........................................................................................................2

1.3. Chỉnh hợp (chỉnh hợp không lặp)..................................................................2

1.4. Chỉnh hợp lặp................................................................................................2

1.5. Tổ hợp...........................................................................................................3

1.6. Công thức nhị thức Newton...........................................................................3

1.7. Bài tập...........................................................................................................3

2. Biến cố và các phép toán trên biến cố. .................................................................4

2.1. Phép thử và biến cố.......................................................................................4

2.2. Các loại biến cố.............................................................................................4

2.3. Biến cố bằng nhau (biến cố tương đương).....................................................5

2.4. Các phép toán trên biến cố. ...........................................................................5

2.5. Nhóm đầy đủ các biến cố. .............................................................................6

2.6. Bài tập...........................................................................................................6

3. Định nghĩa xác suất..............................................................................................7

3.1. Các định nghĩa xác suất.................................................................................7

3.2. Các định lí về xác suất...................................................................................9

3.3. Công thức xác suất đầy đủ. Công thức Bayes. .............................................13

3.4. Bài tập.........................................................................................................15

4. Dãy phép thử Bernoulli. Công thức Bernoulli. ...................................................15

4.1. Dãy phép thử Bernoulli. ..............................................................................15

4.2. Số có khả năng nhất. ...................................................................................16

5. Bài tập chương...................................................................................................19

Đáp số và hướng dẫn..........................................................................................21

Chương II. Đại lượng ngẫu nhiên. Hàm phân phối xác suất. ..................... 25

1. Khái niệm. Phân loại đại lượng ngẫu nhiên. .......................................................25

1.1. Đại lượng ngẫu nhiên rời rạc.......................................................................26

1.2. Đại lượng ngẫu nhiên liên tục......................................................................26

1.3. Hàm phân phối của đại lượng ngẫu nhiên....................................................26

2. Đại lượng ngẫu nhiên rời rạc..............................................................................27

2.1. Bảng phân phối xác suất..............................................................................27

2.2. Hàm phân phối xác suất. .............................................................................28

2.3. Phép toán đại lượng ngẫu nhiên...................................................................31

3. Đại lượng ngẫu nhiên liên tục. ...........................................................................32

4. Các đặc trưng của đại lượng ngẫu nhiên.............................................................34

4.1. Kì vọng. ......................................................................................................34

4.2. Phương sai. .................................................................................................36

4.3. Mốt, trung vị và moment trung tâm.............................................................37

5. Hàm của một đại lượng ngẫu nhiên....................................................................41

5.1. Đại lượng ngẫu nhiên rời rạc. ..................................................................... 41

6.2. Đại lượng ngẫu nhiên liên tục..................................................................... 42

6. Bài tập chương. ................................................................................................. 45

Đáp số và hướng dẫn......................................................................................... 45

Chương III. Các quy luật phân phối thường gặp......................................... 47

1. Quy luật phân phối rời rạc. ................................................................................ 47

1.1. Phân phối nhị thức...................................................................................... 47

1.2. Phân phối siêu bội. ..................................................................................... 48

1.3. Phân phối Poisson....................................................................................... 50

2. Quy luật phân phối liên tục................................................................................ 52

2.1. Phân phối đều. ............................................................................................ 52

2.2. Phân phối mũ.............................................................................................. 52

2.3. Phân phối chuẩn. Phân phối chuẩn tắc. ....................................................... 54

2.4. Phân phối Chi bình phương. ....................................................................... 60

2.5. Phân phối Student....................................................................................... 61

2.6. Công thức tính gần đúng............................................................................. 61

3. Đại lượng ngẫu nhiên nhiều chiều. .................................................................... 63

3.1. Khái niệm................................................................................................... 63

3.2. Quy luật phân phối xác suất của đại lượng ngẫu nhiên hai chiều................. 63

3.3. Hàm phân phối của đại lượng ngẫu nhiên hai chiều. ................................... 64

4. Bài tập chương. ................................................................................................. 65

Đáp số và hướng dẫn......................................................................................... 67

Chương IV. Lí thuyết mẫu ............................................................................ 71

1. Tổng thể và mẫu................................................................................................ 71

1.1. Mở đầu. ...................................................................................................... 71

1.2. Mẫu ngẫu nhiên, mẫu cụ thể. ...................................................................... 72

1.3. Bảng phân phối tần số................................................................................. 73

1.4. Hàm phân phối mẫu.................................................................................... 76

2. Các tham số đặc trưng của mẫu ......................................................................... 76

2.1. Tỉ lệ mẫu. ................................................................................................... 76

2.2. Số mốt (Mode) của mẫu.............................................................................. 79

2.3. Số trung vị (Median) của mẫu..................................................................... 79

2.4. Các quy luật phân phối mẫu........................................................................ 81

3. Bài tập chương. ................................................................................................. 83

Chương V. Lí thuyết ước lượng .................................................................... 85

1. Ước lượng điểm. ............................................................................................... 85

2. Ước lượng khoảng............................................................................................. 86

2.1. Ước lượng khoảng tin cậy cho kì vọng ....................................................... 87

2.2. Ước lượng khoảng tin cậy cho phương sai.................................................. 90

2.3. Ước lượng khoảng tin cậy cho tỉ lệ. ............................................................ 92

2.4. Ước lượng kích thước mẫu. ........................................................................ 94

3. Bài tập chương. ................................................................................................. 95

Đáp số và hướng dẫn......................................................................................... 97

Chương VI. Kiểm định giả thiết thống kê.................................................... 99

1. Các khái niệm cơ bản ........................................................................................ 99

1.1. Đặt vấn đề: ................................................................................................. 99

1.2. Phương pháp kiểm định giả thiết thống kê................................................ 101

2. Kiểm định giả thiết về tham số.........................................................................101

2.1. Các loại kiểm định và phương pháp kiểm định giả thiết về các tham số. ...101

2.2. Kiểm định giả thiết về trung bình của ĐLNN X~N(µ; σ

). ........................102

2.3. Kiểm định giả thiết về phương sai của ĐLNN X~N(µ; σ

). .......................106

2.4. Kiểm định giả thiết về tỉ lệ các phần tử có tính chất nào đó trong tổng thể.108

2.5. Kiểm định giả thiết về hai kì vọng của hai ĐLNN chuẩn độc lập...............110

2.6. Kiểm định giả thiết thống kê về hai tỉ lệ của hai ĐLNN. ...........................113

2.7. Kiểm định giả thiết thống kê về quy luật phân phối...................................115

2.8. Kiểm định giả thiết thống kê về tính độc lập. ............................................120

3. Bài tập chương.................................................................................................122

Các bảng số................................................................................................... 125

Bảng 1. Bảng phân phối Poisson:.........................................................................125

Bảng 2. Giá trị tích phân Laplace:........................................................................126

Bảng 3. Phân vị α của phân phối Student .............................................................127

Bảng 4. Phân vị α của phân phối Chi bình phương...............................................128

Chương I.

Các khái niệm cơ bản trong lí thuyết xác

suất.

A. Mục tiêu

- Ôn lại các kiến thức về Tập hợp và Giải tích tổ hợp như: tập hợp, các phép toán về tập hợp,

qui tắc nhân, hoán vị, chỉnh hợp, tổ hợp . . .

- Rèn luyện cách giải một số bài tập liên quan.

- Giới thiệu các khái niệm về phép thử, biến cố và phép toán giữa các biến cố.

- Nắm vững khái niệm về các biến cố xung và các biến cố độc lập.

- Xây dựng một số định nghĩa xác suất (định nghĩa cổ điển, định nghĩa theo hình học và định

nghĩa theo thống kê) và tìm công thức thể hiện định nghĩa đó.

- Nắm được các công thức cộng, công thức nhân xác suất.

- Hiểu được các công thức tính xác suất có điều kiện, công thức xác suất đầy đủ, công thức

Bayes.

- Giới thiệu về dãy phép thử Bernoulli và công thức Bernoulli.

B. Nội dung.

1. Nhắc lại một số công thức giải tích tổ hợp.

1.1. Quy tắc cộng và quy tắc nhân.

1.1.1. Quy tắc cộng.

Nếu một công việc được chia làm

trường hợp để thực hiện, trường hợp

có

cách thực hiện xong công việc, trường hợp

có

cách thực hiện xong công việc,

…, trường hợp

có

cách thực hiện xong công việc và không có bất kì mỗi cách

thực hiện nào ở các trường hợp nào lại trùng với một cách thực hiện ở các trường

hợp khác, thì có

nnn

cách thực hiện xong công việc.

1.1.2. Quy tắc nhân.

Nếu một công việc được chia làm

giai đoạn, giai đoạn

có

cách thực hiện

xong công việc, giai đoạn

có

cách thực hiện xong công việc, …, giai đoạn

có

cách thực hiện xong công việc, thì có

nnn L

cách thực hiện xong công

việc.

Bài giảng

1.2. Hoán vị.

Một hoán vị từ

phần tử là một bộ có thể kể thứ tự gồm

phần tử khác nhau đã

cho.

Số các hoán vị từ

phần tử kí hiệu là

Công thức tính:

Ví dụ 1.1.

Có

sinh viên và

cái ghế được sắp xếp theo một hàng ngang. Sắp xếp mỗi sinh

viên ngồi một ghế. Có bao nhiều cách sắp xếp khác nhau?

Rõ ràng mỗi kiểu sắp xếp là một hoán vị của

phần tử. Số cách sắp xếp chỗ ngồi là

1.3. Chỉnh hợp (chỉnh hợp không lặp).

Một chỉnh hợp chập

(

≤

) từ

phần tử là một bộ có thể kể thứ tự gồm

phần tử khác nhau lấy từ

phần tử đã cho

Số các chỉnh hợp chập

từ

phần tử kí hiệu là

Công thức tính:

( ) ( )

( )

knnnA

−

=+−−= K

Nhận xét.

Số các chỉnh hợp chập

của

phần tử bằng số các hoán vị của

phần tử, nghĩa

là:

PA =

Ví dụ 1.2.

Có bao nhiêu số khác nhau gồm

chữ số phân biệt được thiết lập từ các chữ số

Giải

Một số gồm

chữ số phân biệt được thiết lập từ các chữ số bằng

( )

!35

−

1.4. Chỉnh hợp lặp.

Một chỉnh hợp lặp chập

(

≥

) từ

phần tử là một bộ có thể kể thứ tự gồm

phần tử không nhất thiết khác nhau lấy từ

phần tử đã cho

Số các chỉnh hợp lặp chập

từ

phần tử kí hiệu là

Công thức tính:

nA =

Ví dụ 1.3.

Giả sử

{

}

3;2;1

là tập hợp gồm

phần tử. Khi đó, các dãy

hoặc

là

những chỉnh hợp lặp

từ

phần tử của

. Ta có thể liệt kê ra đây tất cả các chỉnh

hợp lặp là:

. Và số chỉnh hợp đó là

Chương I. Các khái niệm cơ bản trong lí thuyết xác suất.

1.5. Tổ hợp.

Một tổ hợp chập

từ

phần tử là một tập con gồm

phần tử khác nhau đã cho.

Số các tổ hợp chập

từ

phần tử kí hiệu là

Công thức tính:

(

)

(

)

( )

knk

knnn

−

Nhận xét:

−

, với mọi

nk ;0=

Ví dụ 1.4.

Có bao nhiêu cách phân công

sinh viên đi lao động của một lớp gồm

sinh

viên?

Giải

Mỗi cách chọn ngẫu nhiên

người trong

sinh viên là một tổ hợp chập

của

Vậy số cách phân công khác nhau

sinh viên trong

sinh viên đi lao động là

( )

2118760

!550!5

−

Ví dụ 1.5.

Có bao nhiêu cách phân công

sinh viên thành

nhóm

III

sao cho nhóm

có đúng

sinh viên.

Giải

Ta thấy có

cách phân công

sinh viên vào nhóm

. Số cách phân công

(

)

3050

−

sinh viên còn lại vào nhóm

và

III

bằng số các chỉnh hợp lặp chập

của

, nghĩa là bằng

. Vậy, số cách phân công

sinh viên thành

nhóm

III

sao cho nhóm

có đúng

sinh viên là

2030

2×

1.6. Công thức nhị thức Newton.

Công th

ứ

( )

kkn

baCba

∑

Nhận xét:

( )

nnn

xCxCCx

+++=+

( ) ( )

kkn

baCba

∑

−=−

1.7. Bài tập.

Tìm

ừ

các ph

ươ

ng trình:

−

Bài giảng

128

Trên m

ặ

t ph

ẳ

ng có 20

ể

m (không có 3

ể

m này cùng n

ằ

m trên m

ộ

đườ

ng th

ẳ

ng).

Qua m

ỗ

i c

ặ

ể

m, ta v

ẽ

ộ

đườ

ng th

ẳ

ng. H

ỏ

i có bao nhiêu

đườ

ng th

ẳ

ng nh

ậ

ừ

thành ph

ố

có

con

đườ

đế

n thành ph

ố

và t

ừ

có

con

đườ

i t

ớ

thành ph

ố

. H

ỏ

i có m

ấ

y cách

i t

ừ

đế

(ph

ả

i qua

Trên m

ộ

đườ

ng tròn có

ể

m. Có m

ấ

y cách v

ẽ

dây cung có các mút là các

ể

cho. Có m

ấ

y tam giác nh

ậ

n các

ể

m là

đỉ

nh.

2. Biến cố và các phép toán trên biến cố.

2.1. Phép thử và biến cố.

Phép thử (phép thử ngẫu nhiên) là sự thực hiện một nhóm các điều kiện xác định và

có thể được lặp lại nhiều lần. Kết quả của nó, ta không đoán trước được.

Một kết quả của phép thử gọi là một biến cố.

Ví dụ 2.1.

a) Để nghiên cứu hiện tượng ngẫu nhiên về sự xuất hiện sấp hay ngửa khi tung đồng

tiền, ta tiến hành phép thử: “tung một đồng tiền”. Kết quả nhận được sẽ là

(được

mặt sấp) hoặc

(được mặt ngửa).

và

là những biến cố.

b) Chọn ngẫu nhiên một sinh viên trong lớp, ta được các biến cố, chẳng hạn:

“sinh viên đó là nữ”,

: “sinh viên đó là nam”,

: “sinh viên đó là sinh viên giỏi

Toán”.

2.2. Các loại biến cố.

Biến cố không thể có (hay biến cố rỗng) là biến cố không bao giờ xảy ra khi phép

thử thực hiện. Kí hiệu:

∅

Biến cố ngẫu nhiên là biến cố có thể xảy ra hoặc không xảy ra tùy thuộc vào từng

phép thử.

Biến cố sơ cấp là biến cố xảy ra khi và chỉ khi có một kết quả cụ thể trong số những

kết quả loại trừ nhau của phép thử. Kí hiệu là

Biến cố chắc chắn là biến cố luôn luôn xảy ra khi phép thử thực hiện. Kí hiệu:

Ω

Biến cố chắc chắn gồm tất cả các biến cố sơ cấp. Ta thường coi đó là không gian

biến cố sơ cấp.

Ví dụ 2.2.

Trong Ví dụ 2.1. a) Nếu đồng tiền có hai mặt đều ngửa thì

là biến cố rỗng và

là biến cố chắc chắn.

Trong Ví dụ 2.1. b) Nếu lớp học đó không có nam thì

là biến cố chắc chắn và

là biến cố rỗng.

Ví dụ 2.3.

Gieo

một lần

con xúc xắc. Gọi

là biến cố “Mặt trên con xúc xắc của nó có

chấm”,

6;1=

. Khi đó

Chương I. Các khái niệm cơ bản trong lí thuyết xác suất.

Không gian biến cố sơ cấp là

{

}

654321

,,,,,

BBBBBB

Ω

. Các

là

những biến cố sơ cấp.

Chú ý:

Mọi biến cố sơ cấp đều là biến cố ngẫu nhiên. Ngược lại, biến cố ngẫu nhiên nói

chung không là biến cố sơ cấp.

2.3. Biến cố bằng nhau (biến cố tương đương).

Biến cố

gọi là kéo theo biến cố

nếu

xảy ra thì

xảy ra. Kí hiệu:

⊂

Nếu đồng thời có

⊂

và

⊂

thì các biến cố

và

gọi là bằng nhau. Kí

hiệu:

2.4. Các phép toán trên biến cố.

Cho hai biến cố

và

. Khi đó, ta gọi:

Tích của

và

, hay

nhân

, là biến cố xảy ra khi

và

đồng thời xảy ra.

Kí hiệu:

( hoặc

hoặc

∩

Tổng của

và

, hay

cộng

, là biến cố xảy ra khi

xảy ra hoặc

hoặc

xảy ra. Kí hiệu:

(hoặc

∪

Cho một biến cố

. Khi đó, ta gọi biến cố đối lập của biến cố

là biến cố xảy ra

nếu

không xảy ra và không xảy ra nếu

xảy ra. Kí hiệu:

Tính chất.

Với các biến cố

tùy ý, ta có các tính chất sau:

(

)

(

)

CBACBA ++=++ ,

(

)

(

)

BCACAB = .

(

)

ACABCBA +=+ ,

(

)

(

)

(

)

CABABCA ++=+ .

4) N

ế

⊂

thì

Ω

∅=

(quy t

ắ

đố

i ng

ẫ

8) Với các biến cố

ta có

AAA

là biến cố xảy ra khi có ít nhất một biến cố

xảy ra (

;1=

AAA ...

là biến cố xảy ra khi tất cả các

đều xảy ra (

;1=

Ví dụ 2.4.

Bắn

mũi tên vào một tấm bia. Gọi

là biến cố “mũi tên thứ

trúng đích”

(

3;1=i

). Hãy biểu diễn qua

các biến cố:

: Cả

mũi tên đều trúng đích.

: Có đúng

mũi tên trúng đích.

: Có ít nhất

mũi tên trúng đích.

: Không có mũi tên nào trúng đích.

Bài giảng

Giải

Ta có:

321

AAAA

213

132

AAAAAAAAAB ++=

321

AAAC

321

AAAD =

2.5. Nhóm đầy đủ các biến cố.

Hai biến cố

và

gọi là xung khắc nếu

∅

Các biến cố

gọi là đôi một xung khắc nếu hai biến cố khác nhau bất

kì trong đó đều xung khắc, tức là

∅

với mọi

≠

Các biến cố

gọi là một nhóm đầy đủ các biến cố nếu chúng đôi một

xung khắc và ít nhất một trong chúng xảy ra, tức là

Ω

AAA

∅=

với mọi

≠

, và

(

)

với mọi

Ví dụ 2.5.

a) Gieo một lần một con xúc xắc:

Đặt

là biến cố “mặt trên của con xúc xắc có

chấm”,

6;1

. Dãy

lập thành hệ đầy đủ các biến cố. Vì nó có tính chất:

Ω

621

BBB

∅

ớ

i m

ọ

≠

, và

(

)

, v

ớ

i m

ọ

i 6;1

b) Gieo một đồng tiền một lần:

Đặt

là biến cố “xuất hiện mặt sấp”, khi đó

là biến cố “xuất hiện mặt ngửa”. Ta

thấy rằng dãy

lập thành một hệ đầy đủ vì

∅=AA

và

Ω

Chú ý.

Hai biến cố đối lập nhau thì xung khắc với nhau. Điều ngược lại nói chung là không

đúng.

2.6. Bài tập.

Xét phép th

ử

: gieo con xúc x

ắ

ầ

n. Mô t

ả

không gian bi

ế

n c

ố

ấ

ứ

ng v

ớ

i phép

ử

trên. Tìm các bi

ế

n c

ố

“t

ổ

ng s

ố

ấ

m chia h

ế

t cho

”;

“tr

ị

tuy

ệ

đố

i c

ủ

a hi

ệ

ố

ấ

m là s

ố

ẵ

n”.

ể

m tra theo th

ứ

ự

ộ

t lô hàng g

ồ

ả

n ph

ẩ

m. Các s

ả

n ph

ẩ

đề

u thu

ộ

c m

ộ

t trong

ạ

i: t

ố

t ho

ặ

c x

ấ

u. Kí hi

ệ

(

) là bi

ế

n c

ố

ỉ

ả

n ph

ẩ

m ki

ể

m tra th

ứ

thu

ộ

c lo

ạ

i x

ấ

u. Vi

ế

t b

ằ

ng kí hi

ệ

u các bi

ế

n c

ố

ướ

ây:

ả

n ph

ẩ

đề

u x

ấ

Có ít nh

ấ

ả

n ph

ẩ

m x

ấ

ả

n ph

ẩ

m ki

ể

m tra

đầ

u là t

ố

t, các s

ả

n ph

ẩ

m còn l

ạ

i là x

ấ

Các s

ả

n ph

ẩ

m ki

ể

m tra theo th

ứ

ự

ẵ

n là x

ấ

u, còn các s

ả

n ph

ẩ

m ki

ể

m tra theo th

ứ

ự

ẻ

là t

ố

Không gian bi

ế

n c

ố

ấ

p có bao nhiêu ph

ầ

n t

ử

ắ

n 3 viên

đạ

n vào m

ộ

t t

ấ

m bia. G

ọ

là bi

ế

n c

ố

: “viên

đạ

n th

ứ

trúng bia”, 3;1

là bi

ế

n c

ố

: “có

úng

viên

đạ

n trúng m

ộ

t t

ấ

m bia”,

là bi

ế

n c

ố

“có ít nh

ấ

viên

đạ

n trúng bia” và

là bi

ế

n c

ố

“c

ả

viên

đạ

n không trúng bia”. Hãy bi

ể

u di

ễ

n các bi

ế

ố

qua các

và

Chương I. Các khái niệm cơ bản trong lí thuyết xác suất.

ắ

n không h

ạ

n ch

ế

vào m

ộ

t m

ụ

c tiêu cho

đế

n khi có viên

đạ

n trúng m

ụ

c tiêu thì thôi

ắ

n. Gi

ả

ử

ỗ

i l

ầ

n b

ắ

n ch

ỉ

có

ả

ng trúng bia (g

ọ

i là bi

ế

n c

ố

) ho

ặ

c ch

ệ

ch bia

(bi

ế

n c

ố

Hãy mô t

ả

không gian bi

ế

n c

ố

ấ

Hãy nêu m

ộ

t h

ệ

đầ

đủ

các bi

ế

n c

ố

3. Định nghĩa xác suất.

3.1. Các định nghĩa xác suất.

3.1.1. Định nghĩa cổ điển.

Ta gọi các trường hợp đồng khả năng là các trường hợp mà khả năng xảy ra của

chúng là ngang bằng nhau.

Ta gọi một trường hợp là thuận lợi cho biến cố

nếu trường hợp này xảy ra thì

xảy ra.

Giả sử có tất cả

(

)

Ω

trường hợp đồng khả năng, trong số đó có

(

)

trường hợp

thuận lợi cho biến cố

Khi đó, ta gọi xác suất của biến cố

là

( )

(

)

( )

Ω

Như vậy, xác suất của biến cố là tỉ số về khả năng biến cố đó xuất hiện.

Ví dụ 3.1.

Gieo một lần con xúc xắc cân đối và đồng chất. Tìm xác suất để

a) Mặt trên của nó có

chấm.

b) Mặt trên của nó có số chấm là số chẵn.

Giải

a) Đặt

là biến cố “mặt trên của con xúc xắc có

chấm”,

6;1

Đặt

là biến cố “mặt trên của con xúc xắc có

chấm. Do con xúc xắc cân đối và

đồng chất nên khả năng xuất hiện các mặt

là như nhau và

(

)

Ω

và số khả năng thuận lợi cho

là

. Vậy xác suất cúa biến cố

là

( )

=AP

a) Đặt

là biến cố “mặt trên của con xúc xắc có số chấm là số chẵn”. Dễ thấy

{

}

321

;; BBBB

và số khả năng thuận lợi cho

là

. Vậy

( )

==BP

Ví dụ 3.2.

Một lớp học gồm

sinh viên trong đó có

nam và

−

nữ. Chọn ngẫu nhiên

sinh viên. Tìm xác suất để trong

sinh viên được chọn thì có đúng

sinh viên

nam

Giải

Bài giảng

Số cách chọn

sinh viên trong

sinh viên là

Số cách chọn được

sinh viên nam trong

sinh viên là

Số cách chọn được

sinh viên trong lớp trong đó có

sinh viên nam và

−

sinh

viên nữ là

ksk

−

Vậy, xác suất cần tìm là

( )

−

3.1.2. Định nghĩa hình học.

Giả sử tập hợp (vô hạn) các trường hợp đồng khả năng của một phép thử có thể biểu

thị bởi một miền

Ω

(chẳng hạn đoạn thẳng, mặt phẳng, không gian ba chiều v.v…)

còn tập hợp các kết quả thuận lợi cho cho biến cố

là một miền con

của

Ω

. Ta

lấy ngẫu nhiên một điểm trong miền

Ω

. Xác suất của biến cố

được xác định như

(

)

(độ đo của

)/(độ đo của

Ω

Nếu miền

Ω

là đường cong hay đoạn thẳng thì “độ đo” của

Ω

là độ dài của nó.

Nếu miền

Ω

là hình phẳng hay mặt cong thì “độ đo” của

Ω

là diện tích của nó.

Ví dụ 3.3.

Đường dây điện thoại ngầm nối một tổng đài đến một trạm dài

. Tính xác suất

để dây đứt tại nơi cách tổng đài không quá

100

biết rằng dây điện thoại đồng

chất.

Giải.

Do dây điện thoại là đồng chất nên khả năng nó bị đứt tại một điểm bất kì là như

nhau. Khi đó, tập hợp các trường hợp đồng khả năng có thể biểu thị bằng đoạn

thẳng nối tổng đài với trạm. Các trường hợp thuận lợi cho biến cố

“dây bị đứt tại

nơi cách tổng đài không quá

100

” là đoạn thẳng có độ dài

100

. Khi đó

( )

1000

100

==AP

Ví dụ 3.4.

Hai người bạn hẹn gặp nhau tại một địa điểm theo quy ước như sau:

Mỗi người độc lập đến điểm hẹn trong khoảng từ

giờ đến

giờ.

Mỗi người đến, nếu không gặp người kia thì đợi

phút hoặc đến

giờ không đợi

nữa.

Tính xác suất hai người gặp nhau, nếu biết rằng mỗi người có thể đến chỗ hẹn trong

khoảng thời gian quy định một cách ngẫu nhiên và không tùy thuộc vào người kia

đến lúc nào.

Giải

Chương I. Các khái niệm cơ bản trong lí thuyết xác suất.

Gọi

là thời điểm hai người này đến điểm hẹn,

1,0

≤

. Các trường

hợp đồng khả năng tương ứng với các điểm

(

)

yx;

tạo thành hình vuông có cạnh

bằng

, có diện tích (độ đo) bằng

Các trường hợp thuận lợi cho biến cố

(hai người gặp nhau) tương ứng với các

điểm

(

)

yx;

thỏa mãn

≤− yx

Dựa vào hình vẽ, ta có

Diện tích hình là













−

. Từ đó, ta có

( )

==AP

Ví dụ 3.5.

Tìm xác suất để điểm

rơi vào hình tròn nội tiếp hình vuông có cạnh

cm.

Giải

Hình tròn nội tiếp hình vuông có cạnh

có đường kính

Vậy diện tích hình tròn đó là

ππ

và diện tích hình vuông là

422 aaaS =×=

Khi đó, xác suất phải tìm là

( )

ππ

3.1.3. Định nghĩa thống kê.

Giả sử trong

phép thử với điều kiện như nhau, biến cố

xuất hiện

lần. Khi đó

ta gọi

( )

là tần suất xuất hiện biến cố

trong

phép thử. Khi

tăng lên

rất lớn, ta thấy rằng

(

)

dao động quanh một số

cố định và tiến dần về số

đó. Ta gọi xác suất của biến cố

là

(

)

(

)

AfpAP

+∞→

lim

3.2. Các định lí về xác suất.

3.2.1. Định lí cộng xác suất.

Định lí 3.1.

Nếu

là các biến cố đôi một xung khắc thì

(

)

(

)

(

)

APAPAAAP

121

Định lí 3.2.

Với các biến cố tùy ý

và

, ta có

(

)

(

)

(

)

(

)

ABPBPAPBAP

−

Chứng minh

⊂

nên

. Từ đó

(

)

ABAABBAAAABABA +=++=++=+

và

xung khắc nên

(

)

(

)

(

)

ABPAPBAP +=+

Tương tự, ta có:

Bài giảng

nên

(

)

(

)

(

)

ABPBAPBP +=

hay

(

)

(

)

(

)

ABPBPABP −=

Từ các điều kiện trên, ta suy ra:

(

)

(

)

(

)

(

)

ABPBPAPBAP

−

Áp dụng Định lí 3.2. và áp dụng nguyên lí quy nạp, ta có:

Định lí 3.3.

( ) ( )

kji

AAAPAAAPAAPAPAAAP

KLL

121

−

<<<=

−+−+−=+++

∑∑∑

Ví dụ 3.6.

Trong số

sinh viên của lớp có

sinh viên giỏi Toán,

sinh viên giỏi Anh và

học sinh giỏi cả Toán và Anh. Chọn ngẫu nhiên một sinh viên của lớp. Tính xác

suất để sinh viên này giỏi Toán hoặc giỏi Anh.

Giải

Gọi

và

lần lượt là biến cố sinh viên được chọn giỏi Toán và giỏi Anh.

Khi đó

là biến cố sinh viên được chọn giỏi Toán hoặc giỏi Anh. Áp dụng

Định lí 3.2., ta có:

( ) ( ) ( ) ( )

=−+=−+=+ ABPBPAPBAP

Ví dụ 3.7.

Xếp ngẫu nhiên

bức thư vào

phong bì đã ghi sẵn địa chỉ (mỗi phong bì chì có

thư). Tìm xác suất để có ít nhất

thư đến đúng địa chỉ.

Giải

Đặt

là biến cố “bức thư thứ

đến đúng người nhận”,

. Gọi

là biến cố

“ít nhất

lá thư đến đúng địa chỉ”. Khi đó, ta có:

AAAA

. Theo Định lí

3.3. ta suy ra

( ) ( )

( )

( ) ( )

( )

∑

∑∑

≤<<<≤

−

−=

−++−=+++

niii

iii

AAAP

AAAPAAPAPAAAP

KLL

121

Dễ thấy

(

)

(

)

AAAP

iii

−

vì các bức thư

đến đúng địa chỉ, còn

lại

−

khác có thể đến đúng người nhận hoặc không.

Ta có

( )

(

)

CAAAP

niii

iii

−

∑

≤<<<≤ L

Vậy

( ) ( )

∑

−

−=

Chương I. Các khái niệm cơ bản trong lí thuyết xác suất.

3.2.2. Xác suất có điều kiện.

Định nghĩa.

Cho hai biến cố

và

. Ta gọi xác suất của biến cố

khi biến cố

đã xảy ra

(

)

) là xác suất của

đối với điều kiện

. Kí hiệu:

(

)

BAP /

Người ta chứng minh được công thức

( )

(

)

( )

ABP

BAP =/

, trong đó

(

)

Chứng minh

Ta chứng minh cho trường hợp phép thử có

trường hợp cùng khả năng. Giả sử

trong

trường hợp này có

trường hợp thuận lợi cho

và

trường hợp thuận

lợi cho

. Vì

đã xảy ra nên số trường hợp cùng khả năng lúc này là

, và số

trường hợp thuận lợi cho

trong đó chính là số trường hợp thuận lợi cho

, tức

là

. Vì vậy

( )

ABP

BAP ==/

Chú ý.

Định nghĩa trên mang tính chất thuần túy toán học. Tuy nhiên trong trong thực tế, ta

có thể tính xác suất bằng trực giác.

3.2.3. Định lí nhân xác suất. Tính độc lập của các biến cố.

Định lí 3.4.

Nếu các biến cố tùy ý

và

cùng liên kết với một phép thử (

(

)

(

)

), thì

ta có:

(

)

(

)

(

)

(

)

(

)

BAPBPABPAPABP //

Áp dụng Định lí 3.4. và áp dụng nguyên lí quy nạp, ta có:

(

)

(

)

(

)

(

)

12112121

//.

−

nnn

AAAAPAAPAPAAAP

KKK

Bây giờ ta đưa điều kiện để xác suất của tích bằng tích các xác suất.

Hai biến cố

và

được gọi là độc lập nếu xác suất của biến cố này không phụ

thuộc vào sự xảy ra hay không xảy ra của biến cố kia, tức là:

(

)

(

)

APBAP

hoặc

(

)

(

)

BPABP

Chú ý rằng chỉ cần thỏa mãn một trong hai điều kiện này thì sẽ thỏa mãn điều kiện

kia.

Các biến cố

gọi là độc lập toàn thể nếu xác suất của mỗi biến cố

trong đó không phụ thuộc vào sự xảy ra hay không xảy ra của một tổ hợp bất kì của

các biến cố khác.

Định lí 3.5.

a) Nếu

và

độc lập thì

(

)

(

)

(

)

BPAPABP .

b) Nếu các biến cố

độc lập toàn thể thì

(

)

(

)

(

)

(

)

APAPAPAAAP

2121

Bài giảng

Tính chất

Nếu

và

là hai biến cố độc lập thì các cặp biến cố

và

độc lập.

và

độc lập.

và

độc lập.

Ví dụ 3.8.

Cho

hộp bi, mỗi hộp có

bi. Trong hộp thứ

có

bi đỏ và

−

bi xanh

(

3;1=i

). Lấy ngẫu nhiên mỗi hộp ra

bi.

a) Tính xác suất cả

bi lấy ra đều đỏ.

b) Tính xác suất trong

bi lấy ra có

đỏ và

xanh.

c) Biết trong

bi lấy ra có

đỏ và

xanh. Tính xác suất bi lấy ra từ hộp thứ

có

màu xanh.

Giải

Gọi

là biến cố “lấy ra từ hộp thứ

bi đỏ” (

3;1=i

). Dễ thấy

độc lập

toàn thể và

( )

=AP

( )

=AP

( )

=AP

a) Biến cố “cả

bi lấy ra đều đỏ” là

321

AAA

Ta có

( ) ( ) ( ) ( )

1000

321321

=== APAPAPAAAP

b) Biến cố “trong

bi lấy ra có

đỏ và

xanh” là

321321321

AAAAAAAAAB

++=

là tổng của các biến cố đôi một xung khắc nên

(

)

(

)

(

)

(

)

( ) ( )

( )

( ) ( ) ( )

( )

1000

321321321

=++=

++=

APAPAPAPAPAPAPAPAP

AAAPAAAPAAAPBP

c) Ta có:

(

)

32132132132122

AAAAAAAAAAAAABA

=++=

. Khi đó xác suất bi lấy ra từ

hộp thứ

có màu xanh là

( )

1000

3212

====

AAAP

BAP

Ví dụ 3.9.

Một lô hàng gồm

sản phẩm, trong đó có

phế phẩm. Lấy ngẫu nhiên từng sản

phẩm ra kiểm tra đến khi gặp đủ

phế phẩm thì dừng lại.

a) Tính xác suất dừng lại ở lần kiểm tra thứ

b) Tính xác suất dừng lại ở lần kiểm tra thứ

Chương I. Các khái niệm cơ bản trong lí thuyết xác suất.

c) Biết rằng đã dừng lại ở lần kiểm tra thứ

, tính xác suất ở lần kiểm tra thứ

gặp

phế phẩm.

Giải

Gọi

là biến cố “kiểm tra lần thứ

gặp phế phẩm” (

10;1=i

a) Biến cố “dừng lại ở lần kiểm tra thứ

” là

321

AAA

. Ta có

( ) ( ) ( ) ( )

120

/./.

213121321

=== AAAPAAPAPAAAP

b) Ta có biến cố “dừng lại ở lần kiểm tra thứ

” là

432143214321

AAAAAAAAAAAAF

++=

Ta có

(

)

(

)

(

)

(

)

(

)

120

/././.

32142131214321

=== AAAAPAAAPAAPAPAAAAP

Tương tự, ta có:

(

)

(

)

120

43214321

== AAAAPAAAAP

là tổng của các biến cố đôi một xung khắc nhau nên

( )

120

.3 ==FP

c) Ta cần tính

(

)

FAP

. Thật vậy, ta có

( )

( ) ( )

( )

120

432143212

AAAAPAAAAP

FAP

3.3. Công thức xác suất đầy đủ. Công thức Bayes.

Cho

là một nhóm đầy đủ các biến cố liên kết với một phép thử.

là

biến cố bất kì liên kết với phép thử đó, hay

xảy ra khi một trong các biến cố

xảy ra. Khi đó, ta có Định lí sau đây

Định lí 3.6.

a) Với mọi biến cố

, ta luôn có

(

)

(

)

(

)

(

)

(

)

AFPAPAFPAPFP /./.

Công thức này được gọi là công thức xác suất đầy đủ.

c) Với mỗi

(

nk ;1=

), ta có:

( )

(

)

(

)

( )

(

)

(

)

( ) ( )

∑

kkkk

AFPAP

FAP

/./.

Công thức này được gọi là công thức Bayes.

Chứng minh

a) Ta có

(

)

FAFAFAAAAFFF

Ω

2121

đôi một xung khắc nên

Bài giảng

(

)

(

)

(

)

(

)

( ) ( ) ( ) ( )

AFPAPAFPAP

FAPFAPFAPFP

/./.

++=

b) Dễ thấy rằng:

( )

(

)

( )

(

)

(

)

( )

AFPAP

FAP

kkk

/ ==

và ta suy ra điều phải chứng

minh.

Ví dụ 3.10.

Có

kiện hàng, mỗi kiện hàng có

sản phẩm. Trong số đố có

kiện hàng loại

, mỗi kiện hàng có

phế phẩm;

kiện loại

, mỗi kiện có

phế phẩm;

kiện

loại

III

, mỗi kiện có

phế phẩm. Lấy ngẫu nhiên một kiện, rồi từ kiện đó lấy ra

ngẫu nhiên một sản phẩm.

a) Tính xác suất sản phẩm lấy ra là phế phẩm.

b) Biết sản phẩm được lấy là phế phẩm. Tính xác suất kiện được lấy là loại

Giải

Gọi

là biến cố “lấy được sản phẩm loại

”,

IIIIIIi ,,

. Khi đó,

là

nhóm đầy đủ các biến cố. Gọi

là biến cố “sản phẩm được lấy từ kiện là phế

phẩm”.

a) Theo công thức xác suất đầy đủ, ta có

(

)

(

)

(

)

(

)

(

)

(

)

(

)

27,0

/././.

332211

=++=

AFPAPAFPAPAFPAPFP

b) Theo công thức Bayes, ta có

( )

( ) ( )

( )

200

====

AFPAP

FAP

Ví dụ 3.11.

Có

bình đựng bi, trong đó có

bình loại 1: mỗi bình đựng

bi đen và

bi đỏ,

một bình loại 2: mỗi bình đựng

bi đen và

bi đỏ. Bình loại 3: mỗi bình đựng

bi đen và

bi đỏ. Chọn ngẫu nhiên một bình và từ bình đó, chọn ngẫu nhiên một bi.

a) Tính xác suất để bi lấy ra là bi đen.

b) Biết bi lấy ra là bi đen. Tính xác suất để bình lấy ra là bình loại 3.

Giải

a) Gọi

là biến cố “bình chọn ra là bình loại

”,

là biến cố “bi chọn ra là bi

đen”.

Ta có

và

là nhóm đầy đủ các biến cố. Khi đó

Chương I. Các khái niệm cơ bản trong lí thuyết xác suất.

(

)

(

)

(

)

(

)

(

)

(

)

(

)

52,0

///

332211

=++=

AFPAPAFPAPAFPAPFP

b) Đây là xác suất có điều kiện

( )

( ) ( )

( )

52,0

===

AFPAP

FAP

3.4. Bài tập.

ộ

t lô hàng g

ồ

m có

150

ả

n ph

ẩ

m có ch

ứ

ế

ẩ

m. Ng

ườ

i ta dùng ph

ươ

ng pháp

ọ

n m

ẫ

để

ể

m tra lô hang và quy

ướ

c r

ằ

ng: Ki

ể

m tra l

ầ

n l

ượ

ả

n ph

ẩ

m, n

ế

u có ít

ấ

trong

ả

n ph

ẩ

ó là ph

ế

ẩ

m thì lo

ạ

i lô hàng. Tìm xác su

ấ

để

ấ

p nh

ậ

n lô

hàng.

ắ

n liên ti

ế

p vào m

ộ

t m

ụ

c tiêu cho

đế

n khi nào có

viên

đạ

đầ

u tiên trúng m

ụ

c tiêu

thì ng

ừ

ng b

ắ

n. Tìm xác su

ấ

t sao cho ph

ả

i b

ắ

đế

n viên

đạ

n th

ứ

ế

t r

ằ

ng xác su

ấ

trúng

ích c

ủ

a m

ỗ

i viên

đạ

n là

2,0

và các l

ầ

n b

ắ

n là

độ

c l

ậ

4. Dãy phép thử Bernoulli. Công thức Bernoulli.

4.1. Dãy phép thử Bernoulli.

Một dãy

phép thử gọi là một dãy

phép thử Bernoulli nếu thỏa mãn hai điều

kiện sau đây:

- Dãy

phép thử đó là độc lập với nhau.

- Trong mỗi phép thử xác suất của biến cố

mà ta quan tâm có xác suất

(

)

pAP

không đổi.

Xác suất

gọi là xác suất thành công, số lần

xuất hiện trong

phép thử gọi là

số lần thành công trong dãy

phép thử Bernoulli.

Kí hiệu:

(

)

(

)

pkPkP

là xác suất để có

lần thành công.

Định lí 4.1.

(

)

knkk

qpCpkP

−

nk ,1=

−

Chứng minh

Kí hiệu

là biến cố “phép thử thứ

thành công”,

ni ;1=

. Gọi

là biến cố “có

lần thành công” thì

là tổng của

biến cố đôi một xung khắc có dạng

nkk

iiiii

AAAAA KK

121 +

trong đó

{

}

{

}

niii

;;2;1;;;

Do tính độc lập nên ta có:

(

)

(

)

(

)

(

)

(

)

(

)

knk

iiiiiiiiii

qpAPAPAPAPAPAAAAAP

nkknkk

−

KKKK

121121

Từ đó, ta suy ra:

(

)

knkk

qpCpkP

−

(đpcm)

Ví dụ 4.1.

Một lô hàng trong kho có

%20

phế phẩm.

Bài giảng

a) Lấy ngẫu nhiên

sản phẩm. Tính xác suất trong

sản phẩm này.

i) Có

phế phẩm.

ii) Có ít nhất

phế phẩm.

b) Cần lấy ít nhất bao nhiêu sản phẩm để xác suất có ít nhất một phế phẩm không

nhỏ hơn

99,0

Giải

a) Số phế phẩm trong

sản phẩm lấy ra là số lần thành công trong dãy

phép thử

Bernoulli với xác suất thành công là

2,0

i) Ta có

(

)

(

)

(

)

2048.08,02,02,0;2

== CP

ii) Ta có

( ) ( ) ( ) ( )

67232,08,02,012.0;012,0;

=−=−==

∑

CPkPP

b) Gọi

là số sản phẩm cần lấy ra. Khi đó, xác suất có ít nhất một phế phẩm là

( ) ( ) ( )

PkPP 8,012,0;012,0;

−=−==

∑

Ta cần tìm

nhỏ nhất sao cho

(

)

99,08,01 ≥−

hay

64,20

8,0ln

01,0ln

=≥n

Vậy, ít nhất phải lấy ra

sản phẩm.

4.2. Số có khả năng nhất.

Trong dãy

phép thử Bernoulli, số

có xác suất

(

)

lớn nhất được gọi là số có

khả năng nhất.

Định lí 4.2.

Số có khả năng nhất bằng

−

nếu

−

nguyên; bằng

[

]

qnp

−

hoặc bằng

[

]

−

qnp

nếu

−

không nguyên.

Chứng minh

Ta có

(

)

knkk

qpCpkP

−

(

)

111

−−++

knkk

qpCpkP

Khi đó

(

)

( )

(

)

( )

pkn

qpC

pkP

knkk

111

−

−−++

Ta xét nhận xét sau:

(

)

( )

≥

−

pkn

hay

(

)

(

)

qkpkn 1

≥

−

hay

qnpk

−

≤

và

(

)

( )

−

pkn

hay

(

)

(

)

qkpkn 1

−

hay

qnpk

−

Khi đó, ta suy ra:

Xác suất

(

)

pkP

tăng khi

tăng từ

đến

−

và nó giàm khi

tiếp tục tăng từ

−

đến

. Vì

nhận giá trị nguyên nên ta có kết luận sau:

Chương I. Các khái niệm cơ bản trong lí thuyết xác suất.

- Nếu

−

nguyên thì xác suất

(

)

pkP

đạt giá trị lớn nhất tại hai giá trị của

là

qnpk

−

và

−

qnpk

(chú ý rằng

(

)

(

)

pkPpkP

- Nếu

−

không nguyên thì xác suất

(

)

pkP

đạt giá trị lớn nhất tại một giá trị

của

là

[

]

−

qnpk

, trong đó

[

]

qnp

−

là kí hiệu phần nguyên của

−

Ví dụ 4.2.

Giả sử tỉ lệ người dân tham gia giao thông ở thành phố M có hiểu biết về luật giao

thông là

%80

. Giả sử, ta chọn ngẫu nhiên

người tham gia giao thông trên

đường. Hãy tính xác suất trong các trường hợp sau:

a) Có

người hiểu biết luật giao thông.

b) Có

người không hiểu biết về luật giao thông.

c) Số người không hiểu biết về luật giao thông có khả năng nhất.

Giải

Việc chọn ngẫu nhiên

người là dãy phép thử Bernoulli, với

là biến cố “người

được chọn hiểu biết luật giao thông” và

(

)

8,0%80

a) Gọi

là biến cố “có

người hiểu biết luật giao thông”. Khi đó, ta có:

(

)

(

)

(

)

(

)

515

2020

2,0.8,08,0;15 CPAP ==

b) Gọi

là biến cố “có

người không hiểu biết luật giao thông”. Khi đó, ta có:

(

)

(

)

(

)

(

)

(

)

911

202020

2,0.8,02,0;98,0;920 CPPBP ==−=

c) Áp dụng Định lí 3.8, ta có:

(

)

(

)

(

)

(

)

2,32,012,0.201.20 =−−=−−=− HpHpqnp

không nguyên

Vậy, số người được chọn không hiểu biết luật giao thông là

[

]

−

qnpk

5. Bài tập chương.

Có

sinh viên. G

ọ

A là bi

ế

n c

ố

sinh viên th

ứ

là nam. Hãy vi

ế

t b

ằ

ng kí hi

ệ

u các

ế

n c

ố

ấ

t c

ả

sinh viên là nam.

Có ít nh

ấ

ộ

t sinh viên n

ữ

Có

úng

ộ

t sinh viên n

ữ

Có

úng

sinh viên là n

ữ

ọ

n ng

ẫ

u nhiên

công nhân trong s

ố

các công nhân có m

ặ

ở

xí nghi

ệ

p. G

ọ

là bi

ế

ố

ả

y ra khi ng

ườ

i công nhân

đượ

c ch

ọ

n là nam và

là bi

ế

n c

ố

ườ

i công nhân

đượ

ọ

ở

khu t

ậ

p th

ể

;

là bi

ế

n c

ố

ườ

i công nhân

đượ

c không hút thu

ố

c là.

Hãy mô t

ả

ế

n c

ố

CAB

ớ

ề

u ki

ệ

n nào ta có

ACBA =

Khi nào thì ta có AC = .

ứ

ng minh r

ằ

ng:

−

CCC +=

−

CCC

−

∑

( )

∑

( )

∑

−+

≤

CCC

222

Cho các ch

ữ

ố

. H

ỏ

i t

ừ

các ch

ữ

ố

này:

ậ

đượ

c bao nhiêu s

ố

có

ữ

ố

khác nhau trong

ó nh

ấ

t thi

ế

t ph

ả

i có m

ặ

t ch

ữ

ố

ậ

đượ

c bao nhiêu s

ố

có

ữ

ố

trong

ó ch

ữ

ố

có m

ặ

úng

ầ

n còn các ch

ữ

ố

khác có m

ặ

t không quá

ầ

Các s

ố

ậ

p thành m

ộ

t hang ngang. H

ỏ

i có m

ấ

y cách s

ắ

p x

ế

p sao cho:

Hai ch

ữ

ố

và

đứ

ng c

ạ

nh nhau.

Ba ch

ữ

ố

và

đứ

ng c

ạ

nh nhau.

Rút

lá bài t

ừ

ộ

bài có

lá. G

ọ

là bi

ế

n c

ố

“

đượ

lá c

”,

là bi

ế

n c

ố

“

đượ

lá

” và

là bi

ế

n c

ố

“

đượ

lá

đỏ

”.

Các c

ặ

p bi

ế

n c

ố

sau, c

ặ

p nào xung kh

ắ

và

Tính các xác su

ấ

(

)

BAP

(

)

CBP

và

(

)

CAP

Tính các xác su

ấ

(

)

ABP

(

)

BCP

và

(

)

ACP

ộ

t bàn dài g

ồ

dãy gh

ế

đố

i di

ệ

n nhau, m

ỗ

i dãy g

ồ

ế

. Ng

ườ

i ta mu

ố

n s

ắ

p x

ế

ỗ

ồ

i cho

sinh viên l

ớ

và

sinh viên l

ớ

vào bàn nói trên. H

ỏ

i có bao

nhiêu cách s

ắ

p x

ế

p trong m

ỗ

i tr

ườ

ng h

ợ

p sau:

ấ

t c

ứ

hai sinh viên nào ng

ồ

i c

ạ

nh nhau ho

ặ

đố

i di

ệ

n nhau thì khác l

ớ

p v

ớ

i nhau.

ấ

t c

ứ

hai sinh viên nào ng

ồ

đố

i di

ệ

n nhau thì khác l

ớ

p v

ớ

i nhau.

Có bao nhiêu cách s

ắ

p x

ế

ườ

i ng

ồ

i thành ngang sao cho

hai ng

ườ

ồ

ạ

nh nhau và

ườ

không ng

ồ

i c

ạ

nh nhau.

Có bao nhiêu ng

ườ

i tham gia vào cu

ộ

đấ

u c

ờ

, n

ế

u bi

ế

t r

ằ

ng cu

ộ

đấ

ó có t

ấ

t c

ả

ván c

ờ

và m

ỗ

đấ

u th

ủ

ả

đấ

u m

ớ

i m

ỗ

đấ

u th

ủ

khác m

ộ

t ván?

10.

Gieo

đồ

ng th

ờ

con xúc s

ắ

c. Tìm xác su

ấ

để

ổ

ng s

ố

ấ

m xu

ấ

t hi

ệ

n trên

con xúc s

ắ

c là 7 .

ổ

ng s

ố

ấ

m xu

ấ

t hi

ệ

n trên

con xúc s

ắ

c là 8.

Bài giảng

ổ

ng s

ố

ấ

m xu

ấ

t hi

ệ

n trên

con xúc s

ắ

c h

n kém nhau

11.

ỏ

ẫ

u nhiên

lá th

vào

phong bì

đề

đị

a ch

ỉ

ướ

c (m

ỗ

i phong bì ch

ỉ

ứ

úng m

ộ

t lá th

). Tìm xác su

ấ

để

ả

lá th

đề

úng ng

ườ

i nh

ậ

Lá th

ứ

ấ

úng ng

ườ

i nh

ậ

Lá th

ứ

ấ

t và lá th

ứ

hai

úng ng

ườ

i nh

ậ

12.

ế

p ng

ẫ

u nhiên

ườ

i lên

toa tàu

đượ

ánh s

ố

ỗ

i toa tàu có th

ể

ứ

a nhi

ề

ườ

i). Tìm xác su

ấ

t các bi

ế

n c

ố

ườ

i cùng lên m

ộ

t toa.

ườ

i lên

toa

đầ

ườ

i lên

toa khác nhau.

Hai ng

ườ

và

cùng lên toa

đầ

Hai ng

ườ

và

cùng lên m

ộ

t toa.

Hai ng

ườ

và

cùng lên m

ộ

t toa, ngoài ra không có ai khác lên toa này.

13.

Ba kh

ẩ

u súng

độ

c l

ậ

p cùng b

ắ

n vào m

ộ

t m

ụ

c tiêu. Xác su

ấ

để

ẩ

u th

ứ

ấ

t b

ắ

n trúng

là

7,0

đề

ẩ

u th

ứ

hai b

ắ

n trúng là

8,0

để

ẩ

u th

ứ

ba b

ắ

n trúng là

5,0

. M

ỗ

i kh

ẩ

u b

ắ

ộ

t viên. Tính xác su

ấ

để

Có

ẩ

u b

ắ

n trúng.

Có

ẩ

u b

ắ

n trúng.

ả

ẩ

u b

ắ

n tr

ậ

Ít nh

ấ

ẩ

u b

ắ

n trúng.

ẩ

u th

ứ

ấ

t b

ắ

n trúng bi

ế

t r

ằ

ã có

hai kh

ẩ

u b

ắ

n trúng.

14.

ộ

t h

ộ

đự

ng 15 qu

ả

bóng bàn trong

ó có 9 qu

ả

còn m

ớ

i. L

ầ

đầ

u ng

ườ

i ta l

ấ

y ng

ẫ

nhiên

ả

để

thi

đấ

u, sau

ó l

ạ

i tr

ả

vào h

ộ

p. L

ầ

ấ

y ng

ẫ

u nhiên

ả

. Tìm xác

ấ

để

ả

ấ

y ra l

ầ

n sau

đề

u m

ớ

15.

Có hai h

ộ

và

. H

ộ

đự

bi tr

ắ

ng và

en. H

ộ

đự

bi tr

ắ

ng và

en. L

ấ

y ng

ẫ

u nhiên

bi t

ừ

ộ

ỏ

sang h

ộ

ồ

i sau

ó rút ng

ẫ

u nhiên

bi t

ừ

ộ

. Tìm xác su

ấ

để

trong

bi l

ấ

y t

ừ

ộ

có

bi tr

ắ

ng.

16.

ộ

t h

ộ

p ch

ứ

ờ

vé s

ố

, trong

ó có

úng

ờ

vé s

ố

trúng th

ưở

ng.

ạ

n Tr

ườ

ng,

Đạ

ọ

c, Duy, Tân l

ầ

n l

ượ

t rút ng

ẫ

u nhiên m

ỗ

i ng

ườ

ờ

vé s

ố

. H

ỏ

i rút tr

ướ

c hay rút sau

có l

ợ

i h

n (xác su

ấ

đượ

c t

ờ

vé s

ố

trúng th

ưở

ng cao h

n)? Hãy t

ổ

ng quát bài toán này

cho

(

≥

) t

ờ

vé s

ố

mà ch

ỉ

có

úng

ờ

trúng th

ưở

ng.

17.

Trong m

ộ

t lô hàng g

ồ

m có

100

ả

n ph

ẩ

m, trong

ó có

ả

n ph

ẩ

m lo

ạ

i t

ố

t, l

ấ

y ng

ẫ

nhiên l

ầ

n l

ượ

ả

n ph

ẩ

m không tr

ả

ạ

i. Tìm xác su

ấ

để

ầ

n th

ứ

ấ

đượ

c s

ả

n ph

ẩ

m lo

ạ

i t

ố

ầ

n th

ứ

ấ

đượ

c s

ả

n ph

ẩ

m lo

ạ

i t

ố

ầ

đầ

u l

ấ

đượ

c s

ả

n ph

ẩ

m lo

ạ

i t

ố

18.

ộ

t s

ố

ệ

n tho

ạ

i có

ố

. Ng

ườ

i g

ọ

i quên ch

ữ

ố

i cùng nh

ng anh ta bi

ế

t r

ằ

ng s

ố

ó khác

, và anh ta quay s

ố

ó m

ộ

t cách ng

ẫ

u nhiên. Tìm xác su

ấ

để

anh ta th

ự

c hi

ệ

đượ

c cu

ộ

c liên l

ạ

c mà không ph

ả

i quay quá 3 l

ầ

19.

Trong gi

ờ

bài t

ậ

p, giáo viên cho m

ộ

t bài toán. L

ớ

p có 30 sinh viên nh

ng ch

ỉ

có 6 b

ạ

ả

đượ

c bài toán này. Giáo viên g

ọ

i ng

ẫ

u nhiên m

ộ

t sinh viên cho

đế

n khi có m

ộ

t sinh

viên gi

ả

đượ

c bài toán này. Tính xác su

ấ

t giáo viên g

ọ

đế

n sinh viên th

ứ

20.

ộ

t ng

ườ

i b

ắ

n l

ầ

n l

ượ

viên

đạ

n vào m

ộ

t t

ấ

m bia. Xác su

ấ

t trúng bia c

ủ

a viên

đạ

ứ

ấ

t là

8,0

và c

ủ

a viên

đạ

n th

ứ

hai là

6,0

Tìm xác su

ấ

để

có

úng

viên

đạ

n trúng

ích.

ế

t r

ằ

ng có

viên trúng

ích. Tìm xác su

ấ

để

ó là viên

đạ

n th

ứ

hai.

21.

ộ

t c

ử

a hàng bán m

ộ

t lo

ạ

i s

ả

n ph

ầ

m trong

ó có

%40

là do x

ưở

ả

n xu

ấ

t, còn l

ạ

do x

ưở

ả

n xu

ấ

t. T

ỉ

ệ

ả

n ph

ẩ

m lo

ạ

do x

ưở

ả

n xu

ấ

t là 8,0 và c

ủ

a x

ưở

ả

n xu

ấ

t là 9,0 .

Chương I. Các khái niệm cơ bản trong lí thuyết xác suất.

Mua ng

ẫ

u nhiên m

ộ

t s

ả

n ph

ẩ

m. Tìm xác su

ấ

để

mua

đượ

c s

ả

n ph

ẩ

m lo

ạ

Mua m

ộ

t s

ả

n ph

ẩ

m t

ừ

ử

a hàng và th

ấ

ó không ph

ả

i là s

ả

n ph

ẩ

m lo

ạ

. H

ỏ

i s

ả

ẩ

ó có kh

ả

ng do x

ưở

ng nào s

ả

n xu

ấ

t nhi

ề

u h

22.

ắ

viên

đạ

độ

c l

ậ

p vào m

ộ

t m

ụ

c tiêu. Xác su

ấ

t trúng

ích c

ủ

a m

ỗ

i viên t

ươ

ứ

là

3,0

;

4,0

;

5,0

. N

ế

u ch

ỉ

trúng thì m

ụ

c ti

ể

u b

ị

phá h

ủ

y v

i xác su

ấ

t là

2,0

. N

ế

u ít

ấ

viên trúng thì m

ụ

c tiêu ch

ắ

c ch

ắ

n b

ị

phá h

ủ

y. Hãy tìm xác su

ấ

để

ụ

c tiêu b

ị

phá h

ủ

y khi b

ắ

viên trên.

Đáp số và hướng dẫn.

AAA

, b)

AAA

nnn

AAAAAAAAA KKKK

212121

+++

nnnnn

AAAAAAAAAAAA

122132121

−−

+++ KKKK

CAB

là bi

ế

n c

ố

“ng

ườ

i công nhân

đượ

c ch

ọ

n là nam và

ở

trong khu t

ậ

p th

ể

không

hút thu

ố

c”.

b) Khi

⊂

thì

ACBA =

Dùng các công th

ứ

( )

knk

−

( )

∑

−

kknk

baCba

và

(

)

(

)

(

)

nnn

xxx

111 +=++

204

, b)

3720

(

)

!12

−

, b)

(

)

−

∅

≠

∅

≠

, b)

( )

BAP

( )

CAP =+

( ) ( ) ( ) ( )

BCPCPBPCBP

−+

=−+=+

(

)

ABP ,

( )

ACP =

( )

BCP =

( )

2. 6!

, b)

( )

2 . 6!

2.8! 2 .6!

−

10 5

C n

⇒

10.

, b)

, c)

11.

1 1

5! 120

, b)

1.4! 1

5! 5

, c)

1.1.3! 1

5! 20

12.

5 4

7 1

7 7

= , b)

, c)

, d)

= , e)

= , f)

6.7

13.

a) 22,0 , b) 47,0 , c) 03,0 , d) 97,0 , e)

14.

ọ

là bi

ế

n c

ố

“c

ả

3 qu

ả

bóng l

ấ

đượ

c l

ầ

n sau

đề

u m

ớ

i”. G

ọ

B là bi

ế

n c

ố

“trong

3” qu

ả

ấ

y ra thi

đấ

u có

ả

ớ

i”, 3;0=i . Khi

( ) ( ) ( )

∑

BAPBPAP

hay

( )

AP +++=

Bài giảng

15.

ươ

ng t

ự

bài 14, ta

đượ

( )

AP ++=

16.

Các xác su

ấ

t trúng th

ưở

ng c

ủ

ạ

n Tr

ườ

ng,

Đạ

i, H

ọ

c, Duy, Tân là nh

nhau và

đề

ằ

17.

ọ

A là bi

ế

n c

ố

“l

ầ

n th

ứ

ấ

đượ

c s

ả

n ph

ẩ

m lo

ạ

i t

ố

t”,

100;1=i

. Khi

Chú ý r

ằ

ng:

21212

AAAAA +=

nên

(

)

(

)

(

)

(

)

(

)

1211212

/./. AAPAPAAPAPAP +=

321321321321

. AAAAAAAAAAAAA +++=

ễ

ấ

( )

330

100

AAP

18.

ọ

là bi

ế

n c

ố

“g

ọ

úng

đượ

c s

ố

i cùng” và

A là bi

ế

n c

ố

“g

ọ

úng

đượ

c s

ố

i cùng

ở

ầ

n th

ứ

”, 3;1=i . Khi

321211

... AAAAAAA ++=

và chú ý r

ằ

ng:

(

)

(

)

(

)

(

)

(

)

(

)

(

)

.///

213121

1211

=++=

−++= AAAPAAPAPAAPAPAPAP

19. Gọi

A là biến cố “sinh viên được gọi lần thứ

giải được bài toán”, 30;1=i .

Ta có:

(

)

(

)

(

)

(

)

(

)

(

)

///

32142131214321

== AAAAPAAAPAAPAPAAAAPAP

20. Gọi

là biến cố “có đúng

viên trúng đích”.

A là biến cố “viên đạn thứ

trúng

đích”, 2;1=i .

2121

AAAAA +=

. Từ đó suy ra

(

)

44,0

( )

(

)

(

)

( )

44,0

12,0

2121

AAAPAAP

AAAP

21. Gọi

là biến cố “Sản phẩm mua được loại

”.

lần lượt là biến cố “Sản phẩm

mua được do xưởng

sản xuất”, “Sản phẩm mua được do xưởng

sản xuất”.

a) Ta có:

(

)

(

)

(

)

(

)

(

)

9,0%.608,0%.40/./.

QMPQPNMPNPMP .

b) Ta có:

(

)

/ =NMP

và

(

)

/ =QMP

22. Gọi

là biến cố “mục tiêu bị phá hủy”.

B là biến cố “có

viên đạn bắn trúng mục

tiêu”, 3;1=i .

C là biến cố “viên đạn thứ

bắn trúng mục tiêu”, 3;1=j .

Ta có:

( ) ( ) ( )

438,0/

∑

BAPBPAP

trong đó

(

)

2,0/

BAP

(

)

(

)

1//

BAPBAP

và

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

3213213211

...... CPCPCPCPCPCPCPCPCPBP ++=

. Tương tự, ta

tính được

(

)

(

)

BP .

C. Phương pháp giảng dạy.

- Vấn đáp và làm bài tập.

Chương I. Các khái niệm cơ bản trong lí thuyết xác suất.

- Đưa ra các ví dụ thường gặp trong thực tiễn để tạo động cơ và hướng đích tạo nên hứng thú

học tập cho sinh viên.

- Kiểm tra, đánh giá việc làm bài tập của SV.

- Gợi mở từ trực quan sinh động đến tư duy trừu tượng giải quyết vấn đề.

- Phối hợp phương pháp thuyết trình và vấn đáp giải quyết vấn đề và làm bài tập.

- Yêu cầu SV đọc bài giảng trước khi lên lớp.

- Kiểm tra, đánh giá việc làm bài tập của SV.

- Sử dụng phương tiện dạy học hiện đại như Mic, Projector.

D. Tài liệu tham khảo

[1] Đậu Thế Cấp, Xác suất thống kê: Lí thuyết và các bài tập (Chương 1), NXB

Giáo dục, 2006.

[2] Đinh Văn Gắng, Bài tập xác suất và thống kê (Chương 1), NXB Giáo dục,

2007.

[3] PGS. TS. Phạm Xuân Kiều, Giáo Trình xác suất và thống kê (Chương 1), NXB

Giáo dục, 2005.

[4] Đặng Công Hanh, Đặng Ngọc Dục, Giáo trình Lý thuyết xác suất và Thống kê

toán (Chương 1), trường Đại học Duy Tân, 1996.

Chương II.

Đại lượng ngẫu nhiên. Hàm phân phối xác

suất.

A. Mục tiêu.

- Giới thiệu biến ngẫu nhiên và hàm phân phối xác suất.: biến ngẫu nhiên rời rạc cùng

với bảng phân phối xác suất của nó, biến ngẫu nhiên liên tục cùng với hàm mật độ của

nó.

- Nắm các đặc trưng của biến ngẫu nhiên: kì vọng, phương sai, Mod, Med,… và hiểu được ý

nghĩa của chúng.

B. Nội dung.

1. Khái niệm. Phân loại đại lượng ngẫu nhiên.

Định nghĩa.

Cho một phép thử và

Ω

là không gian các biến cố sơ cấp của nó. Một ánh xạ từ

R→Ω

hay một quy tắc cho tương ứng mỗi kết quả của phép thử với mỗi một số

thực nào đó được gọi là một đại lượng ngẫu nhiên (biến ngẫu nhiên) liên kết với phép

thử nào đó.

Ta thường kí hiệu đại lượng ngẫu nhiên bằng chữ in hoa

Giá trị của nó

được kí hiệu bằng chữ in thường

Ví dụ 1.1.

là số con gái trong một lần sinh (

con).

là đại lượng ngẫu nhiên. Giá trị của

nó có thể nhận là

là số viên đạn trúng đích khi bắn liên tiếp

viên đạn độc lập vào một mục tiêu.

Giá trị của nó có thể nhận là

là số sản phẩm tốt trong

sản phẩm được chọn ngẫu nhiên từ lô sản phẩm có

100

sản phẩm tốt và

phế phẩm.

cũng là đại lượng ngẫu nhiên. Giá trị của nó có

thể nhận là

là số lần tung một đồng tiền cho đến khi được mặt ngửa thì dừng. Khi đó

là

đại lượng ngẫu nhiên và giá trị của nó có thể nhận là

là độ cao của một cây tại thời gian

nào đó.

là đại lượng ngẫu nhiên.

Bài giảng

Trong ví dụ này, xét a):

là số con gái trong

lần sinh con. Ta thấy

thỏa mãn

định nghĩa đại lượng ngẫu nhiên ở trên. Thật vậy, ta có không gian đại lượng cố sơ cấp

là

{

}

GT;

Ω

, và

có thể nhận

giá trị

hoặc

Với mỗi

∈

, ta sẽ chứng minh tập hợp

{

}

là biến cố ngẫu nhiên.

Dễ dàng ta có:

{ } { }











>Ω

≤<

≤∅

10,

. Ba tập

∅

{

}

và

Ω

đều là biến cố ngẫu

nhiên. Vậy

{

}

là biến cố ngẫu nhiên.

Ta quan tâm nghiên cứu đến hai loại đại lượng: đại lượng ngẫu nhiên rời rạc và đại

lượng ngẫu nhiên liên tục.

1.1. Đại lượng ngẫu nhiên rời rạc.

Định nghĩa:

Đại lượng ngẫu nhiên rời rạc là đại lượng ngẫu nhiên mà các giá trị có thể nhận của nó

là tập hợp hữu hạn hoặc vô hạn đếm được. Trong Ví dụ 1.1. Các ví dụ a), b), c), d) đều

là đại lượng ngẫu nhiên rời rạc.

1.2. Đại lượng ngẫu nhiên liên tục.

Định nghĩa.

Đại lượng ngẫu nhiên liên tục là đại lượng ngẫu nhiên mà các giá trị có thể nhận của

nó là lấp đầy khoảng

(

)

ba;

(hoặc đoạn

[

]

ba;

) nào đó,

có thể bằng

∞

−

có thể

bằng

∞

1.3. Hàm phân phối của đại lượng ngẫu nhiên.

Ta nhận thấy tập hợp

{

}

∈

thay đổi nếu

thay đổi. Do đó

{

}

(

)

cũng

thay đổi, tức là xác suất này phụ thuộc vào

. Nó là hàm của

Định nghĩa.

Cho

là đại lượng ngẫu nhiên. Ánh xạ

[

]

1;0: →RF

xác định bởi

[

]

( ) ( )

xXPxFx

<=→

→ 1;0:

được gọi là hàm phân phối xác suất của đại lượng ngẫu nhiên

Ví dụ 1.2.

Tìm hàm phân phối của đại lượng ngẫu nhiên

chỉ số lần xuất hiện mặt sấp khi gieo

một đồng tiền cân đối và đồng chất.

Giải

Không gian biến cố sơ cấp tương ứng với phép thử “gieo đồng tiền” là

{

}

NS;

Ω

. Vì

có thể nhận

giá trị

hoặc

Chương II. Đại lượng ngẫu nhiên. Hàm phân phối xác suất

Vì vậy:

{ } { }











>Ω

≤<

≤∅

10,

Khi đó, hàm phân phối của đại lượng ngẫu nhiên

là:

( ) ( )

(

)

{ }( )

( )











>Ω

≤<

≤∅

=<=

10,

xSP

xXPxF

hay

( )











≤<

≤

1,1

10,

0,0

Các tính chất của hàm phân phối

a) Hàm phân phối

(

)

là hàm không giảm.

(

)

(

)

(

)

aFbFbXaP

−

≤

(

)

(

)

(

)

aFbFaXP

−

→

lim

(

)

∞

−

và

(

)

∞

Nhận xét.

Từ a) và d), ta có

(

)

≤

. Tính chất a) và d) được gọi là tính chất đặc trưng của

hàm phân phối xác suất. Một hàm

(

)

xác định trên

có tính chất a) và d) đều là

phân phối xác suất của một đại lượng ngẫu nhiên nào đó

Ví dụ 1.3.

Cho hàm số

( )

arctan

+= xxF

Chứng minh rằng

(

)

là hàm phân phối xác suất của đại lượng ngẫu nhiên.

Giải.

( )

nên

(

)

tăng.

Mặt khác

( )

arctan

limlim =+













−=













−∞→−∞→

ππ

xxF

và

( )

arctan

limlim =+

























+∞→+∞→

ππ

xxF

nên

(

)

là hàm phân phối xác suất của đại lượng ngẫu nhiên (đpcm).

2. Đại lượng ngẫu nhiên rời rạc

2.1. Bảng phân phối xác suất.

Giả sử

là đại lượng ngẫu nhiên rời rạc. Nó nhận các giá trị

có thể

với các xác suất tương ứng là

(

)

≥

pxXP

Ta lập bảng sau đây

Bài giảng

…

(

)

xXP

…

Với

∑

. Bảng này có thể vô hạn khi

nhận giá trị

∞

Bảng trên được gọi là bảng phân phối xác suất của đại lượng ngẫu nhiên

2.2. Hàm phân phối xác suất.

Nếu ta sắp xếp các giá trị

theo thứ tự tăng dần, ví dụ

xxx

thì hàm phân phối của

có thể viết dưới dạng:

( )











≤<+++

≤<+

≤<

≤

−−

nnn

xxxppp

xxxpp

xxxp

1121

3221

211

KKK

Nếu các giá trị ở vị trí bất kì thì ta có thể viết hàm phân phối dưới dạng:

(

)

∑

pxF

∈

Ví dụ 2.1.

Trong một lô hàng gồm có

sản phẩm tốt và

sản phẩm xấu. Lấy ngẫu nhiên

sản

phẩm. Gọi

số sản phẩm xấu lấy được.

Lập bảng phân phối xác suất của

. Viết hàm phân phối của

và tính xác suất

(

)

≤

Giải

Lấy ngẫu nhiên

sản phẩm thì với

là số sản phẩm tốt lấy được, ta có

có thể

nhận các giá trị là

Ta có:

( )

210

===

( )

===

( )

===

( )

===

( )

===

Từ đó, ta có bảng phân phối xác suất như sau:

210

Từ đó, ta có hàm phân phối xác suất là

Chương II. Đại lượng ngẫu nhiên. Hàm phân phối xác suất

( )











≤<

≤

4,1

43,

32,

21,

10,

210

0,0

Khi đó, ta có

( ) ( ) ( )

0330 =−=−=<≤ FFXP

hoặc ta có thể tính như sau

( ) ( ) ( ) ( )

21030 ==+=+==<≤ XPXPXPXP

Ví dụ 2.2.

Bắn liên tiếp

viên đạn độc lập vào một mục tiêu. Xác suất trúng đích của mỗi viên

đạn là

5,0

. Gọi

là số viên đạn trúng đích trong

viên. Tìm hàm phân phối xác suất

của

. Viết hàm phân phối của

. Tính xác suất

(

)

≥

Giải

Ta xem việc bắn

viên đạn độc lập vào một mục tiêu là tiến hành dãy

phép thử

Bernoulli. Xác suất bắn trúng đích của mỗi viên đạn là

Theo công thức xác suất, ta có:

( )

CkXP

−













−













3;0=k

hay

( )













CkXP

3;0=k

, là phân phối xác suất của

. Ta có thể viết dưới dạng

bảng sau:

Hàm phân phối của

là

Bài giảng

( )











≤<

≤

3,1

32,

21,

10,

0,0

Xác suất

( ) ( ) ( )

101111 =−=−=<−=≥ PXPXP

Ví dụ 2.3.

Trong một lô hàng gồm có

máy vi tính mới thì có

chiếc bị lỗi, lấy ngẫu nhiên

máy trong

máy tính này. Gọi

là số máy tính bị lỗi trong

máy lấy ra. Hãy:

a) Lập bảng phân phối xác suất của

b) Khi lấy

máy thì có mấy máy bị lỗi là có khả năng xảy ra cao nhất.

c) Tìm xác suất khi lấy ra

máy sẽ có ít nhất một máy bị lỗi.

d) Nếu người nào đó lấy ngẫu nhiên ra

máy tính để kiểm tra thấy không có máy nào

bị lỗi thì sẽ chấp nhận cả lô hàng. Tìm xác suất người mua chấp nhận lô hàng và xác

suất người mua bác bỏ lô hàng.

Giải.

a) Ta có

{

}

3;2;1;0

∈

( )

XP ==

( )

XP ==

( )

XP ==

( )

XP ==

Từ đó ta có bảng phân phối

(

)

xXP

b) Dựa vào bảng xác suất, ta có

( )

5,0

===

là cao nhất nên trong

máy

tính lấy ra thì bị

máy tính bị lỗi là có khả năng cao nhất.

( ) ( )

833,0167,01

1011

=−=−=−=≥

PXP

2917,0

là xác suất để người mua chấp nhận lô hàng. Xác suất để người

mua bác bỏ lô hàng là

7083,02917,011

−

Chương II. Đại lượng ngẫu nhiên. Hàm phân phối xác suất

2.3. Phép toán đại lượng ngẫu nhiên.

Cho

và

là các đại lượng ngẫu nhiên có bảng phân phối xác suất

…

(

)

xXP

…

và

…

(

)

yYP

…

Kí hiệu:

(

)

jiij

yYxXPp === ;

để cho ĐLNN

nhận giá trị

và ĐLNN

nhận giá

trị

. Giả sử

là các giá trị khác nhau của tổng

, đặt

∑

kji

zyx

ijk

Ta gọi tổng của

và

là đại lượng ngẫu nhiên

có bảng phân phối xác suất là

…

(

)

zYXP

…

Tương tự, giả sử

là các giá trị khác nhau của tích

yx .

, đặt

∑

∗

kji

zyx

ijk

Ta gọi tích của

và

là đại lượng ngẫu nhiên

YX.

(hoặc

) có bảng phân phối

xác suất là

YX.

…

(

)

zYXP

∗

…

∗

…

Đại lượng ngẫu nhiên

và

gọi là độc lập nếu

(

)

jijiij

qpyYxXPp ====

;

Ví dụ 2.4.

Cho

và

độc lập có bảng phân phối xác suất

(

)

xXP

2,0

3,0

5,0

và

−

(

)

yyP

4,0

3,0

Tìm phân phối xác suất của

Giải

Bài giảng

Theo định nghĩa, ta có:

(

)

(

)

(

)

(

)

08,04.0.2,01.01;043

−

YPXPYXPYXP

(

)

(

)

(

)

( ) ( ) ( ) ( )

18,04,0.3,03,0.2,0

1.10.0

1;10;033

=+=

−==+===

−

YPXPYPXP

YXPYXPYXP

Tương tự,

(

)

(

)

(

)

(

)

1;20;11;023

−

YXPYXPYXPYXP

(

)

(

)

(

)

0;21;113

−

YXPYXPYXP

và

(

)

(

)

1;203

−

YXPYXP

Khi đó, ta có bảng phân phối của đại lượng

−

là

−

(

)

zYXP

−

08,0

18,0

35,0

24,0

15,0

Tương tự, ta có bảng phân phối của

là

YX.

−

(

)

zYXP

20,0

12,0

44,0

09,0

15,0

3. Đại lượng ngẫu nhiên liên tục.

Định nghĩa.

Đại lượng ngẫu nhiên liên tục

có

(

)

là hàm phân phối xác suất của nó. Nếu tồn

tại hàm số

(

)

xác định và không âm trên

sao cho

( ) ( )

∫

∞−

dttfxF

thì hàm số

(

)

được gọi là hàm mật độ của

(

)

chính là diện tích giới hạn bởi đường cong của hàm mật độ

(

)

và phần trục

hoành bên trái điểm

Ví dụ 3.1.

( )

∫

∞−

−

dtexF

được gọi là hàm phân phối chuẩn. Đó là diện tích giới hạn bởi

đường cong

( )

exf

−

và trục hoành bên trái

Từ tính chất của hàm phân phối, ta suy ra tính chất của hàm mật độ là

(

)

≥

( ) ( )

∫

∞−

dttfxF

Chương II. Đại lượng ngẫu nhiên. Hàm phân phối xác suất

( )

∫

+∞

∞−

dxxf

vì

(

)

∞

−

và

(

)

∞

( ) ( )

∫

=<≤

dxxfbXaP

. Thật vậy

( ) ( ) ( ) ( ) ( ) ( )

∫∫∫

=−=−=<≤

∞−∞−

dxxfdxxfdxxfaFbFbXaP

Ví dụ 3.2.

Giả sử hàm phân phối của đại lượng ngẫu nhiên là

( )

arctan

+= xxF

. Tìm hàm mật

độ của

và tính xác suất

(

)

≤

−

Giải.

Ta có hàm mật độ

( ) ( )

( )

xFxf

và xác suất

( ) ( ) ( )

1111

























−−=−−=<≤−

ππ

FFXP

Định lí.

Nếu hàm phân phối

(

)

của đại lượng ngẫu nhiên

liên tục tại

thì

(

)

axP

Chứng minh

(

)

(

)

(

)

aFbFbXaP

−

≤

và liên tục tại

nên cho

→ ab

, ta có

(

)

(

)

(

)

(

)

(

)

0lim

−

→

aFaFaFbFaxP

Nhận xét.

Theo Định lí, nếu

(

)

liên tục tại

và

thì

(

)

(

)

(

)

(

)

bXaPbxaPbXaPbXaP

≤

Ví dụ 3.3.

Giả sử hàm mật độ của đại lượng ngẫu nhiên

là

( )







≤

−

0,0

0;0,

xMe

Tìm

. Tìm hàm phân phối của

Giải

Theo tính chất của hàm mật độ, ta có:

( )

∫

+∞

∞−

dxxf

Dễ thấy

( )

λλ

eMMedxdxxf













−=+=

+∞

−

+∞

−

∞−

+∞

∞−

∫∫∫

Vậy

Bài giảng

Ta có hàm phân phối

(

)

được xác định như sau:

+ Nếu

thì

( ) ( )

0==

∫

∞−

dxxfxF

+ Nếu

≥

thì

( ) ( ) ( ) ( )

edxedxxfdxxfdxxfxF

λλ

−−

∞−∞−

−=+=+==

∫∫∫∫

Vậy

( )







≥−

−

0,1

0,0

4. Các đặc trưng của đại lượng ngẫu nhiên.

4.1. Kì vọng.

Định nghĩa.

Kì vọng của đại lượng ngẫu nhiên

, kí hiệu là:

(

)

xác định bởi:

+ Nếu

là đại lượng ngẫu nhiên rời rạc có bảng phân phối xác suất

…

(

)

xXP

…

thì

( )

∑

+∞

=++++=

2211

iinn

pxpxpxpxXE

Trong trường hợp có vô hạn

thì ta nói

có kì vọng và

(

)

là kì vọng của nó nếu

chuỗi

∑

+∞

=1i

hội tụ tuyệt đối.

+ Nếu

là đại lượng ngẫu nhiên liên tục có hàm mật độ xác suất

(

)

thì

( ) ( )

∫

+∞

∞−

= dxxxfXE

Ý nghĩa của kì vọng.

Kì vọng của đại lượng ngẫu nhiên là trung bình theo xác suất các giá trị có thể nhận

của đại lượng ngẫu nhiên đó.

Tính chất

Với mọi đại lượng ngẫu nhiên

, ta có:

(

)

CCE

với

là đại lượng ngẫu nhiên hằng số.

(

)

(

)

(

)

YEXEYXE

(

)

(

)

XEXE .

là một số.

(

)

(

)

(

)

YEXEXYE .

nếu

và

độc lập.

Chương II. Đại lượng ngẫu nhiên. Hàm phân phối xác suất

Ví dụ 4.1.

Nghiên cứu về điểm thi môn Toán của

400

sinh viên một trường Đại học, ta được

bảng số liệu như sau

Điểm

Số sinh

viên

160

100

Gọi

là số điểm môn Toán của sinh viên một trường Đại học.

a) Tính

(

)

b) Tính tổng số điểm môn Toán của

400

sinh viên. Như vậy, điểm trung bình môn

Toán của một sinh viên là bao nhiêu? So sánh giá trị đó với

(

)

Giải

a) Ta lập bảng phân phối xác suất như sau

(Điểm)

(

)

xXP

Khi đó, ta có

( )

400

1960

.2 =+++++=XE

b) Ta có tổng số điểm môn Toán của

400

sinh viên là

196030.840.7100.6160.460.310.2

Suy ra điểm trung bình môn Toán của một sinh viên là

400

1960

Dễ thấy

( )

400

1960

=XE

. Khi đó,

(

)

là điểm trung bình môn Toán của sinh viên.

Như vậy, ta suy ra kì vọng của một đại lượng ngẫu nhiên

là giá trị trung bình của

đại lượng ngẫu nhiên đó.

Ví dụ 4.2.

Trong một cuộc thi vấn đáp, có hai hình thức thi như sau:

+ Hình thức thi thứ nhất là mỗi người phải trả lời 2 câu hỏi, mỗi câu trả lời đúng thì

được 5 điểm.

+ Hình thức thi thứ hai là nếu trả lời đúng câu thứ nhất thì mới được trả lời câu thứ hai.

Câu thứ nhất trả lời đúng được 5 điểm, câu thứ hai trả lời đúng được 10 điểm.

Trong cả hai hình thức thi này, các câu trả lời sai đều không được điểm. Giả sử xác

suất trả lời đúng mỗi câu là

và việc trả lời mỗi câu là độc lập với nhau. Theo bạn,

nên chọn hình thức nào để số điểm trung bình đạt được nhiều hơn.

Giải.

Bài giảng

Gọi

là biến cố “trả lời đúng câu hỏi thứ

”,

2;1=i

. Ta có:

( ) ( )

== APAP

Gọi

là số điểm đạt được tương ứng với hai hình thức thi trên. Theo yêu cầu bài

toán, ta cần so sánh

(

)

và

(

)

Ta có bảng phân phối xác suất của

như sau

(

)

xXP

Khi đó, điểm trung bình trong hình thức thi thứ nhất là

(

)

5,7

Ta có bảng phân phối xác suất của

là

(

)

xXP

Khi đó, điểm trung bình trong hình thức thi thứ hai là

(

)

375,9

Vậy, ta có

(

)

(

)

XEXE

nên chọn hình thức thi thứ hai.

4.2. Phương sai.

Định nghĩa.

Cho

là một đại lượng ngẫu nhiên có kì vọng

(

)

. Khi đó, ta gọi phương sai của

là kì vọng của bình phương độ sai khác giữa

và

(

)

, kí hiệu là

(

)

Vậy

(

)

(

)

(

)

(

)

(

)

XEXEXEXEXD

−=−=

Ý nghĩa của phương sai.

Phương sai là trung bình của bình phương sai số giữa

và

. Như vậy, phương

sai càng nhỏ thì các giá trị của

càng tập trung quanh

(

)

≥

nên ta định nghĩa độ lệch chuẩn của đại lượng ngẫu nhiên

như sau

Định nghĩa.

Độ lệch chuẩn của đại lượng ngẫu nhiên

là

(

)

(

)

XDX

Độ lệch chuẩn được dùng thường xuyên hơn phương sai do có cùng đơn vị đo với đại

lượng ngẫu nhiên

Tính chất.

Với mọi đại lượng ngẫu nhiên

, ta có:

(

)

≥

(

)

⇔

là đại lượng ngẫu nhiên hằng số.

(

)

với

là đại lượng ngẫu nhiên hằng số.

(

)

(

)

XDXD

λλ

là một số.

Chương II. Đại lượng ngẫu nhiên. Hàm phân phối xác suất

(

)

(

)

XDXD

là một số.

(

)

(

)

(

)

XEXEXD

−=

(

)

(

)

(

)

YDXDYXD

nếu

và

độc lập.

Ví dụ 4.3.

Điểm các môn Toán cao cấp

, Xác suất thống kê (XSTK) và Kinh tế lượng

(KTL) của hai sinh viên An và Bình được cho theo bảng sau

Môn

TCC

XSTK KTL

Điểm của

Bình

Gọi

lần lượt là điểm môn Toán của bạn An và Bình.

a) Hãy tính

(

)

(

)

và so sánh

(

)

(

)

b) Tính

(

)

(

)

. So sánh các giá trị này.

Giải

a) Ta có

( )

59867

=XE

( )

1105109

=YE

Vậy

(

)

(

)

YEXE

b) Ta có

( )

59867

22222

++++

=XE

Khi đó

(

)

(

)

(

)

6755

222

=−=−= XEXEXD

( )

307

1105109

22222

++++

Khi đó

( )

(

)

( )

4,127

307

222

=−=−= YEYEYD

. Vậy

(

)

(

)

XDYD

Ta thấy rằng An và Bình cùng có điểm trung bình các môn Toán, tuy nhiên An là “học

đều” hơn Bình.

4.3. Mốt, trung vị và moment trung tâm.

a) M

ố

t (mod).

Định nghĩa.

Mốt là giá trị của đại lượng ngẫu nhiên

được kí hiệu là

(

)

XMod

mà tại đó hàm mật

độ

(

)

đạt giá trị lớn nhất.

Bài giảng

Trường hợp

là đại lượng ngẫu nhiên rời rạc,

(

)

XMod

là giá trị của

mà tại đó xác

suất

(

)

(

)

XModXP

là lớn nhất.

Mốt của

còn gọi là số có khả năng nhất.

Chú ý.

a) Mốt có thể không tồn tại và khi nó tồn tại không nhất thiết là giá trị duy nhất.

b) Mốt không phải luôn luôn tồn tại, chẳng hạn khi tất cả các số liệu trong mẫu có số

lần xuất hiện bằng nhau.

Ví dụ 4.4.

Cho đại lượng ngẫu nhiên

có bảng phân phối

(

)

xXP

Ta có

(

)

XMod

vì

( )

1 ==XP

là xác suất lớn nhất.

Ví dụ 4.5.

Cho

là đại lượng ngẫu nhiên có hàm mật độ

( )











≤

−

0,0

. Hãy xác định

(

)

XMod

Giải

Ta có:

(

)

≤

∀

( )

−

∀

Ta có

( )













−=−=

−−−

222

exf

xxx

Khi đó

(

)

⇔

2−=x

hoặc

2=x

. Do

nên

2=x

Dựa vào bảng biến thiên, ta được

( )

−

=≤ efxf

Vậy

(

)

2=XMod

b) Phân v

ị

Điểm

được gọi là phân vị với xác suất

của đại lượng ngẫu nhiên

nếu

(

)

xXP

(hoặc

(

)

xXP

Hiển nhiên

(

)

(

)

−

≤

xXPxXP

Chương II. Đại lượng ngẫu nhiên. Hàm phân phối xác suất

Trong bài giảng này, chúng ta dùng phân vị

(

)

xXP

Nếu

thì điểm

này được gọi là trung vị của

. Khi đó, ta xác định như sau

c) Trung v

ị

(median).

Định nghĩa.

Cho

là một đại lượng ngẫu nhiên. Số

gọi là trung vị của

, kí hiệu

(

)

XMed

nếu

( )( ) ( )( )











≥=≤

≤=<

XMedFXMedXP

)1(

hoặc

( )( )











≥>

≤<

XMedXP

)2(

* Nếu

là đại lượng ngẫu nhiên rời rạc

(

)

XMed

là giá trị

sao cho

( ) ( ) ( )











≥=++=+=

≤=++=+=

−

121

xXPxXPxXP

, trong đó

xxx

≤

* Nếu

là đại lượng ngẫu nhiên liên tục thì

(

)

XMed

thỏa

( )( )

=XMedF

Ví dụ 4.6.

Cho hàm phân phối của đại lượng ngẫu nhiên

là

( )











≤<

≤

1,1

10,

0,0

Ta có

( )

=xF

suy ra

( )

=XMed

Ví dụ 4.7.

Cho đại lượng ngẫu nhiên

có bảng phân phối

(

)

xXP

Ta có

( )

1 ≤=<XP

và

( )

1 >=≤XP

nên

(

)

XMed

Chú ý.

Theo định nghĩa trên thì

có thể có một hoặc nhiều trung vị. Nếu có

cùng

thỏa

)1(

hoặc

)2(

và

thì với

bất kì thuộc

[

]

;mm

cũng là median của

Ví dụ 4.8.

Gọi

là số chấm xuất hiện khi gieo con xúc xắc. Khi đó

có bảng phân phối

Bài giảng

(

)

Ta có

( ) ( ) ( )

.2213 ≤===+==< XPXPXP

và

( ) ( ) ( ) ( )

.33213 ≥===+=+==≤ XPXPXPXP

Suy ra

Mặt khác

( ) ( ) ( ) ( )

.33214 ===+=+==< XPXPXPXP

và

( ) ( ) ( ) ( ) ( )

.443214 ≥===+=+=+==≤ XPXPXPXPXP

Suy ra

Khi đó,

(

)

mXMed

[

]

4;3

∈

hoặc

c) Moment trung tâm. Moment g

ố

Định nghĩa.

Cho

là một đại lượng ngẫu nhiên có kì vọng

(

)

aXE

. Ta gọi moment trung tâm

cấp

của

là

(

)

(

)

aXEX

−==

µµ

Ta gọi moment gốc cấp

là

(

)

XE=

Ta có

. Theo công thức nhị thức Newton

( ) ( ) ( )

( )

∑

∑∑

−

−=













−=−=

XEaCXaCEaXE

γγ

Vậy

( )

∑

−

−=

γγµ

Ví dụ 4.9.

Đại lượng ngẫu nhiên

có bảng phân phối xác suất như sau:

(

)

1,0

2,0

3,0

2,0

Tính

(

)

(

)

(

)

(

)

(

)

XMed

(

)

XMod

(

)

<−

EXXP

Giải

Chương II. Đại lượng ngẫu nhiên. Hàm phân phối xác suất

(

)

6.42,0.72,0.63,0.42,0.31,0.2

(

)

242,0.72,0.63,0.42,0.31,0.2

222222

=++++=XE

(

)

(

)

(

)

84,26,424

222

=−=−= XEXEXD

(

)

(

)

685,184,2

===

XDX

(

)

2,1372,0.72,0.63,0.42,0.31,0.2

333333

=++++=XE

Dễ thấy

(

)

XMed

vì

( )

3,04 ≤=<XP

và

( )

6,04 ≥=≤XP

(

)

XMod

vì

(

)

(

)

3,04max

XPXXP

(

)

(

)

( ) ( ) ( ) ( )

7,02,03,02,06436,66,2

26,42

=++=++=<<=

<−=<−

PPPXP

XPEXXP

5. Hàm của một đại lượng ngẫu nhiên.

Nếu ta xác định

(

)

XgZ

là một hàm của đại lượng ngẫu nhiên

thì

trở thành đại

lượng ngẫu nhiên mới. Vấn đề đặt ra là tìm cách xác định luật phân phối của

qua

luật phân phối đã biết của

. Ở đây, ta chỉ xét các trường hợp đơn giản khi hàm

không quá phức tạp.

5.1. Đại lượng ngẫu nhiên rời rạc.

Ví dụ 5.1.

Cho đại lượng ngẫu nhiên

có luật phân phối

−

(

)

xXP

1,0

2,0

3,0

2,0

Xác định luật phân phối của đại lượng ngẫu nhiên

và tìm kì vọng của

Giải.

Dễ dàng ta có

(

)

(

)

3,000

XPZP ,

(

)

(

)

(

)

4,02,02,0111

−

XPXPZP

(

)

(

)

(

)

3,02,01,0224

−

XPXPZP .

Khi đó, ta có bảng phân phối của đại lượng ngẫu nhiên

là

(

)

zZP

3,0

4,0

3,0

Từ bảng phân phối trên, ta có kì vọng

( ) ( )

6,13,0.44,0.13,0.0

=++===

∑

zZPzZE

Bài giảng

Trong trường hợp

(

)

XgZ

tổng quát, ta có thể tính trực tiếp kì vọng của đại lượng

ngẫu nhiên

như sau:

( ) ( ) ( )

∑

xXPxgZE

Trong ví dụ trên, ta có thể tính kì vọng của đại lượng ngẫu nhiên

là

(

)

(

)

(

)

(

)

(

)

(

)

6,12,0.22,0.13,0.02,0.11,0.2

22222

=+++−+−=ZE

6.2. Đại lượng ngẫu nhiên liên tục.

Khi

là đại lượng ngẫu nhiên liên tục, vấn đề sẽ phức tạp hơn. Giả sử đại lượng ngẫu

nhiên

có hàm mật độ

(

)

đã biết và

(

)

XgY

. Ta sẽ tìm hàm mật độ

(

)

của

Ta có:

( ) ( ) ( )( ) ( )

∫

=<==<=

duufxXgYPxYPxF

, trong đó

xugD

)(

Sau đó, lấy đạo hàm

(

)

vế, ta được mật độ

(

)

của đại lượng ngẫu nhiên

Ví dụ 5.2.

Cho đại lượng ngẫu nhiên

có hàm mật độ xác suất là

(

)

. Tìm hàm mật độ của

Giải.

a) Áp dụng công thức, ta có:

( ) ( ) ( )













−













−

<=<+=<=

XPxXPxZPxF

Lấy đạo hàm, ta được

( ) ( )

[ ]













−













−

























−

FxFxf

XZZ

Vậy hàm mật độ của

là

( )













−

1 x

fxf

(

)

(

)

(

)

(

)

(

)

xFxXPxXPxYPxF

=<=<=<=

Lấy đạo hàm, ta được hàm mật độ của

là:

( ) ( )

[ ]

(

)

[

]

(

)

(

)

333

.''.'

xfxxFxFxf

XYY

===

Ví dụ 5.3.

Cho đại lượng ngẫu nhiên

có phân phối chuẩn

(

)

σµ

, đặt

−

Chứng minh rằng

có phân phối chuẩn

(

)

1;0~ NY

Giải.

Chương II. Đại lượng ngẫu nhiên. Hàm phân phối xác suất

( ) ( ) ( ) ( )

µσµσ

+=+<=













−

=<= xFxXPx

PxYPxF

Lấy đạo hàm, ta được

( ) ( )

[ ]

( )

[ ]

( )

( )( )

.''

XXYY

eexfxFxFxf

−

−+

−

==+=+==

πσ

σµσµσ

µµσ

Vậy

có phân phối chuẩn

(

)

1;0~ NY

Chương II. Đại lượng ngẫu nhiên. Hàm phân phối xác suất

6. Bài tập chương.

ộ

t nhóm có

ườ

i g

ồ

m có

nam và

ữ

. Ch

ọ

n ng

ẫ

u nhiên ra

ườ

i. G

ọ

là s

ố

ữ

ở

trong nhóm. L

ậ

p b

ả

ng phân ph

ố

i xác su

ấ

t c

ủ

và tính

(

)

(

)

và

(

)

mod

Cho

LNN liên t

ụ

có hàm m

ậ

độ

( )

[ ]











∉

∈−

2;0,0

2;0,2

xxx

ẽ

đồ

ị

ủ

(

)

Tính

(

)

5,1

và

(

)

1,19,0

Cho

LNN liên t

ụ

có hàm m

ậ

độ

( )

[

]

[ ]







∉

∈

3;0,0

3;0,

xkx

Tìm h

ằ

ng s

ố

Tính

(

)

Tìm

(

)

XMed

Cho hàm m

ậ

độ

ủ

LNN

là

( )











≤

−

0,0

0,0,

Tìm hàm phân ph

ố

i c

ủ

và tính xác su

ấ

(

)

≤

0 .

Tính kì v

ọ

ng và ph

ươ

ng sai c

ủ

ộ

t ng

ườ

i nuôi 100 con gà. Xác su

ấ

để

ỗ

i con gà

đẻ

trong m

ộ

t ngày là 8,0

. G

ọ

là s

ố

ứ

ng thu

đượ

c trong m

ộ

t ngày.

Tính xác su

ấ

để

thu

đượ

c ít nh

ấ

t 80 qu

ả

ứ

ng trong m

ộ

t ngày.

ả

ử

, giá bán m

ỗ

i qu

ả

ứ

ng gà là 2000 VN

và chi phí cho m

ỗ

i con là 200.1 VN

ọ

là s

ố

ề

n l

ờ

i trong m

ộ

t ngày. Tính ti

ề

n l

ờ

i trung bình?

ộ

t h

ộ

đự

ng 7 s

ả

n ph

ẩ

m x

ấ

u và 3 s

ả

n ph

ẩ

m t

ố

t. Ch

ọ

n ng

ẫ

u nhiên cùng lúc

ả

ẩ

m. G

ọ

là s

ố

ả

n ph

ẩ

m t

ố

t trong hai s

ả

n ph

ẩ

m l

ấ

y ra.

ậ

p b

ả

ng phân ph

ố

i xác su

ấ

t c

ủ

Tính

(

)

(

)

và

(

)

XMod

Cho

LNN

ờ

i r

ạ

c và có phân ph

ố

i xác su

ấ

t nh

1 3 5 7 9

0,1 0,4 0,2 0,2 0,1

Tính

(

)

≤

Xác

đị

(

)

XMed

(

)

XMod

(

)

và

(

)

Đáp số và hướng dẫn.

Dùng các công th

ứ

Bài giảng

(

)

2,1

(

)

56,0

và

(

)

1mod

(

)

15625,05,1

≈

(

)

1495,01,19,0

≈

, b)

( )

2 =>XP

, c)

( )











≤≤

3,1

30,

0,0

Median

là nghi

ệ

m c

ủ

a ph

ươ

ng trình

hay

. V

ậ

( )











>−

≤

−

0,1

0,0

(

)

−

−=<≤ eXP

, b)

(

)

(

)

=XD

C. Phương pháp giảng dạy.

- Thuyết trình, đàm thoại khơi động hoạt động tự giác, tích cực của sinh viên.

- Sử dụng hình thức trực quan: bảng, đồ thị, kí hiệu,…

- Yêu cầu SV đọc bài giảng trước khi lên lớp.

- Kiểm tra, đánh giá việc làm bài tập của SV.

- Sử dụng phương tiện dạy học hiện đại như Mic, Projector.

- Gi

ả

ng viên g

ử

i bài gi

ả

ng cho sinh viên

đọ

c tr

ướ

c. Gi

ả

ng viên trình bày bài gi

ả

ng trên l

ớ

theo ph

ươ

ng pháp thuy

ế

t trình h

ỏ

áp. Giao bài t

ậ

p cho sinh viên v

ề

nhà làm. Gi

ớ

i thi

ệ

u m

ộ

ố

tài li

ệ

u tham kh

ả

D. Tài liệu tham khảo

[1] Đậu Thế Cấp, Xác suất thống kê: Lí thuyết và các bài tập (Chương 2), NXB

Giáo dục, 2006.

[2] Đinh Văn Gắng, Bài tập xác suất và thống kê (Chương 2), NXB Giáo dục, 2007.

[3] PGS. TS. Phạm Xuân Kiều, Giáo Trình xác suất và thống kê (Chương 2), NXB

Giáo dục, 2005.

[4] Đặng Công Hanh, Đặng Ngọc Dục, Giáo trình Lý thuyết xác suất và Thống kê

toán (Chương 2), trường Đại học Duy Tân,1996.

Chương III.

Các quy luật phân phối thường gặp.

A. Mục tiêu.

- Sử dụng hình thức trực quan: bảng, đồ thị, kí hiệu,…

- Ứng dụng Excel cho việc tính các giá trị của biến ngẫu nhiên có phân phối chuẩn,

phân phối Poisson, phân phối Student, phân phối chi bình phương.

- Yêu cầu SV đọc bài giảng trước khi lên lớp.

- Kiểm tra, đánh giá việc làm bài tập của SV.

- S

ử

ụ

ng ph

ươ

ng ti

ệ

n d

ạ

y h

ọ

c hi

ệ

đạ

i nh

Mic, Projector.

B. Nội dung.

1. Quy luật phân phối rời rạc.

1.1. Phân phối nhị thức.

Định nghĩa.

Gọi

là số lần biến cố

xuất hiện trong dãy

phép thử Bernoulli. Khi đó,

là

đại lượng ngẫu nhiên có phân phối nhị thức.

Kí hiệu

(

)

pnBX

Công thức xác suất:

(

)

knkk

qpCkXP

−

, trong đó

−

Các tính chất.

Cho

(

)

pnBX ;~

, ta có

(

)

npXE

(

)

npqXD

pnpXqnp

≤

−

mod

Chứng minh

a) Gọi

là “số lần đại lượng cố

xuất hiện trong phép thử thứ

” (trong dãy phép

thử Bernoulli), ta có bảng phân phối của

là:

Bài giảng

trong đó

(

)

knkk

qpCkXPp

−

=== .

Suy ra

( )

∑∑∑

−

===

knkk

qpCkqpCkpkXE

100

...

Ta có

( )

∑

−

kknk

xpCxp

. Đạo hàm hai vế theo

, ta được

( )

∑

−−

−

kknk

xpkCxpn

hay

( )

∑

−

kknk

xpkCxxpn

Chọn

, ta suy ra

∑

−

kknk

xpkCnp

. Vậy

(

)

npXE

(đpcm).

b) Dễ dàng chứng minh được

( )

nppnnqpCkpkXE

knkk

+−===

∑∑

−

1..

Khi đó

(

)

(

)

(

)

(

)

(

)

(

)

npqnpnpnpnppnnXEXEXD =−=−+−=−=

(đpcm).=

c) Do

(

)

{

}

pppXXP

;;;maxmod

. Theo Chương 2, ta có:

+ Nếu

−

nguyên thì

1mod

−

qnpXqnp

+ Nếu

−

không nguyên thì

[

]

[

]

1mod

−

qnpXqnp

Vậy

pnpXqnp

≤

−

mod

(đpcm).

Ví dụ 1.1.

Bắn

viên đạn vào mục tiêu, xác suất trúng mục tiêu của mỗi viên đạn là

8,0

. Gọi

là đại lượng ngẫu nhiên chỉ số viên đạn trúng mục tiêu. Lập bảng phân phối của

Tính

(

)

Giải

Ta có

có thể nhận các giá trị

. Khi đó, ta có:

(

)

kkk

CkXP

−

2,08,0

5;0

Từ đó, ta có bảng phân phối

500

2,0.8,0C

411

2,0.8,0C

322

2,0.8,0C

233

2,0.8,0C

144

2,0.8,0C

055

2,0.8,0C

Dễ thấy kì vọng

(

)

48,0.5

npXE

1.2. Phân phối siêu bội.

Định nghĩa.

Chương III. Các quy luật phân phối xác suất thường gặp.

Gọi

là số lần chọn được phần tử có tính chất

trong

lần chọn không lặp từ một

tập hợp có

phần tử, trong đó có

phần tử có tính chất

. Khi đó,

được gọi là

đại lượng ngẫu nhiên có phân phối siêu bội.

Kí hiệu:

(

)

nMNHX ;;~

Công thức xác suất:

( )

kXP

−

Các tính chất.

Cho

(

)

nMNHX ;;~

. Ta có

(

)

npXE

( )

−

npqXD

trong đó

p =

−

Chứng minh

Trước hết, ta chứng minh công thức

∑

−

. Thật vậy, ta có

(

)

(

)

(

)

NMNM

xxx +=++

−

111

hay

∑∑∑

−

xCxCxC

000

So sánh hệ số của

hai vế, ta được

CCC =

∑

−

(đpcm)

Ta có:

( ) ( )

( )

( ) ( )

( )

( ) ( )

∑

∑∑

∑∑∑

−

−−

−

−−

−

====

nNn

kMk

nNn

kMk

nMC

CkNC

CkC

kXkPXE

000

!!1

!!.1

!!.

Chú ý rằng:

∑∑

−

, (trong đó

−

và

−

Vậy ta có điều phải chứng minh.

b) Ta có.

Tương tự như câu a), ta dễ dàng chứng minh được:

Bài giảng

( )

( ) ( ) ( )

( ) ( )

( )

−

+−−

−

−−

=+=−=

∑∑

∑

NnMnMMn

nnMM

kXkPkXPkk

kXPkXE

Khi đó

(

)

(

)

(

)

(

)

( )

...

−

−−













−

+−−

−=

npq

NnMnM

XEXEXD

Ví dụ 1.2.

Một hộp có

viên bi đỏ và

viên bi xanh. Lấy ngẫu nhiên

bi từ hộp. Gọi

là số

bi xanh lấy được.

a) Tính xác suất lấy được

bi xanh.

b) Lập bảng phân phối xác của

. Từ đó tính kì vọng và phương sai.

Giải

a) Ta có

và

(

)

3;3;7~ HX

. Khi đó

( )

XP ==

b) Dễ thấy

có thể nhận các giá trị

. Khi đó, ta có bảng phân phối xác suất

như sau:

(

)

3;3;7~ HX

nên

( )

.3 ==XE

và

( )

.3 =

−













−=XD

1.3. Phân phối Poisson.

Định nghĩa.

Gọi

là số lần phần tử có tính chất

xuất hiện trong một khoảng thời gian (hoặc

trên một miền, một vùng) nào đó. Khi đó,

được gọi là đại lượng ngẫu nhiên có

phân phối Poisson với tham số

là số trung bình của số lần phần tử có tính chất

xảy ra.

Kí hiệu:

(

)

PX ~

Công thức xác suất:

( )

kXP

−

Chương III. Các quy luật phân phối xác suất thường gặp.

Các tính chất.

Cho

(

)

PX ~

. Ta có

(

)

(

)

[

]

(

)

[

]

≤

−

Xmod1

Chứng minh

a) Ta có:

( ) ( )

( )

λλ

λλλ

−

====

−

+∞

−

+∞

−

+∞

∑∑∑

kXkPXE

!1!

, (do

∑

+∞

b) Ta có

( )

(

)

∑∑∑∑

+∞

−

+∞

−

+∞

−

+∞

−

====

000

ekk

kXPkXE

λλλ

Dễ thấy

∑

+∞

−

và

(

)

( )

!2!

−

∑∑

+∞

−

+∞

−

ekk

nên

(

)

λλ

. Vậy

(

)

(

)

(

)

(

)

=−=

XEXEXD

(đpcm).

c) Ta có

( )

kXP

−

và

( )

=+=

+−

kXP

Dễ thấy

(

)

(

)

kXPkXP

≥

khi và chỉ khi

−

≤

và

(

)

(

)

kXPkXP

khi và chỉ khi

−

∈

nên

[

]

(

)

[

]

≤

−

Xmod1

(đpcm)

Chú ý.

Luật phân phối Poisson có ý nghĩa thực tế rất lớn và được ứng dụng rộng rãi trong việc

kiểm tra chất lượng sản phẩm. Đặc biệt giải quyết một số bài toán sau đây

Ví dụ 1.3.

Tại một CLB Bóng bàn, biết rằng trung bình mỗi ngày có

người đến tập luyện. Tính

xác suất để trong một ngày mà ta xét.

a) Có

người đến tập luyện.

b) Có ít nhất

người đến tập luyện.

Giải

Gọi

là số người đến tập luyện trong ngày. Ta có

(

)

5~ PX

. Khi đó

( )

−

( ) ( )

∑

−

−=<−=≥

1414

XPXP

Bài giảng

Ví dụ 1.4.

Xét số khách hàng vào cửa hàng mua ĐTDĐ trong một tháng là đại lượng ngẫu nhiên

tuân theo phân phối Poisson với mật độ trung bình là

khách hàng trong một ngày.

a) Tìm xác suất để trong một ngày có

khách hàng.

b) Tìm xác suất để trong một tuần có

100

khách hàng.

c) Tìm xác suất để trong một ngày có hơn

khách hàng.

Giải

Gọi

là số khách hàng vào cửa hàng mua ĐTDĐ.

a) Ta có

(

)

. Khi đó

( )

409

−

b) Số khách hàng trung bình vào cửa hàng mua ĐTDĐ trong một tuần là

367.9

(

)

Khi đó, ta có

( )

100

10036

−

c) Ta có

( ) ( )

∑

−

−=≤−=>

140140

XPXP

2. Quy luật phân phối liên tục.

2.1. Phân phối đều.

Định nghĩa.

Đại lượng ngẫu nhiên liên tục

được gọi là có phân phối đều trên đoạn

[

]

ba;

nếu

hàm mật độ của

là

( )

[ ]











∉

∈

−

bax

;,0

Kí hiệu:

(

)

baUX ;~

Các tính chất.

Cho

(

)

baUX ;~

. Ta có:

( )

(

)

−

2.2. Phân phối mũ.

Định nghĩa.

Chương III. Các quy luật phân phối xác suất thường gặp.

Đại lượng ngẫu nhiên liên tục

được gọi là có phân phối mũ tham số

(

)

hàm mật độ của nó có dạng

( )







≥

−

0,0

Kí hiệu:

(

)

EX ~

Các tính chất.

Cho

(

)

EX ~

. Ta có:

( )

=XE

( )

=XD

Chứng minh

a) Ta có:

( )

∫

+∞

−

dxexXE

Đặt

. Khi đó

( )

(

)

(

)

λλλλ

11.121

∫

+∞

−

duteXE

b) Ta có:

( )

∫

+∞

−

dxexXE

Đặt

. Khi đó

( )

(

)

(

)

222

21.231

λλλλ

∫

+∞

−

dtetXE

Suy ra

( )

(

)

( )( )

=−= XEXEXD

Trong đó, Hàm Gamma được xác định như sau

( )

∫

+∞

−−

=Γ

dxxe

Các tính chất của hàm Gamma:

(

)

(

)

!1 nn

∈

∀













Ví dụ 2.1.

Tuổi thọ

(tính bằng giờ) của một thiết bị có phân phối mũ

(

)

00125,0~ EX

Hãy tính và đưa ra ý nghĩa các giá trị sau:

(

)

720

(

)

720600

Bài giảng

(

)

(

)

800

Giải

a) Ta có

(

)

(

)

(

)

(

)

(

)

9,0720.00125,0

1172017207201720

−−

=−−=−==−<−=> eeFXPXPXP

Ý nghĩa

(

)

720

là xác suất để tuổi thọ của thiết bị lớn hơn

720

giờ là

9,0

−

(

)

(

)

(

)

(

)

(

)

9,075,0600.00125,0720.00125,0

11600720720600

−−−−

−=−−−=−=<< eeeeFFXP

Ý nghĩa

(

)

720600

là xác suất để tuổi thọ của thiết bị nằm trong khoảng

(

)

720;600

là

9,075,0

−−

− ee

( )

00125,0

( ) ( )

eFXP

11800800

800.00125,0

−=−==<

−

2.3. Phân phối chuẩn. Phân phối chuẩn tắc.

Định nghĩa.

Đại lượng ngẫu nhiên liên tục

được gọi là có phân phối chuẩn với kì vọng

phương sai

nếu hàm mật độ của nó có dạng

( )

πσ

−

exf

Kí hiệu

(

)

σµ

Chú ý.

Chương III. Các quy luật phân phối xác suất thường gặp.

Nếu

và

thì

(

)

1;0~ NX

, ta nói

có phân phối chuẩn tắc.

Tính chất.

Cho

(

)

σµ

. Ta có:

(

)

(

)

=XD

Hàm Gauss.

Đó là hàm

( )

∫

−

=Φ

dtex

, hay còn gọi là tích phân Laplace, trong đó:

( )

exf

−

gọi là hàm mật độ Gauss.

( )

∫

∞−

−

dtexF

gọi là hàm phân phối xác suất Gauss.

Dễ thấy

(

)

và

(

)

cũng là hàm mật độ và hàm phân phối xác suất của đại lượng

ngẫu nhiên

(

)

1;0~ NX

Nhận xét:

(

)

(

)

−

∈

∀

( )

lim =Φ

+∞→

, do

∫

+∞

−

dte

( )

exf

−

là hàm số chẵn nên có đồ thị nhận

làm trục đối xứng.

Định lí.

Cho

(

)

là hàm phân phối xác suất của đại lượng ngẫu nhiên

(

)

1;0~ NX

. Ta có

( ) ( )

xxF Φ+=

(

)

(

)

(

)

(

)

(

)

−

FFXP

(

)

(

)

αα

Φ=<

2XP

Chứng minh.

a) Dễ thấy

( ) ( )

xdtedtedtexF

Φ+=+==

∫∫∫

−

∞−

−

∞−

−

222

πππ

b) Ta có

Bài giảng

( ) ( ) ( ) ( )

αβ

βα

Φ−Φ=+−=

+==<<

∫∫

∫∫∫

dxxfdxxf

dxxfdxxfdxxfXP

c) Ta có

(

)

(

)

(

)

(

)

(

)

(

)

(

)

αααααααα

Φ=−Φ−Φ=−−=<<−=<

2FFXPXP

Tính chất.

Cho

(

)

σµ

. Ta có

( )













−

Φ+=

( )













−

Φ−













−

Φ=













−













−

=<<

µα

µβ

µα

µβ

βα

FFXP

( )













Φ=<−

αµ

Tính chất.

Cho

(

)

1;0~

. Gọi

là số thỏa mãn

(

)

zZP

(

≤

). Ta có

αα

−

, trong đó

−

là số thỏa mãn

(

)

−

zZP

(

)

zZP

(với

≤≤

)

Chú ý.

Giá trị hàm

( )

∫

−

=Φ

dtex

được cho trong Bảng 2. Chẳng hạn

(

)

475,096,1

. Ta

quy ước

(

)

5,0

với mọi

≥

Hệ quả. (Quy tắc

-sigma).

Nếu

(

)

σµ

thì

(

)

(

)

kkXP

Φ=<−

σµ

Với

, ta có quy tắc

-sigma

(

)

(

)

9973,0323

=Φ=<−

σµ

. Quy tắc này có

nghĩa là sai số giữa

và

không quá

là gần chắc chắn. Khi đó, với xác suất

9973,0

giá trị của đại lượng ngẫu nhiên

nằm trong khoảng

(

)

3;3

−

Ví dụ 2.2.

Cho đại lượng ngẫu nhiên

có phân phối chuẩn tắc

(

)

1;0

. Tìm diện tích phần nằm

bên dưới đường cong chuẩn tắc này.

a) Ở bên phải đường thẳng

84,1

b) Ở giữa hai đường thẳng

97,1

−

và

86,0

Chương III. Các quy luật phân phối xác suất thường gặp.

Giải

a) Ta có diện tích bằng

( ) ( )

033,0467,0

84,1

84,1 =−=Φ−=>ZP

b) Ta có diện tích bằng

(

)

(

)

(

)

(

)

(

)

781,0476,0305,097,186,097,186,086,097,1

−

Ví dụ 2.3.

Cho đại lượng ngẫu nhiên

có phân phối chuẩn tắc

(

)

1;0~ NZ

. Dựa vào hình vẽ sau,

hãy tìm giá trị

sao cho

(

)

3015,0

kZP

(

)

4197,018,0

−

ZkP

Giải

a) Dựa vào hình vẽ, ta có:

( ) ( )

kkZP Φ−==>

3015,0

Khi đó

(

)

1985,0

. Từ Bảng 2, ta suy ra

52,0

b) Ta có

(

)

(

)

(

)

(

)

(

)

kkZkP

−

18,018,04197,018,0

Khi đó,

(

)

(

)

4197,018,0

−

. Từ Bảng 2, ta có

(

)

0714,018,0

Suy ra

(

)

(

)

(

)

37,237,24911,04197,00714,0

−

Bài giảng

Vậy

37,2

−

Ví dụ 2.4.

Cho đại lượng ngẫu nhiên ngẫu nhiên

có phân phối chuẩn

(

)

10;50~

. Tìm xác

suất để

nhận các giá trị trong khoảng

(

)

62;45

Giải

Ta có xác suất cần tìm là

( ) ( ) ( ) ( ) ( )

5,02,105,02,1

5045

5062

6245

Φ+Φ=−Φ−Φ=













−

Φ−













−

Φ=<< XP

Dựa vào Bảng 2, ta tính được

(

)

3849,02,1

(

)

1915,05,0

Vậy

(

)

5764,01915,03849,06245

Ví dụ 2.5.

Cho đại lượng ngẫu ngẫu nhiên có phân phối

(

)

5,0;1

. Hãy tìm các xác suất sau:

(

)

213,15

≤

−

(

)

64,01

<−

(

)

1,2

(

)

3,2

Giải

a) Ta có

( ) ( ) ( )

( ) ( ) ( ) ( )

664,6

664,14426,012426,0

12426,0

5,0

1213,1

213,15

=+≈Φ+Φ≈Φ+Φ=

−Φ−Φ=













−−

Φ−













−

Φ=<≤− XP

( )

79946,039973,0.228,12

5,0

64,0

264,01

==Φ=













Φ=<−XP

( ) ( )

9861,04861,0

2,2

5,0

11,2

1,2

=+=Φ+=













−

Φ+=<XP

( ) ( )

( )

00466,049534,0

6,2

5,0

13,2

13,213,2

=−=Φ−=

























−

Φ+−=≤−=> XPXP

Ví dụ 2.6.

Đường kính của một loại chi tiết do một máy sản xuất có phân phối chuẩn, kì vọng

và có phương sai

(

)

2,0 mm

. Tính xác suất lấy ngẫu nhiên một chi tiết

Chương III. Các quy luật phân phối xác suất thường gặp.

a) Có đường kính trong khoảng

9,19

đến

3,20

b) Có đường kính sai khác với kì vọng không quá

3,0

Giải

Gọi

là đường kính của một chi tiết, ta có

(

)

(

)

2,0;20~ NX

. Khi đó

a) Ta có

( )

( ) ( ) ( ) ( )

6247,01915,04332,05,05,15,05,1

2,0

209,19

2,0

203,20

3,209,19

=+=Φ+Φ=−Φ−Φ=













−

Φ−













−

Φ=<< XP

b) Áp dụng công thức, ta suy ra

( )

8664,04332,0.25,12

2,0

3,0

23,0

==Φ=













Φ=<−

Ví dụ 2.7.

Gọi

là chỉ số thông minh –

(Intelligent Quota) của học sinh lứa tuổi 12-15. Giả

sử

(

)

25;85~

a) Cho biết chỉ số

trung bình của học sinh là bao nhiêu?

b) Tính xác suất chọn được học sinh rất thông minh (

≥

c) Tính tỉ lệ học sinh có chỉ số

(

)

95;80

∈

d) Gọi

là số học sinh có chỉ số

(

)

95;80

∈

trong lớp có

học sinh. Hãy chỉ rõ

phân phối xác suất của

Giải

a) Chỉ số

trung bình của học sinh là

(

)

( )

1587,05413,011

8590

)90(

=−=Φ−=













−

Φ−=≥XP

c) Tỉ lệ học sinh có chỉ số

(

)

95;80

∈

là

(

)

9580

. Khi đó

( ) ( ) ( ) ( ) ( )

82,08186,03413,04773,0

1212

8580

8595

9580

≈=+=

Φ+Φ=−Φ−Φ=













−

Φ−













−

Φ=<< XP

d) Một lớp gồm

học sinh được chọn từ tập hợp học sinh với tỉ lệ

(

)

82,09580

≈

XPp

được xem là

phép thử với xác suất

82,0

. Do đó

có

phân phối nhị thức

(

)

82,0;50

, tức là:

(

)

mmm

CmYP

−

18,0.82,0

50;0

Ví dụ 2.8.

Cho đại lượng

có phân phối chuẩn

(

)

;5~

. Cho biết

(

)

2,09

. Tính

Giải

Bài giảng

Ta có

( )













Φ−=













−

Φ−=>

σσ

159

Khi đó

(

)

2,09

suy ra

3,0













hay

85,0

. Vậy

14,22

2.4. Phân phối Chi bình phương.

Định nghĩa.

Đại lượng ngẫu nhiên

được gọi là có phân phối Chi bình phương

(

)

với

bậc

tự do nếu hàm mật độ của nó có dạng:

( )











≤













−−

0,0

Kí hiệu

(

)

Các tính chất.

+ Nếu dãy các đại lượng ngẫu nhiên độc lập

là có phân phối chuẩn

tắc thì

1 n

XXXX +++=

có phân phối Chi bình phương

(

)

với

bậc tự do.

+ Cho

(

)

. Ta có:

(

)

nXE

(

)

nXD 2

Chứng minh

a) Ta có:

( ) ( )

∫∫∫

∞+

−

∞+

−−

∞+

∞−

























dxex

xdxxxfXE

Đặt:

t =

. Khi đó

( )

dtet





































+Γ

























∫

∞+

−

.2.

b) Tương tự, ta chứng minh được

( )

( ) ( )













∫∫

+∞

−+

+∞

∞−

nndxex

dxxfxXE

Khi đó

(

)

(

)

(

)

nXEXEXD 2

=−=

(đpcm)

Chương III. Các quy luật phân phối xác suất thường gặp.

2.5. Phân phối Student.

Định nghĩa.

Đại lượng ngẫu nhiên liên tục

được gọi là có phân phối Student với

bậc tự do

nếu hàm mật độ của

có dạng:

( )

−





































Kí hiệu:

(

)

nTX ~

Các tính chất.

( )

−





































là hàm số chẵn nên có đồ thị nhận

làm trục đối

xứng.

(

)

1;0~ NX

(

)

và

độc lập thì

T =

có phân phối

(

)

, với

bậc tự

do.

+ Cho

(

)

nTX ~

. Ta có:

(

)

( )

−

2.6. Công thức tính gần đúng.

2.6.1. Phân ph

ố

i siêu b

ộ

i và phân ph

ố

i nh

ị

ứ

Định lí.

Cho

(

)

nMNHX ;;~

. Nếu

khá lớn (

nN 10

) và

p =

thì ta có thể coi













nBX ;~

Tức là ta có công thức tính gần đúng

knk

−













−













≈ 1

2.6.2. Phân ph

ố

i nh

ị

ứ

c và phân ph

ố

i Poisson.

Định lí.

Cho

(

)

pnBX ;~

. Nếu

khá bé (gần

, ta xem

1,0

) và khi

khá lớn (

≥

) thì

nk ;0=

, ta có thể coi

(

)

npPX ~

Bài giảng

Tức là ta có công thức gần đúng

( ) ( )

(

)

eppCkXP

−

≈−==

nk ;0=

Nhận xét.

Cho

(

)

pnBX ;~

. Nếu

khá lớn (gần

) và

khá lớn thì

nk ;0=

, ta có thể dùng phân

phối Poisson để tính gần đúng.

Thật vậy,

(

)

pnBX ;~

thì

(

)

pnBY

−

1;~

, trong đó

là số lần biến cố

xuất hiện và

là số lần biến cố

xuất hiện.

khá lớn nên

−

khá bé. Do dó

(

)

(

)

pnPY

−

Khi đó

( ) ( )

(

)

(

)

[

]

( )

pne

knYPkXP

−

=−===

−

−−

Ví dụ 2.9.

Một cửa hàng sản xuất đĩa nhạc, trung bình sản xuất

1000

đĩa thì có

đĩa hỏng. Tìm

xác suất để khi hãng đó sản xuất

3000

đĩa thì có nhiều hơn

đĩa không bị hỏng.

Giải

Xác suất để được đĩa không hỏng trong

1000

đĩa là

1000

999

Gọi

là số đĩa không bị hỏng. Ta có













1000

999

;3000~ BX

, ta có

3000

và

1000

999

khá lớn.

Suy ra

(

)

PY ~

với

1000

.3000 ==

−

3000

nên ta có

( ) ( ) ( )

92,01008,01494,00498,055

=+++===≤=>

∑

kYPYPXP

2.6.3. Phân ph

ố

i nh

ị

ứ

c và phân ph

ố

i chu

ẩ

Định lí.

Cho

(

)

pnBX ;~

. Nếu

không quá gần

và

, khi đó

khá lớn (

≥

) thì

ta có thể coi

(

)

npqnpNX ;~

Tức là ta có công thức gần đúng

( ) ( )













−

≈−==

−

npq

npk

npq

qpCkXP

nk ;0=

trong đó:

( )

exf

−

Ví dụ 2.10.

Biến cố A: “một anh B yêu một cô gái” có xác suất

(

)

25,0

pAP

không đổi. Tìm

xác suất để khi anh B quen với 243 người cô gái thì có đúng 70 lần biến cố A xảy ra.

Chương III. Các quy luật phân phối xác suất thường gặp.

Giải.

Chú ý rằng, anh B quen với 243 người là một phép thử độc lập.

Gọi X là số lần biến cố A xảy ra trong 243 phép thử độc lập. Ta có

(

)

25,0;243~ BX

30243

và

1025,0.243

nên ta xem

(

)

npqnpX ;~

với

25,0.243

và

75,0.25,0.243

npq

Vậy

( ) ( )

0231,037,1

75,6

75,0.25,0.243

25,0.24370

75,0.25,0.243

70 ==













−

≈= ffXP

3. Đại lượng ngẫu nhiên nhiều chiều.

3.1. Khái niệm.

Ở các phần đã học, chúng ta đã xét các đại lượng ngẫu nhiên mà các giá trị có thể của

chúng được biểu diễn bằng một số. Các đại lượng ngẫu nhiên đó được gọi là đại lượng

ngẫu nhiên một chiều. Ngoài các đại lượng ngẫu nhiên một chiều, trong thực tế ta còn

gặp các đại lượng ngẫu nhiên mà các giá trị có thể có của nó được xác định bằng

số. Những đại lượng ngẫu nhiên này được gọi là các đại lượng ngẫu nhiên

hai chiều, ba chiều,

chiều.

Xét đại lượng ngẫu nhiên hai chiều, kí hiệu là

(

)

YX ;

. Trong đó,

và

được gọi là

các thành phần của đại lượng ngẫu nhiên hai chiều. Hai đại lượng ngẫu nhiên

và

được xét đồng thời tạo nên hệ hai đại lượng ngẫu nhiên. Tương tự như vậy, đại lượng

ngẫu nhiên

chiều có thể xem là hệ của

đại lượng ngẫu nhiên.

Ví dụ 3.1.

Một máy sản xuất một loại sản phẩm. Nếu kích thước của sản phẩm được đo bằng

chiều dài

và chiều rộng

, thì ta có đại lượng ngẫu nhiên hai chiều

(

)

YX ;

, còn nếu

tính thêm cả chiều cao

nữa thì ta có đại lượng ngẫu nhiên ba chiều

(

)

ZYX ;;

Trong thực tế, người ta cũng chia các đại lượng ngẫu nhiên nhiều chiều thành hai loại:

rời rạc và liên tục.

Các đại lượng ngẫu nhiên nhiều chiều được gọi là rời rạc nếu các thành phần của nó là

đại lượng ngẫu nhiên rời rạc.

Các đại lượng ngẫu nhiên nhiều chiều được gọi là liên tục nếu các thành phần của nó

là đại lượng ngẫu nhiên liên tục.

Sau đây, ta xét các đại lượng ngẫu nhiên hai chiều.

3.2. Quy luật phân phối xác suất của đại lượng ngẫu nhiên hai chiều.

Đối với đại lượng ngẫu nhiên hai chiều, người ta cũng dùng bảng phân phối xác suất,

hàm phân phối xác suất, hàm mật độ xác suất để thiết lập quy luật phân phối xác suất

của chúng.

* Bảng phân phối xác suất của đại lượng ngẫu nhiên hai chiều.

Bảng phân phối xác suất của đại lượng ngẫu nhiên hai chiều

(

)

YX ;

rời rạc là

Bài giảng

…

∑

…

(

)

…

(

)

…

(

)

∑

(

)

(

)

(

)

trong đó

(

)

jiij

yYxXPp === ;

là xác suất đồng thời để đại lượng

lấy giá trị

;

ki ;1=

và

lấy giá trị

;

hj ;1=

. Bảng này có thể vô hạn khi

nhận giá trị

∞

Các tính chất.

a) 10

≤

b) 1

1 1

∑∑

= =

p .

3.3. Hàm phân phối của đại lượng ngẫu nhiên hai chiều.

Xét đại lượng ngẫu nhiên hai chiều

(

)

YX ;

có thể rời rạc hoặc liên tục. Xét

là hai

số thực bất kì, khi đó biến cố

(

)

yYxX

;

là biến cố để

nhận giá trị nhỏ hơn

, và

nhận giá trị nhỏ hơn

Hàm phân phối xác suất của đại lượng ngẫu nhiên hai chiều là

(

)

(

)

yYxXPyxF

;;

Các phân phối biên của đại lượng ngẫu nhiên hai chiều rời rạc

(

)

YX ;

là:

a) Phân phối xác suất của

là

( )

∑

iji

pxXP

b) Phân phối xác suất của

là

( )

∑

iji

pyYP

Ví dụ 3.2.

Cho bảng phân phối của đại lượng ngẫu nhiên

chiều

(

)

YX ;

như sau

10,0

25,0

10,0

15,0 05,0 35,0

Tìm bảng phân phối của các đại lượng

và

sau đó tính

(

)

3;1,2F

Giải.

Lấy tổng hàng và tổng cột tương ứng, ta có các phân phối biên như sau

Chương III. Các quy luật phân phối xác suất thường gặp.

(

)

xXP

45,0

55,0

và

(

)

yYP =

25,0

30,0

45,0

Ta có:

( )

55,005,015,025,010,03;1,2

22211211

1,2

=+++=+++==

∑ ∑

< <

pppppF

i j

x y

4. Bài tập chương.

Tung hai con xúc x

ắ

đồ

ng th

ờ

i. G

ọ

là t

ổ

ng s

ố

ấ

m xu

ấ

t hi

ệ

n trên hai con xúc x

ắ

ó. L

ậ

p b

ả

ng phân ph

ố

i xác su

ấ

t c

ủ

ộ

đổ

i tuy

ể

n có 3 v

ậ

độ

ng viên. Xác su

ấ

t thi

đấ

u th

ắ

ng tr

ậ

n c

ủ

a t

ừ

ng v

ậ

độ

ng viên

ầ

n l

ượ

t là

4,0

;

3,0

;

6,0

. M

ỗ

i v

ậ

độ

ng viên thi

đấ

độ

c l

ậ

p m

ộ

t tr

ậ

n v

ớ

độ

i b

ạ

Tìm phân ph

ố

i xác su

ấ

t s

ố

ậ

n th

ắ

ng c

ủ

độ

i tuy

ể

ậ

p hàm phân ph

ố

i xác su

ấ

t s

ố

ậ

n th

ắ

ng c

ủ

độ

i tuy

ể

Tìm xác su

ấ

độ

i tuy

ể

n th

ắ

ng ít nh

ấ

t m

ộ

t tr

ậ

Trong m

ộ

t h

ộ

p có ch

ứ

a 3 bi

đỏ

và

en. L

ấ

y ng

ẫ

u nhiên t

ừ

ng viên cho

đế

n khi l

ấ

đượ

c bi

đỏ

thì d

ừ

ng. G

ọ

là s

ố

bi c

ầ

n l

ấ

y. L

ậ

p b

ả

ng phân ph

ố

i xác su

ấ

t c

ủ

Trong m

ộ

t h

ộ

p có 3 bi

đỏ

và

en. L

ấ

y ng

ẫ

u nhiên t

ừ

ộ

p ra

viên. N

ế

đượ

đỏ

thì b

ỏ

ở

ạ

i h

ộ

đỏ

, n

ế

đượ

đỏ

thì b

ỏ

ở

ạ

i h

ộ

đỏ

, n

ế

u có

viên

đề

en thì thôi. G

ọ

là bi

ế

n ng

ẫ

u nhiên ch

ỉ

ố

đỏ

sau khi th

ự

c hi

ệ

n phép th

ử

ậ

p b

ả

ng phân ph

ố

i c

ủ

ộ

t h

ộ

đự

ả

n ph

ẩ

m t

ố

ả

n ph

ẩ

m x

ấ

u. L

ấ

y ng

ẫ

u nhiên t

ừ

ng s

ả

n ph

ẩ

m cho

đế

n khi l

ấ

y ra

đượ

c s

ả

n ph

ẩ

m t

ố

t. Tìm phân ph

ố

i xác su

ấ

t s

ố

ả

n ph

ẩ

đượ

c l

ấ

y ra.

Có hai h

ộ

p bi

. H

ộ

có

bi xanh và

đỏ

. H

ộ

có

bi xanh và

đỏ

ừ

ộ

ấ

y ng

ẫ

u nhiên

bi b

ỏ

vào h

ộ

, sau

ó t

ừ

ộ

ấ

y ra

bi.

Tìm phân ph

ố

i xác su

ấ

t s

ố

bi xanh

đượ

c l

ấ

y ra.

ậ

p hàm phân ph

ố

i xác su

ấ

t s

ố

bi xanh

đượ

c l

ấ

y ra.

Cho

là bi

ế

n ng

ẫ

u nhiên có phân ph

ố

i xác su

ấ

aa +

Xác

đị

Tính

(

)

≥

(

)

Tìm s

ố

ỏ

ấ

t sao cho

( )

≥≤ kXP

ế

n ng

ẫ

u nhiên r

ờ

i r

ạ

có b

ả

ng phân ph

ố

i xác su

ấ

0 1 2 3 4

(

)

0,05 0,2 0,3 0,3 0,15

ậ

p hàm phân ph

ố

(

)

và v

ẽ

đồ

ị

ủ

(

)

Bài giảng

Tìm

(

)

≤

(

)

≤

và

(

)

Trong các hàm sau

ây, hàm nào là hàm m

ậ

độ

xác su

ấ

( )

[

]

[ ]







∈

∉

1;0,3

1;0,0

( )











≥

cos

Tìm

(

)

(

)

(

)

XMod

và

(

)

XMed

ủ

a bi

ế

n ng

ẫ

u nhiên

ươ

ứ

ng.

10.

Cho bi

ế

n ng

ẫ

u nhiên

có hàm phân ph

ố

( ) ( )











≤<−

3,1

32,2

2,0

Tìm hàm m

ậ

độ

(

)

Tính

[

]

6,11

11.

Cho bi

ế

n ng

ẫ

u nhiên

có hàm phân ph

ố

( )











≤<−+

−≤

1,0

Tìm hàm m

ậ

độ

ủ

a bi

ế

n ng

ẫ

u nhiên

Tính

(

)

−

XP .

12.

Cho hàm s

ố

( )











≤<−

≤<

>∨≤

21,2

10,

20,0

xxa

xax

xf .

Tìm

để

(

)

là hàm m

ậ

độ

Tìm hàm phân ph

ố

i t

ươ

ứ

ng.

13.

Cho hàm s

ố

( )























−∉













−∈

;

,cos

ππ

xxA

Tìm

để

(

)

là hàm m

ậ

độ

ủ

a bi

ế

n ng

ẫ

u nhiên nào

ó.

Tìm hàm phân ph

ố

(

)

. Tìm













<≤−

ππ

14.

Cho hàm

( )







≥

−

0,0

xeBx

Xác

đị

để

(

)

là hàm m

ậ

độ

ủ

a bi

ế

n ng

ẫ

u nhiên nào

ó.

Tìm hàm phân ph

ố

(

)

Chương III. Các quy luật phân phối xác suất thường gặp.

15.

Tìm

để

hàm

( )











>≥

−

0,0

)0(0,

xke

là hàm m

ậ

độ

ủ

a bi

ế

nào

ó. Tìm

hàm phân ph

ố

i t

ươ

ứ

ng.

16.

Cho bi

ế

n ng

ẫ

u nhiên

có hàm phân ph

ố

( )











≤<−+

−≤

2,1

22,

arcsin

2,0

Tìm

(

)

−

Tìm hàm m

ậ

độ

(

)

17.

Cho hàm m

ậ

độ

ủ

a bi

ế

n ng

ẫ

u nhiên

là:

( )











≤

−

0,0

0,0,

Tìm hàm phân ph

ố

i c

ủ

a bi

ế

n ng

ẫ

u nhiên

và tính xác su

ấ

(

)

≤

XP 0

Tính kì v

ọ

ng và ph

ươ

ng sai c

ủ

18.

Cho bi

ế

n ng

ẫ

u nhiên

có b

ả

ng phân ph

ố

i xác su

ấ

−

1,0

3,0

2,0

4,0

ậ

p b

ả

ng phân ph

ố

i xác su

ấ

t c

ủ

a bi

ế

n ng

ẫ

u nhiên 2008

+= XY .

Tính

(

)

(

)

19.

Cho

(

)

8,0

AP . Tìm xác su

ấ

t khi th

ự

c hi

ệ

n 100 phép th

ử

thì

ố

ầ

n x

ả

y ra bi

ế

n c

ố

A l

ớ

n h

n 75.

ố

ầ

n x

ả

y ra bi

ế

n c

ố

A không quá 75.

ố

ầ

n x

ả

y ra bi

ế

n c

ố

A là n

ằ

m trong

ạ

[

]

90;75

Đáp số và hướng dẫn.

Ta có:

ọ

là s

ố

ậ

n th

ắ

ng c

ủ

độ

i tuy

ể

Ta có:

168,0

436,0

324,0

072,0

( )











≤<

≤

3,1

32,928,0

21,604,0

10,168,0

0,0

Bài giảng

ễ

ấ

(

)

(

)

832,068,011011

−

≥

XPXP

Vì trong h

ộ

p có

en nên ta ch

ỉ

ấ

y nhi

ề

u nh

ấ

t là 5 bi là

đượ

c bi

đỏ

ả

ng phân ph

ố

Ta có

ậ

n các giá tr

ị

ươ

ứ

ng là:

Ta có

2475

916

2475

1477

1910

=+ aa

≥

1,0

⇒

, b)

2,0

, c)

3,0

( )











≤<

≤

4,1

43,805,0

32,505,0

21205,0

10,05,0

0,0

(

)

(

)

(

)

05,01020

≤

XPXPXP

(

)

(

)

(

)

65,03231

≤

XPXPXP

(

)

(

)

45,0212

≤

−

XPXP .

ả

hai hàm này là hàm m

ậ

độ

xác su

ấ

10.

( ) ( )











≤≤−

3,0

32,22

2,0

, b) 0

11.

( )











≤<−

−≤

1,0

xf , b)

( )

02 =<<− XP

Chương III. Các quy luật phân phối xác suất thường gặp.

12.

=a .

13.

14.

( )

∫

+∞

∞−

dxxf

=⇔=⇒

∫

+∞

−

BdxeBx

15.

=k .

16.

( )

11 =<<− XP

, b)

( )











≤<−

−

−≤

2,0

22,

2,0

17.

( )











>>−

≤

−

0,0,1

0,0

, b)

(

)

(

)

=XD

18.

(

)

9,2009

(

)

9,3

C. Phương pháp giảng dạy.

- Ứng dụng Excel cho việc tính các giá trị của biến ngẫu nhiên có phân phối chuẩn,

phân phối Poisson, phân phối Student, phân phối chi bình phương.

- Gi

ả

ng viên g

ử

i bài gi

ả

ng cho sinh viên

đọ

c tr

ướ

c. Gi

ả

ng viên trình bày bài gi

ả

ng trên l

ớ

theo ph

ươ

ng pháp thuy

ế

t trình h

ỏ

áp. Giao bài t

ậ

p cho sinh viên v

ề

nhà làm. Gi

ớ

i thi

ệ

u m

ộ

ố

tài li

ệ

u tham kh

ả

D. Tài liệu tham khảo

[1] Đậu Thế Cấp, Xác suất thống kê: Lí thuyết và các bài tập, NXB Giáo dục,

2006.

[2] Đặng Công Hanh, Đặng Ngọc Dục, Giáo trình Lý thuyết xác suất và Thống kê

toán, trường Đại học Duy Tân,1996

[3] PGS. TS. Phạm Xuân Kiều, Giáo Trình xác suất và thống kê, NXB Giáo dục,

2005.

[4] Trần Văn Minh, Phí Thị Vân Anh, Xác suất thống kê, NXB Giao thông vận tải,

2008.

[5] Trần Văn Minh, Phí Thị Vân Anh, Hướng dẫn giải bài tập Xác suất thống kê,

NXB Giao thông vận tải, 2008.

Chương IV. Lí thuyết mẫu

A. Mục tiêu.

- Giới thiệu các khái niệm: tổng thể, mẫu ngẫu nhiên, mẫu cụ thể, kích thước mẫu.

- Xây dựng các bảng phân phối thực nghiệm và vẽ biểu đồ của chúng.

- Xây dựng hàm phân phối mẫu và giới thiệu đa giác tần suất tích luỹ.

- Giới thiệu các đặc trưng của mẫu:trung bình mẫu, phương sai mẫu chưa hiệu chỉnh

và đã hiệu chỉnh, độ lệch chuẩn mẫu chưa hiệu chỉnh và đã hiệu chỉnh, tỉ lệ mẫu.

- Gi

ớ

i thi

ệ

u lu

ậ

t phân ph

ố

i c

ủ

a các

đặ

c tr

ng m

ẫ

B. Nội dung.

1. Tổng thể và mẫu.

1.1. Mở đầu.

Trong thực tế, ta thường phải nghiên cứu một tập hợp các phần tử theo một hay

nhiều dấu hiệu đặc trưng cho các phần tử. Nhưng tập hợp có quá nhiều phần tử thì

không thể nghiên cứu tất cả các phần tử, vì nếu làm như vậy sẽ tốn thời gian, công

sức, … Do đó, người ta thường nghiên cứu một phần, đặc biệt các phương pháp

chọn mẫu.

Giả sử ta cần nghiên cứu một tập hợp gồm

phần tử, tập hợp này gọi là tổng thể,

mỗi phần tử của tập hợp này gọi là một cá thể,

gọi là kích thước của tổng thể.

Ta lấy ngẫu nhiên

phần tử, từ tổng thể gọi là một mẫu. Số

gọi là kích thước

mẫu. Từ những thông tin có được trên mẫu này ta suy ra kết luận của tổng thể, do đó

phải lấy mẫu như thế nào để đại diện cho tổng thể. Trong mỗi ngành, mỗi lĩnh vực

có các phương pháp riêng mang tính đặc thù của ngành, để sao cho việc lấy mẫu đại

diện trung thực cho tổng thể.

Ví dụ 1.1.

Ta xét bài toán sau: Để có chiến lược cho chương trình dinh dưỡng quốc gia nhằm

tăng chiều cao của người dân, người ta đi tìm chiều cao của những người trưởng

thành ở Việt Nam.

Khi đó, trong bài toán này:

a) Tập hợp gồm tất cả những người trưởng thành ở Việt Nam, ta gọi là tổng thể.

b) Mỗi người trong tổng thể, được gọi là một cá thể.

c) Chiều cao của người trong tổng thể là một đại lượng ngẫu nhiên.

Bài giảng

d) Do số người trưởng thành ở Việt Nam là rất lớn, nên ta không thể đo chiều cao tất

cả được mà chỉ ra một số người (chẳng hạn 500 người) để đo chiều cao. Tập hợp

500 người này được gọi là một mẫu, số 500 được gọi là kích thước mẫu.

Ta nói rằng một mẫu là ngẫu nhiên nếu trong phép lấy mẫu đó, mỗi phần tử của tổng

thể đều được chọn một cách độc lập và có xác suất được chọn như nhau. Ngoài

phương pháp lấy mẫu ngẫu nhiên, ta còn có các phương pháp lấy mẫu khác nữa như

chọn mẫu với xác suất không đều, chọn mẫu theo nhóm trội, mẫu chùm v.v… Trong

bài giảng này, chúng ta giới thiệu cách lấy mẫu đơn giản nhất và được sử dụng rộng

rãi trong các lĩnh vực khác nhau.

Khi chọn mẫu nếu phần tử đã chọn loại ra khỏi tổng thể mới chọn phần tử tiếp theo

thì gọi là mẫu không hoàn lại, nếu phần tử đã chọn trả lại tổng thể mới chọn phần tử

tiếp theo thì gọi là mẫu có hoàn lại.

Khi kích thước của tổng thể đủ lớn thì có thể coi 2 cách lấy trên là như nhau.

1.2. Mẫu ngẫu nhiên, mẫu cụ thể.

Tiến hành

quan sát độc lập về biến ngẫu nhiên

nào đó trên tổng thể.

Ta gọi

là quan sát thứ

của biến ngẫu nhiên

ni ;1=

Khi đó

(

)

XXX

;;;

được gọi là mẫu ngẫu nhiên, trong đó

độc

lập và có cùng phân phối xác suất với

Ta gọi

là kết quả quan sát thứ

. Khi đó

(

)

xxx

;;;

là

giá trị quan sát được.

Đó là giá trị cụ thể của mẫu ngẫu nhiên

(

)

XXX

;;;

nhận còn được gọi là mẫu

cụ thể (hoặc mẫu thực nghiệm).

Chú ý.

+ Ta chỉ xét các kết quả quan sát độc lập.

+ Khi xét lí thuyết, ta dùng mẫu ngẫu nhiên, còn khi làm toán thì ta dùng mẫu cụ

thể.

Ví dụ 1.2.

Xét một tổng thể là một hộp gồm có

cây thước, trong đó có

cây thước dài

cm,

cây thước dài

cm và

cây thước dài

cm.

Gọi

là biến ngẫu nhiên đặc trưng cho chiều dài (xét về lượng) của cây thước.

Ta xét tổng thể về mặt định lượng.

Khi đó,

có bảng phân phối như sau:

Ta thực hiện việc lấy ngẫu nhiên (có hoàn lại)

cây thước. Khi đó

Gọi

là chiều dài của cây thước được lấy ra lần thứ

5;1=i

thì

có phân phối

Chương IV. Lí thuyết mẫu.

Như vậy,

là

biến ngẫu nhiên độc lập có cùng phân phối với

(

)

XXX

;;;

là mẫu ngẫu nhiên.

Ta thực hiện

lần lấy cây thước như sau:

(

)

xxx

;;;

là mẫu cụ thể trong

lần

quan sát, chẳng hạn là:

cmxX

Vậy

(

)

(

)

cmcmcmcmcmxxx

30;20;30;10;10;;;

Bây giờ, ta xét tổng thể về mặt định tính.

Nếu ta xem những cây thước nhỏ hơn

cm là “không đạt yêu cầu”.

Lấy ngẫu nhiên

cây thước. Gọi

là số cây thước “không đạt yêu cầu”.

Ta có bảng phân phối xác suất của

là

Gọi

là số cây thước “không đạt yêu cầu” khi lấy cây thước thứ

5;1

. Ta thấy

các

có cùng phân phối với

(

)

XXX

;;;

là mẫu ngẫu nhiên.

Ta xem chiều dài cụ thể của cây thước được lấy ra. Khi đó, chẳng hạn ta có kết quả

(

)

(

)

1;0;0;1;1;;;

xxx

được gọi là mẫu cụ thể.

1.3. Bảng phân phối tần số.

1.3.1. Phân loại mẫu và bảng phân phối tần số.

Giả sử mẫu

(

)

xxx ;;

2;1

có kích thước

, nếu các

ni ;1=

khác nhau khi đó mẫu

gọi là mẫu đơn.

Nếu trong mẫu có

giá trị khác nhau với

xuất hiện

lần,

xuất hiện

lần,

…,

xuất hiện

lần thì

nnnn

và

gọi là tần số của

Mẫu có các giá trị giống nhau gọi là mẫu lặp.

Nếu ta xếp

theo thứ tự tăng dần

xxx

và lập bảng gồm các

và tần số

tương ứng thì ta được một bảng

…

ầ

n s

ố

…

gọi là bảng phân phối tần số.

Bài giảng

Trong trường hợp mẫu có kích thước lớn các giá trị của

khác nhau không nhiều,

để tiện lợi cho việc tính toán ta phân miền giá trị của

thành

khoảng (có thể chia

đều hoặc không đều)

[

)

;

[

)

;

[

)

;

1−

và nếu có

giá trị của mẫu

xuất hiện trong khoảng

[

)

;

thì bảng

[

)

;

[

)

;aa

…

[

)

;

1−

ầ

n s

ố

…

gọi là bảng phân phối tần số phân lớp.

Ta quy ước đầu mút bên trái của một khoảng thuộc khoảng đó khi tính tần số của

mỗi lớp.

Ví dụ 1.3.

Thống kê cân nặng

của

370

trẻ sơ sinh, ta được bảng phân phối tần số phân lớp

6,24,2

−

8,26,2

−

0,38,2

−

2,30,3

−

4,32,3

−

6,34,3

−

Tần số

100

Thông thường, người ta chia số liệu thành từ

đến

lớp. Nếu số lớp nhiều hơn có

thể giúp phân tích tốt hơn, nhưng sự cải thiện không nhiều, nếu số lớp ít quá, thì các

thông tin có thể bị mất khi xử lí.

Một bảng phân phối tần số phân lớp có thể đưa về bảng phân phối lặp bằng phép lấy

trung bình cộng của mỗi lớp.

Ví dụ 1.4.

Xét Ví dụ 1.3, ta có:

5,2

7,2

9,2

1,3

3,3

5,3

Tần số

100

1.3.2. Bảng phân phối tần suất.

Từ bảng phân phối, nếu ta đặt

thì

được gọi là tần suất xuất hiện

của

. Khi đó, bảng

…

ầ

n su

ấ

…

được gọi là bảng phân phối tần suất, nó rất giống với bảng phân phối xác suất của

một biến ngẫu nhiên rời rạc.

Để có được một hình dung về phân phối mẫu, người ta thường dùng đồ thị để biểu

diễn bảng phân phối tần suất.

1.3.3. Đa giác tần suất

Trên đồ thị, nối các điểm có tọa độ

(

)

;

ki ;1=

ta được đường gấp khúc gọi là đa

giác tần suất.

Chương IV. Lí thuyết mẫu.

1.3.4. Biểu đồ tần số.

Nếu mẫu cho bằng các khoảng phân lớp, ta xây dựng một biểu đồ gồm các hình chữ

nhật cạnh nhau có đáy bằng độ dài của khoảng phân lớp và có diện tích bằng tần số

của lớp và gọi là biểu đồ tần số.

Sau đây, là bảng phân phối tần suất, đa giác tần suất và biểu đồ tần số của Ví dụ 1.3.

5,2

7,2

9,2

1,3

3,3

5,3

Tần số

100

Tần suất 0,162 0,119 0,205 0,270 0,257 0,132

0.05

0.1

0.15

0.2

0.25

0.3

2,5 2,7 2,9 3,1 3,3 3,5

Tần suất

Đa giác tần suất

100

120

Biểu đồ tần số

Bài giảng

1.4. Hàm phân phối mẫu.

Với ĐLNN

, ta không thể biết được hàm phân phối xác suất

(

)

của nó. Tuy

nhiên từ một mẫu thống kê

(

)

xxx

;;;

của

dựa vào bảng phân phối tần suất ta

có thể thu được những thông tin quan trọng về

(

)

Từ bảng phân phối tần suất, ta xây dựng hàm

(

)

như sau:

(

)

∑

fxF

. Hay

( )











≤<+++

≤<+

≤<

≤

−−

nnn

xxxfff

xxxff

xxxf

1121

3221

211

KKK

(

)

được gọi là hàm phân phối thực nghiệm hoặc phân phối mẫu.

Trên đồ thị, nối các điểm có tọa độ













∑

;

ki ;1=

ta được được đường gấp khúc

gọi là đa giác tần suất tích lũy.

Sau đây, là biểu đồ đa giác tần suất tích lũy Ví dụ 1.1.

0.2

0.4

0.6

0.8

1.2

2.5 2.7 2.9 3.1 3.3 3.5 3.7 3.9

Biểu đồ đa giác tần suất tích lũy.

2. Các tham số đặc trưng của mẫu

2.1. Tỉ lệ mẫu.

Ta gọi hàm phân phối xác suất của biến ngẫu nhiên này là hàm phân phối mẫu; kì

vọng, phương sai của biến ngẫu nhiên là trung bình mẫu và phương sai mẫu. Khi đó,

ta có:

Chương IV. Lí thuyết mẫu.

Trung bình mẫu:

nxnxnx

fxfxfxx

=+++=

2211

Phương sai mẫu:

(

)

(

)

(

)

( ) ( ) ( )

nxxnxxnxx

fxxfxxfxxs

−++−+−

−++−+−=

Đặt:

nxnxnx

fxfxfxx

+++

=+++=

Theo tính chất phương sai, ta có

( )

(

)

xnxn

xxs

−

=−=

∑

Phương sai mẫu hiệu chỉnh:

(

)

(

)

(

)

−

−++−+−

−

nxxnxxnxx

Tương tự với biến ngẫu nhiên, ta gọi

ˆˆ

ss =

là độ lệch mẫu và

ss =

là độ lệch mẫu hiệu chỉnh.

Để tính các đặc trưng này, ta thường lập bảng sau

… … … …

∑

Từ bảng này, ta có

∑

(

)

xxs −=

và

−

Ví dụ 2.1.

Cho mẫu

5 10 15 20 25

a) Viết hàm phân phối mẫu.

b) Tính trung bình mẫu, phương sai mẫu, phương sai mẫu hiệu chỉnh.

Giải.

Bài giảng

a) Bảng phân phối xác suất

ầ

n su

ấ

15,0

25,0

30,0

20,0

10,0

ừ

ó, ta có hàm phân ph

ố

i là:

( )











≤<

≤

25,1

2520,90,0

2015,70,0

1510,45,0

105,15,0

5,0

b) Ta có bảng tính

5 15 75 375

250

2500

450

6750

400

8000

25 10 250 6250

∑

100

1425

23875

Từ bảng, ta có:

25,14

100

1425

==x ; 75,238

100

23875

==x ;

(

)

(

)

6875,3525,1475,238

=−=−= xxs

; 0480,366875,35.

100

−

= s

Ví dụ 2.2.

Theo dõi số lượng bài tập ở một nhóm gồm

100

sinh viên giải trong một tuần, ta thu

được bảng số liệu sau:

ổ

ng s

ố

bài t

ậ

ố

sinh viên

hoàn thành

a) Tính trung bình mẫu, phương sai mẫu chưa hiệu chỉnh, phương sai mẫu hiệu

chỉnh.

b) Những sinh viên thực hiện xong một phép toán toán lớn hơn

bài là những sinh

sinh viên có tốc độ làm bài tập nhanh. Tính tỉ lệ sinh viên có tốc độ làm bài tập

nhanh?

c) Tính trung bình mẫu, phương sai mẫu hiệu chỉnh của những học sinh viên có tốc

độ làm bài tập nhanh.

Giải.

a) Ta lập bảng như sau:

Chương IV. Lí thuyết mẫu.

141

16810

880

38720

1350

60750

690

31740

480

23040

520

27040

54 5 270 14580

∑

100

4600

212680

Dựa vào bảng trên, ta có

Số bài tập trung bình:

100

4600

==x

bài.

Phương sai mẫu chưa hiệu chỉnh:

(

)

( )

8,1046

100

212680

=−=−= xxs

Phương sai mẫu hiệu chỉnh là:

909,108,10.

100

−

= s

b) Tỉ lệ mẫu là

25,0

100

51010

c) Ta có bảng

480

23040

520

27040

54 5 270 14580

∑

1270

64660

Khi

ó, ta có:

8,50

1270

==x

( )

(

)

68,50.2564660

=−

−

2.2. Số mốt (Mode) của mẫu.

Số mốt của mẫu ngẫu nhiên

, kí hiệu là

(

)

XMod

, được xác định như sau: Nếu

mẫu được cho dưới bảng phân phối tần số thì Mode là giá trị có tần số lớn nhất.

Đối với trường hợp mẫu được cho dưới dạng bảng phân phối tần số phân lớp,

người ta định nghĩa khoảng Mode là khoảng có diện tích của hình chữ nhật dựng

trên khoảng đó là lớn nhất.

Mode là một chỉ tiêu thường được chú ý trong các bài toán về kinh tế. Chẳng hạn

một nhà máy sản xuất ô tô Civic muốn có một số lượng ô tô đủ đáp ứng nhu cầu của

người cần mua thì phải chú ý đến ô tô loại gì mà khách hàng thường hay hỏi mua

nhất.

2.3. Số trung vị (Median) của mẫu.

Trung vị của một mẫu số liệu, kí hiệu bởi

(

)

XMed

, là một số có tính chất sau: Số

các giá trị của mẫu bé hơn hoặc bằng

(

)

XMed

thì bằng số các giá trị của mẫu lớn

hơn hoặc bằng

(

)

XMed

Bài giảng

Xét trường hợp các giá trị của mẫu là phân biệt. Giả sử các giá trị của mẫu được sắp

xếp theo thứ tự tăng dần

xxx

Khi đó, dễ thấy nếu

lẻ thì lấy

(

)

xXMed

Nếu

chẵn thì ta lấy

( )













xxXMed

Trong trường hợp giá trị

có tần số

, gọi

là chỉ số bé nhất sao cho

nnn

≥+++

. Lúc đó, ta định nghĩa

(

)

nXMed

Ví dụ 2.3.

Cho mẫu

ổ

ng s

ố

bài t

ậ

ố

sinh viên

hoàn thành

10 20 30 15 10 10 5

Ta có

100

Dễ thấy: số sinh viên hoàn thành ít hơn hoặc bằng

bài là

100

<=+ nn

và số sinh viên hoàn thành ít hơn hoặc bằng

bài tập là

100

321

>=++ nnn

Vậy

(

)

XMed

Trong trường hợp mẫu được cho dưới dạng bảng phân phối tần số phân lớp, ta định

nghĩa khái niệm trung vị như sau:

Giả sử, ta có

khoảng với các điểm chia là

aaa

, với

[

)

101

;aaC

[

)

212

;aaC

[

)

mmm

aaC ;

1−

, trong đó khoảng

có tần số là

nnnn

Khoảng

được gọi là khoảng trung vị nếu

là số bé nhất sao cho

nnn

≥+++

Số trung vị

(

)

XMed

là số mà tại đó, đường thẳng

chia đôi diện tích của biểu

đồ tần số. Rõ ràng, số trung vị luôn luôn nằm trong khoảng trung vị.

Ví dụ 2.4.

Tìm khoảng trung vị và số trung vị cho Ví dụ 1.3.

Giải

Ta có

22610076446

370

12676446 =+++<<=++

nên khoảng trung vị là

(

)

2,3;0,3

Chương IV. Lí thuyết mẫu.

Để tính số trung vị, ta nhận thấy: chiều cao của khoảng trung vị này là

500

2,0

100

Khi đó, ta chia hình chữ nhật dựng trên khoảng này là thành

phần có diện tích

phần bên trái là

59126185

−

Ta có

59.500

hay

500

=AM

. Vậy số trung vị

( )

500

0,3 +=xMed

Hoặc ta có thể tính như sau:

Hình chữ nhật có diện tích phần bên phải là

41185226

−

Ta có

41.500

hay

500

=BM

Vậy số trung vị là

( )

500

2,3 −=xMed

Dựa vào bài toán này, ta có nhận xét sau.

Nhận xét.

Ta chứng minh được

( )

aXMed

−













−

−=

∑

là số trung vị, trong đó

[

)

kkk

aaC ;

1−

là khoảng trung vị.

2.4. Các quy luật phân phối mẫu.

Người ta chứng minh được các kết quả sau:

Định lí.

Cho

tuân theo phân phối chuẩn

(

)

;

σµ

thì

a) Nếu biết

thì













( )

1;0~. Nn

−

b) Nếu chưa biết

thì

≤

, ta có

( )

1~. −

−

nTn

A B

Bài giảng

, ta có

( )

1;0~. Nn

−

c) Nếu biết

thì

( )

∑

−

d) Nếu chưa biết

thì

(

)

( )

−

∑

Chú ý.

Nếu không biết phân phối của biến ngẫu nhiên

nhưng với kích thước mẫu

khi đó ta xem biến ngẫu nhiên

có phân phối chuẩn

(

)

;

σµ

3. Bài tập chương.

ọ

ng l

ượ

ng c

ủ

100

ẻ

em c

ủ

a m

ộ

t tr

ườ

ng m

ẫ

u giáo ghi nh

ậ

đượ

c nh

ọ

ng l

ượ

ng (kg) 41 44 45 46 48 52 54

ố

ẻ

em 10 20 30 15 10 10 5

a) Hãy xác

đị

là tr

ọ

ng l

ượ

ng trung bình c

ủ

a các sinh viên và

độ

ệ

ch m

ẫ

u hi

ệ

u ch

ỉ

b) Hãy xác

đị

nh b

ả

ng phân ph

ố

i xác su

ấ

ế

t qu

ả

thi h

ọ

c kì môn toán A1 c

ủ

a m

ộ

t kh

ố

i sinh viên khóa

ồ

ạ

n nh

ể

m 3 5 6 8 9

ố

sinh viên 40 15 5 10 2

a) Hãy l

ậ

p b

ả

ng phân ph

ố

i t

ầ

n s

ố

ủ

a các k

ế

t qu

ả

này.

b) L

ậ

p b

ả

ng phân ph

ố

i t

ầ

n su

ấ

t và v

ẽ

a giác t

ầ

n su

ấ

ố

ng kê cân n

ặ

ng c

ủ

400

ẻ

sinh, ta

đượ

c b

ả

ng phân ph

ố

i t

ầ

n s

ố

phân l

ớ

p sau

6,24,2

−

8,26,2

−

0,38,2

−

2,30,3

−

4,32,3

−

4,32,3

−

8,36,3

−

Tần

số

100

a) L

ậ

p b

ả

ng phân ph

ố

i t

ầ

n s

ố

không phân l

ớ

b) L

ậ

p b

ả

ng phân ph

ố

i t

ầ

n su

ấ

t, v

ẽ

a giác t

ầ

n su

ấ

t và bi

ể

đồ

ầ

n s

ố

c) L

ậ

p hàm phân ph

ố

i m

ẫ

u và v

ẽ

a giác t

ầ

n su

ấ

t tích l

d) Tìm

(

)

XMod

, xác

đị

nh kho

ả

ng trung v

ị

Giá c

ủ

a m

ộ

t lo

ạ

i c

ổ

phi

ế

u bán trên th

ị

ườ

ng ch

ứ

ng khoáng trong

100

phiên giao d

ị

đượ

c cho

ở

ả

ng sau

Giá c

ổ

phi

ế

(1000

)

1513

−

1715

−

1917

−

2119

−

2321

−

ố

phiên giao

ị

5 18 42 27 8

Hãy tính các giá tr

ị

, ph

ươ

ng sai m

ẫ

ổ

i c

ủ

nhân viên trong m

ộ

t c

quan

đượ

c ghi l

ạ

i nh

Kho

ả

ng T

ầ

n s

ố

ướ

i 20

20-30 13

30-40 26

40-50 15

50-60 6

Trên 60 3

Tìm kho

ả

ng trung v

ị

, s

ố

trung v

ị

, kho

ả

ng Mod.

6. Để

nghiên c

ứ

u nhu c

ầ

u tiêu th

ụ

ữ

a h

ộ

p trong m

ộ

t khu v

ự

c, ng

ườ

i ta ti

ế

n hành kh

ả

o sát

800 gia

ình. K

ế

t qu

ả

đượ

c cho

ở

ả

ng d

ướ

ây:

Nhu c

ầ

u (h

ộ

p/tháng) S

ố

gia

ình Nhu c

ầ

u (h

ộ

p/tháng) S

ố

gia

ình

30-34 35 55-59 142

35-39 48 60-64 94

40-44 83 65-70 50

45-49 159 70-74 10

50-54 189

b) Tìm s

ố

ộ

p s

ữ

a tiêu th

ụ

trung bình.

Chương IV. Lí thuyết ước lượng

c) Tìm kho

ả

ng trung v

ị

, s

ố

trung v

ị

Khi ki

ể

m tra th

ể

ự

c m

ộ

t nhóm sinh viên, ta có k

ế

t qu

ả

ề

cân n

ặ

ng nh

(kg)

5,475,42

−

5,525,47

−

5,575,52

−

5,625,57

−

5,675,62

−

Số

sinh

viên

a) Tính

là cân n

ặ

ng trung bình cho các sinh viên và tính

độ

ệ

ch m

ẫ

b) L

ậ

p b

ả

ng phân ph

ố

i xác su

ấ

t m

ẫ

8. Đ

ề

u tra n

ng su

ấ

t lúa trên di

ệ

n tích

100

ha tr

ồ

ng lúa c

ủ

a m

ộ

t vùng, ta thu

đượ

c b

ả

ng s

ố

ệ

u sau.

ng su

ấ

t (t

ạ

/ha) 41 44 45 46 48 52 54

ố

ha có n

ng su

ấ

ươ

ứ

10 20 30 15 10 10 5

a) Tính trung bình m

ẫ

u, ph

ươ

ng sai m

ẫ

u, ph

ươ

ng sai m

ẫ

u hi

ệ

u ch

ỉ

nh.

b) Nh

ữ

ng th

ử

a ru

ộ

ng có n

ng su

ấ

t t

ừ

ạ

ở

lên g

ọ

i là nh

ữ

ng th

ử

a ru

ộ

ng có n

ng su

ấ

t cao.

Tính t

ỉ

ệ

ử

a ru

ộ

ng có n

ng su

ấ

t cao.

c) Tính trung bình m

ẫ

u, ph

ươ

ng sai m

ẫ

u hi

ệ

u ch

ỉ

nh c

ủ

a nh

ữ

ng th

ử

a ru

ộ

ng có n

ng su

ấ

t cao.

C. Phương pháp giảng dạy.

- Phối hợp phương pháp thuyết trình và vấn đáp giải quyết vấn đề.

- Đưa ví dụ cụ thể để nêu rõ ý nghĩa của việc chọn mẫu.

- Từ trực quan sinh động đến tư duy trừu tượng. Áp dụng một số ví dụ thực tế.

- Yêu cầu SV đọc bài giảng trước khi lên lớp.

- Kiểm tra, đánh giá việc làm bài tập của SV.

- Sử dụng phương tiện dạy học hiện đại như Mic.

D. Tài liệu tham khảo

[1] Đậu Thế Cấp, Xác suất thống kê: Lí thuyết và các bài tập, NXB Giáo dục, 2006.

[2] Đặng Hùng Thắng, Thống kê và ứng dụng, NXB Giáo dục, 2008.

[3] PGS. TS. Phạm Xuân Kiều, Giáo Trình xác suất và thống kê, NXB Giáo dục,

2005.

[4] Trần Văn Minh, Phí Thị Vân Anh, Xác suất thống kê với các tính toán trên

Excel, NXB Giao Thông Vận tải, 2008.

[5] Đặng Công Hanh, Đặng Ngọc Dục, Giáo trình Lý thuyết xác suất và Thống kê

toán, trường Đại học Duy Tân,1996

[6] Trần Văn Minh, Phí Thị Vân Anh, Hướng dẫn giải bài tập Xác suất thống kê với

các tính toán trên Excel, NXB Giao Thông Vận tải, 2008.

Chương V.

Lí thuyết ước lượng

A. Mục tiêu.

- Giới thiệu các khái niệm ước lượng: ước lượng điểm, ước lượng khoảng.

- Giới thiệu các loại ước lượng điểm: ước lượng không chệch, ước lượng hiệu quả, ước

lượng vững.

- Gi

ớ

i thi

ệ

u các ph

ươ

ng pháp

ướ

c l

ượ

ng kho

ả

ng cho: kì v

ọ

ng, ph

ươ

ng sai, t

ỉ

ệ

B. Nội dung.

Xét một tổng thể

Ω

và giả sử ta quan tâm đến biến lượng

đo lường một dấu hiệu

nào đó của tổng thể

Ω

. Khi đó

được coi là đại lượng ngẫu nhiên. Phân phối xác

suất của

thường rất khó nắm bắt, và thông thường ta giới hạn ở việc xác định một

số các tham số đặc trưng của

như các giá trị:

(

)

(

)

(

)

XMed

(

)

XMod

, …

Các tham số này không thể xác định chính xác được (nếu không biết phân phối của

), mà phải ước lượng từ các giá trị của

trên một mẫu chọn ngẫu nhiên. Như vậy,

bài toán ước lượng tham số được phát biểu như sau:

Giả sử

là một đại lượng ngẫu nhiên có tham số đặc trưng

nào đó (chưa biết) mà

ta quan tâm. Vấn đề đặt ra là: Căn cứ trên

giá trị

của

đo được trên

một mẫu kích thước

được lấy từ tổng thể

Ω

, cần tìm một giá trị gần đúng

của

1. Ước lượng điểm.

Định nghĩa.

Một hàm

(

)

xxxT ;;;

của

giá trị

được gọi là một ước lượng

điểm cho

Như vậy, một ước lượng

là một hàm của

đại lượng ngẫu nhiên

nên nó cũng là đại lượng ngẫu nhiên. Có nhiều hàm ước lượng

(

)

xxxT ;;;

của tham số

khác nhau. Tuy nhiên, việc lựa chọn một ước lượng nào là “tốt” được

dựa vào các tiêu chuẩn dưới đây.

Định nghĩa.

Hàm ước lượng

(

)

xxxT

;;;

được gọi là ước lượng không chệch nếu

(

)

θθ

Bài giảng

Từ định nghĩa, ta thấy nếu

(

)

xxxT ;;;

là hàm ước lượng không chệch của

thì

(

)

=−

θθ

Tính chất không chệch có nghĩa là ước lượng

không có sai số hệ thống.

Định nghĩa.

Hàm ước lượng

(

)

xxxT ;;;

được gọi là ước lượng vững nếu với mọi

thì

(

)

lim =<−

+∞→

εθθ

hay

(

)

lim

=+<<−

+∞→

εθθεθ

Tính chất vững đảm bảo cho ước lượng

gần

tùy ý với xác suất cao (gần

) khi

kích thước mẫu

đủ lớn.

Định nghĩa.

Ước lượng

được gọi là một ước lượng hiệu quả của

nếu nó là một ước lượng

không chệch và có phương sai

(

)

nhỏ nhất.

2. Ước lượng khoảng.

Ước lượng điểm dù tốt nhất cũng chỉ cho ta một giá trị trong tập vô hạn nên ta không

biết được độ chính xác cũng như xác suất để điểm ước lượng có độ chính xác, do đó

không đánh giá được sai lầm khi dùng

thay cho

Để khắc phục hạn chế đó, người ta đưa ra ước lượng khoảng tin cậy cho tham số

nghĩa là dựa vào một ước lượng

, tìm một khoảng

(

)

;

với

là hai ước

lượng điểm của tham số

sao cho

(

)

−

Trong đó

−

là xác suất cho trước gọi là độ tin cậy của khoảng ước lượng, do đó

là khả năng mắc sai lầm của khoảng ước lượng còn

(

)

;

gọi là khoảng tin cậy

và

−

được gọi là độ dài của khoảng tin cậy.

Ý nghĩa của khoảng tin cậy là ở chỗ có thể nói trong

%100

trường hợp lấy mẫu

khoảng

(

)

;

chứa tham số

chưa biết thì khẳng định

có thể tin cậy ở

mức

Để ước lượng một tham số

, ta thực hiện quy tắc sau:

+ Chọn một hàm

(

)

;;;;

XXXGG

sao cho phân phối của

xác định hoàn toàn

(không chứa tham số

nữa).

+ Khi đó với độ tin cậy

−

cho trước, ta tìm cặp giá trị

sao cho

và tương ứng với chúng là các phân vị thỏa mãn điều kiện

(

)

gGP

và

(

)

−

gGP

(

)

−

gGP

)

Khi đó,

(

)

(

)

αααθ

αα

−=−−=<<

−

11;;;;

21211

gXXXGgP

+ Dùng các phép biến đổi tương đương, ta đưa bất đẳng thức trên về dạng

(

)

−

Chương V. Lí thuyết ước lượng

Nhận xét.

Trong Chương này, chúng ta chỉ xét trường hợp

αα

−

===

2.1. Ước lượng khoảng tin cậy cho kì vọng

Giả sử đại lượng ngẫu nhiên

có phân phối chuẩn

(

)

σµ

với tham số

chưa biết. Từ một mẫu cụ thể

(

)

xxx

;;;

của

. Bài toán đặt ra là tìm khoảng tin

cậy cho

(

)

2.1.1. Đã biết phương sai

σσ

Ta chọn hàm:

−

. Do

(

)

σµ

nên

(

)

1;0~













> zZP

và

−=













−

zZP

. Dễ thấy

αα

−

Khi đó

αα

zZz

−

hay

αα

X +<<−

Lại có

αααα

−=













>−













−<−=













<<−

2222

zZPzZPzZzP

Suy ra

αα

−=













<<−

zZzP

Vậy

αα

−=













+<<−

Khoảng ước lượng tin cậy cho kì vọng là













+−

;

αα

σσ

, trong đó

được

xác định từ công thức

γα

=−−=













Φ z

với

( )

∫

−

=Φ

dtem

Đại lượng

được gọi là độ chính xác của ước lượng, nó phản ánh độ lệch

trung bình của trung bình mẫu so với kì vọng lí thuyết với độ tin cậy

−

Khi đó, độ dài khoảng tin cậy là

Ví dụ 2.1.

Giả sử

là trọng lượng của em nam ở lứa tuổi lên

thuộc 4 quận ở thành phố Hà

Nội. Ta muốn biết

(

)

, trọng lượng trung bình của các em nam ở lứa tuổi lên

thuộc 4 quận ở thành phố Hà Nội. Vì điều kiện về tài chính, thời gian nên ta không thể

lấy trọng lượng của mọi em trong khu vực này, ta chọn ngẫu nhiên

em. Qua trọng

Bài giảng

lượng của

em này, ta xác định được

32=

kg. Giả sử phân phối của

có độ lệch

tiêu chuẩn

5,2

kg (đã biết). Vậy, với độ tin cậy là

%95

, ta có thể nói trọng

lượng trung bình

(

)

nằm trong khoảng nào? Xét trường hợp trên với độ tin cậy

%95

Giải

Ta có

5,2

đã biết.

Với độ tin cậy

%95

, ta có

. Khi đó

96,1

. Khi đó, khoảng ước lượng tin

cậy cho kì vọng

(

)

là













+−

;

αα

σσ

hay













+− 96,1.

5,2

2,3;96,1.

5,2

2,3

Ví dụ 2.2.

Một thầy giáo muốn ước lượng điểm môn Toán của toàn bộ sinh viên Đại học A. Giả

sử điểm môn Toán của sinh viên tuân theo phân phối chuẩn với

3,0

điểm. Thầy

giáo kiểm tra lớp có

100

sinh viên và biết được điểm môn Toán của

100

bạn này là

như sau:

ể

m 3 5 6 8

ố

sinh viên 20 30 40 10

a) Ước lượng điểm trung bình môn Toán của toàn sinh viên Đại học A với độ tin cậy

là

%95

b) Với độ chính xác của ước lượng là

25,0

. Hãy xác định độ tin cậy.

Giải.

a) Dựa vào bảng, ta có

3,5

100

530

==x

3,0

100

%95

suy ra

05,0

và

96,1

Khi đó, khoảng ước lượng điểm trung bình là













+−

−−

;

αα

σσ

Hay

(

)

059,53;941,52

b) Ta có

25,0

. Suy ra

833,025,0

Khi đó, từ công thức

αα

−=−−=













Φ z

ta có

(

)

594,0833,02

≈

Vậy độ tin cậy là

%4,59

2.1.2. Chưa biết phương sai

Tương tự như trên, ta thay

bằng phương sai mẫu hiệu chỉnh

Chương V. Lí thuyết ước lượng

Ta chọn hàm

−

Ta xét

trường hợp sau:

TH1.

≤

Khi

≤

thì hàm

−

có phân phối Student với

−

bậc tự do. Do

có hàm mật độ đối xứng nên tương tự câu a), ta được

αα

−−

+<<−

Khoảng ước lượng tin cậy cho kì vọng là













+−

−−

;

αα

, trong đó

−n

được xác định từ công thức













tTP

Chú ý:

1;1

αα

−−−

−

TH 2.

Khi

thì hàm

−

có phân phối tiệm cận chuẩn

(

)

1;0

, và việc tìm

khoảng ước lượng với độ tin cậy

−

được làm như câu a) với

bằng phương

sai mẫu hiệu chỉnh

Vậy khoảng ước lượng tin cậy cho kì vọng là













+−

;

αα

, trong đó

được xác định từ công thức

γα

=−−=













Φ z

với

( )

∫

−

=Φ

dtem

Ví dụ 2.3.

Cân ngẫu nhiên

bao xi măng, ta thu được bảng kết quả sau:

x (kg)

47 48 49 50 51 52 53

n (s

ố

bao)

Tìm khoảng tin cậy

%95

cho trọng lượng trung bình

, biết trọng lượng

của bao xi

măng tuân theo phân phối chuẩn

(

)

;

σµ

với

chưa biết.

Giải

Đây là bài toán ước lượng khoảng tin cậy cho giá trị trung bình với phương sai chưa

biết.

Do chưa biết

và

3025

nên ta có

( )

1~ −

−

== nTn

Ta có trung bình

04,50=x

phương sai mẫu hiệu chỉnh

153,36042,1307 ==

Bài giảng

Ta có

064,2

05,0

;24

−

. Khi đó, khoảng tin cậy cho kì vọng là













+−=













+−

−−

064,2.

153,36

04,50;064,2.

153,36

04,50;

αα

Ví dụ 2.4.

Một nhà máy tiến hành một nghiên cứu xem trung bình một công nhân hoàn thành bao

nhiêu sản phẩm trong một tháng. Một mẫu ngẫu nhiên gồm

công nhân được chọn

và kết quả như sau

14, 18, 22, 30, 36, 28, 42, 79, 36, 52, 15, 47, 95, 16, 27, 111, 37, 63, 127, 23, 31, 70,

27, 111, 30, 147, 72, 37, 25, 7, 33, 29, 35, 41, 48, 15, 29, 73, 26, 15, 26, 31, 57, 40, 18,

85, 28, 32, 22, 37, 60, 41, 35, 26, 20, 58, 33, 23, 35.

Hãy xây dựng khoảng ước lượng tin cậy trung bình

số sản phẩm mà một công nhân

hoàn thành trong một tháng với độ tin cậy

%95

Giải.

Từ bảng số liệu trên, ta có

05,41=x

99,27

96,1

05,0

3059

nên ta có khoảng tin cậy cho

là













+−

;

αα













+−= 96,1.

99,27

05,41;96,1.

99,27

05,41

2.2. Ước lượng khoảng tin cậy cho phương sai.

Giả sử biến ngẫu nhiên

có phân phối chuẩn

(

)

σµ

với tham số

(

)

σθ

== XD

chưa biết. Từ một mẫu cụ thể

(

)

xxx ;;;

của

. Bài toán đặt ra là

tìm khoảng tin cậy cho phương sai

2.2.1. Đã biết kỳ vọng toán

(

)

Ta chọn hàm

( )

∑

−

, Ta có

có phân phối

(

)

χχ

Khi đó, xét các phân vị sau đây

;

χχ













và

χχ

−=













−n

Ta có

;

αα

χχχ

−

hay

( ) ( )

;

αα

−

∑∑

−

Lại có

αχχχ

αα

−=













−

;

1; nn

Chương V. Lí thuyết ước lượng

Vậy

( ) ( )

αα

−=













−

∑∑

;

Khoảng ước lượng tin cậy cho phương sai là

( ) ( )













−−

−

∑∑

;

αα

2.2.2. Chưa biết kỳ vọng toán

(

)

Ta chọn hàm

(

)

∑

−

Ta có

có phân phối

(

)

−n

χχ

. Thực hiện tương tự a), ta thu được

Vậy

(

)

(

)

αα

−=













−

−−

−

∑∑

1;1

XXXX

Khoảng ước lượng tin cậy cho phương sai là

(

)

(

)













−−

−

∑∑

1;1

;

αα

χχ

XXXX

Ví dụ 2.5.

Mức hao phí nguyên liệu cho một đơn vị sản phầm là đại lượng ngẫu nhiên

có phân

phối chuẩn

(

)

;

σµ

. Quan sát

sản phẩm, ta thu được kết quả sau

ượ

ng nguyên li

ệ

u hao phí

(kg)

5,19

5,20

ố

ả

n ph

ẩ

Với độ tin cậy

%90

, hãy ước lượng phương sai của

trong

trường hợp sau

a) Biết

kg.

b) Chưa biết

Giải.

a) Đã biết

kg. Ta có

( )

25,7

=−

∑

337,41

05,0;28

928,16

95,0;28

Khi đó, với độ tin cậy

%90

, ta có khoảng ước lượng tin cậy cho phương sai là

Bài giảng

( ) ( )













−−

−

∑∑

;

αα













928,16

25,7

;

337,43

25,7

b) Ta có

(

)

25,7

=−

∑

xxn

113,40

05,0;128

−

151,16

95,0;128

−

. Khi đó, khoảng ước lượng tin

cậy cho phương sai là

(

)

(

)













−−

−

∑∑

1;1

;

αα

χχ

xxxx













151,16

25,7

;

113,40

25,7

2.3. Ước lượng khoảng tin cậy cho tỉ lệ.

Nếu trong phép lấy mẫu, ta chỉ quan tâm đến sự xuất hiện hoặc không xuất hiện tính

chất

nào đó. Gọi

là tỉ lệ phần tử có tính chất

trong toàn bộ tổng thể,

chưa

biết. Giả sử trong một mẫu kích thước

có

phần tử có tính chất

. Cơ sở toán học

cho việc xây dựng khoảng tin cậy cho tỉ lệ

(chưa biết) là định lí sau đây:

Định lí.

Tần suất mẫu

f =

là một đại lượng ngẫu nhiên có phân phối xấp xỉ chuẩn với kì

vọng

(

)

pfE

và phương sai

( )

(

)

−

với điều kiện

( )







>−

Do ta không biết

nên ta không biết được

(

)

. Tuy nhiên với một số điều kiện, ta

có thể xấp xỉ

bởi

. Nghĩa là ta coi

( )

(

)

−

≈

. Để có thể dùng xấp xỉ này, ta

cần điều kiện sau

( )







>−

101

Khi đó, đại lượng ngẫu nhiên

(

)

(

)

( )

npf

−

sẽ có phân phối xấp xỉ chuẩn tắc

(

)

1;0

Khi đó, để ước lượng khoảng tin cậy cho tỉ lệ với độ tin cậy

−

Ta chọn hàm:

( )

−

. Khi đó

(

)

1;0~

Khi đó,

αα

zZz

−

, hay

(

)

(

)

αα

fpz

−

+<<

−

Từ đẳng thức

αα

−=













<<− 1

zZzP

, sau khi biến đổi ta được

Chương V. Lí thuyết ước lượng

(

)

(

)

αα

−=













−

+<<

−

− 1

fpz

Khi đó, khoảng ước lượng tin cậy cho tỉ lệ

là

(

)

(

)













−

;

αα

, trong đó

được xác định từ công thức

222

γα

=−=













với

( )

∫

−

=Φ

dtem

Ví dụ 2.6.

Kiểm tra ngẫu nhiên

500

xe máy của nhà máy A chuyên sản xuất xe máy thì có

360

xe máy đạt chất lượng tốt. Hãy ước lượng tỉ lệ tối thiểu xe máy đạt chất lượng tốt của

nhà máy A với độ tin cậy

%95

Giải.

Đây là bài toán ước lượng tỉ lệ.

Ta có

7,0

500

360

==f

103507,0.500

(

)

101501

−

Khi đó

( )

500

3,0.7,0

7,0

−

95,0%95

475,0

222

==−=













γα

nên

96,1

Vậy khoảng ước lượng tin cậy cho tỉ lệ là

(

)

(

)













+−=













−

− 96,1.

500

3,0.7,0

7,0;96,1.

500

3,0.7,0

7,0

500

;

500

αα

Tỉ lệ tối thiểu xe máy đạt chất lượng là

66,0

Ví dụ 2.7.

Tại một rừng nguyên sinh, người ta đeo vòng cho

1000

con chim. Sau một thời gian,

bắt lại

200

con thì có

con có đeo vòng. Thử ước lượng số chim trong vùng với độ

tin cậy

%99

Giải.

Đây là bài toán ước lượng tỉ lệ. Ta có:

2,0

200

==f

. Ta có

10402,0.200

và

(

)

10328,0.4001

−

Khi đó,

90,0%90

45,0

90,0

===













nên

645,1

Khi đó, khoảng ước lượng tin cậy cho tỉ lệ là

Bài giảng

(

)

(

)













+−=













−

− 64,1.

200

1,0.9,0

2,0;64,1.

200

1,0.9,0

2,0

500

;

500

αα

Hay

(

)

24,0;17,0

Khi đó, số chim trong vùng với độ tin cậy là













17,0

2000

;

24,0

2000

2.4. Ước lượng kích thước mẫu.

Với độ tin cậy

đã cho, ta thấy có mối quan hệ giữa kích thước mẫu

và độ dài

khoảng tin cậy. Kích thước mẫu càng lớn thì khoảng tin cậy càng hẹp, nghĩa là độ

chính xác của ước lượng càng cao, sai số càng nhỏ. Tuy nhiên, kích thước mẫu càng

lớn thì đòi hỏi nhà nghiên cứu càng nhiều thời gian, tiền của và công sức.

Vậy bài toán đặt ra là: Cần chọn kích thước mẫu tối thiểu là bao nhiêu để đạt được

độ chính xác mong muốn.

2.4.1. Trường hợp ước lượng cho trung bình

Giả sử muốn có ước lượng

với sai số không quá

cho trước với độ tin cậy

Khi đó, với xác suất

, ta xét 2 trường hợp sau

TH1: Nếu biết phương sai

thì

≤−

. Khi đó, ta cần có bất đẳng thức

≤

hay













≥

, trong đó

được xác định từ công thức

222

γα

=−=













với

( )

∫

−

=Φ

dtez

Vậy

là số nguyên dương nhỏ nhất thỏa mãn bất đẳng thức này.

TH2: Nếu không biết phương sai

thì ta thay

trong công thức













≥

bởi

phụ thuộc

nên ta thường lấy mẫu có kích thước

để tính

và

. Vậy

thỏa mãn công thức sau













≥

với điều kiện vế phải của công thức này lớn hơn hoặc bằng

Ví dụ 2.8.

Biết rằng độ lệch tiêu chuẩn chiều cao người lớn là

inch, ta muốn xây dựng một

khoảng tin cậy với

%90

cho chiều cao trung bình

với sai số không quá

5,0

inch.

Hãy xác định kích thước mẫu tối thiểu để đạt được yêu cầu trên.

Chương V. Lí thuyết ước lượng

Giải

Ta biết phương sai

5,0

và độ tin cậy

%90

Ta có

826,96

5,0

64,1.3

























≥

. Vậy

2.4.2. Trường hợp ước lượng cho tỉ lệ

Giả sử muốn có ước lượng

với sai số không quá

cho trước với độ tin cậy

. Ta

có

là số nguyên dương nhỏ nhất thỏa mãn

(

)

ffz

−

≥

, trong đó

được xác

định từ công thức

222

γα

=−=













Φ z

với

( )

∫

−

=Φ

dtez

với điều kiện

( )







>−

101

Ví dụ 2.9.

Phòng cảnh sát giao thông muốn ước lượng tỉ lệ xe chở quá tải trên đường với độ tin

cậy

%95

và sai số không vượt quá

05,0

thì cần phải kiểm tra bao nhiêu lượt xe

chạy trên đường? Biết rằng trong

100

xe đã kiểm tra thì có

xe quá tải.

Giải

Đây là bài toán ước lượng kích thức mẫu cho tỉ lệ.

Ta có

4,0

100

==f

%95

96,1

025,0

05,0

Khi đó, ta có:

(

)

( )

7936,368

05,0

4,01.4,0.96,1

−

≥

ffz

là số tự nhiên nên ta chọn

369

Vây, số xe cần kiểm tra là

369

3. Bài tập chương.

1. Đ

o s

ứ

c b

ề

n c

ủ

a m

ộ

t lo

ạ

i k

ề

m công nghi

ệ

p, ng

ườ

i ta thu

đượ

c b

ộ

ố

ệ

u sau

ây

4500 4800 4900 5000 5125 5200 5375 6500

1 3 3 7 5 3 2 1

ế

t r

ằ

ng s

ứ

c b

ề

n c

ủ

a k

ề

m có phân ph

ố

i chu

ẩ

n v

ớ

độ

ệ

300

. Hãy xây d

ự

kho

ả

ng tin c

ậ

y cho s

ứ

c b

ề

n trung bình c

ủ

a k

ề

m v

ớ

độ

tin c

ậ

y %95

Tìm kho

ả

ng tin c

ậ

y cho s

ứ

c b

ề

n trung bình c

ủ

a k

ề

m v

ớ

i gi

ả

thi

ế

t là không bi

ế

t ph

ươ

sai

ể

m tra s

ứ

c kh

ỏ

e c

ủ

a sinh viên m

ộ

t tr

ườ

đạ

i h

ọ

c, ta thu

đượ

c chi

ề

u cao c

ủ

a 500 sinh

viên nh

sau.

Bài giảng

Cao (cm)

ố

sinh viên

150-154 20

154-158 60

158-162 120

162-164 140

164-168 80

168-172 60

172-174 20

ế

độ

ệ

ch tiêu chu

ẩ

n c

ủ

a chi

ề

u cao ng

ườ

i l

ớ

n là cm5 . Tìm kho

ả

ng tin c

ậ

y cho chi

ề

u cao

trung bình c

ủ

a sinh viên tr

ườ

đạ

i h

ọ

c v

ớ

độ

tin c

ậ

y là

%95

ọ

là m

ứ

c tiêu th

ụ

ng c

ủ

a m

ộ

t lo

ạ

i ô tô (lít/

km100

). Ng

ườ

i ta ki

ể

m tra

chi

ế

và thu

đượ

c k

ế

t qu

ả

sau.

4,5 4,8 5,1 5,3 5,6 5,9 6,2 6,4

3 5 6 7 6 4 3 2

ớ

độ

tin c

ậ

y %95

, hãy xác

đị

nh kho

ả

ướ

c l

ượ

ng cho m

ứ

c hao phí x

ng trung bình

cho 100 km c

ủ

a lo

ạ

i ô tô này?

ố

ng kê t

ạ

i m

ộ

t tr

ạ

đă

ng kí xe máy trong m

ộ

t tháng, trong 3600 xe m

ớ

đă

ng kí thì

có

240

xem Air Blade. Hãy

ướ

c l

ượ

ng t

ỉ

ệ

ầ

n tr

m t

ố

a bán

đượ

c c

ủ

a lo

ạ

i xe Air

Blade trên th

ị

ườ

ng xe máy v

ớ

độ

tin c

ậ

%95

ộ

t nông dân mu

ố

ướ

c l

ượ

ng t

ỉ

ệ

ả

y m

ầ

m cho m

ộ

t gi

ố

ng lúa m

ớ

i. Khi ông ta

ề

tra 1000 h

ạ

t và th

ấ

đượ

c 640 h

ạ

t n

ả

y m

ầ

ớ

độ

tin c

ậ

y 95%, hãy

ướ

c l

ượ

ng t

ỉ

ệ

ả

y m

ầ

m cho gi

ố

ng lúa này.

ế

u mu

ố

ướ

c l

ượ

ng t

ỉ

ệ

ả

y m

ầ

m có sai s

ố

không v

ượ

t quá 2% và

đạ

độ

tin c

ậ

y 95%

thì c

ầ

n gieo ít nh

ấ

t bao nhiêu h

ạ

ớ

độ

tin c

ậ

y 97%, hãy

ướ

c l

ượ

ng s

ố

ạ

t gi

ố

ng n

ả

y m

ầ

m t

ố

i thi

ể

u khi gieo 10000 h

ạ

ộ

t kho hàng có

000.10

ộ

p s

ữ

a. Ng

ườ

i ta nghi ng

ờ

ữ

a b

ị

ỏ

ng, b

ằ

ng cách l

ấ

y ki

ể

tra 250 h

ộ

p thì th

ấ

y có 5 h

ộ

p b

ị

ớ

độ

tin c

ậ

y %95

, hãy

ướ

c l

ượ

ng t

ỉ

ệ

ố

ộ

p s

ữ

a b

ị

trong kho.

Ướ

c l

ượ

ng s

ố

ộ

p s

ữ

a b

ị

trong kho v

ớ

độ

tin c

ậ

%95

Cho

là n

ng su

ấ

t lúa

ở

ộ

t khu v

ự

c (

đơ

n v

ị

tính t

ạ

/ha).

ề

u tra

ở

ộ

t s

ố

ử

ộ

ng, ta có k

ế

t qu

ả

ây:

30-35 35-40 40-45 45-50 50-55

ố

hecta)

6 10 28 40 16

Hãy

ướ

c l

ượ

ng n

ng su

ấ

t lúa trung bình c

ủ

a toàn vùng, v

ớ

độ

tin c

ậ

%95

ữ

ng th

ử

a ru

ộ

đạ

t n

ng su

ấ

t t

ừ

45 t

ạ

/ha tr

ở

lên là nh

ữ

ng th

ử

a ru

ộ

đạ

t n

ng su

ấ

cao. Hãy

ướ

c l

ượ

ng t

ỉ

ệ

ữ

ng th

ử

a ru

ộ

đạ

t n

ng su

ấ

t cao c

ủ

a vùng này, v

ớ

độ

tin

ậ

y %95

ế

u mu

ố

ướ

c l

ượ

ng n

ng su

ấ

t lúa trung bình c

ủ

a toàn vùng

đạ

đượ

độ

chính xác

4,1

ạ

/ha thì

độ

tin c

ậ

y là bao nhiêu?

Theo dõi chi

ề

u cao c

ủ

144

cây B

ạ

àn tr

ồ

ng trên

đấ

t phèn sau

m, ta

đượ

c k

ế

ả

ây.

(cm) 250-300 300-350 350-400 400-450 450-500 500-550 550-600

5 20 25 30 30 23 11

Tính chi

ề

u cao trung bình và

độ

ệ

ch m

ẫ

u c

ủ

Hãy l

ậ

p kho

ả

ướ

c l

ượ

ng c

ủ

a chi

ề

u cao trung bình lo

ạ

i cây B

ạ

àn sau

m v

ớ

độ

tin c

ậ

y %95

Chương V. Lí thuyết ước lượng

Đáp số và hướng dẫn.

(

)

6,5200;4,4965 , b)

(

)

9,5227;1,4938

30500

nên ta xem

(

)

(

)

16,163;28,162

Ta có

3036

nên ta xem

(

)

và ch

a bi

ế

t ph

ươ

ng sai

Kho

ả

ướ

c l

ượ

ng cho t

ỉ

ệ

là

(

)

089,0;045,0 v

ậ

y, t

ỉ

ệ

ầ

n tr

m t

ố

a là %9,8 .

(

)

6698,0;6102,0

2213

, c)

6115

C. Phương pháp giảng dạy.

- Giới thiệu ứng dụng của ước lượng khoảng trong thực tế.

- Thuyết trình, vấn đáp, và làm bài tập.

- Sử dụng các bảng phụ lục cho việc tính các giá trị của hàm phân phối chuẩn, Poisson,

Student, chi bình phương.

- Yêu cầu SV đọc bài giảng trước khi lên lớp.

- Kiểm tra, đánh giá việc làm bài tập của SV.

ả

ng viên g

ử

i bài gi

ả

ng cho sinh viên

đọ

c tr

ướ

c. Gi

ả

ng viên trình bày bài gi

ả

ng trên l

ớ

p theo

ươ

ng pháp thuy

ế

t trình h

ỏ

áp. Giao bài t

ậ

p cho sinh viên v

ề

nhà làm. Gi

ớ

i thi

ệ

u m

ộ

t s

ố

tài

ệ

u tham kh

ả

D. Tài liệu tham khảo

[1] Đậu Thế Cấp, Xác suất thống kê: Lí thuyết và các bài tập, NXB Giáo dục,

2006.

[2] Đặng Hùng Thắng, Thống kê và ứng dụng, NXB Giáo dục, 2008.

[3] PGS. TS. Phạm Xuân Kiều, Giáo Trình xác suất và thống kê, NXB Giáo dục,

2005.

[4] Trần Văn Minh, Phí Thị Vân Anh, Xác suất thống kê với các tính toán trên

Excel, NXB Giao Thông Vận tải, 2008.

[5] Đặng Công Hanh, Đặng Ngọc Dục, Giáo trình Lý thuyết xác suất và Thống kê

toán, trường Đại học Duy Tân,1996

[6] Trần Văn Minh, Phí Thị Vân Anh, Hướng dẫn giải bài tập Xác suất thống kê

với các tính toán trên Excel, NXB Giao Thông Vận tải, 2008.

Chương VI.

Kiểm định giả thiết thống kê.

A. Mục tiêu.

- Giới thiệu về khái niệm kiểm định giả thiết: cách đặt giả thiết

và đối thiết

đưa ra các khả năng phạm sai lầm khi kiểm định.

- Nêu phương pháp chung khi thực hiện một bài toán kiểm định.

Đư

a ra ph

ươ

ng pháp ki

ể

đị

nh cho: kì v

ọ

ng, ph

ươ

ng sai, t

ỉ

ệ

… trong t

ừ

ng tr

ườ

ng h

ợ

p c

ụ

ể

B. Nội dung.

1. Các khái niệm cơ bản

1.1. Đặt vấn đề:

Trong chương này, chúng ta sẽ giải quyết các bài toán dạng như sau:

Giả sử ta có hai giả thiết (hai khả năng) về một vấn đề nào đó, chẳng hạn:

1. Có ý kiến cho rằng tham số chưa biết

của phân phối nhận giá giá trị

nhưng lại có ý kiến cho rằng

≠

2. Có ý kiến cho rằng sau khi áp dụng phương pháp sản xuất mới, tỉ lệ sản phẩm

loại I của nhà máy tăng lên (có nghĩa là phương pháp sản xuất mới này có hiệu

quả), nhưng có ý kiến cho rằng tỉ lệ sản phẩm loại I không thay đổi (có nghĩa là

phương pháp sản xuất mới này không có hiệu quả).

3. Có ý kiến cho rằng Biến ngẫu nhiên đang xét tuân theo quy luật phân phối nhị

thức, lại có ý kiến không tán thành.

4. Có ý kiến cho rằng khả năng làm việc của con người phụ thuộc vào giới tính,

nhưng cũng có ý kiến cho rằng không ảnh hưởng.

Vấn đề đặt ra là ta phải chọn một trong hai giả thiết được nêu ra. Nói cách khác, ta

chọn giả thiết nào để khả năng đúng cao hơn, khả năng sai thấp hơn. Để cho tiện, ta

chọn một trong hai giả thiết là giả thiết

còn giả thiết kia là giả thiết đối (đối thiết)

. Khi đó







≠

θθ

Bài gi

ả

100

Ví dụ 1.1.

Ông chủ của một cửa hàng buôn bán xe máy cho biết số xe máy bán được trong một

ngày của cửa hàng là

xe máy. Để kiểm tra lời tuyên bố này của ông chủ này là

đúng hay sai, ta có thể đặt:







≠

30:

Ví dụ 1.2.

Khi tìm hiểu về chiều cao trung bình của một loại cây ở trong một khu rừng, với chiều

cao

của loại cây đó có phân phối chuẩn

(

)

;

σµ

ta có thể đưa ra giả thiết

như

: “Chiều cao trung bình của cây là

m”. Khi đó, các đối thiết của

có

thể là:

+ Đối thiết

: “Chiều cao trung bình của cây là

≠

m”.

+ Đối thiết

: “Chiều cao trung bình của cây là

m”.

+ Đối thiết

: “Chiều cao trung bình của cây là

m”.

Để giải quyết bài toán này, thông tin duy nhất chúng ta có là mẫu ngẫu nhiên

(

)

XXX ;;;

. Vận dụng kết quả của lí thuyết xác suất, ta tìm miền

, sao cho khi

mẫu

(

)

WXXX

∈

;;;

thì ta bác bỏ giả thiết

, còn khi

(

)

WXXX

∉

;;;

thì ta

chấp nhận giả thiết

cho đến khi có thông tin mới. Miền

được gọi là miền bác

bỏ.

Khi bác bỏ hoặc chấp nhận giả thiết

, chúng ta có thể mắc hai loại sai lầm sau:

Sai lầm loại I: Bác bỏ

nhưng thực tế là

là đúng.

Sai lầm loại II: Chấp nhận

nhưng thực tế là

là sai.

Ta mong muốn chọn miền

sao cho cực tiểu cả hai khả năng phạm sai lầm. Nhưng

khi có mẫu cố định thì mong muốn này không thể thực hiện được, do đó thông thường

ta cho trước giới hạn trên của xác suất sai lầm loại I.

Kí hiệu

thường rất nhỏ

%10

ta sẽ tìm miền

sao cho khả

năng phạm sai lầm loại I không vượt quá

và khả năng phạm sai lầm loại II đạt cực

tiểu.

Tùy theo hoàn cảnh cụ thể, sai lầm loại này có thể tai hại hơn sai lầm loại kia.

Ví dụ 1.3.

a) Để tránh sai lầm cho điểm một học sinh giỏi thấp, thầy giáo cứ cho điểm cao một

cách dễ dàng, khi đó khả năng mắc phải sai lầm cho điểm một học sinh yếu kém cao

(đáng lẽ phải cho điểm thấp) là tăng lên.

b) Để tránh sai lầm cho việc bắt nhầm một người vô tội (bị oan), công an cứ thả người

này cách dễ dàng, nhưng khi đó khả năng mắc phải sai lầm thả nhầm một người có tội

lại tăng lên.

Có hai cách dùng để khống chế khả năng mắc sai lầm:

Cách thứ nhất. Ta ấn định trước mức mắc phải sai lầm loại I và sai lầm loại II rồi tính

toán tìm một mẫu có kích thước ứng với hai mức sai lầm này.

Cách thứ hai. Ta ấn định trước xác suất sai lầm loại I (tức là có trước mức ý nghĩa

)

chọn miền bác bỏ

có xác suất sai lầm loại II nhỏ nhất.

Trong bài giảng này, ta chọn cách thứ hai.

ươ

ng VI. Ki

ể

đị

nh gi

ả

thi

ế

t th

ố

ng kê

101

Cần chú ý rằng: Bác bỏ hoặc chấp nhận giả thiết tùy thuộc vào giá trị thực nghiệm của

tiêu chuẩn

và mức ý nghĩa

, kiểm định giả thuyết thống kê là một quy tắc hành

động sao cho khả năng mắc phải sai lầm nhỏ (ở mức nào đó).

1.2. Phương pháp kiểm định giả thiết thống kê

Có thể mô tả phương pháp kiểm định giả thiết thống kê như sau:

Xuất phát từ yêu cầu của bài toán thực tế, ta đưa ra một giả thiết

và giả thiết đối

của nó.

Giả sử rằng

đúng, từ đó tìm một biến cố có xác suất đủ bé để có thể tin rằng biến

cố đó hầu như không thể xảy ra trong một phép thử. Muốn vậy, từ mẫu ngẫu nhiên

(

)

XXX ;;;

, ta chọn thống kê

(

)

021

;;;;

XXXfT

sao cho nếu

đúng thì

phân phối xác suất của

là xác định và thống kê

gọi là tiêu chuẩn kiểm định giả

thiết

Do quy luật phân phối xác suất

đã biết, nên với

bé tùy ý, ta có thể tìm được miền

sao cho

(

)

∈

WTP

Miền

gọi là miền bác bỏ giả thiết

. Trong thực tế, ta thường lấy

[

]

05,0;01,0

∈

và

được gọi là mức ý nghĩa của kiểm định.

Thực hiện một phép thử đối với mẫu ngẫu nhiên

(

)

XXX ;;;

, ta được mẫu cụ thể

(

)

xxx ;;;

. Từ mẫu này, ta tính được giá trị của

(

)

021

;;;;

xxxftT

Nếu

∈

(tức là biến cố

∈

xảy ra) thì ta bác bỏ

; chấp nhận

Nếu

∈

thì ta chấp nhận

Chú ý.

Khi chấp nhận

, không có nghĩa

đúng, mà chỉ có nghĩa là chưa có cơ sở bác bỏ

, đành chấp nhận

2. Kiểm định giả thiết về tham số.

2.1. Các loại kiểm định và phương pháp kiểm định giả thiết về các tham

số.

Khi nghiên cứu một đặc tính hoặc một dấu hiệu nào đó của một tổng thể ta xét một

biến ngẫu nhiên

tác động lên tổng thể đó và thường là các dấu hiệu của tổng thể

được thể hiện qua các tham số đặc trưng của

hay phân phối của

, cho nên các giả

thiết về các tham số đặc trưng của

cũng là các giả thiết thường gặp.

Các loại kiểm định về tham số là:

1) Kiểm định hai phía đối với tham số, tức là kiểm định giả thiết

với đối

thiết

≠

với

là tham số đặc trưng nào đó của

chưa biết (thường là

(

)

hoặc là

(

)

) và

là một giá trị cụ thể được đưa ra dựa vào sự suy đoán nào đó.

2) Kiểm định phía phải đối với tham số là kiểm định giả thiết

với đối thiết

3) Kiểm định phía trái đối với tham số là kiểm định giả thiết

với đối thiết

Bài gi

ả

102

Để kiểm định giả thiết thống kê về các tham số như trên, người ta thường tiến hành

theo các bước như sau:

Bước 1: Lập mẫu ngẫu nhiên của

là

(

)

XXX ;;;

và chọn một hàm

(

)

021

;;;;

XXXgG

và gọi là tiêu chuẩn kiểm định sao cho tìm được một qui tắc

kiểm định tốt nhất của tham số

. Sau đó tìm giá trị

(

)

021

;;;;

xxxg

ứng với một

mẫu thực nghiệm nào đó và gọi là giá trị thực nghiệm.

Bước 2: Với mức ý nghĩa

đã cho tìm miền bác bỏ

tương ứng (miền

phụ

thuộc vào các loại kiểm định).

Bước 3: Xét xem giá trị cụ thể

(

)

021

;;;;

xxxg

có thuộc

hay không.

+ Nếu

(

)

Wxxxg

∈

021

;;;;

thì ta bác bỏ giả thiết

và thừa nhận đối thiết

với

mức ý nghĩa

(hay độ tin cậy

−

+ Nếu

(

)

Wxxxg

∉

021

;;;;

thì ta chưa có cơ sở bác bỏ giả thiết

và thừa nhận đối

thiết

với mức ý nghĩa

Trong bài giảng này, chúng ta chỉ kiểm định giả thiết về các tham số đặc trưng của

biến ngẫu nhiên có phân phối chuẩn và về tỉ lệ của tổng thể; các bước kiểm định được

trình bày một cách ngắn gọn, chỉ nêu miền bác bỏ cho từng loại kiểm định.

2.2. Kiểm định giả thiết về trung bình của ĐLNN X~N(µ; σ

Giả sử trung bình của tổng thể (cũng chính là kì vọng toán của biến ngẫu nhiên

) là

chưa biết.

2.2.1. Trường hợp đã biết

)(

=XD

a) Kiểm định hai phía đối với

Cần kiểm định giả thiết:

với đối thiết

≠

(với

là một giá trị nào

đó đã biết)







≠

µµ

* Ta chọn tiêu chuẩn kiểm định là

(

)

−

, biến ngẫu nhiên này có phân

phối chuẩn

(

)

1;0~

* Với mức ý nghĩa

đã cho, ta xác định miền bác bỏ

như sau:













+∞∪













−∞−= ;;

ααα

zzW

, trong đó

được xác định từ công thức

γα

=−−=













Φ z

với

( )

∫

−

=Φ

dtem

* So sánh giá trị thực nghiệm

với

+ Nếu

(nghĩa là

∈

) thì ta bác bỏ giả thiết

và thừa nhận đối thiết

với mức ý nghĩa

ươ

ng VI. Ki

ể

đị

nh gi

ả

thi

ế

t th

ố

ng kê

103

+ Nếu

zz ≤

(nghĩa là

∉

) thì ta chưa có cơ sở bác bỏ giả thiết

nên chấp nhận

giả thiết

với mức ý nghĩa

a) Kiểm định phía phải đối với

Cần kiểm định giả thiết:

với đối thiết







≤

µµ

* Ta chọn tiêu chuẩn kiểm định là

(

)

−

, biến ngẫu nhiên

này có

phân phối chuẩn

(

)

1;0N

* Với mức ý nghĩa

đã cho, ta xác định miền bác bỏ

như sau:

(

)

+∞

;

αα

, trong đó

được xác định từ công thức

( )

1 −=−=−−=Φ

γαα

với

( )

∫

−

=Φ

dtem

* So sánh giá trị thực nghiệm

với

+ Nếu

(nghĩa là

∈

) thì ta bác bỏ giả thiết

và thừa nhận đối thiết

với

mức ý nghĩa

+ Nếu

≤

(nghĩa là

∉

) thì ta chưa có cơ sở bác bỏ giả thiết

nên chấp nhận

giả thiết

với mức ý nghĩa

c) Kiểm định phía trái đối với

Cần kiểm định giả thiết:

với đối thiết







≥

µµ

* Ta chọn tiêu chuẩn kiểm định là

(

)

−

, biến ngẫu nhiên

này có

phân phối chuẩn

(

)

1;0~

* Với mức ý nghĩa

đã cho, ta xác định miền bác bỏ

như sau:

(

)

αα

−

∞

−

; zW

, trong đó

−

được xác định từ công thức

αα

−

trong đó,

( )

1 −=−=−−=Φ

γαα

với

( )

∫

−

=Φ

dtem

* So sánh giá trị thực nghiệm

với

−

+ Nếu

−

(nghĩa là

∈

) thì ta bác bỏ giả thiết

và thừa nhận đối thiết

với mức ý nghĩa

+ Nếu

−

≥

(nghĩa là

∉

) thì ta chưa có cơ sở bác bỏ giả thiết

nên chấp

nhận giả thiết

với mức ý nghĩa

Ví dụ 2.1.

Một máy đóng mì gói tự động quy định trọng lượng trung bình là

g, độ lệch

chuẩn

g. Sau một thời gian sản xuất, kiểm tra

gói, ta có trọng lượng trung

Bài gi

ả

104

bình mỗi gói là

g. Cho kết luận về trọng lượng mì gói trung bình sản xuất với mức

ý nghĩa

có đúng quy định không.

Giải

Trọng lượng trung bình cho mỗi gói mì là

Trọng lượng trung bình thực tế sản xuất là

chưa biết.

Ta đặt giả thuyết:

75:

; đối thiết

75:

≠

Trong đó, ta biết:

;

Do đã biết

nên ta chọn tiêu chuẩn kiểm định là

(

)

−

Đây là bài toán kiểm định hai phía.

475,0025,0

05,0

=−=













Φ z

nên

96,1

05,0

Giá trị kiểm định:

79,180

7572

−≈

−

= n

Ta có

96,179,1 <≈

nên ta chưa có cơ sở để bác bỏ

nên chấp nhận giả thuyết

tức là sản xuất diễn ra bình thường.

Ví dụ 2.2.

Một nhà máy cơ khí qui định chiều dài của chi tiết máy A là

cm. Ban giám đốc nhà

máy cho rằng có một tổ sản xuất loại chi tiết máy đó không đúng chiều dài quy định.

Hãy kiểm định nhận định đó với mức ý nghĩa

05,0

, biết rằng sau khi chọn ngẫu

nhiên

chi tiết máy của tổ sản xuất đó thì kết quả đo đạc cho biết chiều dài trung

bình của mẫu là

5,20

cm và chiều dài X của loại chi tiết được sản xuất ra từ nhà máy

đó có phân phối chuẩn

(

)

, với

đã biết.

Giải

Ta đặt giả thiết

20:

cm và đối thiết

20:

≠

cm.

Ta có

5,20=x

cm,

Do đã biết

nên ta chọn tiêu chuẩn kiểm định là

(

)

−

. Ta có

(

)

1;0~

Ta có

5,225

205,20

−

Đây là bài toán kiểm định hai phía

Với mức ý nghĩa

05,0

, ta có

96,1

05,0

Ta có

96,15,2 >=z

nên ta bác bỏ giả thiết

và chấp nhận giả thiết

với mức ý

nghĩa

05,0

Vậy kết luận của giám đốc là đúng.

ươ

ng VI. Ki

ể

đị

nh gi

ả

thi

ế

t th

ố

ng kê

105

2.1.2. Trường hợp chưa biết

(

)

Các bước kiểm định đối với các loại giả thuyết này hoàn toàn tương tự như trên nhưng

thay tiêu chuẩn kiểm định

(

)

−

bởi tiêu chuẩn kiểm định

(

)

−

, biến ngẫu nhiên này có phân phối Student

(

)

−

, với

−

bậc

tự do.

+ Trong trường hợp

≤

, ta thay

và

−

bởi

−n

và

−−

1;1

+ Trong trường hợp

, ta xem

(

)

−

có phân phối chuẩn

(

)

1;0N

Ví dụ 2.3.

Trọng lượng của một loại sản phẩm do một xí nghiệp sản xuất theo qui định chung là

kg. Sau một thời gian sản xuất, người ta tiến hành kiểm tra

121

sản phẩm do xí

nghiệp đó sản xuất và tính được số trung bình

975,5=x

kg và độ lệch tiêu chuẩn điều

chỉnh là

4,2

Biết rằng trọng lượng

của loại sản phầm do xí nghiệp đó sản xuất có phân phối

chuẩn

(

)

;

σµ

Có người cho rằng trọng lượng sản phẩm do xí nghiệp sản xuất không đạt yêu cầu

(không đúng với qui định chung). Hãy cho kết luận về lời nhận xét đó với mức ý

nghĩa

05,0

Giải

Ta đặt giả thiết

kg và đối thiết

≠

kg.

Ta có

975,5=x

121

4,2

chưa biết nên ta chọn tiêu chuẩn kiểm định là

(

)

−

Lại có

30121

≥

nên

(

)

1;0~ NZ

Ta có

(

)

1146,0121

4,2

6975,5

−≈

−

Đây là bài toán kiểm định hai phía.

Với mức ý nghĩa

05,0

, ta tính được

96,1

05,0

Ta có

96,11146,0 <=

. Khi đó ta chưa có cơ sở để bác bỏ

nên ta có thể kết luận

rằng lời nhận xét trên là không đúng với

05,0

Ví dụ 2.4.

Tuổi thọ trung bình của

loại bóng đèn do nhà máy A sản xuất khi chưa cải tiến kĩ

thuật sản xuất là

2000

giờ, sau thời gian cải tiến kĩ thuật người ta chọn ngẫu nhiên

bóng đèn do nhà máy A sản xuất và cho thắp kiểm tra thử nghiệm và kết quả cho biết

tuổi thọ trung bình của mẫu thực nghiệm là

2010=x

giờ và độ lệch tiêu chuẩn của

mẫu là

giờ với mức ý nghĩa

05,0

Bài gi

ả

106

Hãy cho biết kết luận về lời nhận định “tuổi thọ bóng đèn có tăng lên sau khi cải tiến

kĩ thuật”. Biết rằng biến ngẫu nhiên

chỉ tuổi thọ bóng đèn có phân phối chuẩn

(

)

;

σµ

Giải

Ta đặt giả thiết

2000:

giờ và đối thiết

2000:

giờ.

Ta có

chưa biết nên ta chọn tiêu chuẩn kiểm định là

(

)

−

Lại có

3025

nên

(

)

−

nTZ

Đây là bài toán kiểm định phía phải.

Với mức ý nghĩa

05,0

, ta tính được

064,2

05,0;125

−

Ta có

20002010

−

Ta có

064,2

>=z

Do đó, ta bác bỏ giả thiết

và chấp nhận đối thiết

tức là cho rằng sau khi cải tiến

kĩ thuật, tuổi thọ trung bình của loại bong đèn dó có tăng lên với mức ý nghĩa

05,0

2.3. Kiểm định giả thiết về phương sai của ĐLNN X~N(µ; σ

2.3.1. Trường hợp đã biết

(

)

a) Kiểm định hai phía.

Cần kiểm định giả thiết:

σσ

với đối thiết

σσ

≠H

(với

là một giá trị

nào đó đã biết).











≠

σσ

* Ta chọn tiêu chuẩn kiểm định là

( )

∑

−

, biến ngẫu nhiên

này có

phân phối Chi bình phương với

bậc tự do

(

)

χχ

* Với mức ý nghĩa

đã cho, ta xác định miền bác bỏ

như sau:













+∞∪













∞−=

−

;;

;

ααα

χχ

, trong đó

−n

;

được xác định dựa vào bảng phân

phối Chi bình phương với

bậc tự do.

* So sánh giá trị thực nghiệm

với

−n

;

+ Nếu

χχ

−

hoặc

;

χχ

(nghĩa là

∈

) thì ta bác bỏ giả thiết

và thừa

nhận đối thiết

với mức ý nghĩa

ươ

ng VI. Ki

ể

đị

nh gi

ả

thi

ế

t th

ố

ng kê

107

+ Nếu

;

αα

χχχ

≤≤

−

(nghĩa là

∉

) thì ta chưa có cơ sở bác bỏ giả thiết

nên

chấp nhận giả thiết

với mức ý nghĩa

b) Kiểm định phía phải đối với

Cần kiểm định giả thiết:

σσ

với đối thiết

σσ











≤

σσ

Ta thực hiện các bước tương tự như trên nhưng miền bác bỏ của kiểm định bên phải

là

(

)

+∞= ;

;

αα

. So sánh giá trị thực nghiệm

với

;

, ta đưa ra điều kết luận.

c) Kiểm định phía trái đối với

Cần kiểm định giả thiết:

σσ

với đối thiết

σσ











≥

σσ

Ta thực hiện các bước tương tự như trên nhưng miền bác bỏ của kiểm định bên trái là

(

)

;

αα

−

∞−=

. So sánh giá trị thực nghiệm

với

−n

, ta đưa ra điều kết luận.

2.3.2. Trường hợp chưa biết

(

)

Trong thực tế, ta thường gặp kiểm định các tham số của biến ngẫu nhiên

(

)

;

σµ

với

và

chưa biết. Các bước kiểm định ta thực hiện tương tự như trong trường hợp đã

biết

(

)

, nhưng ta chọn tiêu chuẩn kiểm định là

(

)

( )

σσ

−

∑

, với

là độ lệch mẫu hiệu chỉnh, biến ngẫu nhiên

này có phân phối Chi bình phương với

−

bậc tự do

(

)

−n

χχ

Các cận của miền bác bỏ là

−n

;

−n

;

được thay bởi

1;1

−−n

−n

1;1

−−n

−n

Ví dụ 2.5.

Kiểm tra sự ổn định của một máy tự động về thời gian lắp ghép một bộ phận điện tử.

Người ta quan sát ngẫu nhiên

lần lắp ghép của máy tự động đó và tính được độ lệch

tiêu điều chỉnh của mẫu thực nghiệm là

15=s

giây, giả sử rằng thời gian lắp ghép

các bộ phận điện tử của máy tự động đó có phân phối chuẩn

(

)

;

σµ

và máy được

xem là ổn định nếu độ lệch về thời gian không quá

giây. Hãy xét xem máy tự động

trên hoạt động có ổn định không, biết rằng mức ý nghĩa

05,0

Giải

Ta đặt giả thiết

255:

và đối thiết

25:

Do không biết

(

)

nên ta chọn tiêu chuẩn kiểm định là

(

)

−

Bài gi

ả

108

Ta có

15=s

. Khi dó

(

)

225

15116

≈=

−

Đây là bài toán kiểm định bên phải đối với phương sai.

Với mức ý nghĩa

05,0

, ta tính được

05,0;15

−

χχ

Ta có

259

nên ta chưa có cơ sở bác bỏ giả thiết

nên chấp nhận giả thiết

với

mức ý nghĩa

05,0

2.4. Kiểm định giả thiết về tỉ lệ các phần tử có tính chất nào đó trong

tổng thể.

Cho một tổng thể có hai loại đối tượng, kí hiệu là

và

. Gọi

là tỉ lệ số đối tượng

có trong tổng thể. Đối với tham số

, ta có các loại kiểm định sau đây:

* Kiểm định hai phía.

Cần kiểm định giả thiết:

: ppH

với đối thiết

: ppH

≠

(với

là một giá trị nào

đó đã biết).







≠

ppH

* Kiểm định phía phải.

Cần kiểm định giả thiết:

: ppH

với đối thiết

: ppH







≤

ppH

* Kiểm định phía trái.

Cần kiểm định giả thiết:

: ppH

với đối thiết

: ppH







≥

ppH

Như ta đã biết ở phần ước lượng tỉ lệ của tổng thể ở chương trước, nếu mẫu có kích

thước

lớn thì tần suất

∑

bằng số lần đối tượng

xuất hiện trong

lần

chọn ngẫu nhiên một đối tượng từ tổng thể xấp xỉ biến ngẫu nhiên chuẩn

(

)

(

)

pppN

−1;

với

khá lớn.

Do đó, để kiểm định giả thiết về tỉ lệ

của tổng thể, ta chọn tiêu chuẩn kiểm định

( )

1−

−

với

khá lớn, biến ngẫu nhiên

này có phân phối chuẩn

(

)

1;0

Giá trị thực nghiệm là

( ) ( )

11 −

−

với

fx =

là tỉ lệ đối tượng

trong mẫu với

( )







>−

101

Với mức ý nghĩa

và

khá lớn tùy theo từng loại kiểm định, ta thực hiện như sau:

* Đối với kiểm định hai phía.

ươ

ng VI. Ki

ể

đị

nh gi

ả

thi

ế

t th

ố

ng kê

109

Ta tìm

rồi so sánh với

+ Nếu

zz >

thì ta bác bỏ giả thiết

và thừa nhận đối thiết

với mức ý nghĩa

+ Nếu

≤

thì ta chưa có cơ sở bác bỏ giả thiết

nên chấp nhận giả thiết

với

mức ý nghĩa

* Đối với kiểm định phía phải.

Ta tìm

rồi so sánh với

+ Nếu

thì bác bỏ giả thiết

và thừa nhận đối thiết

với mức ý nghĩa

+ Nếu

≤

thì ta chưa có cơ sở bác bỏ giả thiết

nên chấp nhận giả thiết

với

mức ý nghĩa

* Đối với kiểm định phía trái.

Ta tìm

−1

rồi so sánh với

+ Nếu

αα

zzz

−

−1

thì bác bỏ giả thiết

và thừa nhận đối thiết

với mức ý nghĩa

+ Nếu

αα

zzz

−

≥

−1

thì ta chưa có cơ sở bác bỏ giả thiết

nên chấp nhận giả thiết

với mức ý nghĩa

Ví dụ 2.6.

Một nhà máy sản xuất sản phẩm với tỉ lệ sản phẩm loại I lúc đầu là

20,0

. Sau khi áp

dụng phương pháp sản xuất mới, kiểm tra

500

sản phẩm thấy số sản phầm loại I là

150

sản phẩm. Cho kết luận về phương pháp sản xuất mới này với mức ý nghĩa

Giải

Tỉ lệ sản phẩm loại I lúc đầu là

20,0

Tỉ lệ sản phẩm loại I khi áp dụng phương pháp mới là

chưa biết.

Ta đặt giả thiết:

2,0:

ppH

;

2,0:

≠

ppH

Ta có

( )







>−

101

3,0

500

150

==f

;

500

;

495,0005,0

01,0

=−=













Φ z

nên

58,2

995,0

01,0

Giá trị kiểm định:

( )

1−

−

Khi đó:

( )

59,5500

2,012,0

2,03,0

≈

−

Ta có

58,259,5

=>≈

nên ta bác bỏ giả thuyết

, tức là

≠

Khi đó, phương pháp sản xuất mới đã làm thay đổi tỉ lệ sản phẩm loại I.

Bài gi

ả

110

Ví dụ 2.7.

Một công ti

sản xuất bánh kẹo tuyên bố rằng

số trẻ em thích ăn bánh của công ti.

Trong một mẫu gồm

100

trẻ em được hỏi, có

em tỏ ra thích bánh của công ti

Với mức ý nghĩa

, số liệu nói trên có chứng tỏ là lời tuyên bố của công ti là hơi

quá đáng không?

Giải

Ta có giả thiết

== ppH

, đối thiết

<pH

Đây là kiểm định bên trái đối với tỉ lệ. Dựa vào các số liệu của mẫu, ta có:

( )







>−

101

55,0

100

==f

nên

64,1

05,005,01

−

Khi đó

( )

64,149,2100

55,0

−<−=













−

= n

Vậy, lời tuyên bố của công ti là quá sự thật.

Ví dụ 2.8.

Tỉ lệ phế phẩm ở một nhà máy lúc ban đầu là

%10

. Sau một thời gian, nhà máy cải

tiến kĩ thuật sản xuất, điều tra ngẫu nhiên

400

sản phẩm thấy có

phế phẩm. Với

mức ý nghĩa

025,0

, hãy xét xem việc cải tiến kĩ thuật của nhà máy có làm giảm tỉ

lệ phế phẩm của nhà máy không?

Giải

Ta có giả thiết

1,0:

ppH

, đối thiết

1,0:

400

075,0

400

==f

Đây là bài toán kiểm định bên trái đối với tỉ lệ.

Với mức ý nghĩa

025,0

, ta có

96,1

025,0025,01

−

Khi dó

( ) ( )

66,1400

1,011,0

1,0075,0

−=

−

= n

Ta có

025,0

zz >

ta chưa có cơ sở bác bỏ giả thiết

nên chấp nhận giả thiết

với

mức ý nghĩa

025,0

. Tức là việc cải tiến kĩ thuật chưa làm tỉ lệ phế phẩm giảm

xuống.

2.5. Kiểm định giả thiết về hai kì vọng của hai ĐLNN chuẩn độc lập.

Giả sử ta có hai ĐLNN chuẩn

(

)

σµ

có mẫu ngẫu nhiên là

(

)

XXX ;;;

và

(

)

σµ

có mẫu ngẫu nhiên là

(

)

YYY ;;;

2.5.1. Trường hợp đã biết

a) Kiểm định hai phía của

ươ

ng VI. Ki

ể

đị

nh gi

ả

thi

ế

t th

ố

ng kê

111

Cần kiểm định giả thiết:

210

với đối thiết:

211

≠

(với

là một giá trị

nào đó đã biết).







≠

211

210

µµ

* Ta chọn tiêu chuẩn kiểm định là

σσ

−

, biến ngẫu nhiên này có phân

phối chuẩn

(

)

1;0

* Với mức ý nghĩa

đã cho, ta xác định miền bác bỏ

như sau:













+∞∪













−∞−= ;;

ααα

zzW

, trong đó

được xác định từ công thức

γα

=−−=













Φ z

với

( )

∫

−

=Φ

dtem

* So sánh giá trị thực nghiệm

với

+ Nếu

zz >

(nghĩa là

∈

) thì ta bác bỏ giả thiết

và thừa nhận đối thiết

với mức ý nghĩa

+ Nếu

zz ≤

(nghĩa là

∉

) thì ta chưa có cơ sở bác bỏ giả thiết

nên chấp nhận

giả thiết

với mức ý nghĩa

b) Kiểm định phía phải của

Cần kiểm định giả thiết:

210

với đối thiết:

211







≤

211

210

µµ

* Ta chọn tiêu chuẩn kiểm định là

σσ

−

, biến ngẫu nhiên này có phân

phối chuẩn

(

)

1;0

* Với mức ý nghĩa

đã cho, ta xác định miền bác bỏ

như sau:

(

)

+∞

;

αα

, trong đó

được xác định từ công thức

( )

1 −=−=−−=Φ

γαα

với

( )

∫

−

=Φ

dtew

* So sánh giá trị thực nghiệm

với

+ Nếu

(nghĩa là

∈

) thì ta bác bỏ giả thiết

và thừa nhận đối thiết

với

mức ý nghĩa

+ Nếu

≤

(nghĩa là

∉

) thì ta chưa có cơ sở bác bỏ giả thiết

nên chấp nhận

giả thiết

với mức ý nghĩa

c) Kiểm định phía trái của

Bài gi

ả

112

Cần kiểm định giả thiết:

210

với đối thiết:

211







≥

211

210

µµ

* Ta chọn tiêu chuẩn kiểm định là

σσ

−

, biến ngẫu nhiên này có phân

phối chuẩn

(

)

1;0N

* Với mức ý nghĩa

đã cho, ta xác định miền bác bỏ

như sau:

(

)

αα

−

∞

−

; zW

, trong đó

αα

−

−1

được xác định từ công thức

( )

−=−=Φ

γα

với

( )

∫

−

=Φ

dtew

* So sánh giá trị thực nghiệm

với

−1

+ Nếu

−

(nghĩa là

∈

) thì ta bác bỏ giả thiết

và thừa nhận đối thiết

với mức ý nghĩa

+ Nếu

−

≥

(nghĩa là

∉

) thì ta chưa có cơ sở bác bỏ giả thiết

nên chấp

nhận giả thiết

với mức ý nghĩa

2.5.2. Trường hợp chưa biết

và mẫu lớn

Các bước kiểm định ta thực hiện tương tự như trong trường hợp đã biết

và

nhưng ta chọn tiêu chuẩn kiểm định là

−

, trong đó,

là

phương sai mẫu hiệu chỉnh.

Ví dụ 2.9.

Người ta cân ngẫu nhiên

trẻ sơ sinh ở khu vực A và

100

trẻ sơ sinh ở khu vực B,

kết quả cho theo bảng sau đây

Các tham số

Khu vực

Số trẻ được cân Trọng lượng trung

bình

Phương sai điều

chỉnh

0,3=x

0,3

100

2,3=y

0,5

Có người cho rằng trọng lượng trung bình của các trẻ sơ sinh ở hai khu vực trên là như

nhau. Hãy kiểm định lời nhận xét đó với mức ý nghĩa

05,0

. Giả sử trọng lượng

và trọng lượng

của trẻ sơ sinh ở khu vực A và khu vực B đều có phân phối chuẩn.

Giải

Gọi

là kì vọng toán của biến ngẫu nhiên

(trọng lượng trung bình của toàn bộ trẻ

sơ sinh ở khu vực A) và

là kì vọng toán của biến ngẫu nhiên

(trọng lượng trung

bình của toàn bộ trẻ sơ sinh ở khu vực B).

ươ

ng VI. Ki

ể

đị

nh gi

ả

thi

ế

t th

ố

ng kê

113

Ta đặt giả thiết

210

và đối thiết

211

≠

Do chưa biết các phương sai

nên ta chọn tiêu chuẩn kiểm định

−

Ta có

0,3=x

100

0,3=x

2,3=y

0,3

và

0,5

nên

.2,0

100

0,5

0,3

2,30,3

−=−=

−

Đây là bài toán kiểm định hai phía

Với mức ý nghĩa

05,0

, ta có

96,1

05,0

Ta có

96,1

zz =<=

nên ta chưa có cơ sở bác bỏ giả thiết

nên chấp nhận giả

thiết

với mức ý nghĩa

05,0

. Nghĩa là cho rằng trọng lượng trung bình của trẻ

sơ sinh ở hai khu vực là như nhau với mức ý nghĩa

05,0

2.4.3. Trường hợp

σσ

chưa biết và

302

≤

−

Các bước kiểm định ta thực hiện tương tự như trong trường hợp đã biết

và

nhưng ta chọn tiêu chuẩn kiểm định là

(

)

( ) ( )

[ ]

SmSn

mnYX

−+−













−+−

, biến

ngẫu nhiên này có phân phối Student

(

)

−

mnT

với

−

bậc tự do.

Trong đó,

là phương sai mẫu hiệu chỉnh và ta thay

và

−1

bởi

−+mn

;2−+mn

−−+ 1;2mn

2.6. Kiểm định giả thiết thống kê về hai tỉ lệ của hai ĐLNN.

* Ta chọn tiêu chuẩn kiểm định là

( )













+−

−

, ĐLNN này có phân

phối chuẩn

(

)

1;0

, trong đó

2211

FnFn

Giá trị thực nghiệm là

( )













+−

−

, trong đó

2211

fnfn

a) Kiểm định hai phía của

* Cần kiểm định giả thiết:

210

: ppH

với đối thiết

211

ppH

≠

(với

là một giá trị

nào đó đã biết).

Bài gi

ả

114







≠

211

210

ppH

* Với mức ý nghĩa

đã cho, ta xác định miền bác bỏ

như sau:













+∞∪













−∞−= ;;

ααα

zzW

, trong đó

được xác định từ công thức

γα

=−−=













Φ z

với

( )

∫

−

=Φ

dtem

* So sánh giá trị thực nghiệm

với

+ Nếu

zz >

(nghĩa là

∈

) thì ta bác bỏ giả thiết

và thừa nhận đối thiết

với mức ý nghĩa

+ Nếu

zz ≤

(nghĩa là

∉

) thì ta chưa có cơ sở bác bỏ giả thiết

nên chấp nhận

giả thiết

với mức ý nghĩa

b) Kiểm định phía phải của

Cần kiểm định giả thiết:

210

: ppH

với đối thiết

211

ppH







211

210

ppH

* Với mức ý nghĩa

đã cho, ta xác định miền bác bỏ

như sau:

(

)

+∞

;

αα

, trong đó

được xác định từ công thức

( )

1 −=−=−−=Φ

γαα

với

( )

∫

−

=Φ

dtew

* So sánh giá trị thực nghiệm

với

+ Nếu

(nghĩa là

∈

) thì ta bác bỏ giả thiết

và thừa nhận đối thiết

với

mức ý nghĩa

+ Nếu

≤

(nghĩa là

∉

) thì ta chưa có cơ sở bác bỏ giả thiết

nên chấp nhận

giả thiết

với mức ý nghĩa

c) Kiểm định phía trái của

Cần kiểm định giả thiết:

210

: ppH

≥

với đối thiết

211

: ppH







≥

211

210

ppH

* Với mức ý nghĩa

đã cho, ta xác định miền bác bỏ

như sau:

(

)

αα

−

∞

−

; zW

, trong đó

−1

được xác định từ công thức

( )

−=−=−−=Φ

−

γαα

với

( )

∫

−

=Φ

dtew

* So sánh giá trị thực nghiệm

với

−1

ươ

ng VI. Ki

ể

đị

nh gi

ả

thi

ế

t th

ố

ng kê

115

+ Nếu

−

(nghĩa là

∈

) thì ta bác bỏ giả thiết

và thừa nhận đối thiết

với mức ý nghĩa

+ Nếu

−

≥

(nghĩa là

∉

) thì ta chưa có cơ sở bác bỏ giả thiết

nên chấp

nhận giả thiết

với mức ý nghĩa

2.7. Kiểm định giả thiết thống kê về quy luật phân phối.

Ta đã biết rằng khi

khá lớn thì hàm phân phối thực nghiệm

(

)

xấp xỉ hàm phân

phối

(

)

của biến ngẫu nhiên

, nhưng nhiều khi dựa vào sự suy đoán, ta có thể

nhận biết được dạng hàm phân phối

(

)

của biến ngẫu nhiên

Ta đặt giả thiết

(

)

(

)

xFxFH

và đối thiết

(

)

(

)

xFxFH

≠

Để kiểm định giả thiết

, người ta dùng quy tắc kiểm định Chi bình phương như

+ Ta lập mẫu ngẫu nhiên

(

)

XXX ;;;

của

và mẫu thực nghiệm là

(

)

xxx ;;;

ta sắp xếp mẫu thực nghiệm theo dạng các bảng phân phối không chia lớp hoặc chia

lớp.

Xét xác suất:

(

)

aXPp

hoặc

(

)

iii

aXaPp

≤

−1

mi ;1=

nếu mẫu thực nghiệm của

sắp

xếp theo bảng phân phối thực nghiệm không chia lớp hoặc chia lớp và xác định các tần

suất

(với

∑

) của các giá trị hoặc của các lớp trong mẫu thực nghiệm, ta

xem lớp

[

)

;aa

là

(

)

;

∞

−

và lớp

[

)

aa ;

1−

là lớp

[

)

+∞

−

;

…

[

)

(

)

110

;; aaa

∞

−

[

)

;

…

[

)

[

)

+∞

−−

;;

11 mmm

aaa

…

Theo luật số lớn Bernoulli, ta biết rằng:

→

, khi

+∞→n

mi ;1=

Biến ngẫu nhiên

(

)

npn

−=

−

∑∑

== 1

có phân phối Chi bình phương

với

−

bậc tự do với

khá lớn,

là số lượng các giá trị khác nhau hoặc số lớp

ứng với mẫu thực nghiệm cho theo bảng phân phối thực nghiệm không chia lớp vả

là số lượng các tham số chưa biết của

(

)

, các tham số này được ước lượng bằng

phương pháp hợp lí cực đại.

Ta có quy tắc kiểm định sau đây:

* Xác định giá trị thực nghiệm:

(

)

npn

−=

−

∑∑

== 1

* Với mức ý nghĩa

, ta tìm số

−−rm

từ bảng phân phối Chi bình phương rồi so

sánh với

Bài gi

ả

116

+ Nếu

χχ

−−rm

thì bác bỏ giả thiết

và thừa nhận đối thiết

với mức ý nghĩa

+ Nếu

χχ

≥

−−rm

thì ta chưa có cơ sở bác bỏ giả thiết

nên chấp nhận giả thiết

với mức ý nghĩa

Chú ý.

Các phân phối cơ bản cần kiểm định.

1. Nhị thức:

(

)

pnBX ;~

+ Nếu

đã biết,

đã biết thì

+ Nếu

đã biết,

chưa biết thì

+ Nếu

chưa biết,

chưa biết thì

2. Poisson:

(

)

PX ~

chưa biết, ta thay

3. Chuẩn:

(

)

σµ

Nếu

chưa biết, ta thay

với

( )

∑

−

là phương sai mẫu

hiệu chỉnh,

Ví dụ 2.10.

Có thể cho rằng số mặt sấp xuất hiện khi tung bốn đồng tiền là đại lượng ngẫu nhiên

tuân theo quy luật phân phối xác suất nhị thức

(

)

pnB ;

được không, nếu biết mức ý

nghĩa

01,0

Khi tung

100

lần thì người ta được kết quả sau đây

(số mặt sấp)

(số lần xuất hiện)

Giải

Gọi

(

)

là hàm phân phối xác suất của

và

(

)

là hàm phân phối của biến ngẫu

nhiên có phân phối nhị thức

(

)

pnB ;

. Ta có

(

)

(

)

ppCkXP

−

−==

Đặt giả thiết

(

)

(

)

xFxFH

và đối thiết

(

)

(

)

xFxFH

≠

Ta có

5,0

==p

Nếu

có phân phối nhị thức

(

)

5,0;4

thì các xác suất

được xác định như sau

(

)

−

−=

5,015,0

;

4;0=i

Khi đó, ta có:

0625,0

25,0

375,0

25,0

0625,0

Để tính

(

)

∑

−

npn

, ta lập bảng sau đây

npn

−

(

)

npn

−

0625,0

25,6

75,1

49,0

ươ

ng VI. Ki

ể

đị

nh gi

ả

thi

ế

t th

ố

ng kê

117

25,0

−

375,0

5,37

5,4

54,0

25,0

−

36,0

0625,0

25,6

75,1

49,0

Khi đó, ta có

(

)

88,2

−

∑

npn

Với mức ý nghĩa

01,0

và

, ta có:

541,4

01,0;3

01,0;115

===

−−−−

χχχ

Ta có

χχ

−−rm

nên ta chưa có cơ sở bác bỏ giả thiết

nên chấp nhận giả thiết

với mức ý nghĩa

01,0

. Khi đó, ta cho rằng số mặt sấp xuất hiện tuân theo phân

phối nhị thức.

Ví dụ 2.11.

Gọi

là số lần khách đến bán ĐTDĐ ở một cửa hàng trong

ngày được cho theo

bảng sau đây

(số lần khách đến)

(Số ngày)

Với mức ý nghĩa

01,0

, ta có xem

có phân phối Poisson được không?

Giải

Gọi

(

)

là hàm phân phối xác suất của

và

(

)

là hàm phân phối của biến ngẫu

nhiên có phân phối Poisson

(

)

. Ta có:

( )

xXP

−

Đặt giả thiết

(

)

(

)

xFxFH

và đối thiết

(

)

(

)

xFxFH

≠

Dựa vào bảng, ta tính được

Nếu

có phân phối Poisson

(

)

thì các xác suất

được xác định như sau

;

5;1=i

Ta có:

1353,0

2707,0

1804,0

0902,0

Để tính

(

)

∑

−

npn

, ta lập bảng sau đây

npn

−

(

)

npn

−

1353,0

53,13

47,3

89,0

2707,0

07,27

07,5

−

95,0

2707,0

07,27

07,1

−

04,0

1804,0

04,18

96,1

21,0

0902,0

02,9

98,1

43,0

Khi đó, ta có

(

)

89,2

−

∑

npn

Bài gi

ả

118

Với mức ý nghĩa

01,0

và

, ta có:

345,,11

01,0;3

01,0;115

===

−−−−

χχχ

Ta có

χχ

−−rm

nên ta chưa có cơ sở bác bỏ giả thiết

nên chấp nhận giả thiết

với mức ý nghĩa

01,0

. Khi đó, ta cho rằng số lần

khách bán ĐTDĐ có phân

phối Poisson.

Ví dụ 2.12.

Điểm trung bình học tập của

100

sinh viên được cho ở bảng số liệu sau đây

[

)

aa ;

1−

0-3

3-5

5-7

7-8

8-10

Với mức ý nghĩa

05,0

, kiểm định giả thiết nói rằng điểm trung bình học tập của

sinh viên tuân theo luật phân phối chuẩn.

Giải

Gọi

(

)

là hàm phân phối xác suất của

và

(

)

là hàm phân phối của biến ngẫu

nhiên chuẩn

(

)

;

σµ

( )













−

Φ=

Đặt giả thiết

(

)

(

)

xFxFH

và đối thiết

(

)

(

)

xFxFH

≠

Dựa vào bảng số liệu, ta tính được:

02,6=x

84,1=s

Nếu

có phân phối chuẩn thì

(

)

84,1;02,6~ NX

và các xác suất

được tính như

( ) ( )

051,0

84,1

02,63













−

Φ==<= FXPp

( ) ( ) ( )

239,0

84,1

02,63

84,1

02,65

3553













−

Φ−













−

Φ=−=<≤= FFXPp

( ) ( ) ( )

412,0

84,1

02,65

84,1

02,67

5775













−

Φ−













−

Φ=−=<≤= FFXPp

( ) ( ) ( )

156,0

84,1

02,67

84,1

02,68

7887













−

Φ−













−

Φ=−=<≤= FFXPp

( ) ( )

141,0

84,1

02,68

318













−

Φ−=−=≥= FXPp

Để tính

(

)

∑

−

npn

, ta lập bảng sau đây

npn

−

(

)

npn

−

8 0,051 5,069 2,931 1,694

11 0,239 23,934 -12,934 6,99

ươ

ng VI. Ki

ể

đị

nh gi

ả

thi

ế

t th

ố

ng kê

119

50 0,412 41,246 8,754 1,858

22 0,156 15,610 6,390 2,616

9 0,141 14,140 -5,140 1,869

Khi đó, ta có

(

)

026,15

−

∑

npn

Với mức ý nghĩa

05,0

và

, ta có:

992,5

05,0;2

05,0;125

===

−−−−

χχχ

+ Nếu

χχ

−−rm

thì bác bỏ giả thiết

và thừa nhận đối thiết

với mức ý nghĩa

. Như vậy, ta không thể coi điểm trung bình học tập của sinh viên có phân phối

chuẩn.

Ví dụ 2.13.

Kiểm tra ngẫu nhiên

130

cây có trong một khu rừng và đo chiều cao của chúng, kết

quả thu được cho theo bảng sau đây:

[

)

aa ;

1−

30-36 36-42 42-48 48-54 54-60 60-66 66-72

Có người cho rằng chiều cao

của loại cây này có phân phối chuẩn

(

)

;

σµ

. Hãy

kiểm định lời nhận định này với mức ý nghĩa

05,0

Giải

Gọi

(

)

là hàm phân phối xác suất của

và

(

)

là hàm phân phối của biến ngẫu

nhiên chuẩn

(

)

;

σµ

( )













−

Φ=

Đặt giả thiết

(

)

(

)

xFxFH

và đối thiết

(

)

(

)

xFxFH

≠

Dựa vào bảng, ta tính được

5,51=x

và

68,7

Nếu

có phân phối chuẩn thì

(

)

(

)

68,7;5,51~ NX

và các xác suất

được tính như

( ) ( )

022,0

68,7

5,5136

3636













−

Φ==<= FXPp

( ) ( ) ( )

087,0

68,7

5,5136

68,7

5,5142

36424236

002













−

Φ−













−

Φ=−=<≤= FFXPp

( ) ( ) ( )

217,0

68,7

5,5142

68,7

5,5148

42484842

003













−

Φ−













−

Φ=−=<≤= FFXPp

( ) ( ) ( )

303,0

68,7

5,5148

68,7

5,5154

48545448

004













−

Φ−













−

Φ=−=<≤= FFXPp

( ) ( ) ( )

237,0

68,7

5,5154

68,7

5,5160

48546054

005













−

Φ−













−

Φ=−=<≤= FFXPp

( ) ( ) ( )

104,0

68,7

5,5160

68,7

5,5166

48666660

006













−

Φ−













−

Φ=−=<≤= FFXPp

( )

029,0

68,7

5,5166













−

Φ−=≥= XPp

Bài gi

ả

120

Để tính

(

)

∑

−

npn

, ta lập bảng sau đây

npn

−

(

)

npn

−

022,0

86,2

86,0

−

26,0

087,0

3,11

3,3

−

96,0

217,0

23,28

77,6

62,1

303,0

45,39

55,3

32,0

237,0

86,30

86.8

−

55,2

104,0

51,13

49,1

16,0

029,0

79,3

21,1

39,0

Khi đó, ta có

(

)

26,6

−

∑

npn

Với mức ý nghĩa

05,0

và

, ta có:

5,9

05,0;4

05,0;127

===

−−−−

χχχ

Ta có

χχ

−−rm

nên ta chưa có cơ sở bác bỏ giả thiết

nên chấp nhận giả thiết

với mức ý nghĩa

05,0

. Khi đó, ta cho rằng chiều cao

của loại cây trên có

phân phối chuẩn với mức ý nghĩa

05,0

2.8. Kiểm định giả thiết thống kê về tính độc lập.

Giả sử ta có mẫu ngẫu nhiên hai quan sát đồng thời về hai ĐLNN

và

. Từ mẫu có

kích thước

, ta có bảng số liệu sau đây

(

)

YX ;

Tổng

∑

Trong đó,

∑

iji

ki ;1=

∑

ijj

hj ;1=

, và

∑∑

Ta đặt giả thiết:

và

độc lập.

Đối thiết:

và

không độc độc lập.

Với mức ý nghĩa

cho trước. Hãy kiểm định giả thiết

ươ

ng VI. Ki

ể

đị

nh gi

ả

thi

ế

t th

ố

ng kê

121

Biến ngẫu nhiên













−==

∑∑

= =

1 1

có phân phối Chi bình phương với

(

)

(

)

−

bậc tự do.

Ta có quy tắc kiểm định sau đây:

* Xác định giá trị thực nghiệm:













−=

∑∑

= =

1 1

* Với mức ý nghĩa

, ta tìm số

( )( )

;11

−− hk

từ bảng phân phối Chi bình phương rồi so

sánh với

+ Nếu

( )( )

;11

χχ

−− hk

thì bác bỏ giả thiết

và thừa nhận đối thiết

với mức ý

nghĩa

+ Nếu

( )( )

;11

χχ

≥

−− hk

thì ta chưa có cơ sở bác bỏ giả thiết

nên chấp nhận giả thiết

với mức ý nghĩa

Ví dụ 2.14.

Trong một nhà máy dệt may, một nhà thống kê theo dõi

1000

công nhân làm việc

trong một năm và thấy số ngày nghỉ việc của họ được cho trong bảng sau

Số ngày nghỉ việc trong năm

Nam

Nữ

0-10 300 500

10-20 80 70

20 trở lên 20 30

Với mức ý nghĩa

, nhà thống kê này có thể cho rằng số ngày nghỉ của công

nhân có phụ thuộc vào giới tính không?

Giải

Gọi

là số ngày nghỉ của công nhân,

là giới tính của công nhân.

Dựa vào bảng số liệu, ta có:

(

)

YX ;

Tổng

300 500 800

80 70 150

20 30 50

Tổng 400 600

1000

Đây là bài toán kiểm định giả thiết về tính độc lập của

và

Ta đặt giả thiết: :

và

độc lập.

Đối thiết:

và

không độc độc lập.

Ta chọn giá trị kiểm định:













−=

∑∑

= =

1 1

Khi đó, ta có:

Bài gi

ả

122

19,131

600.50

400.50

600.150

400.150

600.800

500

400.800

300

1000

222222













−+++++=

Với mức ý nghĩa

, ta có

( )( )

992,5

05,0;2

;11

−−

χχ

Ta có

( )( )

;11

χχ

−− hk

thì bác bỏ giả thiết

và thừa nhận đối thiết

với mức ý

nghĩa

. Vậy số ngày nghỉ của công nhân phụ thuộc vào giới tính.

3. Bài tập chương.

ọ

ng l

ượ

ủ

a s

ả

n ph

ẩ

m do m

ộ

t nhà máy s

ả

n xu

ấ

t ra là m

ộ

t bi

ế

n ng

ẫ

u nhiên có

phân ph

ố

i chu

ẩ

(

)

;

σµ

ớ

kg và tr

ọ

ng l

ượ

ng trung bình là

kg. Nghi

ờ

nhà máy ho

ạ

độ

ng không bình th

ườ

ng làm thay

đổ

i tr

ọ

ng l

ượ

ng trung bình c

ủ

a s

ả

ẩ

m, ng

ườ

i ta cân

100

ả

n ph

ẩ

m và k

ế

t qu

ả

thu

đượ

c cho theo b

ả

ng sau:

x : tr

ọ

ng l

ượ

ng s

ả

n ph

ẩ

18 19 20 21 22

n : s

ố

ả

n ph

ẩ

m t

ươ

ứ

5 25 40 20 10

Hãy ki

ể

đị

ề

u nghi ng

ờ

trên v

ớ

i m

ứ

c ý ngh

a 05,0

ớ

i gi

ả

thi

ế

t: 20:

H kg và

đố

i thi

ế

t 20:

≠

H .

Theo k

ỹ

thu

ậ

t quy

đị

nh thi

ế

t k

ế

quy

đị

nh chi

ề

u dài trung bình c

ủ

a m

ộ

t chi ti

ế

t máy do

nhà máy A s

ả

n xu

ấ

t là

cm. Sau m

ộ

t th

ờ

i gian s

ả

n xu

ấ

t, có ý ki

ế

n cho r

ằ

ng nhà máy

A s

ả

n xu

ấ

t lo

ạ

i chi ti

ế

t máy trên không

đạ

t yêu c

ầ

Để

ể

m tra, ng

ườ

i tra ch

ọ

n ng

ẫ

nhiên

chi ti

ế

t và

o (phép

o không có sai s

ố

) k

ế

t qu

ả

thu

đượ

c: chi

ề

u dài trung bình

5,20=x cm và

độ

ệ

ch tiêu chu

ẩ

n hi

ệ

u ch

ỉ

nh là 1

s cm. Bi

ế

t r

ằ

ng chi

ề

u dài lo

ạ

i chi

ế

t trên là bi

ế

n ng

ẫ

u nhiên chu

ẩ

(

)

;

σµ

N . Hãy ki

ể

đị

ề

u nghi ng

ờ

trên v

ớ

i m

ứ

ý ngh

05,0

ớ

i gi

ả

thi

ế

t: 20:

H cm và

đố

i thi

ế

t 20:

≠

H cm.

ộ

t nhà th

ố

ng kê theo dõi m

ứ

c thu nh

ậ

p c

ủ

a m

ộ

t s

ố

ườ

ở

Công ty May và thu

đượ

ố

ệ

u nh

sau.

X (tr

m ngàn) 8 11 13 15 17 19 21 23

ố

ườ

4 16 25 30 26 20 15 8

Tính thu nh

ậ

p trung bình c

ủ

và

độ

ệ

ch chu

ẩ

ề

u ch

ỉ

ủ

a thu nh

ậ

ớ

độ

tin c

ậ

%95

. Hãy

ướ

c l

ượ

ng thu nh

ậ

p trung bình c

ủ

a toàn b

ộ

công nhân

ở

Công ty May.

ế

u nhà th

ố

ng kê cho r

ằ

ng thu nh

ậ

p m

ỗ

i tháng

7,1

≥

tri

ệ

u là cao. Hãy

ướ

c l

ượ

ng t

ỉ

ệ

ủ

a nh

ữ

ng ng

ườ

i có thu nh

ậ

p cao trong Công ty v

ớ

độ

tin c

ậ

%99

ế

u ban giám

đố

c báo cáo r

ằ

ng thu nh

ậ

p trung bình là 6,1 tri

ệ

u. Nhà th

ố

ng kê d

ự

a vào

ẫ

u k

ế

t qu

ả

ở

trên v

ớ

i m

ứ

c ý ngh

a %5

. Nhà th

ố

ng kê có th

ể

tin c

ậ

y vào ý ki

ế

này không?

4. Đ

ề

u tra doanh s

ố

bán hàng

(tri

ệ

đồ

ng/tháng) c

ủ

a các h

ộ

kinh doanh m

ộ

t lo

ạ

i hàng

m nay, ta

đượ

c s

ố

ệ

u sau

ây

(tri

ệ

u/tháng) 11 11,5 12 12,5 13 13,5

ố

ộ

10 15 20 30 15 10

ế

u bi

ế

t r

ằ

ng nh

ữ

ng h

ộ

có doanh s

ố

trên 12,5 tri

ệ

u / tháng là nh

ữ

ng h

ộ

có doanh s

ố

cao.

Có bài báo công b

ố

ằ

ng t

ỉ

ệ

ộ

có doanh s

ố

cao là %35 . Cho nh

ậ

n xét v

ề

ỉ

ệ

ữ

ộ

có doanh s

ố

cao trong bài báo này v

ớ

i m

ứ

c ý ngh

ươ

ng VI. Ki

ể

đị

nh gi

ả

thi

ế

t th

ố

ng kê

123

m tr

ướ

c, doanh s

ố

bán hàng c

ủ

a các h

ộ

này là 120 tri

ệ

u / n

m (t

ứ

c là 10 tri

ệ

u /

tháng). Có th

ể

cho r

ằ

ng doanh s

ố

bán hàng c

ủ

a các h

ộ

này n

m nay t

ng lên không v

ớ

ứ

c ý ngh

ộ

t công ti kinh doanh xe

đạ

ệ

n tuyên b

ố

ằ

ng 60% khách hàng

a thích s

ả

n ph

ẩ

ủ

a công ti.

ề

u tra 400 khách hàng thì có 230 khách hàng

a thích s

ả

n ph

ẩ

m c

ủ

a tông

ti này. V

ớ

i m

ứ

c ý ngh

, hãy xem t

ỉ

ệ

trong tuyên b

ố

ủ

a công ti có

úng

không?

ọ

ng l

ượ

ng c

ủ

a m

ộ

t gói b

ộ

t ng

ọ

t do m

ộ

t máy t

ự

độ

óng theo thi

ế

t k

ế

là 500

gram/gói. Nghi ng

ờ

máy t

ự

độ

óng gói này làm vi

ệ

c không bình th

ườ

ng làm cho

ọ

ng l

ượ

ng c

ủ

a gói b

ộ

t ng

ọ

t có xu h

ướ

ng gi

ả

m sút. Ng

ườ

i ta l

ấ

y ng

ẫ

u nhiên 30 gói, cân

ử

và

đượ

c tr

ọ

ng l

ượ

ng trung bình là 495 gram và

độ

ệ

ch tiêu chu

ẩ

n hi

ệ

u ch

ỉ

nh 10

gram. V

ớ

i m

ứ

c ý ngh

, hãy cho k

ế

t lu

ậ

n v

ề

nghi ng

ờ

này.

ướ

ây,

đị

nh m

ứ

c tiêu dùng

ệ

n c

ủ

a m

ộ

t h

ộ

gia

ình trong m

ộ

t tháng là 140 kW. Do

đờ

i s

ố

ng nâng cao, ng

ườ

i ta theo dõi 100 h

ộ

gia

ình và thu

đượ

c s

ố

ệ

u sau

ây

ượ

ng tiêu dùng

(kW)

100-120 120-140 140-160 160-180 180-200

ố

ộ

gia

ình 14 25 30 20 11

ớ

i m

ứ

c ý ngh

, theo b

ạ

n có nên t

đị

nh m

ứ

c lên không?

ế

u tr

ướ

ây,

độ

ế

độ

ng c

ủ

a m

ứ

c tiêu dùng

ệ

n cho m

ộ

t h

ộ

gia

ình là 400 (kW)

ậ

y, hi

ệ

n nay,

độ

ế

độ

ng t

ng không? Hãy cho k

ế

t lu

ậ

n v

ớ

i m

ứ

c ý ngh

ộ

đạ

i lí xe máy

ã kí h

ợ

đồ

ng v

ớ

i 2 nhà cung c

ấ

p A và B s

ả

n xu

ấ

t th

ử

linh ki

ệ

khung cho xe Dream II. D

ự

a vào k

ế

t qu

ả

ử

khung,

đạ

i lí s

ẽ

ọ

n nhà cung c

ấ

p nào cho

đạ

i lí c

ủ

a mình. Nhà cung c

ấ

p A

ã s

ả

n xu

ấ

t th

ử

đượ

c 10 cái v

ớ

độ

ề

n trung bình là

4,8 tháng và

độ

ệ

ch tiêu chu

ẩ

n là 1,1 tháng; nhà cung c

ấ

p B s

ả

n xu

ấ

t th

ử

13 cái có

độ

ề

n trung bình là 4,3 tháng và

độ

ệ

ch tiêu chu

ẩ

n là 0,9 tháng. Cho m

ứ

c ý ngh

%10

, gi

ả

ử

độ

ề

n c

ủ

a hai lo

ạ

i khung do các nhà cung c

ấ

p A và B s

ả

n xu

ấ

t có

phân ph

ố

i chu

ẩ

n. N

ế

u bi

ế

độ

ổ

đị

nh v

ề

độ

ề

n (ph

ươ

ng sai) c

ủ

a hai lo

ạ

i khung là nh

nhau, hãy xem tu

ổ

i th

ọ

trung bình c

ủ

a hai lo

ạ

i khung có khác nhau không?

9. Độ

ệ

ch tiêu chu

ẩ

n c

ủ

a tr

ọ

ng l

ượ

ng X c

ủ

a m

ộ

t lo

ạ

i s

ả

n ph

ẩ

m là 0,1 kg. Nghi ng

ờ

độ

đồ

đề

u c

ủ

a tr

ọ

ng l

ượ

ng s

ả

n ph

ẩ

m gi

ả

m sút, ng

ườ

i ta cân th

ử

25 s

ả

n ph

ẩ

m và thu

đượ

ố

ệ

u sau

ây

X (kg) 2,1 2,2 2,3 2,4 2,5

ố

ả

n ph

ầ

m 2 4 15 3 1

ớ

i m

ứ

c ý ngh

a %5

, hãy cho bi

ế

t k

ế

t lu

ậ

n v

ề

u nghi ng

ờ

trên. Gi

ả

thi

ế

t tr

ọ

ng l

ượ

ả

n ph

ẩ

m có phân ph

ố

i chu

ẩ

C. Phương pháp giảng dạy.

- Đưa ví dụ cụ thể để thấy rõ ứng dụng của kiểm định.

- Sử dụng các bảng phụ lục cho việc tính các giá trị của hàm phân phối chuẩn, Poisson,

Student, chi bình phương.

- Phối hợp phương pháp thuyết trình và vấn đáp giải quyết vấn đề.

- Yêu cầu SV đọc bài giảng trước khi lên lớp.

- Kiểm tra, đánh giá việc làm bài tập của SV.

D. Tài liệu tham khảo

[1] Đậu Thế Cấp, Xác suất thống kê: Lí thuyết và các bài tập, NXB Giáo dục, 2006.

Bài gi

ả

124

[2] Đặng Hùng Thắng,

ố

ng kê và

ứ

ng d

ụ

, NXB Giáo dục, 2008.

[3] PGS. TS. Phạm Xuân Kiều,

Giáo Trình xác su

ấ

t và th

ố

ng kê

, NXB Giáo dục,

2005.

[4] Trần Văn Minh, Phí Thị Vân Anh,

Xác su

ấ

t th

ố

ng kê v

ớ

i các tính toán trên Excel

NXB Giao Thông Vận tải, 2008.

[5] Đặng Công Hanh, Đặng Ngọc Dục,

Giáo trình Lý thuy

ế

t xác su

ấ

t và Th

ố

ng kê

toán

, trường Đại học Duy Tân,1996

[6] Trần Văn Minh, Phí Thị Vân Anh,

ướ

ng d

ẫ

n gi

ả

i bài t

ậ

p Xác su

ấ

t th

ố

ng kê v

ớ

các tính toán trên Excel

, NXB Giao Thông Vận tải, 2008.

Các b

ả

ng s

ố

125

Các bảng số

Bảng 1. Bảng phân phối Poisson:

( )

kXP

−

(

)

0905,00,1.0,1

POISSON

( )

1.0

11.0

−

(k;λ)

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

0.9048

0.8187

0.7408

0.6703

0.6065

0.5488

0.4966

0.4493

0.4066

0.0905

0.1637

0.2222

0.2681

0.3033

0.3293

0.3476

0.3595

0.3659

0.0045

0.0164

0.0333

0.0536

0.0758

0.0988

0.1217

0.1438

0.1647

0.0002

0.0011

0.0033

0.0072

0.0126

0.0198

0.0284

0.0383

0.0494

0.0000

0.0001

0.0003

0.0007

0.0016

0.0030

0.0050

0.0077

0.0111

0.0000

0.0001

0.0002

0.0004

0.0007

0.0012

0.0020

0.0000

0.0001

0.0002

0.0003

(k;λ)

1.5

2.5

3.5

4.5

0.3679

0.2231

0.1353

0.0821

0.0498

0.0302

0.0183

0.0111

0.0067

0.3679

0.3347

0.2707

0.2052

0.1494

0.1057

0.0733

0.0500

0.0337

0.1839

0.2510

0.2707

0.2565

0.2240

0.1850

0.1465

0.1125

0.0842

0.0613

0.1255

0.1804

0.2138

0.2240

0.2158

0.1954

0.1687

0.1404

0.0153

0.0471

0.0902

0.1336

0.1680

0.1888

0.1954

0.1898

0.1755

0.0031

0.0141

0.0361

0.0668

0.1008

0.1322

0.1563

0.1708

0.1755

0.0005

0.0035

0.0120

0.0278

0.0504

0.0771

0.1042

0.1281

0.1462

Các b

ả

ng s

ố

126

Bảng 2. Giá trị tích phân Laplace:

( )

∫

−

=Φ

dtez

, Ví dụ:

(

)

47501,1,0,96.1

,NORMDIST

05.0

−=













Φ z

z 0

0.0000

0.0040

0.0080

0.0120

0.0160

0.0199

0.0239

0.0279

0.0319

0.0359

0.1

0.0398

0.0438

0.0478

0.0517

0.0557

0.0596

0.0636

0.0675

0.0714

0.0753

0.2

0.0793

0.0832

0.0871

0.0910

0.0948

0.0987

0.1026

0.1064

0.1103

0.1141

0.3

0.1179

0.1217

0.1255

0.1293

0.1331

0.1368

0.1406

0.1443

0.1480

0.1517

0.4

0.1554

0.1591

0.1628

0.1664

0.1700

0.1736

0.1772

0.1808

0.1844

0.1879

0.5

0.1915

0.1950

0.1985

0.2019

0.2054

0.2088

0.2123

0.2157

0.2190

0.2224

0.6

0.2257

0.2291

0.2324

0.2357

0.2389

0.2422

0.2454

0.2486

0.2517

0.2549

0.7

0.2580

0.2611

0.2642

0.2673

0.2704

0.2734

0.2764

0.2794

0.2823

0.2852

0.8

0.2881

0.2910

0.2939

0.2967

0.2995

0.3023

0.3051

0.3078

0.3106

0.3133

0.9

0.3159

0.3186

0.3212

0.3238

0.3264

0.3289

0.3315

0.3340

0.3365

0.3389

0.3413

0.3438

0.3461

0.3485

0.3508

0.3531

0.3554

0.3577

0.3599

0.3621

1.1

0.3643

0.3665

0.3686

0.3708

0.3729

0.3749

0.3770

0.3790

0.3810

0.3830

1.2

0.3849

0.3869

0.3888

0.3907

0.3925

0.3944

0.3962

0.3980

0.3997

0.4015

1.3

0.4032

0.4049

0.4066

0.4082

0.4099

0.4115

0.4131

0.4147

0.4162

0.4177

1.4

0.4192

0.4207

0.4222

0.4236

0.4251

0.4265

0.4279

0.4292

0.4306

0.4319

1.5

0.4332

0.4345

0.4357

0.4370

0.4382

0.4394

0.4406

0.4418

0.4429

0.4441

1.6

0.4452

0.4463

0.4474

0.4484

0.4495

0.4505

0.4515

0.4525

0.4535

0.4545

1.7

0.4554

0.4564

0.4573

0.4582

0.4591

0.4599

0.4608

0.4616

0.4625

0.4633

1.8

0.4641

0.4649

0.4656

0.4664

0.4671

0.4678

0.4686

0.4693

0.4699

0.4706

1.9

0.4713

0.4719

0.4726

0.4732

0.4738

0.4744

0.4750

0.4756

0.4761

0.4767

0.4772

0.4778

0.4783

0.4788

0.4793

0.4798

0.4803

0.4808

0.4812

0.4817

2.1

0.4821

0.4826

0.4830

0.4834

0.4838

0.4842

0.4846

0.4850

0.4854

0.4857

2.2

0.4861

0.4864

0.4868

0.4871

0.4875

0.4878

0.4881

0.4884

0.4887

0.4890

2.3

0.4893

0.4896

0.4898

0.4901

0.4904

0.4906

0.4909

0.4911

0.4913

0.4916

2.4

0.4918

0.4920

0.4922

0.4925

0.4927

0.4929

0.4931

0.4932

0.4934

0.4936

2.5

0.4938

0.4940

0.4941

0.4943

0.4945

0.4946

0.4948

0.4949

0.4951

0.4952

2.6

0.4953

0.4955

0.4956

0.4957

0.4959

0.4960

0.4961

0.4962

0.4963

0.4964

2.7

0.4965

0.4966

0.4967

0.4968

0.4969

0.4970

0.4971

0.4972

0.4973

0.4974

2.8

0.4974

0.4975

0.4976

0.4977

0.4978

0.4979

0.4980

0.4981

2.9

0.4981

0.4982

0.4983

0.4984

0.4985

0.4986

0.4987

0.4988

0.4989

0.4990

Các b

ả

ng s

ố

127

Bảng 3. Phân vị α của phân phối Student













tTP

. Ví dụ:

(

)

0639.205.0,24

TINV

05.0

;24













> tTP

(n;α)

0.200

0.100

0.050

0.025

0.010

0.005

3.0777

6.3138

12.7062

25.4517

63.6567

127.3213

1.8856

2.9200

4.3027

6.2053

9.9248

14.0890

1.6377

2.3534

3.1824

4.1765

5.8409

7.4533

1.5332

2.1318

2.7764

3.4954

4.6041

5.5976

1.4759

2.0150

2.5706

3.1634

4.0321

4.7733

1.4398

1.9432

2.4469

2.9687

3.7074

4.3168

1.4149

1.8946

2.3646

2.8412

3.4995

4.0293

1.3968

1.8595

2.3060

2.7515

3.3554

3.8325

1.3830

1.8331

2.2622

2.6850

3.2498

3.6897

1.3722

1.8125

2.2281

2.6338

3.1693

3.5814

1.3634

1.7959

2.2010

2.5931

3.1058

3.4966

1.3562

1.7823

2.1788

2.5600

3.0545

3.4284

1.3502

1.7709

2.1604

2.5326

3.0123

3.3725

1.3450

1.7613

2.1448

2.5096

2.9768

3.3257

1.3406

1.7531

2.1314

2.4899

2.9467

3.2860

1.3368

1.7459

2.1199

2.4729

2.9208

3.2520

1.3334

1.7396

2.1098

2.4581

2.8982

3.2224

1.3304

1.7341

2.1009

2.4450

2.8784

3.1966

1.3277

1.7291

2.0930

2.4334

2.8609

3.1737

1.3253

1.7247

2.0860

2.4231

2.8453

3.1534

1.3232

1.7207

2.0796

2.4138

2.8314

3.1352

1.3212

1.7171

2.0739

2.4055

2.8188

3.1188

1.3195

1.7139

2.0687

2.3979

2.8073

3.1040

1.3178

1.7109

2.0639

2.3909

2.7969

3.0905

1.3163

1.7081

2.0595

2.3846

2.7874

3.0782

1.3150

1.7056

2.0555

2.3788

2.7787

3.0669

1.3137

1.7033

2.0518

2.3734

2.7707

3.0565

1.3125

1.7011

2.0484

2.3685

2.7633

3.0469

1.3114

1.6991

2.0452

2.3638

2.7564

3.0380

1.3104

1.6973

2.0423

2.3596

2.7500

3.0298

Các b

ả

ng s

ố

128

Bảng 4. Phân vị α của phân phối Chi bình phương

(

)

αχχ

;

. Ví dụ:

(

)

0863.1501.0,5

CHIINV

(

)

01.0

01.0;5

χχ

(n;α)

0.010 0.025 0.050 0.950 0.975 0.990

6.6349

5.0239

3.8415

0.0039

0.0010

0.0002

9.2103

7.3778

5.9915

0.1026

0.0506

0.0201

11.3449

9.3484

7.8147

0.3518

0.2158

0.1148

13.2767

11.1433

9.4877

0.7107

0.4844

0.2971

15.0863

12.8325

11.0705

1.1455

0.8312

0.5543

16.8119

14.4494

12.5916

1.6354

1.2373

0.8721

18.4753

16.0128

14.0671

2.1673

1.6899

1.2390

20.0902

17.5345

15.5073

2.7326

2.1797

1.6465

21.6660

19.0228

16.9190

3.3251

2.7004

2.0879

23.2093

20.4832

18.3070

3.9403

3.2470

2.5582

24.7250

21.9200

19.6751

4.5748

3.8157

3.0535

26.2170

23.3367

21.0261

5.2260

4.4038

3.5706

27.6882

24.7356

22.3620

5.8919

5.0088

4.1069

29.1412

26.1189

23.6848

6.5706

5.6287

4.6604

30.5779

27.4884

24.9958

7.2609

6.2621

5.2293

31.9999

28.8454

26.2962

7.9616

6.9077

5.8122

33.4087

30.1910

27.5871

8.6718

7.5642

6.4078

34.8053

31.5264

28.8693

9.3905

8.2307

7.0149

36.1909

32.8523

30.1435

10.1170

8.9065

7.6327

37.5662

34.1696

31.4104

10.8508

9.5908

8.2604

38.9322

35.4789

32.6706

11.5913

10.2829

8.8972

40.2894

36.7807

33.9244

12.3380

10.9823

9.5425

41.6384

38.0756

35.1725

13.0905

11.6886

10.1957

42.9798

39.3641

36.4150

13.8484

12.4012

10.8564

44.3141

40.6465

37.6525

14.6114

13.1197

11.5240

45.6417

41.9232

38.8851

15.3792

13.8439

12.1981

46.9629

43.1945

40.1133

16.1514

14.5734

12.8785

48.2782

44.4608

41.3371

16.9279

15.3079

13.5647

49.5879

45.7223

42.5570

17.7084

16.0471

14.2565

50.8922

46.9792

43.7730

18.4927

16.7908

14.9535

Bấm Tải xuống để xem toàn bộ.

Preview text:

lOMoARcPSD|36212343 ĐẠI HỌC DUY TÂN KHOA KHOA HỌC TỰ NHIÊN
BỘ MÔN XÁC SUẤT THỐNG KÊ BÀI GIẢNG
LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN (Lưu hành nội bộ) Đà Nẵng, năm 2018
Downloaded by Di?p DN - Chuyên Viên R&D (diepdn@bibabo.vn) Lời mở đầu
Trong khoa học cũng như trong đời sống hàng ngày, chúng ta rất thường gặp các
hiện tượng ngẫu nhiên (toán học gọi là biến cố ngẫu nhiên). Đó là các biến cố mà ta
không thể dự báo một cách chắc chắn rằng chúng xảy ra hay không xảy ra.
Lí thuyết xác suất là bộ môn toán học nghiên cứu nhằm tìm ra các quy luật chi phối
và đưa ra các phương pháp tính toán xác suất của các hiện tượng ngẫu nhiên. Ngày
nay lý thuyết xác suất đã trở thành một ngành toán học quan trọng cả về phương
diện lý thuyết và ứng dụng. Nó là công cụ không thể thiếu được mỗi khi ta nói đến
dự báo, bảo hiểm, mỗi khi cần đánh giá các cơ may, các nguy cơ rủi ro. Nhà toán
học Pháp Laplace ở thế kỷ 19 đã tiên đoán rằng: ‘Môn khoa học này hứa hẹn trở
thành một trong những đối tượng quan trọng nhất của tri thức nhân loại. Rất
nhiều những vấn đề quan trọng nhất của đời sống thực tế thuộc về những bài
toán của lý thuyết xác suất’.
Lí thuyết xác suất và thống kê toán học là môn học cơ bản được giảng dạy ở hầu hết các trường Đại học.
Ngoài tập bài giảng này ra, giảng viên khuyến khích sinh viên khi học môn học xác
suất và thống kê nên có ít nhất 1 tài liệu khác để đọc thêm, bất cứ cuốn sách nào về
xác suất thống kê có trên thị trường đều tốt. Nó sẽ bổ sung kiến thức cho bạn.
Trong quá trình soạn bài giảng này, giảng viên đã tham khảo nhiều ý kiến của các
đồng nghiệp, và giảng viên cũng cố gắng rất lớn trong quá trình biên soạn nhưng do
hạn chế về nhiều mặt nên không thể tránh được sai sót. Rất mong nhận được sự phê
bình và sự đóng góp ý kiến của các đồng nghiệp và các bạn sinh viên. Xin chân thành cảm ơn.
Biên soạn: Nguyễn Quang Thi Mục lục
Lời mở đầu ....................................................................................................... 3
Mục lục ............................................................................................................. v Chương I.
Các khái niệm cơ bản trong lí thuyết xác suất. ...................... 1
1. Nhắc lại một số công thức giải tích tổ hợp. ..........................................................1
1.1. Quy tắc cộng và quy tắc nhân........................................................................1
1.2. Hoán vị. ........................................................................................................2
1.3. Chỉnh hợp (chỉnh hợp không lặp). .................................................................2
1.4. Chỉnh hợp lặp................................................................................................2
1.5. Tổ hợp...........................................................................................................3
1.6. Công thức nhị thức Newton...........................................................................3
1.7. Bài tập...........................................................................................................3
2. Biến cố và các phép toán trên biến cố. .................................................................4
2.1. Phép thử và biến cố. ......................................................................................4
2.2. Các loại biến cố.............................................................................................4
2.3. Biến cố bằng nhau (biến cố tương đương). ....................................................5
2.4. Các phép toán trên biến cố. ...........................................................................5
2.5. Nhóm đầy đủ các biến cố. .............................................................................6
2.6. Bài tập...........................................................................................................6
3. Định nghĩa xác suất..............................................................................................7
3.1. Các định nghĩa xác suất.................................................................................7
3.2. Các định lí về xác suất...................................................................................9
3.3. Công thức xác suất đầy đủ. Công thức Bayes. .............................................13
3.4. Bài tập.........................................................................................................15
4. Dãy phép thử Bernoulli. Công thức Bernoulli. ...................................................15
4.1. Dãy phép thử Bernoulli. ..............................................................................15
4.2. Số có khả năng nhất. ...................................................................................16
5. Bài tập chương...................................................................................................19
Đáp số và hướng dẫn..........................................................................................21
Chương II. Đại lượng ngẫu nhiên. Hàm phân phối xác suất. ..................... 25
1. Khái niệm. Phân loại đại lượng ngẫu nhiên. .......................................................25
1.1. Đại lượng ngẫu nhiên rời rạc. ......................................................................26
1.2. Đại lượng ngẫu nhiên liên tục......................................................................26
1.3. Hàm phân phối của đại lượng ngẫu nhiên....................................................26
2. Đại lượng ngẫu nhiên rời rạc..............................................................................27
2.1. Bảng phân phối xác suất..............................................................................27
2.2. Hàm phân phối xác suất. .............................................................................28
2.3. Phép toán đại lượng ngẫu nhiên...................................................................31
3. Đại lượng ngẫu nhiên liên tục. ...........................................................................32
4. Các đặc trưng của đại lượng ngẫu nhiên.............................................................34
4.1. Kì vọng. ......................................................................................................34
4.2. Phương sai. .................................................................................................36
4.3. Mốt, trung vị và moment trung tâm. ............................................................37
5. Hàm của một đại lượng ngẫu nhiên....................................................................41
5.1. Đại lượng ngẫu nhiên rời rạc. ..................................................................... 41
6.2. Đại lượng ngẫu nhiên liên tục. .................................................................... 42
6. Bài tập chương. ................................................................................................. 45
Đáp số và hướng dẫn. ........................................................................................ 45
Chương III. Các quy luật phân phối thường gặp......................................... 47
1. Quy luật phân phối rời rạc. ................................................................................ 47
1.1. Phân phối nhị thức...................................................................................... 47
1.2. Phân phối siêu bội. ..................................................................................... 48
1.3. Phân phối Poisson....................................................................................... 50
2. Quy luật phân phối liên tục................................................................................ 52
2.1. Phân phối đều. ............................................................................................ 52
2.2. Phân phối mũ.............................................................................................. 52
2.3. Phân phối chuẩn. Phân phối chuẩn tắc. ....................................................... 54
2.4. Phân phối Chi bình phương. ....................................................................... 60
2.5. Phân phối Student....................................................................................... 61
2.6. Công thức tính gần đúng............................................................................. 61
3. Đại lượng ngẫu nhiên nhiều chiều. .................................................................... 63
3.1. Khái niệm. .................................................................................................. 63
3.2. Quy luật phân phối xác suất của đại lượng ngẫu nhiên hai chiều................. 63
3.3. Hàm phân phối của đại lượng ngẫu nhiên hai chiều. ................................... 64
4. Bài tập chương. ................................................................................................. 65
Đáp số và hướng dẫn. ........................................................................................ 67
Chương IV. Lí thuyết mẫu ............................................................................ 71
1. Tổng thể và mẫu................................................................................................ 71
1.1. Mở đầu. ...................................................................................................... 71
1.2. Mẫu ngẫu nhiên, mẫu cụ thể. ...................................................................... 72
1.3. Bảng phân phối tần số................................................................................. 73
1.4. Hàm phân phối mẫu.................................................................................... 76
2. Các tham số đặc trưng của mẫu ......................................................................... 76
2.1. Tỉ lệ mẫu. ................................................................................................... 76
2.2. Số mốt (Mode) của mẫu.............................................................................. 79
2.3. Số trung vị (Median) của mẫu..................................................................... 79
2.4. Các quy luật phân phối mẫu........................................................................ 81
3. Bài tập chương. ................................................................................................. 83
Chương V. Lí thuyết ước lượng .................................................................... 85
1. Ước lượng điểm. ............................................................................................... 85
2. Ước lượng khoảng............................................................................................. 86
2.1. Ước lượng khoảng tin cậy cho kì vọng ....................................................... 87
2.2. Ước lượng khoảng tin cậy cho phương sai.................................................. 90
2.3. Ước lượng khoảng tin cậy cho tỉ lệ. ............................................................ 92
2.4. Ước lượng kích thước mẫu. ........................................................................ 94
3. Bài tập chương. ................................................................................................. 95
Đáp số và hướng dẫn. ........................................................................................ 97
Chương VI. Kiểm định giả thiết thống kê.................................................... 99
1. Các khái niệm cơ bản ........................................................................................ 99
1.1. Đặt vấn đề: ................................................................................................. 99
1.2. Phương pháp kiểm định giả thiết thống kê ................................................ 101 vi
2. Kiểm định giả thiết về tham số......................................................................... 101
2.1. Các loại kiểm định và phương pháp kiểm định giả thiết về các tham số. ... 101
2.2. Kiểm định giả thiết về trung bình của ĐLNN X~N(µ; σ2). ........................ 102
2.3. Kiểm định giả thiết về phương sai của ĐLNN X~N(µ; σ2). ....................... 106
2.4. Kiểm định giả thiết về tỉ lệ các phần tử có tính chất nào đó trong tổng thể.108
2.5. Kiểm định giả thiết về hai kì vọng của hai ĐLNN chuẩn độc lập............... 110
2.6. Kiểm định giả thiết thống kê về hai tỉ lệ của hai ĐLNN. ........................... 113
2.7. Kiểm định giả thiết thống kê về quy luật phân phối................................... 115
2.8. Kiểm định giả thiết thống kê về tính độc lập. ............................................ 120
3. Bài tập chương................................................................................................. 122
Các bảng số................................................................................................... 125
Bảng 1. Bảng phân phối Poisson:......................................................................... 125
Bảng 2. Giá trị tích phân Laplace:........................................................................ 126
Bảng 3. Phân vị α của phân phối Student ............................................................. 127
Bảng 4. Phân vị α của phân phối Chi bình phương............................................... 128 Chương I.
Các khái niệm cơ bản trong lí thuyết xác suất. A. Mục tiêu
- Ôn lại các kiến thức về Tập hợp và Giải tích tổ hợp như: tập hợp, các phép toán về tập hợp,
qui tắc nhân, hoán vị, chỉnh hợp, tổ hợp . . .
- Rèn luyện cách giải một số bài tập liên quan.
- Giới thiệu các khái niệm về phép thử, biến cố và phép toán giữa các biến cố.
- Nắm vững khái niệm về các biến cố xung và các biến cố độc lập.
- Xây dựng một số định nghĩa xác suất (định nghĩa cổ điển, định nghĩa theo hình học và định
nghĩa theo thống kê) và tìm công thức thể hiện định nghĩa đó.
- Nắm được các công thức cộng, công thức nhân xác suất.
- Hiểu được các công thức tính xác suất có điều kiện, công thức xác suất đầy đủ, công thức Bayes.
- Giới thiệu về dãy phép thử Bernoulli và công thức Bernoulli. B. Nội dung.
1. Nhắc lại một số công thức giải tích tổ hợp.
1.1. Quy tắc cộng và quy tắc nhân.
1.1.1. Quy tắc cộng.
Nếu một công việc được chia làm k trường hợp để thực hiện, trường hợp 1 có 1 n
cách thực hiện xong công việc, trường hợp 2 có n cách thực hiện xong công việc, 2
…, trường hợp k có n cách thực hiện xong công việc và không có bất kì mỗi cách k
thực hiện nào ở các trường hợp nào lại trùng với một cách thực hiện ở các trường
hợp khác, thì có n + n + L + n cách thực hiện xong công việc. 1 2 k
1.1.2. Quy tắc nhân.
Nếu một công việc được chia làm k giai đoạn, giai đoạn 1 có 1 n cách thực hiện
xong công việc, giai đoạn 2 có n cách thực hiện xong công việc, …, 2
giai đoạn k
có n cách thực hiện xong công việc, thì có n n Ln cách thực hiện xong công k 2 3 k việc. Bài giảng
1.2. Hoán vị.
Một hoán vị từ n phần tử là một bộ có thể kể thứ tự gồm n phần tử khác nhau đã cho.
Số các hoán vị từ n phần tử kí hiệu là P . n
Công thức tính: P = ! n . n Ví dụ 1.1.
Có 4 sinh viên và 4 cái ghế được sắp xếp theo một hàng ngang. Sắp xếp mỗi sinh
viên ngồi một ghế. Có bao nhiều cách sắp xếp khác nhau?
Rõ ràng mỗi kiểu sắp xếp là một hoán vị của 4 phần tử. Số cách sắp xếp chỗ ngồi là P ! 4 . 4 =
1.3. Chỉnh hợp (chỉnh hợp không lặp).
Một chỉnh hợp chập k (1 ≤ k ≤ n ) từ n phần tử là một bộ có thể kể thứ tự gồm k
phần tử khác nhau lấy từ n phần tử đã cho
Số các chỉnh hợp chập k từ n phần tử kí hiệu là k A . n ! Công th n
ức tính: Ak = n − K − + = n (n ) 1 (n k ) 1 (n − k)! Nhận xét.
Số các chỉnh hợp chập n của n phần tử bằng số các hoán vị của n phần tử, nghĩa là: n A = P . n n Ví dụ 1.2.
Có bao nhiêu số khác nhau gồm 3 chữ số phân biệt được thiết lập từ các chữ số 1, 2 , 3 , 4 , 5 ? Giải 3 ! 5
Một số gồm 3 chữ số phân biệt được thiết lập từ các chữ số bằng A = 60 . 5 = (5 − 3)!
1.4. Chỉnh hợp lặp.
Một chỉnh hợp lặp chập k ( k ≥ 1) từ n phần tử là một bộ có thể kể thứ tự gồm k
phần tử không nhất thiết khác nhau lấy từ n phần tử đã cho
Số các chỉnh hợp lặp chập k từ n phần tử kí hiệu là k A . n Công th k ức tính: k A = . n n Ví dụ 1.3. Giả sử A = { ; 1 } 3 ; 2
là tập hợp gồm 3 phần tử. Khi đó, các dãy 11, 21 hoặc 33 là
những chỉnh hợp lặp 2 từ 3 phần tử của A . Ta có thể liệt kê ra đây tất cả các chỉnh h 2
ợp lặp là: 11, 12 , 13 , 21, 22 , 23, 31, 32 , 33 . Và số chỉnh hợp đó là A3 = 32 = 9 . 2
Chương I. Các khái niệm cơ bản trong lí thuyết xác suất.
1.5. Tổ hợp.
Một tổ hợp chập k từ n phần tử là một tập con gồm k phần tử khác nhau đã cho.
Số các tổ hợp chập k từ n phần tử kí hiệu là k C . n n(n − ) 1 K(n − k + ) 1 ! Công th n ức tính: C k = = n k! k ( ! n − k )! Nhận xét: 0 C = 1 , n−k k C
= C , với mọi k = ; 0 n . n n n Ví dụ 1.4.
Có bao nhiêu cách phân công 5 sinh viên đi lao động của một lớp gồm 45 sinh viên? Giải
Mỗi cách chọn ngẫu nhiên 5 người trong 50 sinh viên là một tổ hợp chập 5 của 50 .
Vậy số cách phân công khác nhau 5 sinh viên trong 50 sinh viên đi lao động là 5 50 C = 2118760 . 50 = ! 5 (50 − 5)! Ví dụ 1.5.
Có bao nhiêu cách phân công 50 sinh viên thành 3 nhóm I , II , III sao cho nhóm
I có đúng 30 sinh viên. Giải Ta thấy có 30
C cách phân công 30 sinh viên vào nhóm 50
I . Số cách phân công
(50 − 30) sinh viên còn lại vào nhóm II và III bằng số các chỉnh hợp lặp chập 20 của 2 , nghĩa là bằng 20
2 . Vậy, số cách phân công 50 sinh viên thành 3 nhóm I ,
II , III sao cho nhóm I có đúng 30 sinh viên là 30 20 C × 2 50
1.6. Công thức nhị thức Newton. n
Công thức: (a + b)n k n k k = C ∑ a b n k =0 Nhận xét: a) (1 + x)n 0 1 n n
= C + C x + L + C x n n n n
b) (a − b)n = ( ∑− )k k n k k 1 C a b n k =0 1.7. Bài tập. 1.
Tìm n từ các phương trình: a) 2 C = 45 , n 4 A b) n = 60 , 3 Cn 1 − 3 Bài giảng c) 8 12 C = C n n 2.
Trên mặt phẳng có 20 điểm (không có 3 điểm này cùng nằm trên một đường thẳng).
Qua mỗi cặp điểm, ta vẽ một đường thẳng. Hỏi có bao nhiêu đường thẳng như vậy. 3.
Từ thành phố A có 3 con đường đi đến thành phố B và từ B có 2 con đường đi tới
thành phố C . Hỏi có mấy cách đi từ A đến C (phải qua B )? 4.
Trên một đường tròn có 12 điểm. Có mấy cách vẽ dây cung có các mút là các điểm đã
cho. Có mấy tam giác nhận các điểm là đỉnh.
2. Biến cố và các phép toán trên biến cố.
2.1. Phép thử và biến cố.
Phép thử (phép thử ngẫu nhiên) là sự thực hiện một nhóm các điều kiện xác định và
có thể được lặp lại nhiều lần. Kết quả của nó, ta không đoán trước được.
Một kết quả của phép thử gọi là một biến cố. Ví dụ 2.1.
a) Để nghiên cứu hiện tượng ngẫu nhiên về sự xuất hiện sấp hay ngửa khi tung đồng
tiền, ta tiến hành phép thử: “tung một đồng tiền”. Kết quả nhận được sẽ là S (được
mặt sấp) hoặc N (được mặt ngửa). S và N là những biến cố.
b) Chọn ngẫu nhiên một sinh viên trong lớp, ta được các biến cố, chẳng hạn: A :
“sinh viên đó là nữ”, B : “sinh viên đó là nam”, C : “sinh viên đó là sinh viên giỏi Toán”.
2.2. Các loại biến cố.
Biến cố không thể có (hay biến cố rỗng) là biến cố không bao giờ xảy ra khi phép
thử thực hiện. Kí hiệu: ∅ .
Biến cố ngẫu nhiên là biến cố có thể xảy ra hoặc không xảy ra tùy thuộc vào từng phép thử.
Biến cố sơ cấp là biến cố xảy ra khi và chỉ khi có một kết quả cụ thể trong số những
kết quả loại trừ nhau của phép thử. Kí hiệu là ω .
Biến cố chắc chắn là biến cố luôn luôn xảy ra khi phép thử thực hiện. Kí hiệu: Ω .
Biến cố chắc chắn gồm tất cả các biến cố sơ cấp. Ta thường coi đó là không gian
biến cố sơ cấp. Ví dụ 2.2.
Trong Ví dụ 2.1. a) Nếu đồng tiền có hai mặt đều ngửa thì S là biến cố rỗng và N
là biến cố chắc chắn.
Trong Ví dụ 2.1. b) Nếu lớp học đó không có nam thì A là biến cố chắc chắn và B là biến cố rỗng. Ví dụ 2.3.
Gieo 1 một lần 1 con xúc xắc. Gọi B là biến cố “Mặt trên con xúc xắc của nó có i i chấm”, i = 6 ; 1 . Khi đó 4
Chương I. Các khái niệm cơ bản trong lí thuyết xác suất.
Không gian biến cố sơ cấp là Ω = {B , B , B , B , B , . Các 1 2 3 4 5 B6 } 1 B , B , K , 2 B là 6
những biến cố sơ cấp. Chú ý:
Mọi biến cố sơ cấp đều là biến cố ngẫu nhiên. Ngược lại, biến cố ngẫu nhiên nói
chung không là biến cố sơ cấp.
2.3. Biến cố bằng nhau (biến cố tương đương).
Biến cố A gọi là kéo theo biến cố B nếu A xảy ra thì B xảy ra. Kí hiệu: A B ⊂ .
Nếu đồng thời có A B ⊂ và B A
⊂ thì các biến cố A và B gọi là bằng nhau. Kí hiệu: A = B .
2.4. Các phép toán trên biến cố.
Cho hai biến cố A và B . Khi đó, ta gọi:
Tích của A và B , hay A nhân B , là biến cố xảy ra khi A và B đồng thời xảy ra. Kí hiệu: A B
. ( hoặc AB hoặc A ∩ B ).
Tổng của A và B , hay A cộng B , là biến cố xảy ra khi A xảy ra hoặc B hoặc A B
. xảy ra. Kí hiệu: A + B (hoặc A ∪ B ).
Cho một biến cố A . Khi đó, ta gọi biến cố đối lập của biến cố A là biến cố xảy ra
nếu A không xảy ra và không xảy ra nếu A xảy ra. Kí hiệu: A . Tính chất.
Với các biến cố A , B , C tùy ý, ta có các tính chất sau:
1) A + B = B + A , AB = BA .
2) (A + B) + C = A + (B + C) , (AB)C = ( A BC) . 3) (
A B + C) = AB + AC , A + (BC) = (A + B)(A + C) . 4) Nếu A B
⊂ thì A + B = B , AB = A . 5) A = A .
6) A + A = Ω , AA = ∅ .
7) A + B = AB , AB = A + B (quy tắc đối ngẫu) 8) Với các biến cố 1 A , 2
A , K , A ta có n
A + A + L + A là biến cố xảy ra khi có ít nhất một biến cố = ). 1 2 A xảy ra ( i ; 1 n n i
A .A .L.A là biến cố xảy ra khi tất cả các = ). 1 2
A đều xảy ra ( i ; 1 n n i Ví dụ 2.4.
Bắn 3 mũi tên vào một tấm bia. Gọi A là biến cố “mũi tên thứ i trúng đích” i ( i = 3 ; 1 ). Hãy biểu diễn qua 1 A , 2 A , 3 A các biến cố:
A : Cả 3 mũi tên đều trúng đích.
B : Có đúng 1 mũi tên trúng đích.
C : Có ít nhất 1 mũi tên trúng đích.
D : Không có mũi tên nào trúng đích. 5 Bài giảng Giải Ta có: A = , , 1 A 2 A 3 A
B = A A2 A3 + 1 A A A3 + 1 A A2 1 2 3 A C = , 1 A + 2 A + 3 A D = . 1 A 2 A 3 A
2.5. Nhóm đầy đủ các biến cố.
Hai biến cố A và B gọi là xung khắc nếu AB = ∅ . Các biến cố 1 A , 2
A , K , A gọi là đôi một xung khắc nếu hai biến cố khác nhau bất n
kì trong đó đều xung khắc, tức là A A = ∅ với mọi i ≠ j . i j Các biến cố 1 A , 2
A , K , A gọi là một nhóm đầy đủ các biến cố nếu chúng đôi một n
xung khắc và ít nhất một trong chúng xảy ra, tức là A + A + L + A = Ω , 1 2 A A = ∅ n i j
với mọi i ≠ j , và P(A với mọi i = ; 1 n . i ) > 0 Ví dụ 2.5.
a) Gieo một lần một con xúc xắc:
Đặt B là biến cố “mặt trên của con xúc xắc có i chấm”, i = 6 ; 1 . Dãy B , B , i 1 B , 2 3 B , 4 B , 5
B lập thành hệ đầy đủ các biến cố. Vì nó có tính chất: 6
B + B + K + B = Ω , với mọi , và P(B , với mọi i = 6 ; 1 . i ) > 0 1 2 6 B B = ∅ i ≠ j i j
b) Gieo một đồng tiền một lần:
Đặt A là biến cố “xuất hiện mặt sấp”, khi đó A là biến cố “xuất hiện mặt ngửa”. Ta
thấy rằng dãy A , A lập thành một hệ đầy đủ vì AA = ∅ và A + A = Ω . Chú ý.
Hai biến cố đối lập nhau thì xung khắc với nhau. Điều ngược lại nói chung là không đúng. 2.6. Bài tập. 1.
Xét phép thử: gieo con xúc xắc 2 lần. Mô tả không gian biến cố sơ cấp ứng với phép
thử trên. Tìm các biến cố : A “tổng số chấm chia hết cho 3 ”; B “trị tuyệt đối của hiệu
số chấm là số chẵn”. 2.
Kiểm tra theo thứ tự một lô hàng gồm N sản phẩm. Các sản phẩm đều thuộc một trong
2 loại: tốt hoặc xấu. Kí hiệu A ( k = ;
1 N ) là biến cố chỉ sản phẩm kiểm tra thứ k k
thuộc loại xấu. Viết bằng kí hiệu các biến cố dưới đây:
a) Cả N sản phẩm đều xấu.
b) Có ít nhất 1 sản phẩm xấu.
c) m sản phẩm kiểm tra đầu là tốt, các sản phẩm còn lại là xấu.
d) Các sản phẩm kiểm tra theo thứ tự chẵn là xấu, còn các sản phẩm kiểm tra theo thứ tự lẻ là tốt.
e) Không gian biến cố sơ cấp có bao nhiêu phần tử. 3.
Bắn 3 viên đạn vào một tấm bia. Gọi A là biến cố: “viên đạn thứ i trúng bia”, i = 3 ; 1 . i
B là biến cố: “có đúng 1 viên đạn trúng một tấm bia”, C là biến cố “có ít nhất 2 viên
đạn trúng bia” và D là biến cố “cả 3 viên đạn không trúng bia”. Hãy biểu diễn các biến
cố B , C , D , B + C qua các A và A . i i 6
Chương I. Các khái niệm cơ bản trong lí thuyết xác suất. 4.
Bắn không hạn chế vào một mục tiêu cho đến khi có viên đạn trúng mục tiêu thì thôi
bắn. Giả sử mỗi lần bắn chỉ có 2 khả năng trúng bia (gọi là biến cố A ) hoặc chệch bia (biến cố A ).
a) Hãy mô tả không gian biến cố sơ cấp.
b) Hãy nêu một hệ đầy đủ các biến cố.
3. Định nghĩa xác suất.
3.1. Các định nghĩa xác suất.
3.1.1. Định nghĩa cổ điển.
Ta gọi các trường hợp đồng khả năng là các trường hợp mà khả năng xảy ra của chúng là ngang bằng nhau.
Ta gọi một trường hợp là thuận lợi cho biến cố A nếu trường hợp này xảy ra thì A xảy ra.
Giả sử có tất cả n(Ω) trường hợp đồng khả năng, trong số đó có n(A) trường hợp
thuận lợi cho biến cố A . Khi n A
đó, ta gọi xác suất của biến cố A là P(A) ( ) = . n(Ω)
Như vậy, xác suất của biến cố là tỉ số về khả năng biến cố đó xuất hiện. Ví dụ 3.1.
Gieo một lần con xúc xắc cân đối và đồng chất. Tìm xác suất để
a) Mặt trên của nó có 1 chấm.
b) Mặt trên của nó có số chấm là số chẵn. Giải
a) Đặt B là biến cố “mặt trên của con xúc xắc có i chấm”, i = 6 ; 1 . i
Đặt A là biến cố “mặt trên của con xúc xắc có 1 chấm. Do con xúc xắc cân đối và
đồng chất nên khả năng xuất hiện các mặt 1 B , B , 2 3 B , B , 4 B , 5 B là như nhau và 6
n(Ω) = 6 và số khả năng thuận lợi cho A là 1. Vậy xác suất cúa biến cố A là P(A) 1 = . 6
a) Đặt B là biến cố “mặt trên của con xúc xắc có số chấm là số chẵn”. Dễ thấy 3 1
B = {B ; B ;
và số khả năng thuận lợi cho . 1 2 3 B }
B là 3 . Vậy P(B) = = 6 2 Ví dụ 3.2.
Một lớp học gồm N sinh viên trong đó có M nam và N − M nữ. Chọn ngẫu nhiên
s sinh viên. Tìm xác suất để trong s sinh viên được chọn thì có đúng k sinh viên nam Giải 7 Bài giảng
Số cách chọn s sinh viên trong N sinh viên là s C . N
Số cách chọn được k sinh viên nam trong M sinh viên là k C . M
Số cách chọn được s sinh viên trong lớp trong đó có k sinh viên nam và s − k sinh viên nữ là k s−k C × C . M N − M k s−k V C × C
ậy, xác suất cần tìm là P(A) M N −M = . s CN
3.1.2. Định nghĩa hình học.
Giả sử tập hợp (vô hạn) các trường hợp đồng khả năng của một phép thử có thể biểu
thị bởi một miền Ω (chẳng hạn đoạn thẳng, mặt phẳng, không gian ba chiều v.v…)
còn tập hợp các kết quả thuận lợi cho cho biến cố A là một miền con S của Ω . Ta
lấy ngẫu nhiên một điểm trong miền Ω . Xác suất của biến cố A được xác định như sau:
P(A) = (độ đo của S )/(độ đo của Ω ).
Nếu miền Ω là đường cong hay đoạn thẳng thì “độ đo” của Ω là độ dài của nó.
Nếu miền Ω là hình phẳng hay mặt cong thì “độ đo” của Ω là diện tích của nó. Ví dụ 3.3.
Đường dây điện thoại ngầm nối một tổng đài đến một trạm dài 1 km . Tính xác suất
để dây đứt tại nơi cách tổng đài không quá 100 m biết rằng dây điện thoại đồng chất. Giải.
Do dây điện thoại là đồng chất nên khả năng nó bị đứt tại một điểm bất kì là như
nhau. Khi đó, tập hợp các trường hợp đồng khả năng có thể biểu thị bằng đoạn
thẳng nối tổng đài với trạm. Các trường hợp thuận lợi cho biến cố A “dây bị đứt tại
nơi cách tổng đài không quá 100 m ” là đoạn thẳng có độ dài 100 m . Khi đó P(A) 100 1 = = . 1000 10 Ví dụ 3.4.
Hai người bạn hẹn gặp nhau tại một địa điểm theo quy ước như sau:
Mỗi người độc lập đến điểm hẹn trong khoảng từ 7 giờ đến 8 giờ.
Mỗi người đến, nếu không gặp người kia thì đợi 30 phút hoặc đến 8 giờ không đợi nữa.
Tính xác suất hai người gặp nhau, nếu biết rằng mỗi người có thể đến chỗ hẹn trong
khoảng thời gian quy định một cách ngẫu nhiên và không tùy thuộc vào người kia đến lúc nào. Giải 8
Chương I. Các khái niệm cơ bản trong lí thuyết xác suất.
Gọi 7 + x , 7 + y là thời điểm hai người này đến điểm hẹn, 0 ≤ x, y ≤ 1. Các trường
hợp đồng khả năng tương ứng với các điểm (x; y) tạo thành hình vuông có cạnh
bằng 1, có diện tích (độ đo) bằng 1.
Các trường hợp thuận lợi cho biến cố A (hai người gặp nhau) tương ứng với các 1
điểm (x; y) thỏa mãn x − y ≤ . 2 Dựa vào hình vẽ, ta có 3 2   3 Di 1 3 ện tích hình là 1 4 −   =
. Từ đó, ta có P(A) = =  2  4 1 4 Ví dụ 3.5.
Tìm xác suất để điểm M rơi vào hình tròn nội tiếp hình vuông có cạnh 2 cm. Giải
Hình tròn nội tiếp hình vuông có cạnh 2a có đường kính 2a .
Vậy diện tích hình tròn đó là 2 2 R π = a π
và diện tích hình vuông là 2
S = 2a × 2a = 4a . 2 Khi πa π
đó, xác suất phải tìm là P(A) = = . 4 2 a 4
3.1.3. Định nghĩa thống kê.
Giả sử trong n phép thử với điều kiện như nhau, biến cố A xuất hiện k lần. Khi đó ta g k ọi f =
là tần suất xuất hiện biến cố A trong n phép thử. Khi n tăng lên n ( A) n
rất lớn, ta thấy rằng f
dao động quanh một số p cố định và tiến dần về số p n ( A)
đó. Ta gọi xác suất của biến cố A là P(A) = p = lim f . n ( A) n→+∞
3.2. Các định lí về xác suất.
3.2.1. Định lí cộng xác suất. Định lí 3.1. Nếu 1 A , 2 A , K ,
A là các biến cố đôi
một xung khắc thì n
P(A + A + L + A = P A + L + P A . 1 2 n ) ( 1) ( n ) Định lí 3.2.
Với các biến cố tùy ý A và B , ta có P(A + B) = P(A) + P(B)− P(AB) . Chứng minh
Do BA ⊂ A nên A + BA = A . Từ đó
A + B = A + B(A + A) = A + BA + B A = A + B A.
Do A và B A xung khắc nên P(A + B) = P(A)+ P(BA). Tương tự, ta có: 9 Bài giảng
B = BA + B A nên P(B) = P(BA) + P(B A) hay P(B A) = P(B) − P(AB).
Từ các điều kiện trên, ta suy ra: P(A + B) = P(A)+ P(B)− P(AB).
Áp dụng Định lí 3.2. và áp dụng nguyên lí quy nạp, ta có: Định lí 3.3. 1 P(A + A L +
+ A = ∑ P A − ∑ P A A + ∑ P A A A L −
+ −1 − P A A K A 1 2 n ) ( 1) ( i j ) ( i j k ) ( )n ( 1 2 n ) i 1 = i< j
i< j<k Ví dụ 3.6.
Trong số 50 sinh viên của lớp có 20 sinh viên giỏi Toán, 25 sinh viên giỏi Anh và
10 học sinh giỏi cả Toán và Anh. Chọn ngẫu nhiên một sinh viên của lớp. Tính xác
suất để sinh viên này giỏi Toán hoặc giỏi Anh. Giải
Gọi A và B lần lượt là biến cố sinh viên được chọn giỏi Toán và giỏi Anh.
Khi đó A + B là biến cố sinh viên được chọn giỏi Toán hoặc giỏi Anh. Áp dụng
Định lí 3.2., ta có:
P(A + B) = P(A) + P(B) − P(AB) 20 25 10 7 = + − = 50 50 50 10 Ví dụ 3.7.
Xếp ngẫu nhiên n bức thư vào n phong bì đã ghi sẵn địa chỉ (mỗi phong bì chì có 1
thư). Tìm xác suất để có ít nhất 1 thư đến đúng địa chỉ. Giải
Đặt A là biến cố “bức thư thứ i đến đúng người nhận”, i = ;
1 n . Gọi A là biến cố i
“ít nhất 1 lá thư đến đúng địa chỉ”. Khi đó, ta có: A = A + A + L + A . Theo 1 2 Định lí n 3.3. ta suy ra 1
P(A + A + L + A P A P A A L 1 P A A K A 1 2 n ) = ∑
( 1) − ∑ ( i j )+ + (− )n− ( 1 2 n ) i=1 i< j = (− )k−1 1
∑ P(A A LA i i i ) 1 2 k ≤
1 i <i < < L i ≤n 1 2 k n − k !
Dễ thấy P(A A L A = vì các bức thư
i , K , i đến đúng địa chỉ, còn i i i ) ( ) 1 2 1 i , 2 k ! n k
lại n − k khác có thể đến đúng người nhận hoặc không. − k n k ! 1 Ta có
∑ P(A A LA = = . i i i ) ( ) C 1 2 n k
1≤i <i < < L i ≤n ! n k! 1 2 k n 1 Vậy 1 P(A) = ∑ ( )k− −1 . 1 k! k = 10
Chương I. Các khái niệm cơ bản trong lí thuyết xác suất.
3.2.2. Xác suất có điều kiện. Định nghĩa.
Cho hai biến cố A và B . Ta gọi xác suất của biến cố A khi biến cố B đã xảy ra
( P(B) > 0 ) là xác suất của A đối với điều kiện B . Kí hiệu: P(A/ B). Ng P AB
ười ta chứng minh được công thức P(A / B) ( ) =
, trong đó P(B) > 0 . P(B) Chứng minh
Ta chứng minh cho trường hợp phép thử có n trường hợp cùng khả năng. Giả sử
trong n trường hợp này có m trường hợp thuận lợi cho B và k trường hợp thuận
lợi cho AB . Vì B đã xảy ra nên số trường hợp cùng khả năng lúc này là m , và số
trường hợp thuận lợi cho A trong đó chính là số trường hợp thuận lợi cho AB , tức k là P AB
k . Vì vậy P(A / B) n ( ) = = . m P(B) n Chú ý.
Định nghĩa trên mang tính chất thuần túy toán học. Tuy nhiên trong trong thực tế, ta
có thể tính xác suất bằng trực giác.
3.2.3. Định lí nhân xác suất. Tính độc lập của các biến cố. Định lí 3.4.
Nếu các biến cố tùy ý A và B cùng liên kết với một phép thử ( P(A), P(B) > 0 ), thì
ta có: P(AB) = P(A)P(B / A) = P(B)P(A / B) .
Áp dụng Định lí 3.4. và áp dụng nguyên lí quy nạp, ta có:
P(A A K A = P A .P A / A K P A / K 1 2 A A A n ) ( 1) ( 2 1) ( n 1 2 n 1 − )
Bây giờ ta đưa điều kiện để xác suất của tích bằng tích các xác suất.
Hai biến cố A và B được gọi là độc lập nếu xác suất của biến cố này không phụ
thuộc vào sự xảy ra hay không xảy ra của biến cố kia, tức là:
P(A / B) = P(A) hoặc P(B / A) = P(B).
Chú ý rằng chỉ cần thỏa mãn một trong hai điều kiện này thì sẽ thỏa mãn điều kiện kia. Các biến cố 1 A , 2
A , K , A gọi là độc lập toàn thể nếu xác suất của mỗi biến cố n
trong đó không phụ thuộc vào sự xảy ra hay không xảy ra của một tổ hợp bất kì của các biến cố khác. Định lí 3.5.
a) Nếu A và B độc lập thì P(AB) = P(A).P(B). b) Nếu các biến cố 1 A , 2 A , K , A độc lập toàn thể thì n
P(A A K A = P A .P A K P A . 1 2 n ) ( 1) ( 2 ) ( n ) 11 Bài giảng Tính chất
Nếu A và B là hai biến cố độc lập thì các cặp biến cố
a) A và B độc lập.
b) A và B độc lập.
c) A và B độc lập. Ví dụ 3.8.
Cho 3 hộp bi, mỗi hộp có 10 bi. Trong hộp thứ i có i bi đỏ và 10 − i bi xanh ( i = 3 ;
1 ). Lấy ngẫu nhiên mỗi hộp ra 1 bi.
a) Tính xác suất cả 3 bi lấy ra đều đỏ.
b) Tính xác suất trong 3 bi lấy ra có 2 đỏ và 1 xanh.
c) Biết trong 3 bi lấy ra có 2 đỏ và 1 xanh. Tính xác suất bi lấy ra từ hộp thứ 2 có màu xanh. Giải
Gọi A là biến cố “lấy ra từ hộp thứ i bi đỏ” (i = 3 ; 1 ). Dễ thấy i 1 A , 2 A , 3 A độc lập 1 2 3 toàn thể và P( , P( , P( . 1 A ) 1 A ) 1 A ) = = = 10 10 10
a) Biến cố “cả 3 bi lấy ra đều đỏ” là 1 A . 2 A 3 A 1 2 3 6 Ta có P( . 1 A 2 A 3 A ) = P( 1 A ).P( 2 A ).P( 3 A ) = . . = 10 10 10 1000
b) Biến cố “trong 3 bi lấy ra có 2 đỏ và 1 xanh” là B = . 1 A 2 A 3 A + 1 A 2 A 3 A + 1 A 2 A 3 A
Do B là tổng của các biến cố đôi một xung khắc nên
P(B) = P( 1 A 2 A 3 A )+ P( 1 A 2 A 3 A )+ P( 1 A 2 A 3 A ) = P( 1 A )P( 2 A )P( 3 A )+ P( 1 A )P( 2 A )P( 3 A ) + P( 1 A )P( 2 A )P( 3 A ) 1 2 7 1 8 3 9 2 3 92 = . . + . . + . . = . 10 10 10 10 10 10 10 10 10 1000 c) Ta có: 2 A B =
. Khi đó xác suất bi lấy ra từ 2 A ( 1 A 2 A 3 A + 1 A 2 A 3 A + 1 A 2 A 3 A ) = 1 A 2 A 3 A 24 P 2 A B P( 1 A 2 A 3 A ) 1000 6
hộp thứ 2 có màu xanh là P(A / . 2 B) ( ) = = = = P(B) P(B) 92 23 1000 Ví dụ 3.9.
Một lô hàng gồm 10 sản phẩm, trong đó có 3 phế phẩm. Lấy ngẫu nhiên từng sản
phẩm ra kiểm tra đến khi gặp đủ 3 phế phẩm thì dừng lại.
a) Tính xác suất dừng lại ở lần kiểm tra thứ 3 .
b) Tính xác suất dừng lại ở lần kiểm tra thứ 4 . 12
Chương I. Các khái niệm cơ bản trong lí thuyết xác suất.
c) Biết rằng đã dừng lại ở lần kiểm tra thứ 4 , tính xác suất ở lần kiểm tra thứ 2 gặp phế phẩm. Giải
Gọi A là biến cố “kiểm tra lần thứ i gặp phế phẩm” ( i = 1 ; 1 0 ). i
a) Biến cố “dừng lại ở lần kiểm tra thứ 3 ” là 1 A . Ta có 2 A 3 A P( 1 A 2 A 3 A ) = P( 1 A ).P(A / 2 1 A ).P(A / 3 1 A 2 A ) 3 2 1 1 = . . = 10 9 8 120
b) Ta có biến cố “dừng lại ở lần kiểm tra thứ 4 ” là F = . 1 A 2 A 3 A 4 A + 1 A 2 A 3 A 4 A + 1 A 2 A 3 A 4 A Ta có P( . 1 A 2 A 3 A 4 A ) = P( 1 A ).P(A / 2 1 A ).P(A / 3 1 A 2 A ).P(A / 4 1 A 2 A 3 A ) 7 3 2 1 1 = . . . = 10 9 8 7 120 1
Tương tự, ta có: P( . 1 A 2 A 3 A 4 A ) = P( 1 A 2 A 3 A 4 A ) = 120 1 1
Do F là tổng của các biến cố đôi một xung khắc nhau nên P(F ) = 3. = . 120 40
c) Ta cần tính P(A / F . Thật vậy, ta có 2 ) 1 P( 2 A F ) P( 1 A 2 A 3 A 4 A )+ P( 1 A 2 A 3 A 4 A ) 2. P(A / . 2 F ) 120 2 = = = = P(F ) P(F ) 1 3 3.120
3.3. Công thức xác suất đầy đủ. Công thức Bayes. Cho 1 A , 2
A , K , A là một nhóm đầy đủ các biến cố liên kết với một phép thử. F là n
biến cố bất kì liên kết với phép thử đó, hay F xảy ra khi một trong các biến cố 1 A , 2
A , K , A xảy ra. Khi đó, ta có Định lí sau đây n Định lí 3.6.
a) Với mọi biến cố F , ta luôn có P(F ) = P(A L . 1 ) P
. (F / A1)+ + P(A P . F / A n ) ( n )
Công thức này được gọi là công thức xác suất đầy đủ.
P(A .P F / A
P A .P F / A k ) ( k ) ( k ) ( k )
c) Với mỗi k ( k = ;
1 n ), ta có: P(A / F . k ) = = P(F ) ∑n P(A P . F / A i ) ( i ) i=1
Công thức này được gọi là công thức Bayes. Chứng minh
a) Ta có F = F Ω
. = F(A + A + L + A = FA + FA + L + FA . 1 2 n ) 1 2 n Do F 1 A , F 2
A , K , FA đôi một xung khắc nên n 13 Bài giảng
P(F ) = P(FA L 1 ) + P(FA2 ) + + P(FAn ) = P(A L 1 ) P
. (F / A1)+ + P(A P . F / A n ) ( n ) P(A F . / k
) P(Ak )P(F Ak )
b) Dễ thấy rằng: P(A / F = =
và ta suy ra điều phải chứng k ) P(F ) P(F ) minh. Ví dụ 3.10.
Có 20 kiện hàng, mỗi kiện hàng có 10 sản phẩm. Trong số đố có 8 kiện hàng loại
I , mỗi kiện hàng có 1 phế phẩm; 7 kiện loại II , mỗi kiện có 3 phế phẩm; 5 kiện
loại III , mỗi kiện có 5 phế phẩm. Lấy ngẫu nhiên một kiện, rồi từ kiện đó lấy ra
ngẫu nhiên một sản phẩm.
a) Tính xác suất sản phẩm lấy ra là phế phẩm.
b) Biết sản phẩm được lấy là phế phẩm. Tính xác suất kiện được lấy là loại II . Giải
Gọi A là biến cố “lấy được sản phẩm loại i ”, i = I, II, III . Khi đó, i 1 A , 2 A , 3 A là
nhóm đầy đủ các biến cố. Gọi F là biến cố “sản phẩm được lấy từ kiện là phế phẩm”.
a) Theo công thức xác suất đầy đủ, ta có
P(F ) = P( 1
A ).P(F / 1 A ) + P( 2
A ).P(F / 2 A ) + P( 3
A ).P(F / 3 A ) 8 1 7 3 5 5 = . + . + . = , 0 27 20 10 20 10 20 10
b) Theo công thức Bayes, ta có 21 P( 2 A F ) P( 2
A ).P(F / Ak ) P(A / . 2 F ) 200 7 = = = = P(F ) P(F ) 54 18 200 Ví dụ 3.11.
Có 5 bình đựng bi, trong đó có 2 bình loại 1: mỗi bình đựng 3 bi đen và 4 bi đỏ,
một bình loại 2: mỗi bình đựng 3 bi đen và 2 bi đỏ. Bình loại 3: mỗi bình đựng 4
bi đen và 3 bi đỏ. Chọn ngẫu nhiên một bình và từ bình đó, chọn ngẫu nhiên một bi.
a) Tính xác suất để bi lấy ra là bi đen.
b) Biết bi lấy ra là bi đen. Tính xác suất để bình lấy ra là bình loại 3. Giải
a) Gọi A là biến cố “bình chọn ra là bình loại i ”, F là biến cố “bi chọn ra là bi i đen”. Ta có 1 A , 2 A và 3
A là nhóm đầy đủ các biến cố. Khi đó 14
Chương I. Các khái niệm cơ bản trong lí thuyết xác suất.
P(F ) = P( 1
A )P(F / 1 A ) + P( 2
A )P(F / 2 A ) + P( 3
A )P(F / 3 A ) 2 3 1 3 2 4 = . + . + . = 5 , 0 2 5 7 5 5 5 7 2 4 P( 3
A ).P(F / 3 A ) . 5 7 16
b) Đây là xác suất có điều kiện P(A / . 3 F ) = = = P(F ) 5 , 0 2 35 3.4. Bài tập. 1.
Một lô hàng gồm có 150 sản phẩm có chứa 6% phế phẩm. Người ta dùng phương pháp
chọn mẫu để kiểm tra lô hang và quy ước rằng: Kiểm tra lần lượt 6 sản phẩm, nếu có ít
nhất 1 trong 6 sản phẩm đó là phế phẩm thì loại lô hàng. Tìm xác suất để chấp nhận lô hàng. 2.
Bắn liên tiếp vào một mục tiêu cho đến khi nào có 1 viên đạn đầu tiên trúng mục tiêu
thì ngừng bắn. Tìm xác suất sao cho phải bắn đến viên đạn thứ 6 biết rằng xác suất
trúng đích của mỗi viên đạn là ,
0 2 và các lần bắn là độc lập.
4. Dãy phép thử Bernoulli. Công thức Bernoulli.
4.1. Dãy phép thử Bernoulli.
Một dãy n phép thử gọi là một dãy n phép thử Bernoulli nếu thỏa mãn hai điều kiện sau đây:
- Dãy n phép thử đó là độc lập với nhau.
- Trong mỗi phép thử xác suất của biến cố A mà ta quan tâm có xác suất P(A) = p không đổi.
Xác suất p gọi là xác suất thành công, số lần A xuất hiện trong n phép thử gọi là
số lần thành công trong dãy n phép thử Bernoulli. Kí hiệu: P = ,
là xác suất để có k lần thành công. n (k ) Pn (k p) Định lí 4.1. P k, p C p q − = , k = ,
1 n , q = 1− p . n ( ) k k n k n Chứng minh
Kí hiệu A là biến cố “phép thử thứ i thành công”, i = ;
1 n . Gọi F là biến cố “có k i
lần thành công” thì F là tổng của k
C biến cố đôi một xung khắc có dạng n A A K A A
K A trong đó {i ;i ;K;i = ; 1 ; 2 K; . 1 2 n } { } n i i i 1 2 k ik i 1 + n
Do tính độc lập nên ta có:
P(A A K A A K A = P A P A KP A P A K P A p q − = i i i i i ) ( i ) ( i ) ( i ) ( i ) ( i ) k n k 1 2 k k +1 n 1 2 k k +1 n
Từ đó, ta suy ra: P k, p C p q − = (đpcm) n ( ) k k n k n Ví dụ 4.1.
Một lô hàng trong kho có 20% phế phẩm. 15 Bài giảng
a) Lấy ngẫu nhiên 5 sản phẩm. Tính xác suất trong 5 sản phẩm này. i) Có 2 phế phẩm.
ii) Có ít nhất 1 phế phẩm.
b) Cần lấy ít nhất bao nhiêu sản phẩm để xác suất có ít nhất một phế phẩm không nhỏ hơn 9 , 0 9 . Giải
a) Số phế phẩm trong 5 sản phẩm lấy ra là số lần thành công trong dãy 5 phép thử
Bernoulli với xác suất thành công là , 0 2 . i) Ta có . 5 P ( , 0 ; 2 2) 2 = C5 ( , 0 2)2 ( 8 , 0 )3 = . 0 2048 5 ii) Ta có P = ∑ . 5 P (k , 0 ; 2) = 1− 5 P ( 0 ; 0 .2) = 1 0 − C5 ( , 0 2)0 ( 8 , 0 )5 = , 0 67232 k 1 =
b) Gọi n là số sản phẩm cần lấy ra. Khi đó, xác suất có ít nhất một phế phẩm là n P = ∑ P k , 0 ; 2 = 1− P , 0 ; 0 2 = 1− 8 , 0 . n ( ) ( ) ( )n n k 1 = Ta c ln , 0 01
ần tìm n nhỏ nhất sao cho 1 − ( 8 , 0 )n ≥ 9 , 0 9 hay n ≥ = 20 6 , 4 . ln 8 , 0
Vậy, ít nhất phải lấy ra n = 21 sản phẩm.
4.2. Số có khả năng nhất.
Trong dãy n phép thử Bernoulli, số m có xác suất P(m) lớn nhất được gọi là số có khả năng nhất. Định lí 4.2.
Số có khả năng nhất bằng np − q nếu np − q nguyên; bằng [np − q] hoặc bằng
[np − q]+1 nếu np − q không nguyên. Chứng minh Ta có P k, p C p q − = , P k p C p q . n ( + , 1 ) k 1 + k 1 + n−k 1 − = n ( ) k k n k n n P + , 1 1 + 1 + − 1 − − n (k p) C k p k q n k n (n k) Khi p đó = = . P , − + 1 n (k p) C k p k q n k (k )q n Ta xét nhận xét sau:
(n − k)p ≥1 hay (n − k)p ≥ (k + )1q hay k ≤ np − q . (k + ) 1 q (n − k) và
p < 1 hay (n − k)p < (k + )1q hay k > np − q . (k + ) 1 q Khi đó, ta suy ra: Xác suất P ,
tăng khi k tăng từ 0 đến np − q và nó giàm khi k tiếp tục tăng từ n (k p)
np − q đến n . Vì k nhận giá trị nguyên nên ta có kết luận sau: 16
Chương I. Các khái niệm cơ bản trong lí thuyết xác suất.
- Nếu np − q nguyên thì xác suất P ,
đạt giá trị lớn nhất tại hai giá trị của k là n (k p)
k = np − q và k = np − q 1 (chú ý rằng P , = , ). n (k p 0 ) Pn (k p 1 ) 0 1 +
- Nếu np − q không nguyên thì xác suất P ,
đạt giá trị lớn nhất tại một giá trị n (k p)
của k là k = [np − q] 1, trong đó [np − q] là kí hiệu phần nguyên của . 0 + np − q Ví dụ 4.2.
Giả sử tỉ lệ người dân tham gia giao thông ở thành phố M có hiểu biết về luật giao
thông là 80% . Giả sử, ta chọn ngẫu nhiên 20 người tham gia giao thông trên
đường. Hãy tính xác suất trong các trường hợp sau:
a) Có 15 người hiểu biết luật giao thông.
b) Có 9 người không hiểu biết về luật giao thông.
c) Số người không hiểu biết về luật giao thông có khả năng nhất. Giải
Việc chọn ngẫu nhiên 20 người là dãy phép thử Bernoulli, với H là biến cố “người
được chọn hiểu biết luật giao thông” và p(H ) = 80% = 8 , 0
a) Gọi A là biến cố “có 15 người hiểu biết luật giao thông”. Khi đó, ta có:
P(A) = P 15 8 , 0 ; = C 8 , 0 . , 0 2 . 20 ( ) 15 20 ( )15 ( )5
b) Gọi B là biến cố “có 9 người không hiểu biết luật giao thông”. Khi đó, ta có:
P(B) = P 20 − 8 , 0 ; 9 = P , 0 ; 9 2 = C 8 , 0 . , 0 2 . 20 ( ) 20 ( ) 11 20 ( )11 ( )9
c) Áp dụng Định lí 3.8, ta có:
np − q = 20. p(H )− (1 − p(H ) = 20. , 0 2 − (1− , 0 2) = , 3 2 không nguyên
Vậy, số người được chọn không hiểu biết luật giao thông là k .
0 = [np − q] + 1 = 4 17 5. Bài tập chương. 1.
Có n sinh viên. Gọi A là biến cố sinh viên thứ k là nam. Hãy viết bằng kí hiệu các k biến cố sau:
a) Tất cả sinh viên là nam.
b) Có ít nhất 1 một sinh viên nữ.
c) Có đúng 1 một sinh viên nữ.
d) Có đúng 2 sinh viên là nữ. 2.
Chọn ngẫu nhiên 1 công nhân trong số các công nhân có mặt ở xí nghiệp. Gọi A là biến
cố xảy ra khi người công nhân được chọn là nam và B là biến cố người công nhân được
chọn ở khu tập thể; C là biến cố người công nhân được không hút thuốc là.
a) Hãy mô tả biến cố ABC .
b) Với điều kiện nào ta có A C B = A .
c) Khi nào thì ta có C = A . 3. Chứng minh rằng: a) r n−r C = C , n n b) r r −1 r C = C + C , n+1 n n n c) r k r −k C = ∑ C C , n n−m m k =0 n d) 2 ∑ ( k C C , 2 = n ) n 2n k =0 n e) 2 n n C C ≤ k C . 2n+k 2n−k ∑( 2n ) k =0 4.
Cho các chữ số 0 , 1, 2 , 3 , 4 , 5 . Hỏi từ các chữ số này:
a) Lập được bao nhiêu số có 4 chữ số khác nhau trong đó nhất thiết phải có mặt chữ số 5 .
b) Lập được bao nhiêu số có 7 chữ số trong đó chữ số 5 có mặt đúng 3 lần còn các chữ
số khác có mặt không quá 1 lần? 5.
Các số 1, 2 , K, n lập thành một hang ngang. Hỏi có mấy cách sắp xếp sao cho:
a) Hai chữ số 1 và 2 đứng cạnh nhau.
b) Ba chữ số 1, 2 và 3 đứng cạnh nhau. 6.
Rút 2 lá bài từ bộ bài có 52 lá. Gọi A là biến cố “được 2 lá cơ”, B là biến cố “được
2 lá 10 ” và C là biến cố “được 2 lá đỏ”.
a) Các cặp biến cố sau, cặp nào xung khắc: A và B , A và C , B và C .
b) Tính các xác suất: P(A + B) , P(B + C) và P(A + C).
c) Tính các xác suất: P(AB), P(BC) và P(AC). 7.
Một bàn dài gồm 2 dãy ghế đối diện nhau, mỗi dãy gồm 6 ghế. Người ta muốn sắp xếp
6 chỗ ngồi cho 6 sinh viên lớp A và 6 sinh viên lớp B vào bàn nói trên. Hỏi có bao
nhiêu cách sắp xếp trong mỗi trường hợp sau:
a) Bất cứ hai sinh viên nào ngồi cạnh nhau hoặc đối diện nhau thì khác lớp với nhau.
b) Bất cứ hai sinh viên nào ngồi đối diện nhau thì khác lớp với nhau. 8.
Có bao nhiêu cách sắp xếp 10 người ngồi thành ngang sao cho 2 hai người A , B ngồi
cạnh nhau và 2 người C , D không ngồi cạnh nhau. 9.
Có bao nhiêu người tham gia vào cuộc đấu cờ, nếu biết rằng cuộc đấu đó có tất cả 10
ván cờ và mỗi đấu thủ phải đấu mới mỗi đấu thủ khác một ván?
10. Gieo đồng thời 2 con xúc sắc. Tìm xác suất để:
a) Tổng số chấm xuất hiện trên 2 con xúc sắc là 7 .
b) Tổng số chấm xuất hiện trên 2 con xúc sắc là 8 . Bài giảng
c) Tổng số chấm xuất hiện trên 2 con xúc sắc hơn kém nhau 2 .
11. Bỏ ngẫu nhiên 5 lá thư vào 5 phong bì đã đề địa chỉ trước (mỗi phong bì chỉ chứa
đúng một lá thư). Tìm xác suất để:
a) Cả 5 lá thư đều đúng người nhận.
b) Lá thư thứ nhất đúng người nhận.
c) Lá thư thứ nhất và lá thư thứ hai đúng người nhận.
12. Xếp ngẫu nhiên 5 người lên 7 toa tàu được đánh số (mỗi toa tàu có thể chứa nhiều
người). Tìm xác suất các biến cố sau:
a) 5 người cùng lên một toa.
b) 5 người lên 5 toa đầu.
c) 5 người lên 5 toa khác nhau.
d) Hai người A và B cùng lên toa đầu.
e) Hai người A và B cùng lên một toa.
f) Hai người A và B cùng lên một toa, ngoài ra không có ai khác lên toa này.
13. Ba khẩu súng độc lập cùng bắn vào một mục tiêu. Xác suất để khẩu thứ nhất bắn trúng là ,
0 7 , đề khẩu thứ hai bắn trúng là 8 ,
0 , để khẩu thứ ba bắn trúng là 5 , 0 . Mỗi khẩu bắn
một viên. Tính xác suất để: a) Có 1 khẩu bắn trúng. b) Có 2 khẩu bắn trúng.
c) Cả 3 khẩu bắn trật.
d) Ít nhất 1 khẩu bắn trúng.
e) Khẩu thứ nhất bắn trúng biết rằng đã có 2 hai khẩu bắn trúng.
14. Một hộp đựng 15 quả bóng bàn trong đó có 9 quả còn mới. Lần đầu người ta lấy ngẫu
nhiên 3 quả để thi đấu, sau đó lại trả vào hộp. Lần 2 lấy ngẫu nhiên 3 quả. Tìm xác
suất để 3 quả lấy ra lần sau đều mới.
15. Có hai hộp A và B . Hộp A đựng 8 bi trắng và 2 bi đen. Hộp B đựng 9 bi trắng và 1
bi đen. Lấy ngẫu nhiên 2 bi từ hộp A bỏ sang hộp B rồi sau đó rút ngẫu nhiên 3 bi từ
hộp B . Tìm xác suất để trong 3 bi lấy từ hộp B có 2 bi trắng.
16. Một hộp chứa 5 tờ vé số, trong đó có đúng 1 tờ vé số trúng thưởng. 5 bạn Trường, Đại,
Học, Duy, Tân lần lượt rút ngẫu nhiên mỗi người 1 tờ vé số. Hỏi rút trước hay rút sau
có lợi hơn (xác suất được tờ vé số trúng thưởng cao hơn)? Hãy tổng quát bài toán này
cho n ( n ≥ 1) tờ vé số mà chỉ có đúng 1 tờ trúng thưởng.
17. Trong một lô hàng gồm có 100 sản phẩm, trong đó có 30 sản phẩm loại tốt, lấy ngẫu
nhiên lần lượt 4 sản phẩm không trả lại. Tìm xác suất để:
a) lần thứ 2 lấy được sản phẩm loại tốt.
b) lần thứ 3 lấy được sản phẩm loại tốt.
c) 2 lần đầu lấy được sản phẩm loại tốt.
18. Một số điện thoại có 7 số. Người gọi quên chữ số cuối cùng nhưng anh ta biết rằng số
đó khác 0 , và anh ta quay số đó một cách ngẫu nhiên. Tìm xác suất để anh ta thực hiện
được cuộc liên lạc mà không phải quay quá 3 lần.
19. Trong giờ bài tập, giáo viên cho một bài toán. Lớp có 30 sinh viên nhưng chỉ có 6 bạn
giải được bài toán này. Giáo viên gọi ngẫu nhiên một sinh viên cho đến khi có một sinh
viên giải được bài toán này. Tính xác suất giáo viên gọi đến sinh viên thứ 4 .
20. Một người bắn lần lượt 2 viên đạn vào một tấm bia. Xác suất trúng bia của viên đạn thứ nhất là 8 ,
0 và của viên đạn thứ hai là , 0 6 .
a) Tìm xác suất để có đúng 1 viên đạn trúng đích.
b) Biết rằng có 1 viên trúng đích. Tìm xác suất để đó là viên đạn thứ hai.
21. Một cửa hàng bán một loại sản phầm trong đó có 40% là do xưởng A sản xuất, còn lại
do xưởng B sản xuất. Tỉ lệ sản phẩm loại I do xưởng A sản xuất là 8 , 0 và của xưởng B sản xuất là 9 , 0 . 20
Chương I. Các khái niệm cơ bản trong lí thuyết xác suất.
a) Mua ngẫu nhiên một sản phẩm. Tìm xác suất để mua được sản phẩm loại I .
b) Mua một sản phẩm từ cửa hàng và thấy đó không phải là sản phẩm loại I . Hỏi sản
phẩm đó có khả năng do xưởng nào sản xuất nhiều hơn.
22. Bắn 3 viên đạn độc lập vào một mục tiêu. Xác suất trúng đích của mỗi viên tương ứng là 3 , 0 ; , 0 4 ; 5 ,
0 . Nếu chỉ 1 trúng thì mục tiểu bị phá hủy vơi xác suất là , 0 2 . Nếu ít
nhất 2 viên trúng thì mục tiêu chắc chắn bị phá hủy. Hãy tìm xác suất để mục tiêu bị
phá hủy khi bắn 3 viên trên.
Đáp số và hướng dẫn. 1. a) A A K A , b) K , 1 2 A + A + + A n 1 2 n
c) A A K A + A A K A K + + A A K A , 1 2 n 1 2 n 1 2 n
d) A A K A + A A A K A + K + A A K A A A 1 2 n 1 2 3 n 1 2 n−2 n 1 − n 2. a) A C
B là biến cố “người công nhân được chọn là nam và ở trong khu tập thể không hút thuốc”.
b) Khi A ⊂ B , A ⊂ C thì A C B = A . 3. Dùng các công thức: ! n n 2 C k =
, (a + b)n ∑ k n− = k k C a
b và (1 + x)n (1 + x)n = (1 + x) n . n
k!(n − k )! n k =0 4. a) 204 , b) 3720 . 5. a) ( 2 n − ) 1 !, b) (n − 2)!. 2 2 2 6. C + C C
a) AB = ∅ , BC ≠ ∅ , AC ≠ ∅ , b) P(A + B) 13 4 =
, P(A + C) 26 = , 2 C 2 52 C52 2 2 C + C − 1
P(B + C ) = P(B) + P(C ) − P(BC ) 4 26 = , 2 C52 2 C 1
c) P(AB) = 0 , P(AC) 13 = , P(BC) = . 2 C 2 52 C52 7. a) ( )2 2. 6! , b) ( )2 6 2 . 6! . 8. 2 2.8!− 2 .6!. 9. 2
C = 10 ⇒ n = 5 . n 1 5 2 10. a) , b) , c) . 6 36 9 1 1 1.4! 1 1.1.3! 1 11. a) = , b) = , c) = . 5! 120 5! 5 5! 20 7 1 5! 5 3 7 1 74 1 3 3 7 6 . 6 12. A a) = , b) , c) 7 , d) = , e) = , f) = 5 4 7 7 5 7 5 7 5 2 7 7 75 7 5 4 7 7 35 13. a) , 0 22 , b) , 0 47 , c) , 0 03 , d) 9 , 0 7 , e) . 47
14. Gọi A là biến cố “cả 3 quả bóng lấy được lần sau đều mới”. Gọi B là biến cố “trong i 3
3 ” quả lấy ra thi đấu có i quả mới”, i = 3 ;
0 . Khi đó P(A) = ∑ P(B P A B hay i ) ( / i ) i=0 3 3 1 2 3 2 1 3 3 3 C C C .C C C . P(A) 6 9 9 6 8 9 C6 C7 C9 C6 = . + . + . + . 3 3 3 3 3 3 3 3 1 C 5 1 C 5 1 C 5 1 C 5 1 C 5 1 C 5 1 C 5 1 C 5 21 Bài giảng
15. Tương tự bài 14, ta được 2 2 1 1 1 2 1 2 2 1 C C .C C .C C .C C C . P(A) 2 9 3 8 2 10 2 8 11 1 C = . + . + . 2 3 2 3 2 3 1 C 0 1 C 2 1 C 0 1 C 2 1 C 0 1 C 2
16. Các xác suất trúng thưởng của 5 bạn Trường, Đại, Học, Duy, Tân là như nhau và đều 1 bằng . 5
17. Gọi A là biến cố “lần thứ i lấy được sản phẩm loại tốt”, i = 1 ; 1 00 . Khi đó i a) Chú ý rằng: P A
= P A .P A / A + P A .P A / . 2 A = nên ( 2 ) ( 1) ( 2 1) ( 1) ( 2 1A) 1 A 2 A + 1 A 2 A
b) A = A A A + A A A + A A A + A . . 1 2 3 1 2 3 1 2 3 1 2 A 3 A 2 A 29 c) Dễ thấy: P( . 1 A A ) 30 2 = = 2 A 330 100
18. Gọi A là biến cố “gọi đúng được số cuối cùng” và A là biến cố “gọi đúng được số i
cuối cùng ở lần thứ i ”, i = 3 ;
1 . Khi đó A = A + A .A + A .A . và chú ý rằng: 1 1 2 1 2 3 A
P(A) = P( 1 A ) + P( 1 A )P(A / 2 1 A ) + P A P A A − P A A A 2 ( 1) ( / 2 1 ) ( / . 3 1 2 ) 1 8 1 8 7 1 1 = + . + . . = 9 9 8 9 8 7 3
19. Gọi A là biến cố “sinh viên được gọi lần thứ i giải được bài toán”, i = 3 ; 1 0 . i Ta có:
P(A) = P( 1 A 2 A 3 A 4 A ) = P( 1 A )P(A / 2 1 A )P(A / 3 1 A 2 A )P(A / 4 1 A 2 A 3 A ) 24 23 22 6 = . . . 30 29 28 27
20. Gọi A là biến cố “có đúng 1 viên trúng đích”. A là biến cố “viên đạn thứ i trúng i đích”, i = 2 ; 1 . a) A =
. Từ đó suy ra P(A) = , 0 44 . 1 A 2 A + 1 A 2 A
P A A .P A / A A 1 , 0 2 b) P(A A / 1 2 A) ( 1 2 ) ( 1 2 ) = = P(A) , 0 44
21. Gọi M là biến cố “Sản phẩm mua được loại I ”. N , Q lần lượt là biến cố “Sản phẩm
mua được do xưởng A sản xuất”, “Sản phẩm mua được do xưởng B sản xuất”.
a) Ta có: P(M ) = P(N ).P(M / N ) + P(Q).P(M / Q) = 40%. 8 , 0 + 60%. 9 , 0 . 8 6
b) Ta có: P(M / N ) =
và P(M / Q) = . 14 14
22. Gọi A là biến cố “mục tiêu bị phá hủy”. B là biến cố “có i viên đạn bắn trúng mục i tiêu”, i = 3 ;
1 . C là biến cố “viên đạn thứ j bắn trúng mục tiêu”, j = 3 ; 1 . j 3
Ta có: P(A) = ∑ P(B P A B , i ) ( / i ) = , 0 438 i 1 = trong đó P(A / , P(A / B 2 ) = P(A / 3 B ) = 1 1 B ) = , 0 2
và P(B = P C .P C .P C + P C .P C .P C + P C .P C . . Tương tự, ta 1 )
( 1) ( 2 ) ( 3) ( 1) ( 2) ( 3) ( 1) ( 2 )P(C3)
tính được P(B , P( . 3 B ) 2 )
C. Phương pháp giảng dạy.
- Vấn đáp và làm bài tập. 22
Chương I. Các khái niệm cơ bản trong lí thuyết xác suất.
- Đưa ra các ví dụ thường gặp trong thực tiễn để tạo động cơ và hướng đích tạo nên hứng thú học tập cho sinh viên.
- Kiểm tra, đánh giá việc làm bài tập của SV.
- Gợi mở từ trực quan sinh động đến tư duy trừu tượng giải quyết vấn đề.
- Phối hợp phương pháp thuyết trình và vấn đáp giải quyết vấn đề và làm bài tập.
- Yêu cầu SV đọc bài giảng trước khi lên lớp.
- Kiểm tra, đánh giá việc làm bài tập của SV.
- Sử dụng phương tiện dạy học hiện đại như Mic, Projector.
D. Tài liệu tham khảo
[1] Đậu Thế Cấp, Xác suất thống kê: Lí thuyết và các bài tập (Chương 1), NXB Giáo dục, 2006.
[2] Đinh Văn Gắng, Bài tập xác suất và thống kê (Chương 1), NXB Giáo dục, 2007.
[3] PGS. TS. Phạm Xuân Kiều, Giáo Trình xác suất và thống kê (Chương 1), NXB Giáo dục, 2005.
[4] Đặng Công Hanh, Đặng Ngọc Dục, Giáo trình Lý thuyết xác suất và Thống kê toán (Chương 1), trường Đại học Duy Tân, 1996. 23 Chương II.
Đại lượng ngẫu nhiên. Hàm phân phối xác suất. A. Mục tiêu.
- Giới thiệu biến ngẫu nhiên và hàm phân phối xác suất.: biến ngẫu nhiên rời rạc cùng
với bảng phân phối xác suất của nó, biến ngẫu nhiên liên tục cùng với hàm mật độ của nó.
- Nắm các đặc trưng của biến ngẫu nhiên: kì vọng, phương sai, Mod, Med,… và hiểu được ý nghĩa của chúng. B. Nội dung.
1. Khái niệm. Phân loại đại lượng ngẫu nhiên. Định nghĩa.
Cho một phép thử và Ω là không gian các biến cố sơ cấp của nó. Một ánh xạ từ Ω 
 → R hay một quy tắc cho tương ứng mỗi kết quả của phép thử với mỗi một số
thực nào đó được gọi là một đại lượng ngẫu nhiên (biến ngẫu nhiên) liên kết với phép thử nào đó.
Ta thường kí hiệu đại lượng ngẫu nhiên bằng chữ in hoa X , Y , Z , K Giá trị của nó
được kí hiệu bằng chữ in thường x , y , z , K Ví dụ 1.1.
a) X là số con gái trong một lần sinh (1 con). X là đại lượng ngẫu nhiên. Giá trị của
nó có thể nhận là 0 , 1.
b) X là số viên đạn trúng đích khi bắn liên tiếp n viên đạn độc lập vào một mục tiêu.
Giá trị của nó có thể nhận là 0 , 1, K, n .
c) X là số sản phẩm tốt trong 10 sản phẩm được chọn ngẫu nhiên từ lô sản phẩm có
100 sản phẩm tốt và 50 phế phẩm. X cũng là đại lượng ngẫu nhiên. Giá trị của nó có
thể nhận là 0 , 1, K, 10.
d) X là số lần tung một đồng tiền cho đến khi được mặt ngửa thì dừng. Khi đó X là
đại lượng ngẫu nhiên và giá trị của nó có thể nhận là 1, 2 , K, n , K
e) X là độ cao của một cây tại thời gian t nào đó. X là đại lượng ngẫu nhiên. Bài giảng
Trong ví dụ này, xét a): X là số con gái trong 1 lần sinh con. Ta thấy X thỏa mãn
định nghĩa đại lượng ngẫu nhiên ở trên. Thật vậy, ta có không gian đại lượng cố sơ cấp
là Ω = {T;G}, và X có thể nhận 2 giá trị 0 hoặc 1.
Với mỗi x ∈ R , ta sẽ chứng minh tập hợp {X < }
x là biến cố ngẫu nhiên. ∅, x ≤ 0 
Dễ dàng ta có: {X < } x = {
 G}, 0 < x ≤ 1. Ba tập ∅ , {G} và Ω đều là biến cố ngẫu  Ω, x > 1 nhiên. Vậy {X < }
x là biến cố ngẫu nhiên.
Ta quan tâm nghiên cứu đến hai loại đại lượng: đại lượng ngẫu nhiên rời rạc và đại
lượng ngẫu nhiên liên tục.
1.1. Đại lượng ngẫu nhiên rời rạc. Định nghĩa:
Đại lượng ngẫu nhiên rời rạc là đại lượng ngẫu nhiên mà các giá trị có thể nhận của nó
là tập hợp hữu hạn hoặc vô hạn đếm được. Trong Ví dụ 1.1. Các ví dụ a), b), c), d) đều
là đại lượng ngẫu nhiên rời rạc.
1.2. Đại lượng ngẫu nhiên liên tục. Định nghĩa.
Đại lượng ngẫu nhiên liên tục là đại lượng ngẫu nhiên mà các giá trị có thể nhận của
nó là lấp đầy khoảng (a;b) (hoặc đoạn [a;b]) nào đó, a có thể bằng − ∞ , b có thể bằng + ∞ .
1.3. Hàm phân phối của đại lượng ngẫu nhiên.
Ta nhận thấy tập hợp {X < }
x , x ∈ R thay đổi nếu x thay đổi. Do đó P { ( X < } x ) cũng
thay đổi, tức là xác suất này phụ thuộc vào x . Nó là hàm của x . Định nghĩa.
Cho X là đại lượng ngẫu nhiên. Ánh xạ F : R   [ → ] 1 ; 0 xác định bởi F : R   [ → ] 1 ; 0 x 
 → F (x) = P(X < x)
được gọi là hàm phân phối xác suất của đại lượng ngẫu nhiên X . Ví dụ 1.2.
Tìm hàm phân phối của đại lượng ngẫu nhiên X chỉ số lần xuất hiện mặt sấp khi gieo
một đồng tiền cân đối và đồng chất. Giải
Không gian biến cố sơ cấp tương ứng với phép thử “gieo đồng tiền” là Ω = {S; N}. Vì
X có thể nhận 2 giá trị 0 hoặc 1. 26
Chương II. Đại lượng ngẫu nhiên. Hàm phân phối xác suất ∅, x ≤ 0  Vì vậy: {X < } x = {
 S}, 0 < x ≤ 1 .  Ω, x > 1
Khi đó, hàm phân phối của đại lượng ngẫu nhiên X là:  , 0 x ≤ 0 P(∅), x ≤ 0   1
F (x) = P(X < x) = P {
( S}), 0 < x ≤ 1 hay F(x) =  , 0 < x ≤ 1  2 P(Ω), x > 1  ,1 x > 1
Các tính chất của hàm phân phối
a) Hàm phân phối F(x) là hàm không giảm.
b) P(a ≤ X < b) = F(b)− F(a).
c) P(X = a) = lim F(b)− F(a). b a+ →
d) F(− ∞) = 0 và F(+ ∞) = 1. Nhận xét.
Từ a) và d), ta có 0 ≤ F(x) ≤ 1. Tính chất a) và d) được gọi là tính chất đặc trưng của
hàm phân phối xác suất. Một hàm F(x) xác định trên R có tính chất a) và d) đều là
phân phối xác suất của một đại lượng ngẫu nhiên nào đó Ví dụ 1.3. 1 1
Cho hàm số F(x) = arctan x + . π 2
Chứng minh rằng F(x) là hàm phân phối xác suất của đại lượng ngẫu nhiên. Giải. 1 1 Do F'(x) = .
> 0 nên F (x) tăng. π 1 2 + x  1 1  1  π  1
Mặt khác lim F(x) = lim  arctan x +  = −  + = 0 x→−∞ x→−∞ π 2  π  2  2  1 1  1  π  1
và lim F(x) = lim  arctan x +  =   + = 1 x→+∞ x→+∞ π 2  π  2  2
nên F(x) là hàm phân phối xác suất của đại lượng ngẫu nhiên (đpcm).
2. Đại lượng ngẫu nhiên rời rạc
2.1. Bảng phân phối xác suất.
Giả sử X là đại lượng ngẫu nhiên rời rạc. Nó nhận các giá trị 1 x , x , K , 2 x , K có thể n
với các xác suất tương ứng là P(X = x p . i ) = ≥ 0 i Ta lập bảng sau đây 27 Bài giảng X 1 x x … 2 x n P(X = x p … p i ) 1 p 2 n n
Với ∑ p = 1. Bảng này có thể vô hạn khi n nhận giá trị + ∞ . i i 1 =
Bảng trên được gọi là bảng phân phối xác suất của đại lượng ngẫu nhiên X .
2.2. Hàm phân phối xác suất.
Nếu ta sắp xếp các giá trị 1 x , x , K , 2
x , K theo thứ tự tăng dần, ví dụ n L L x < x < < x < thì hàm phân phối của 1 2
X có thể viết dưới dạng: n  , 0 x ≤ x1   p ,
x < x ≤ x 1 1 2  p + p ,
x < x ≤ x 1 2 2 3 F (x) =   K K K
 p + p +L+ p , x < x ≤ x  1 2 n−1 n−1 n  ,1 x > xn
Nếu các giá trị ở vị trí bất kì thì ta có thể viết hàm phân phối dưới dạng: F(x) = ∑ p , i x < x i x ∈ R . Ví dụ 2.1.
Trong một lô hàng gồm có 4 sản phẩm tốt và 6 sản phẩm xấu. Lấy ngẫu nhiên 4 sản
phẩm. Gọi X số sản phẩm xấu lấy được.
Lập bảng phân phối xác suất của X . Viết hàm phân phối của X và tính xác suất P(0 ≤ X < ) 3 . Giải
Lấy ngẫu nhiên 4 sản phẩm thì với X là số sản phẩm tốt lấy được, ta có X có thể
nhận các giá trị là 0 , 1, 2 , 3 , 4 . 0 C . 4 C 1 1 C . 3 C 4 Ta có: P(X = 0) 6 4 = = , P(X = ) 1 6 4 = = , 4 C 210 4 C 35 10 10 2 C . 2 3 C . 1 C 8 4 C . 0 C 1 P( C X = 2) 3 6 4 = = , P(X = 3) 6 4 = = , P(X = 4) 6 4 = = . 4 C 7 4 C 21 4 C 14 10 10 10
Từ đó, ta có bảng phân phối xác suất như sau: X 0 1 2 3 4 P 1 4 3 8 1 210 35 7 21 14
Từ đó, ta có hàm phân phối xác suất là 28
Chương II. Đại lượng ngẫu nhiên. Hàm phân phối xác suất  , 0 x ≤ 0   1 , 0 < x ≤ 1 210  5  , 1 < x ≤ 2  F (x) 42 =  23 , 2 < x ≤ 3 42  13 , 3 < x ≤ 4 14  ,1 x > 4 23 23
Khi đó, ta có P(0 ≤ X < 3) = F(3)− F(0) = − 0 =
hoặc ta có thể tính như sau 42 42
P(0 ≤ X < 3) = P(X = 0) + P(X = ) 1 + P(X = ) 23 2 = 42 Ví dụ 2.2.
Bắn liên tiếp 3 viên đạn độc lập vào một mục tiêu. Xác suất trúng đích của mỗi viên đạn là 5 ,
0 . Gọi X là số viên đạn trúng đích trong 3 viên. Tìm hàm phân phối xác suất
của X . Viết hàm phân phối của X . Tính xác suất P(X ≥ ) 1 . Giải
Ta xem việc bắn 3 viên đạn độc lập vào một mục tiêu là tiến hành dãy 3 phép thử 1
Bernoulli. Xác suất bắn trúng đích của mỗi viên đạn là p = . 2 k 3−k Theo công th  1   1 
ức xác suất, ta có: P(X = k ) k
= C   1 −  , k = 3 ; 0 hay 3  2   2  3 P(X = k )  k 1 
= C   , k = 3 ;
0 , là phân phối xác suất của 3
X . Ta có thể viết dưới dạng  2  bảng sau: X 0 1 2 3 P 1 3 3 1 8 8 8 8
Hàm phân phối của X là 29 Bài giảng  , 0 x ≤ 0  1 , 0 < x ≤ 1 8  F (x) 5 =  , 1 < x ≤ 2 8 7  , 2 < x ≤ 3 8  ,1 x > 3 1 7
Xác suất P(X ≥ )
1 = 1− P(X < )
1 = 1− P(0) = 1− = . 8 8 Ví dụ 2.3.
Trong một lô hàng gồm có 10 máy vi tính mới thì có 3 chiếc bị lỗi, lấy ngẫu nhiên 4
máy trong 10 máy tính này. Gọi X là số máy tính bị lỗi trong 4 máy lấy ra. Hãy:
a) Lập bảng phân phối xác suất của X .
b) Khi lấy 4 máy thì có mấy máy bị lỗi là có khả năng xảy ra cao nhất.
c) Tìm xác suất khi lấy ra 4 máy sẽ có ít nhất một máy bị lỗi.
d) Nếu người nào đó lấy ngẫu nhiên ra 3 máy tính để kiểm tra thấy không có máy nào
bị lỗi thì sẽ chấp nhận cả lô hàng. Tìm xác suất người mua chấp nhận lô hàng và xác
suất người mua bác bỏ lô hàng. Giải. a) Ta có X ∈{ } 3 ; 2 ; 1 ; 0 0 4 C . 1 3 C .C 2 2 C .C 3 1 C .C P( C X = 0) 3 7 = , P(X = ) 3 7 1 = , P(X = 2) 3 7 = , P(X = 3) 3 7 = 4 4 4 4 1 C 0 1 C 0 1 C 0 1 C 0
Từ đó ta có bảng phân phối X 0 1 2 3 P(X = x 0 4 C .C 1 3 C .C 2 2 C . 3 1 C .C i ) 3 7 3 7 3 C7 3 7 4 4 4 4 1 C 0 1 C 0 1 C 0 1 C 0 1 C . 3 b) D C
ựa vào bảng xác suất, ta có P(X = ) 1 3 7 = = 5 ,
0 là cao nhất nên trong 4 máy 4 1 C 0
tính lấy ra thì bị 1 máy tính bị lỗi là có khả năng cao nhất. 0 C . 4 c) P( C X ≥ ) 1 = 1− P(0) = 1 3 7 − = 1 − 1 , 0 67 = 8 , 0 33. 4 1 C 0 3 C . 1 d) 3 C7 p = = ,
0 2917 là xác suất để người mua chấp nhận lô hàng. Xác suất để người 4 1 C 0
mua bác bỏ lô hàng là 1− p = 1− , 0 2917 = , 0 7083. 30
Chương II. Đại lượng ngẫu nhiên. Hàm phân phối xác suất
2.3. Phép toán đại lượng ngẫu nhiên.
Cho X và Y là các đại lượng ngẫu nhiên có bảng phân phối xác suất X 1 x x … 2 x n P(X = x p … p i ) 1 p 2 n và Y 1 y y … 2 y n P(Y = y q … q i ) 1 q 2 n
Kí hiệu: p = P X = x ;Y = y để cho ĐLNN X nhận giá trị x và ĐLNN Y nhận giá ij ( i j ) i trị y . Giả sử
z , K , z là các giá trị khác nhau của tổng x + y , đặt j 1 z , 2 S i j + p = p . k ∑ ij x + y = i j zk
Ta gọi tổng của X và Y là đại lượng ngẫu nhiên X + Y có bảng phân phối xác suất là X + Y 1 z z … 2 z n
P(X + Y = z + p … + p i ) 1 p + 2 n Tương tự, giả sử , đặt ∗ p = p . k ∑ 1 z , z , K , 2
z là các giá trị khác nhau của tích x .y T i j ij x y = i j zk
Ta gọi tích của X và Y là đại lượng ngẫu nhiên X Y
. (hoặc XY ) có bảng phân phối xác suất là X Y . 1 z z … 2 z … n P(X Y . = z ∗ p … ∗ p … i ) 1 p ∗ 2 n
Đại lượng ngẫu nhiên X và Y gọi là độc lập nếu p = P X = x ;Y = y = p q . ij ( i j ) i j Ví dụ 2.4.
Cho X và Y độc lập có bảng phân phối xác suất X 0 1 2 P(X = x , 0 2 3 , 0 5 , 0 i ) và Y −1 0 1 P(y = y , 0 4 3 , 0 3 , 0 i )
Tìm phân phối xác suất của X + Y , X Y . . Giải 31 Bài giảng Theo định nghĩa, ta có:
P(X + Y − 3 = 4 − ) = P(X = ; 0 Y = − )
1 = P(X = 0).P(Y = − ) 1 = , 0 2.0 4 . = , 0 08 .
P(X + Y − 3 = 3 − ) = P(X = ;
0 Y = 0) + P(X = ; 1 Y = − ) 1
= P(X = 0).P(Y = 0) + P(X = ) 1 .P(Y = − ) 1 = , 0 2. 3 , 0 + 3 , 0 . , 0 4 = 1 , 0 8 Tương tự,
P(X + Y − 3 = 2 − ) = P(X = ; 0 Y = ) 1 + P(X = ;
1 Y = 0) + P(X = ; 2 Y = − ) 1
P(X + Y − 3 = − ) 1 = P(X = ; 1 Y = ) 1 + P(X = ; 2 Y = 0)
và P(X + Y − 3 = 0) = P(X = ; 2 Y = ) 1
Khi đó, ta có bảng phân phối của đại lượng X + Y − 3 là X + Y − 3 − 4 − 3 − 2 −1 0
P(X + Y − 3 = z , 0 08 1 , 0 8 3 , 0 5 , 0 24 1 , 0 5 i )
Tương tự, ta có bảng phân phối của XY là X Y . − 2 −1 0 1 2 P(X Y . = z , 0 20 1 , 0 2 , 0 44 , 0 09 1 , 0 5 i )
3. Đại lượng ngẫu nhiên liên tục. Định nghĩa.
Đại lượng ngẫu nhiên liên tục X có F (x) là hàm phân phối xác suất của nó. Nếu tồn x
tại hàm số f (x) xác định và không âm trên R sao cho F(x) = ∫ f (t)dt thì hàm số f (x) −∞
được gọi là hàm mật độ của X .
F (x) chính là diện tích giới hạn bởi đường cong của hàm mật độ f (x) và phần trục
hoành bên trái điểm x . Ví dụ 3.1. 2 x t 1 F (x) ∫ − =
e 2 dt được gọi là hàm phân phối chuẩn. Đó là diện tích giới hạn bởi 2π −∞ 2 1 x −
đường cong f (x) 2 = e
và trục hoành bên trái x . 2π
Từ tính chất của hàm phân phối, ta suy ra tính chất của hàm mật độ là x
+ f (x) ≥ 0 , F(x) = ∫ f (t)dt . −∞ 32
Chương II. Đại lượng ngẫu nhiên. Hàm phân phối xác suất +∞
+ ∫ f (x)dx = 1 vì F(− ∞) = 0 và F(+ ∞) = 1. −∞ b
+ P(a ≤ X < b) = ∫ f (x)dx . Thật vậy a b a b
P(a ≤ X < b) = F (b) − F (a) = ∫ f (x)dx − ∫ f (x)dx = ∫ f (x)dx −∞ −∞ a Ví dụ 3.2. 1 1
Giả sử hàm phân phối của đại lượng ngẫu nhiên là F(x) = arctan x + . Tìm hàm mật π 2
độ của X và tính xác suất P(−1 ≤ X < ) 1 . Giải. 1
Ta có hàm mật độ f (x) = F'(x) = π ( 2 1+ x ) 1 π  π  1
và xác suất P(−1 ≤ X < ) 1 = F ( ) 1 − F(− ) 1 =  −  −  = . π  4  4  2 Định lí.
Nếu hàm phân phối F(x) của đại lượng ngẫu nhiên X liên tục tại x = a thì
P(x = a) = 0 . Chứng minh
Do P(a ≤ X < b) = F(b)− F(a) và liên tục tại a nên cho +
b → a , ta có
P(x = a) = lim F (b) − F (a) = F (a) − F (a) = 0 . + b→a Nhận xét.
Theo Định lí, nếu F(x) liên tục tại a và b thì
P(a ≤ X < b) = P(a < X < b) = P(a < x ≤ b) = P(a ≤ X ≤ b). Ví dụ 3.3.  − Me x λ , x ; 0 λ 0 Gi > >
ả sử hàm mật độ của đại lượng ngẫu nhiên X là f (x) =  .  , 0 x ≤ 0
Tìm M . Tìm hàm phân phối của X . Giải +∞
Theo tính chất của hàm mật độ, ta có: ∫ f (x)dx = 1. −∞ +∞ 0 +∞  1  +∞ D − x − x M ễ thấy f ∫ (x) λ λ dx = 0dx ∫ + Me ∫ = M  − e  = .  λ  λ −∞ −∞ 0 0 Vậy M = λ . 33 Bài giảng
Ta có hàm phân phối F(x) được xác định như sau: x
+ Nếu x < 0 thì F(x) = ∫ f (x)dx = 0 . −∞ + Nếu x ≥ 0 thì x 0 x x
F (x) = ∫ f (x)dx = ∫ f (x)dx + ∫ f (x) −λx −λx
dx = 0 + ∫ λe dx = 1− e −∞ −∞ 0 0  , 0 x < 0 Vậy F(x) =  1 − − e λx , x ≥ 0
4. Các đặc trưng của đại lượng ngẫu nhiên. 4.1. Kì vọng. Định nghĩa.
Kì vọng của đại lượng ngẫu nhiên X , kí hiệu là: E(X ) xác định bởi:
+ Nếu X là đại lượng ngẫu nhiên rời rạc có bảng phân phối xác suất X 1 x x … 2 x … n P(X = x p … p … i ) 1 p 2 n +∞
thì E(X ) = x p + x p +L + x p +L = . 1 1 2 2 x p n n ∑ i i i=1
Trong trường hợp có vô hạn x thì ta nói X có kì vọng và E(X ) là kì vọng của nó nếu n +∞
chuỗi ∑ x p hội tụ tuyệt đối. i i i=1
+ Nếu X là đại lượng ngẫu nhiên liên tục có hàm mật độ xác suất f (x) thì +∞
E(X ) = ∫ xf (x)dx . −∞
Ý nghĩa của kì vọng.
Kì vọng của đại lượng ngẫu nhiên là trung bình theo xác suất các giá trị có thể nhận
của đại lượng ngẫu nhiên đó. Tính chất
Với mọi đại lượng ngẫu nhiên X , Y , ta có:
a) E(C) = C với C là đại lượng ngẫu nhiên hằng số.
b) E(X + Y ) = E(X )+ E(Y ).
c) E(λX ) = λ.E(X ), λ là một số.
d) E(XY ) = E(X ) E
. (Y ) nếu X và Y độc lập. 34
Chương II. Đại lượng ngẫu nhiên. Hàm phân phối xác suất Ví dụ 4.1.
Nghiên cứu về điểm thi môn Toán của 400 sinh viên một trường Đại học, ta được bảng số liệu như sau Điểm 2 3 4 6 7 8 Số sinh 10 60 160 100 40 30 viên
Gọi X là số điểm môn Toán của sinh viên một trường Đại học. a) Tính E(X )?
b) Tính tổng số điểm môn Toán của 400 sinh viên. Như vậy, điểm trung bình môn
Toán của một sinh viên là bao nhiêu? So sánh giá trị đó với E(X )? Giải
a) Ta lập bảng phân phối xác suất như sau X (Điểm) 2 3 4 6 7 8 P(X = x 1 6 16 10 4 3 i ) 40 40 40 40 40 40 1 6 16 10 4 3 1960
Khi đó, ta có E(X ) = 2. + 3. + 4. + 6. + 7. + 8. = . 40 40 40 40 40 40 400 b) Ta có tổng số điểm môn Toán của 400 sinh viên là 2.10 + 3.60 + 4 1 . 60 + 6.100 + 7 4 . 0 + 8.30 = 1960 . 1960
Suy ra điểm trung bình môn Toán của một sinh viên là . 400 D 1960
ễ thấy E(X ) =
. Khi đó, E(X ) là điểm trung bình môn Toán của sinh viên. 400
Như vậy, ta suy ra kì vọng của một đại lượng ngẫu nhiên X là giá trị trung bình của
đại lượng ngẫu nhiên đó. Ví dụ 4.2.
Trong một cuộc thi vấn đáp, có hai hình thức thi như sau:
+ Hình thức thi thứ nhất là mỗi người phải trả lời 2 câu hỏi, mỗi câu trả lời đúng thì được 5 điểm.
+ Hình thức thi thứ hai là nếu trả lời đúng câu thứ nhất thì mới được trả lời câu thứ hai.
Câu thứ nhất trả lời đúng được 5 điểm, câu thứ hai trả lời đúng được 10 điểm.
Trong cả hai hình thức thi này, các câu trả lời sai đều không được điểm. Giả sử xác 3
suất trả lời đúng mỗi câu là và việc trả lời mỗi câu là độc lập với nhau. Theo bạn, 4
nên chọn hình thức nào để số điểm trung bình đạt được nhiều hơn. Giải. 35 Bài giảng 3
Gọi A là biến cố “trả lời đúng câu hỏi thứ i ”, i = ; 1 2 . Ta có: P( . 1 A ) = P( 2 A ) = i 4 Gọi X , 1
X là số điểm đạt được tương ứng với hai hình thức thi trên. Theo yêu cầu bài 2
toán, ta cần so sánh E(X và E(X . 2 ) 1 )
Ta có bảng phân phối xác suất của X như sau 1 X 0 5 10 1 P(X = x 1 6 9 1 i ) 16 16 16
Khi đó, điểm trung bình trong hình thức thi thứ nhất là E(X . 1 ) = 7 5 ,
Ta có bảng phân phối xác suất của X là 2 X 0 5 15 2 P(X = x 1 3 9 2 i ) 4 16 16
Khi đó, điểm trung bình trong hình thức thi thứ hai là E(X . 2 ) = 3 , 9 75
Vậy, ta có E(X
nên chọn hình thức thi thứ hai.
1 ) < E( X 2 ) 4.2. Phương sai. Định nghĩa.
Cho X là một đại lượng ngẫu nhiên có kì vọng E(X ). Khi đó, ta gọi phương sai của
X là kì vọng của bình phương độ sai khác giữa X và E(X ) , kí hiệu là D(X ) . Vậy 2
D(X ) = E(X − E(X )) = E(X 2 )− E 2 (X )
Ý nghĩa của phương sai.
Phương sai là trung bình của bình phương sai số giữa X và EX . Như vậy, phương
sai càng nhỏ thì các giá trị của X càng tập trung quanh EX .
Do D(X ) ≥ 0 nên ta định nghĩa độ lệch chuẩn của đại lượng ngẫu nhiên X như sau Định nghĩa.
Độ lệch chuẩn của đại lượng ngẫu nhiên X là σ (X ) = D(X ) .
Độ lệch chuẩn được dùng thường xuyên hơn phương sai do có cùng đơn vị đo với đại
lượng ngẫu nhiên X . Tính chất.
Với mọi đại lượng ngẫu nhiên X , Y , ta có:
a) D(X ) ≥ 0 . D(X ) = 0 ⇔ X là đại lượng ngẫu nhiên hằng số.
b) D(C) = 0 với C là đại lượng ngẫu nhiên hằng số. c) D(λX ) 2
= λ D(X ), λ là một số. 36
Chương II. Đại lượng ngẫu nhiên. Hàm phân phối xác suất
d) D(X + λ) = D(X ), λ là một số.
e) D(X ) = E(X 2 )− E 2 (X ).
f) D(X + Y ) = D(X )+ D(Y ) nếu X và Y độc lập. Ví dụ 4.3.
Điểm các môn Toán cao cấp 1 A , 2 A , 3
A , Xác suất thống kê (XSTK) và Kinh tế lượng
(KTL) của hai sinh viên An và Bình được cho theo bảng sau Môn TCC 1 A TCC 2 A TCC 3 A XSTK KTL Điểm của 7 6 8 9 5 An Điểm của 9 10 5 10 1 Bình
Gọi X , Y lần lượt là điểm môn Toán của bạn An và Bình.
a) Hãy tính E(X ), E(Y ) và so sánh E(X ), E(Y ).
b) Tính D(X ), D(Y ). So sánh các giá trị này. Giải a) Ta có 9 +10 + 5 +10 + 1 35 E(X ) 7 + 6 + 8 + 9 + 5 35 = = = 7 , E(Y ) = = = 7 . 5 5 5 5
Vậy E(X ) = E(Y ) . b) Ta có 2 2 2 2 2 E( 2 X ) 7 + 6 + 8 + 9 + 5 = = 51. 5
Khi đó D(X ) = E( 2 X ) 2
− E (X ) = 55 − 7 2 = 6 . 2 2 2 2 2 E( 2 Y ) 9 +10 + 5 + 10 + 1 307 = = . 5 5 2 2 307
Khi đó D(Y ) = E(Y )− E (Y ) = − 72 = 1 ,
2 4 . Vậy D(Y ) > D(X ). 5
Ta thấy rằng An và Bình cùng có điểm trung bình các môn Toán, tuy nhiên An là “học đều” hơn Bình.
4.3. Mốt, trung vị và moment trung tâm. a) Mốt (mod). Định nghĩa.
Mốt là giá trị của đại lượng ngẫu nhiên X được kí hiệu là Mod(X ) mà tại đó hàm mật
độ f (x) đạt giá trị lớn nhất. 37 Bài giảng
Trường hợp X là đại lượng ngẫu nhiên rời rạc, Mod(X ) là giá trị của X mà tại đó xác
suất P(X = Mod(X )) là lớn nhất.
Mốt của X còn gọi là số có khả năng nhất. Chú ý.
a) Mốt có thể không tồn tại và khi nó tồn tại không nhất thiết là giá trị duy nhất.
b) Mốt không phải luôn luôn tồn tại, chẳng hạn khi tất cả các số liệu trong mẫu có số
lần xuất hiện bằng nhau. Ví dụ 4.4.
Cho đại lượng ngẫu nhiên X có bảng phân phối X 0 1 2 P(X = x 1 1 1 i ) 4 2 4 1
Ta có Mod(X ) = 1 vì P(X = ) 1 =
là xác suất lớn nhất. 2 Ví dụ 4.5.  , 0 x ≤ 0 
Cho X là đại lượng ngẫu nhiên có hàm mật độ f (x) =  2 x . Hãy xác định − x  4 e , x > 0 2 Mod (X ) . Giải Ta có:
+ f (x) = 0 , ∀x ≤ 0 . 2 x + − f (x) x 4 = e , ∀x > 0 . 2 2 x 2 2 2 x x 2 − − − 1 x 1  x  Ta có f '(x) = 4 e − 4 e = 4 e 1 −  . 2 4 2  2 
Khi đó f '(x) = 0 ⇔ x = − 2 hoặc x = 2 . Do x > 0 nên x = 2 . 1 2 D −
ựa vào bảng biến thiên, ta được f (x) ≤ f ( 2) 2 = e . 2
Vậy Mod(X ) = 2 . b) Phân vị.
Điểm x được gọi là phân v 0
ị với xác suất α của đại lượng ngẫu nhiên X nếu
P(X > x
(hoặc P(X < x ). 0 ) = α 0 ) = α
Hiển nhiên P(X ≤ x .
0 ) = 1 − P( X > x0 ) = 1 − α 38
Chương II. Đại lượng ngẫu nhiên. Hàm phân phối xác suất
Trong bài giảng này, chúng ta dùng phân vị P(X > x . 0 ) = α 1
Nếu α = thì điểm x này được gọi là trung vị của X . Khi đó, ta xác định như sau 2 0
c) Trung vị (median). Định nghĩa.
Cho X là một đại lượng ngẫu nhiên. Số m gọi là trung vị của X , kí hiệu Med(X ) nếu   1 P( 1
X < Med (X )) = F (Med (X )) ≤
P(X < Med (X )) ≤  2  2  ) 1 ( hoặc  (2)  1 P( 1
X ≤ Med (X )) = F (Med(X ))   ≥
P(X > Med(X )) ≥  2  2
* Nếu X là đại lượng ngẫu nhiên rời rạc Med(X ) là giá trị x sao cho k P( 1 X = L 1
x ) + P(X = x2 ) +
+ P(X = xk−1 ) ≤  2 
, trong đó x ≤ x ≤ L ≤ x . 1 2 k P( 1 X = L 1
x ) + P(X = x2 ) +
+ P(X = xk )  ≥  2 1
* Nếu X là đại lượng ngẫu nhiên liên tục thì Med(X ) thỏa F(Med(X )) = . 2 Ví dụ 4.6.  , 0 x ≤ 0 
Cho hàm phân phối của đại lượng ngẫu nhiên X là F(x) = x, 0 < x ≤ 1.   , 1 x > 1 1 1
Ta có F(x) = suy ra Med(X ) = 2 2 Ví dụ 4.7.
Cho đại lượng ngẫu nhiên X có bảng phân phối X 0 1 2 P(X = x 1 1 1 i ) 4 2 4 1 1 3 1
Ta có P(X < ) 1 = ≤ và P(X ≤ ) 1 = >
nên Med(X ) =1. 4 2 4 2 Chú ý.
Theo định nghĩa trên thì X có thể có một hoặc nhiều trung vị. Nếu có 1 m , m cùng 2 thỏa ) 1 ( hoặc (2) và thì với m ; cũng là median của 1 m < m2
m bất kì thuộc [ 1 m2 ] X . Ví dụ 4.8.
Gọi X là số chấm xuất hiện khi gieo con xúc xắc. Khi đó X có bảng phân phối 39 Bài giảng X 1 2 3 4 5 6 P(X ) 1 1 1 1 1 1 6 6 6 6 6 6 1 1 1
Ta có P(X < 3) = P(X = )
1 + P(X = 2) = 2. = ≤ 6 3 2
và P(X ≤ 3) = P(X = )
1 + P(X = 2) + P(X = 3) 1 1 1 = 3. = ≥ . 6 2 2 Suy ra m 3 . 1 = M 1 1
ặt khác P(X < 4) = P(X = )
1 + P(X = 2) + P(X = 3) = 3. = 6 2 1 2 1
và P(X ≤ 4) = P(X = )
1 + P(X = 2) + P(X = 3) + P(X = 4) = 4. = ≥ . 6 3 2 Suy ra m 4 . 2 =
Khi đó, Med(X ) = m , m ∈[ 4 ;
3 ]. m = 3 hoặc m = 4 .
c) Moment trung tâm. Moment gốc. Định nghĩa.
Cho X là một đại lượng ngẫu nhiên có kì vọng E(X ) = a . Ta gọi moment trung tâm
cấp k của X là µ = µ X = E X − a . k ( ) ( )k k
Ta gọi moment gốc cấp k là γ = E( k X . k )
Ta có γ = a . Theo công thức nhị thức Newton 1  n  n µ = E X a E C a X C a E X n
( − )n = ∑ kn (− )k n−k  = ∑ kn (− )k ( n−k )  k=0  k =0 n = ∑ k C 1 γ γ n (− )k k n−k 1 k =0 n Vậy µ = C 1 γ γ . n ∑ kn (− )k k n−k 1 k =0 Ví dụ 4.9.
Đại lượng ngẫu nhiên X có bảng phân phối xác suất như sau: X 2 3 4 6 7 P(X ) 1 , 0 , 0 2 3 , 0 , 0 2 , 0 2
Tính E(X ), D(X ), σ (X ) , E( 3
X ), Med(X ), Mod(X ) , P( X − EX < 2). Giải 40
Chương II. Đại lượng ngẫu nhiên. Hàm phân phối xác suất E(X ) = 2. 1 , 0 + 3. , 0 2 + 4 3 , 0 . + 6. , 0 2 + 7. , 0 2 = 4.6 . E( 2 X ) = 22. 1 , 0 + 32. , 0 2 + 42. 3 , 0 + 62. , 0 2 + 72 , 0 . 2 = 24 .
D(X ) = E( 2 X ) 2
− E (X ) = 24 − 6 , 4 2 = 8 , 2 4 .
σ (X ) = D(X ) = 8 , 2 4 = 6 , 1 85 . E( 3 X ) = 2 . 3 1 , 0 + 33 , 0 . 2 + 43 3 , 0 . + 6 . 3 , 0 2 + 7 .3 , 0 2 = 137,2 . 1 1
Dễ thấy Med(X ) = 4 vì P(X < 4) = 3 ,
0 ≤ và P(X ≤ 4) = , 0 6 ≥ . 2 2
Mod (X ) = 4 vì max P(X = X .
i ) = P( X = 4) = 3 , 0
P( X − EX < 2) = P( X − , 4 6 < 2) = P( 6 , 2 < X < 6 ,
6 ) = P(3) + P(4) + P(6) = , 0 2 + 3 , 0 + , 0 2 = 7 , 0
5. Hàm của một đại lượng ngẫu nhiên.
Nếu ta xác định Z = g(X ) là một hàm của đại lượng ngẫu nhiên X thì Z trở thành đại
lượng ngẫu nhiên mới. Vấn đề đặt ra là tìm cách xác định luật phân phối của Z qua
luật phân phối đã biết của X . Ở đây, ta chỉ xét các trường hợp đơn giản khi hàm g không quá phức tạp.
5.1. Đại lượng ngẫu nhiên rời rạc. Ví dụ 5.1.
Cho đại lượng ngẫu nhiên X có luật phân phối X − 2 −1 0 1 2 P(X = 1 , 0 , 0 2 3 , 0 , 0 2 , 0 2 1 x )
Xác định luật phân phối của đại lượng ngẫu nhiên 2
Z = X và tìm kì vọng của Z . Giải. Dễ dàng ta có
P(Z = 0) = P(X = 0) = 3 , 0 , P(Z = ) 1 = P(X = ) 1 + P(X = − ) 1 = , 0 2 + , 0 2 = , 0 4 ,
P(Z = 4) = P(X = 2) + P(X = 2 − ) = 1 , 0 + , 0 2 = 3 , 0 .
Khi đó, ta có bảng phân phối của đại lượng ngẫu nhiên Z là Z 0 1 4 P(Z = z 3 , 0 , 0 4 3 , 0 i )
Từ bảng phân phối trên, ta có kì vọng 3
E(Z ) = ∑ z P Z z i ( = i ) = 0. 3 , 0 + 1 , 0 . 4 + 4. 3 , 0 = , 1 6 i 1 = 41 Bài giảng
Trong trường hợp Z = g(X ) tổng quát, ta có thể tính trực tiếp kì vọng của đại lượng
ngẫu nhiên Z như sau:
E(Z ) = ∑ g(x P X x i ) ( = i ) i=1
Trong ví dụ trên, ta có thể tính kì vọng của đại lượng ngẫu nhiên Z là E(Z ) = (− 2)2 1 , 0 . + (− ) 1 2 , 0 . 2 + (0)2. 3 , 0 + ( ) 1 2. , 0 2 + (2)2. , 0 2 = 6 , 1 .
6.2. Đại lượng ngẫu nhiên liên tục.
Khi X là đại lượng ngẫu nhiên liên tục, vấn đề sẽ phức tạp hơn. Giả sử đại lượng ngẫu
nhiên X có hàm mật độ f
đã biết và Y = g(X ). Ta sẽ tìm hàm mật độ f của Y (x ) X (x ) Y . Ta có: F x P Y x P Y g X x f
u du , trong đó D = g u ( ) < x Y (
) = ( < ) = ( = ( ) < ) = ∫ X ( ) X DX
Sau đó, lấy đạo hàm F
vế, ta được mật độ f
của đại lượng ngẫu nhiên Y . Y (x ) Y (x ) Ví dụ 5.2.
Cho đại lượng ngẫu nhiên X có hàm mật độ xác suất là f (x) . Tìm hàm mật độ của a) Z = 2X + 1. b) 3 Y = X . Giải.
a) Áp dụng công thức, ta có: F . Z (x ) x 1 1
= P(Z < x) = P(2 x X + 1 < x)  −   −  = P X <  = F    2  X  2 
Lấy đạo hàm, ta được   x −1 f . Z (x ) x 1 1 1 = [FZ (x)]  −   −  ' x = F   ,   X  '= f     2   2  2  2  V 1  x −1
ậy hàm mật độ của Z là f . Z (x ) = f   2  2  b) F = < = < = < = . Y (x ) P(Y x) P( 3 X x) P( 3 X
x ) FX (3 x )
Lấy đạo hàm, ta được hàm mật độ của Y là: f = = = Y (x )
[FY (x)]' [FX ( 1 3 x )]' (3
. x )' f (3 x ). 3 2 3 x Ví dụ 5.3. Cho X − µ
đại lượng ngẫu nhiên X có phân phối chuẩn X ~ N ( 2 µ;σ ), đặt Y = . σ
Chứng minh rằng Y có phân phối chuẩn Y ~ N( ) 1 ; 0 . Giải. 42
Chương II. Đại lượng ngẫu nhiên. Hàm phân phối xác suất F . Y (x ) X
= P(Y < x)  − µ  = P
< x  = P(X < σx + µ ) = FX (σx + µ)  σ 
Lấy đạo hàm, ta được ((σx+µ )−µ )2 2 x − − f
x = F x = F x σ + µ = f x σ + µ σ = e σ σ = e . Y (
) [ Y ( )]' [ X ( )]' X ( ) 1 1 2 2 2 . σ 2π 2π
Vậy Y có phân phối chuẩn Y ~ N( ) 1 ; 0 . 43
Chương II. Đại lượng ngẫu nhiên. Hàm phân phối xác suất 6. Bài tập chương. 1.
Một nhóm có 10 người gồm có 6 nam và 4 nữ. Chọn ngẫu nhiên ra 3 người. Gọi X
là số nữ ở trong nhóm. Lập bảng phân phối xác suất của X và tính E(X ) , D(X ) và mod(X ). 3
 x(2 − x), x ∈ [ ; 0 2] 2.
Cho ĐLNN liên tục X có hàm mật độ f (x) = 4 .  ,0 x ∉ [ ; 0 2]
a) Vẽ đồ thị của f (x) .
b) Tính P(X > 5 , 1 ) và P( 9 , 0 < X < ) 1 , 1 .  2 kx , x ∈ [ ] 3 ; 0 3.
Cho ĐLNN liên tục X có hàm mật độ f (x) =  .  , 0 x ∉ [ ] 3 ; 0
a) Tìm hằng số k .
b) Tính P(X > 2).
c) Tìm Med(X ).  x − 1  e λ , x , 0 λ 0 4. > >
Cho hàm mật độ của ĐLNN X là f (x) = λ   , 0 x ≤ 0
a) Tìm hàm phân phối của X và tính xác suất P(0 ≤ X < λ) .
b) Tính kì vọng và phương sai của X . 5.
Một người nuôi 100 con gà. Xác suất để mỗi con gà đẻ trong một ngày là p = 8 , 0 . Gọi
X là số trứng thu được trong một ngày.
a) Tính xác suất để thu được ít nhất 80 quả trứng trong một ngày.
b) Giả sử, giá bán mỗi quả trứng gà là 2000 VNĐ và chi phí cho mỗi con là 1.200 VNĐ.
Gọi Y là số tiền lời trong một ngày. Tính tiền lời trung bình? 6.
Một hộp đựng 7 sản phẩm xấu và 3 sản phẩm tốt. Chọn ngẫu nhiên cùng lúc 2 sản
phẩm. Gọi X là số sản phẩm tốt trong hai sản phẩm lấy ra.
a) Lập bảng phân phối xác suất của X .
b) Tính E(X ), D(X ) và Mod(X ) . 7.
Cho ĐLNN X rời rạc và có phân phối xác suất như sau X 1 3 5 7 9 P 0,1 0,4 0,2 0,2 0,1
a) Tính P(3 ≤ X ≤ 7).
b) Xác định Med(X ), Mod(X ), E(X ) và D(X )
Đáp số và hướng dẫn. 1. Dùng các công thức: X 0 1 2 3 P 5 15 9 1 30 30 30 30 45 Bài giảng E(X ) = , 1 2 , D(X ) = 5 , 0 6 và mod(X ) = 1 2. b) P(X > 5 , 1 ) ≈ 1 , 0 5625 , P( 9 , 0 < X < ) 1 , 1 ≈ 1 , 0 495.  , 0 x < 0  1 19  3 3. x
a) k = , b) P(X > 2) = , c) F(x) =  , 0 ≤ x ≤ 3 . 9 27 27  ,1 x > 3 3 x 1 3 3
Median m là nghiệm của phương trình = hay x = . Vậy m = . 27 2 3 2 3 2  , 0 x ≤ 0 4. a) F(x) =  − x
, P(0 ≤ X < λ) 1
= 1 − e , b) E(X ) = λ , D(X ) 2 = λ .  −
1 − e λ , x > 0
C. Phương pháp giảng dạy.
- Thuyết trình, đàm thoại khơi động hoạt động tự giác, tích cực của sinh viên.
- Sử dụng hình thức trực quan: bảng, đồ thị, kí hiệu,…
- Yêu cầu SV đọc bài giảng trước khi lên lớp.
- Kiểm tra, đánh giá việc làm bài tập của SV.
- Sử dụng phương tiện dạy học hiện đại như Mic, Projector.
- Giảng viên gửi bài giảng cho sinh viên đọc trước. Giảng viên trình bày bài giảng trên lớp
theo phương pháp thuyết trình hỏi đáp. Giao bài tập cho sinh viên về nhà làm. Giới thiệu một số tài liệu tham khảo.
D. Tài liệu tham khảo
[1] Đậu Thế Cấp, Xác suất thống kê: Lí thuyết và các bài tập (Chương 2), NXB Giáo dục, 2006.
[2] Đinh Văn Gắng, Bài tập xác suất và thống kê (Chương 2), NXB Giáo dục, 2007.
[3] PGS. TS. Phạm Xuân Kiều, Giáo Trình xác suất và thống kê (Chương 2), NXB Giáo dục, 2005.
[4] Đặng Công Hanh, Đặng Ngọc Dục, Giáo trình Lý thuyết xác suất và Thống kê
toán (Chương 2), trường Đại học Duy Tân,1996. 46 Chương III.
Các quy luật phân phối thường gặp. A. Mục tiêu.
- Sử dụng hình thức trực quan: bảng, đồ thị, kí hiệu,…
- Ứng dụng Excel cho việc tính các giá trị của biến ngẫu nhiên có phân phối chuẩn,
phân phối Poisson, phân phối Student, phân phối chi bình phương.
- Yêu cầu SV đọc bài giảng trước khi lên lớp.
- Kiểm tra, đánh giá việc làm bài tập của SV.
- Sử dụng phương tiện dạy học hiện đại như Mic, Projector. B. Nội dung.
1. Quy luật phân phối rời rạc.
1.1. Phân phối nhị thức. Định nghĩa.
Gọi X là số lần biến cố A xuất hiện trong dãy n phép thử Bernoulli. Khi đó, X là
đại lượng ngẫu nhiên có phân phối nhị thức.
Kí hiệu X ~ B(n; p).
Công thức xác suất: P(X = k) k k n−k = C p q
, trong đó q = 1− p . n Các tính chất.
Cho X ~ B(n; p), ta có
a) E(X ) = np .
b) D(X ) = npq .
c) np − q ≤ mod X ≤ np + p . Chứng minh
a) Gọi X là “số lần đại lượng cố A xuất hiện trong phép thử thứ n ” (trong dãy phép i
thử Bernoulli), ta có bảng phân phối của X là: i X 0 1 K n Bài giảng P p 0 1 p K p n
trong đó p = P X = k C p q − = . k ( ) k k n k n n n n
Suy ra E(X ) = ∑ k.p = k C . p q k C . p q . k ∑ k k n−k = n ∑ k k n−k n k =0 k =0 k =1 n
Ta có (p + x)n ∑ k n− = k k C p
x . Đạo hàm hai vế theo x , ta được n k =0 n n 1 1
n( p + x)n− = ∑ k n−k k − kC p
x 1 hay n( p + x)n− x = ∑ k n−k k kC p x . n n k =1 k =1 n
Chọn x = q , ta suy ra np ∑ k n− = k k kC p
x . Vậy E(X ) = np (đpcm). n k =1
b) Dễ dàng chứng minh được n n
E(X 2 ) = ∑ k 2.p = ∑ k 2 C k .
p k q n−k = n − 2 1 + . k n (n )p np k =0 k =0 Khi đó 2 2 2 2
D(X ) = E(X )− (E(X )) = n(n − )
1 p + np − (np) = np − np2 = npq (đpcm).=
c) Do P(X = mod X ) ma { x p ; p ;K =
; p . Theo Ch 0 1
ương 2, ta có: n }
+ Nếu np − q nguyên thì np − q = mod X = np − q +1.
+ Nếu np − q không nguyên thì [np − q] < mod X = [np − q]+1.
Vậy np − q ≤ mod X ≤ np + p (đpcm). Ví dụ 1.1.
Bắn 5 viên đạn vào mục tiêu, xác suất trúng mục tiêu của mỗi viên đạn là 8 , 0 . Gọi X
là đại lượng ngẫu nhiên chỉ số viên đạn trúng mục tiêu. Lập bảng phân phối của X . Tính E(X )? Giải
Ta có X có thể nhận các giá trị 0 , 1, 2 , 3 , 4 , 5 . Khi đó, ta có: P(X = k ) k k 5−k = C 8 , 0 , 0 2 , k = 5 ; 0 . 5
Từ đó, ta có bảng phân phối 0 1 2 3 4 5 0 0 5 C 8 , 0 . , 0 2 1 1 4 C 8 , 0 , 0 . 2 2 2 3 C 8 , 0 , 0 . 2 3 3 2 C 8 , 0 . , 0 2 4 4 1 C 8 , 0 , 0 . 2 5 5 0 C 8 , 0 . , 0 2 5 5 5 5 5 5
Dễ thấy kì vọng E(X ) = np = 5 8 , 0 . = 4 .
1.2. Phân phối siêu bội. Định nghĩa. 48
Chương III. Các quy luật phân phối xác suất thường gặp.
Gọi X là số lần chọn được phần tử có tính chất A trong n lần chọn không lặp từ một
tập hợp có N phần tử, trong đó có M phần tử có tính chất A . Khi đó, X được gọi là
đại lượng ngẫu nhiên có phân phối siêu bội.
Kí hiệu: X ~ H (N; M ;n). k n−k . Công th C C
ức xác suất: P(X = k ) M N −M = . n CN Các tính chất.
Cho X ~ H (N; M ;n). Ta có
a) E(X ) = np . b) D(X ) N − n = npq . N −1 trong M đó p = , q = 1− p . N Chứng minh n k C . n−k Tr C
ước hết, ta chứng minh công thức ∑ M N−M = 1. Thật vậy, ta có n k =0 CN M N −M N
(1+ x)M (1+ x)N−M = (1+ x)N hay ∑ k k C x C x C x M ∑ l l = t t N −M ∑ N k =0 l =0 k =0 n
So sánh hệ số của n
x hai vế, ta được k n−k n ∑C C . = C (đpcm) M N −M N k =0 Ta có: n n k n−k n k n−k . . E(X ) kC C M kNC C
= ∑ kP(X = k ) = ∑ M N −M = n n ∑ M N −M n 0 0 C N k = k = 0 nMC N k = N M! M 1 ! n k − − ( ) n−k kN C . C . n k! ( . M − k) N −M n ! (k − ) 1 ! (.M − k ) N −M ! = np∑ = np∑ N! 1 ! 1 1 (N − ) k = k =
nM . n!(N − n)! (n − ) 1 !(N − n)! n k −1 n−k C C .
= np∑ M −1 N−M N −1 k =1 CN−n n k 1 − C . k n − n− k k 1 n 1 C C . 1 1 C Chú ý rằng: M 1 − N − M M 1 N1 −M1 ∑ =
, (trong đó k = k 1, M = M 1, N − ∑ = 1 1 1 − 1 − 1 n k 1 = C C N −n 1 k =0 N1 N = N 1 và n = n 1). 1 − 1 −
Vậy ta có điều phải chứng minh. b) Ta có.
Tương tự như câu a), ta dễ dàng chứng minh được: 49 Bài giảng n E( 2 X ) 2
= ∑ k P(X = k) k =0 n n = ∑ k(k − )
1 P(X = k ) + ∑ kP(X = k) k =0 k =0 M (M − ) 1 n(n − ) 1 M
Mn(nM − M − n + N ) = + n = N (N − ) 1 N N (N − ) 1 Khi đó
D(X ) = E( 2
X )− (E(X ))2
Mn  nM − M − n + N Mn  =  −  N  N − 1 N 
M (N − M ) N n N n = . n . . − − = npq N N N − 1 N − 1 Ví dụ 1.2.
Một hộp có 4 viên bi đỏ và 3 viên bi xanh. Lấy ngẫu nhiên 3 bi từ hộp. Gọi X là số bi xanh lấy được.
a) Tính xác suất lấy được 2 bi xanh.
b) Lập bảng phân phối xác của X . Từ đó tính kì vọng và phương sai. Giải 2 1 C . a) Ta có C
N = 7 , M = 3 và X ~ H ( 3 ; 3 ; 7
). Khi đó P(X = 2) 3 4 = . 3 C7
b) Dễ thấy X có thể nhận các giá trị 0 , 1, 2 , 3 . Khi đó, ta có bảng phân phối xác suất như sau: X 0 1 2 3 P 0 3 C . 1 2 C . 2 1 C . 3 0 C . 3 C4 3 C4 3 C4 3 C4 3 C 3 3 3 7 C7 C7 C7 3 9 3  3  7 − 3 24 Do X ~ H ( ) 3 ; 3 ; 7
nên E(X ) = 3. = và D(X ) = 3. .1−  = . 7 7 7  7  7 −1 49
1.3. Phân phối Poisson. Định nghĩa.
Gọi X là số lần phần tử có tính chất A xuất hiện trong một khoảng thời gian (hoặc
trên một miền, một vùng) nào đó. Khi đó, X được gọi là đại lượng ngẫu nhiên có
phân phối Poisson với tham số λ là số trung bình của số lần phần tử có tính chất A xảy ra.
Kí hiệu: X ~ P(λ) . −λ k Công th e λ
ức xác suất: P(X = k) = . k! 50
Chương III. Các quy luật phân phối xác suất thường gặp. Các tính chất.
Cho X ~ P(λ) . Ta có a) E(X ) = λ . b) D(X ) = λ .
c) [λ]−1 ≤ mod(X ) ≤ [λ]. Chứng minh +∞ +∞ −λ k +∞ k −1 a) Ta có: E(X ) ke
= ∑ kP(X = k ) λ −λ λ = ∑ = λe ∑ = λ −λ λ e e = λ , (do ! 1 k =0 ! k =0 k k =1 (k − ) +∞ λl λ ∑ = e ). ! l =0 l +∞ +∞ 2 −λ k +∞ −λ k +∞ − k e λ k k 1 λ k b) Ta có λ λ E( 2 X ) e ke = ∑ 2
k P(X = k ) ( − ) = ∑ = ∑ + ∑ . k k k k k ! k ! k ! =0 =0 =0 =0 +∞ −λ k
+∞ k(k − ) −λ k +∞ k −2 D ke λ 1 e λ −λ λ ễ thấy ∑ = λ và 2 2 ∑ = e λ ∑ = λ k k k k =0 ! k =2 ( − 2)! k =0 ! nên 2 2 E( 2
X ) = λ2 + λ . Vậy D(X ) = E(X )− (E(X )) = λ (đpcm). −λ k −λ k 1 + c) Ta có λ e λ P(X = ) e k =
và P(X = k + ) 1 = . k! (k + ) 1 !
Dễ thấy P(X = k + )
1 ≥ P(X = k ) khi và chỉ khi k ≤ λ −1
và P(X = k + )
1 < P(X = k ) khi và chỉ khi k > λ −1.
Do k ∈ N nên [λ]−1 ≤ mo ( d X ) ≤ [λ] (đpcm) Chú ý.
Luật phân phối Poisson có ý nghĩa thực tế rất lớn và được ứng dụng rộng rãi trong việc
kiểm tra chất lượng sản phẩm. Đặc biệt giải quyết một số bài toán sau đây Ví dụ 1.3.
Tại một CLB Bóng bàn, biết rằng trung bình mỗi ngày có 5 người đến tập luyện. Tính
xác suất để trong một ngày mà ta xét.
a) Có 3 người đến tập luyện.
b) Có ít nhất 4 người đến tập luyện. Giải
Gọi X là số người đến tập luyện trong ngày. Ta có X ~ P(5). Khi đó 5 − e 53 a) P(X = 3) = . ! 3 3 −9 e 9k
b) P(X ≥ 4) = 1− P(X < 4) = 1− ∑ . k k ! =0 51 Bài giảng Ví dụ 1.4.
Xét số khách hàng vào cửa hàng mua ĐTDĐ trong một tháng là đại lượng ngẫu nhiên
tuân theo phân phối Poisson với mật độ trung bình là 9 khách hàng trong một ngày.
a) Tìm xác suất để trong một ngày có 40 khách hàng.
b) Tìm xác suất để trong một tuần có 100 khách hàng.
c) Tìm xác suất để trong một ngày có hơn 40 khách hàng. Giải
Gọi X là số khách hàng vào cửa hàng mua ĐTDĐ. 9 − e 940
a) Ta có E(X ) = 9 . Khi đó P(X = 4) = . 4 ! 0
b) Số khách hàng trung bình vào cửa hàng mua ĐTDĐ trong một tuần là 9.7 = 36 . E(Y ) = 36 . 3 − 6 e 36100
Khi đó, ta có P(Y = 100) = . 10 ! 0 40 −9 e 9k
c) Ta có P(X > 40) = 1− P(X ≤ 40) = 1− ∑ . k k ! =0
2. Quy luật phân phối liên tục.
2.1. Phân phối đều. Định nghĩa.
Đại lượng ngẫu nhiên liên tục X được gọi là có phân phối đều trên đoạn [a;b] nếu  1  ,
x ∈ [a;b]
hàm mật độ của X là f (x) = b − a .  ,0
x ∉ [a;b]
Kí hiệu: X ~ U (a;b). Các tính chất.
Cho X ~ U (a;b). Ta có: a) + E(X ) b a = . 2 (b − a)2 b) D(X ) = . 12 2.2. Phân phối mũ. Định nghĩa. 52
Chương III. Các quy luật phân phối xác suất thường gặp.
Đại lượng ngẫu nhiên liên tục X được gọi là có phân phối mũ tham số λ ( λ > 0 )  −
λe λx , x 0 hàm m ≥
ật độ của nó có dạng f (x) =  .  , 0 x < 0
Kí hiệu: X ~ E(λ). Các tính chất.
Cho X ~ E(λ). Ta có: 1 a) E(X ) = . λ b) D(X ) 1 = . 2 λ Chứng minh +∞
a) Ta có: E(X ) ∫ − =
xλe λx dx 0 1 +∞ −t Γ 2 1.Γ 1 1
Đặt t = λx . Khi đó E(X ) ( ) ( ) = ∫te du = = = λ λ λ λ 0 +∞ b) Ta có: E( 2 X ) ∫ 2 − =
x λe λx dx . 0 1 +∞ −t Γ 3 2.Γ 1 2
Đặt u = λx . Khi đó E( 2 X ) 2 ( ) ( ) = ∫t e dt = = = . 2 2 2 2 λ λ λ λ 0
Suy ra D(X ) = E( 2
X )− (E(X ))2 1 = . 2 λ +∞
Trong đó, Hàm Gamma được xác định như sau Γ(α ) = ∫ − α−1 e x x dx . 0
Các tính chất của hàm Gamma: a) Γ( ) 1 = 1 . b) Γ(n + ) 1 = ! n , n ∀ ∈ N .  1  c) Γ  = π .  2  Ví dụ 2.1.
Tuổi thọ X (tính bằng giờ) của một thiết bị có phân phối mũ X ~ E( 0 , 0 012 ) 5 .
Hãy tính và đưa ra ý nghĩa các giá trị sau:
a) P(X > 720).
b) P(600 < X < 720). 53 Bài giảng c) E(X ).
d) P(X < 800). Giải a) Ta có
P(X > 720) = 1 − P(X < 720) − P(X = 720) = 1 − F (720) = 1 − ( 0 − ,00125 7 . 20 1− e ) 0 − ,9 = e
Ý nghĩa P(X > 720) là xác suất để tuổi thọ của thiết bị lớn hơn 720 giờ là 0−,9 e .
b) P(600 < X < 720) = F(720)− F(600) = ( 0 − ,00125 7 . 20 1− e )− ( 0 − ,0012 . 5 600 1− e ) 0 − ,75 0 − ,9 = e − e .
Ý nghĩa P(600 < X < 720) là xác suất để tuổi thọ của thiết bị nằm trong khoảng (600 7 ; 20) là 0 − ,75 0 − ,9 e − e . c) E(X ) 1 = . 0 , 0 0125 −0,0012 . 5 800 1
d) P(X < 800) = F(800) = 1− e = 1 − . e
2.3. Phân phối chuẩn. Phân phối chuẩn tắc. Định nghĩa.
Đại lượng ngẫu nhiên liên tục X được gọi là có phân phối chuẩn với kì vọng µ , (x−µ )2 − ph 1 ương sai 2
σ nếu hàm mật độ của nó có dạng f (x) 2 2σ = e . σ 2π
Kí hiệu X ~ N ( 2 µ;σ ). Chú ý. 54
Chương III. Các quy luật phân phối xác suất thường gặp.
Nếu µ = 0 và σ = 1 thì X ~ N( ) 1 ;
0 , ta nói X có phân phối chuẩn tắc. Tính chất. Cho X ~ N ( 2 µ;σ ). Ta có: a) E(X ) = µ . b) D(X ) 2 = σ . Hàm Gauss. 2 x t 1 Đó là hàm Φ(x) ∫ − =
e 2 dt , hay còn gọi là tích phân Laplace, trong đó: 2π 0 2 1 x + − f (x) 2 = e
gọi là hàm mật độ Gauss. 2π 2 x t 1 + F(x) ∫ − =
e 2 dt gọi là hàm phân phối xác suất Gauss. 2π −∞
Dễ thấy f (x) và F(x) cũng là hàm mật độ và hàm phân phối xác suất của đại lượng
ngẫu nhiên X ~ N( ) 1 ; 0 . Nhận xét:
a) Φ(− x) = −Φ(x), x ∀ ∈ R . 2 1 +∞ t − 2 b) π lim Φ(x) = , do 2 ∫e dt = . x→+∞ 2 2 0 2 c) − f (x) 1 x 2 = e
là hàm số chẵn nên có đồ thị nhận Oy làm trục đối xứng. 2π Định lí.
Cho F(x) là hàm phân phối xác suất của đại lượng ngẫu nhiên X ~ N( ) 1 ; 0 . Ta có 1
a) F(x) = + Φ(x). 2
b) P(α < X < β ) = F(β ) − F(α ) = Φ(β )− Φ(α ).
c) P( X < α ) = Φ 2 (α ), α > 0 . Chứng minh. 2 2 2 x t 0 t x t 1 1 1 1 a) D − −
ễ thấy F(x) = e 2 dt ∫ − = e 2 dt ∫ + e 2 dt ∫ = + Φ(x) 2π 2π 2π 2 −∞ −∞ 0 b) Ta có 55 Bài giảng β 0 β
P(α < X < β ) = ∫ f (x)dx = ∫ f (x)dx + ∫ f (x)dx α α 0 α β
= −∫ f (x)dx + ∫ f (x)dx = Φ(β )− Φ(α ) 0 0
c) Ta có P( X < α ) = P(−α < X < α ) = F(α )− F(−α ) = Φ(α )− Φ(−α ) = Φ 2 (α ). Tính chất. Cho X ~ N ( 2 µ;σ ). Ta có 1  x − µ 
a) F(x) = + Φ  . 2  σ   β − µ   α − µ   β − µ   α − µ 
b) P(α < X < β ) = F  − F  = Φ  − Φ  .  σ   σ   σ   σ   α 
c) P( X − µ < α ) = 2Φ  , α > 0.  σ  Tính chất. Cho Z ~ N( ) 1 ;
0 . Gọi z là số thỏa mãn P(Z > z = ( 0 ≤ α ≤ 1). Ta có α ) α α a) z = −z , trong đó P Z > z = 1 − α − 1 α α − 1 z là số thỏa mãn ( − 1 ) α α 1
b) P(Z > z ) = α 2 (với 0 ≤ α ≤ ) α 2 Chú ý. 2 x t 1 Giá trị hàm Φ(x) ∫ − =
e 2 dt được cho trong Bảng 2. Chẳng hạn Φ( 9 , 1 6) = , 0 475 . Ta 2π 0 quy ước Φ(m) = 5 ,
0 với mọi m ≥ 4 .
Hệ quả. (Quy tắc k -sigma). Nếu X ~ N ( 2
µ;σ ) thì P( X − µ < kσ ) = Φ 2 (k )
Với k = 3, ta có quy tắc 3 -sigma P( X − µ < 3σ ) = 2Φ( ) 3 = 9 , 0 973. Quy tắc này có
nghĩa là sai số giữa X và µ không quá σ
3 là gần chắc chắn. Khi đó, với xác suất 9 ,
0 973 giá trị của đại lượng ngẫu nhiên X nằm trong khoảng (µ − σ 3 ; µ + σ 3 ). Ví dụ 2.2.
Cho đại lượng ngẫu nhiên Z có phân phối chuẩn tắc N( ) 1 ;
0 . Tìm diện tích phần nằm
bên dưới đường cong chuẩn tắc này.
a) Ở bên phải đường thẳng z = 8 , 1 4.
b) Ở giữa hai đường thẳng z = − 9 , 1 7 và z = 8 , 0 6 . 56
Chương III. Các quy luật phân phối xác suất thường gặp. Giải 1 1
a) Ta có diện tích bằng P(Z > 8 , 1 4) = − Φ( 8 , 1 4) = − , 0 467 = , 0 033 . 2 2 b) Ta có diện tích bằng P(− 9 , 1 7 < Z < 8 , 0 6) = Φ( 8 , 0 6) − Φ(− 9 , 1 7) = Φ( 8 , 0 6) + Φ( 9 , 1 7) = 3 , 0 05 + , 0 476 = 7 , 0 81 Ví dụ 2.3.
Cho đại lượng ngẫu nhiên Z có phân phối chuẩn tắc Z ~ N( ) 1 ;
0 . Dựa vào hình vẽ sau,
hãy tìm giá trị k sao cho
a) P(Z > k) = 3 , 0 015.
b) P(k < Z < − 1 , 0 8) = , 0 4197 . Giải 1
a) Dựa vào hình vẽ, ta có: P(Z > k) = 3 , 0 015 = − Φ(k ). 2 Khi đó Φ(k) = 1 ,
0 985 . Từ Bảng 2, ta suy ra k = 5 , 0 2 .
b) Ta có P(k < Z < − 1 , 0 8) = , 0 4197 = Φ(− 1 , 0 ) 8 − Φ(k ) = −Φ( 1 , 0 8) − Φ(k ) Khi đó, Φ(k) = Φ( 1 , 0 8) − ,
0 4197 . Từ Bảng 2, ta có Φ( 1 , 0 8) = 0 , 0 714 . Suy ra Φ(k) = − , 0 0714 − , 0 4197 = − , 0 4911 = −Φ( 3 , 2 7) = Φ(− 3 , 2 7) . 57 Bài giảng Vậy k = 3 , 2 − 7 . Ví dụ 2.4.
Cho đại lượng ngẫu nhiên ngẫu nhiên X có phân phối chuẩn X ~ N ( 2 50 1 ; 0 ). Tìm xác
suất để X nhận các giá trị trong khoảng (45 6 ; 2). Giải
Ta có xác suất cần tìm là P(  −   −  45 < X < 62) 62 50 45 50 = Φ  − Φ  = Φ( , 1 2) − Φ(− , 0 05) = Φ( , 1 2) + Φ( 5 , 0 )  10   10 
Dựa vào Bảng 2, ta tính được Φ( , 1 2) = 3 , 0 849, Φ( 5 , 0 ) = 1 , 0 915 .
Vậy P(45 < X < 62) = 3 , 0 849 + 1 , 0 915 = 5 , 0 764 . Ví dụ 2.5.
Cho đại lượng ngẫu ngẫu nhiên có phân phối N ( 2 5 , 0 ; 1
). Hãy tìm các xác suất sau:
a) P(− 5 ≤ X < , 1 213).
b) P( X −1 < , 0 64). c) P(X < ) 1 , 2 . d) P(X > 3 , 2 ). Giải a) Ta có  −   − − 
P(− 5 ≤ X < , 1 213) , 1 213 1 5 1 = Φ  − Φ  = Φ( , 0 426) − Φ(−12)  5 , 0   5 , 0  = Φ( , 0 426) + Φ(12) ≈ Φ( , 0 426) + Φ(4) 1 ≈ 6 , 1 64 + = 6 , 6 64 2  6 , 0 4 
b) P( X −1 < , 0 64) = 2Φ  = 2Φ( , 1 28) = 2 3 , 0 . 9973 = , 0 79946 .  5 , 0  1  1 , 2 −1 1 1 c) P(X < ) 1 , 2 = + Φ  = + Φ( , 2 2) = + , 0 4861 = 9 , 0 861. 2  5 , 0  2 2 d)   −  P(X > 3 ,
2 ) = 1− P(X ≤ 3 , 2 ) 1 3 , 2 1 = 1 −  + Φ   2  5 , 0  1 = − Φ( ) 1 6 , 2 = − , 0 49534 = 0 , 0 0466 2 2 Ví dụ 2.6.
Đường kính của một loại chi tiết do một máy sản xuất có phân phối chuẩn, kì vọng
20mm và có phương sai ( , 0 mm)2 2
. Tính xác suất lấy ngẫu nhiên một chi tiết 58
Chương III. Các quy luật phân phối xác suất thường gặp.
a) Có đường kính trong khoảng 19 9
, mm đến 20 m 3 , m .
b) Có đường kính sai khác với kì vọng không quá m 3 , 0 m . Giải Gọi 2
X là đường kính của một chi tiết, ta có X ~ N (2 ; 0 ( , 0 2) ). Khi đó a) Ta có  −   −  P(19 9 , < X < 20 3 , ) 20 3 , 20 19 9 , 20 = Φ  − Φ   , 0 2   , 0 2  = Φ( 5 , 1 ) − Φ(− 5 , 0 ) = Φ( 5 , 1 ) + Φ( 5 , 0 ) = , 0 4332 + 1 , 0 915 = , 0 6247
b) Áp dụng công thức, ta suy ra P(   X − µ < 3 , 0 ) 3 , 0 = 2Φ  = 2Φ( 5 , 1 ) = 2 , 0 . 4332 = 8 , 0 664 .  , 0 2  Ví dụ 2.7.
Gọi X là chỉ số thông minh – IQ (Intelligent Quota) của học sinh lứa tuổi 12-15. Giả sử X ~ N (85 2 ; 5).
a) Cho biết chỉ số IQ trung bình của học sinh là bao nhiêu?
b) Tính xác suất chọn được học sinh rất thông minh ( X ≥ 90 ).
c) Tính tỉ lệ học sinh có chỉ số IQ ∈ (80 9 ; 5).
d) Gọi Y là số học sinh có chỉ số IQ ∈ (80 9
; 5) trong lớp có 50 học sinh. Hãy chỉ rõ
phân phối xác suất của Y . Giải
a) Chỉ số IQ trung bình của học sinh là E(X ) = 85 . 1  90 − 85  1
b) P(X ≥ 90) = − Φ  = − Φ( ) 1 = 1− 5 , 0 413 = 1 , 0 587 . 2  5  2
c) Tỉ lệ học sinh có chỉ số IQ ∈ (80 9
; 5) là P(80 < X < 95). Khi đó P(  −   −  80 < X < 95) 95 85 80 85 = Φ  − Φ  = Φ(2) − Φ(− ) 1 = Φ(2) + Φ( ) 1  5   5  = , 0 4773 + 3 , 0 413 = 8 , 0 186 ≈ 8 , 0 2
d) Một lớp gồm 50 học sinh được chọn từ tập hợp học sinh với tỉ lệ
p = P(80 < X < 95) ≈ 8 ,
0 2 được xem là 50 phép thử với xác suất p = 8 , 0 2 . Do đó Y có
phân phối nhị thức B(50 8 , 0 ;
2), tức là: P(Y = m) m m 50−m = C 8 , 0 2 . 1 , 0 8 , m = 5 ; 0 0 . 50 Ví dụ 2.8.
Cho đại lượng X có phân phối chuẩn X ~ N ( 2 ;
5 σ ). Cho biết P(X > 9) = , 0 2 . Tính 2 σ . Giải 59 Bài giảng 1  9 − 5  1  4 
Ta có P(X > 9) = − Φ  = − Φ  . 2  σ  2  σ   4  4
Khi đó P(X > 9) = , 0 2 suy ra Φ  = 3 , 0 hay = 8 , 0 5 . Vậy 2 σ = 22 1 , 4 .  σ  σ
2.4. Phân phối Chi bình phương. Định nghĩa.
Đại lượng ngẫu nhiên X được gọi là có phân phối Chi bình phương ( 2 χ ) với n bậc  x n − −1  2 e . 2 x  , x > 0 t n
ự do nếu hàm mật độ của nó có dạng: f (x) =   n  2 2 . Γ    2    , 0 x ≤ 0 Kí hiệu X 2 ~ χ (n). Các tính chất.
+ Nếu dãy các đại lượng ngẫu nhiên độc lập X , 1 X , K , 2
X là có phân phối chuẩn n tắc thì 2 2 2 X = X L
có phân phối Chi bình phương ( 2 χ ) với 1 + X 2 + + X n bậc tự do. n + Cho X 2 ~ χ (n). Ta có:
a) E(X ) = n .
b) D(X ) = 2n . Chứng minh n x 1 +∞ +∞ − − +∞ 2 2 x e 1 n x
a) Ta có: E(X ) = ∫ xf (x)dx = ∫ x dx = n n ∫ − 2 2 x e dx  n   n  −∞ 0 2 2 Γ  2 2 Γ  0  2   2  n  n  Γ .   x +∞ n 1 1   2 2 −   t n
Đặt: t = . Khi đó E(X ) = 2 . . ∫t 2e dt = .2 Γ .  +1 = 2 = n . 2  n   n   2   n  Γ  0 Γ  Γ   2   2   2 
b) Tương tự, ta chứng minh được +∞ +∞ n x E( 2 X ) 2 + − = ∫ x f (x) 1 1 2 2 dx = . n
∫ x e dx = n(n + 2)  n  −∞ 2 2 0 Γ   2 
Khi đó D(X ) = E(X 2 )− E 2 (X ) = 2n (đpcm) 60
Chương III. Các quy luật phân phối xác suất thường gặp.
2.5. Phân phối Student. Định nghĩa.
Đại lượng ngẫu nhiên liên tục X được gọi là có phân phối Student với n bậc tự do  n +1 n 1 + Γ  2 −    x  2 1 n 2
ếu hàm mật độ của X có dạng: f (x) = . 1  +  n π  n   n  Γ   2 
Kí hiệu: X ~ T (n). Các tính chất.  n +1 n 1 + Γ  2 −    x  2 1 + f (x) 2 = . 1  + 
là hàm số chẵn nên có đồ thị nhận Oy làm trục đối n π  n   n  Γ   2  xứng. + X X ~ N ( ) 1 ; 0 , Y 2
~ χ (n) và X , Y độc lập thì T =
có phân phối T (n), với n bậc tự Y n do.
+ Cho X ~ T (n). Ta có: a) E(X ) = 0 . b) D( ) n X = . n − 2
2.6. Công thức tính gần đúng.
2.6.1. Phân phối siêu bội và phân phối nhị thức. Định lí. Cho M
X ~ H (N; M ; n) . Nếu N khá lớn ( N > 10n ) và p = thì ta có thể coi N  M 
X ~ B n;  .  N  k n−k k n−k .     T C C M M
ức là ta có công thức tính gần đúng M N −M k ≈ C   1 −  . n n C  N   N  N
2.6.2. Phân phối nhị thức và phân phối Poisson. Định lí.
Cho X ~ B(n; p). Nếu p khá bé (gần 0 , ta xem p < 1 ,
0 ) và khi n khá lớn ( n ≥ 30 ) thì k = ;
0 n , ta có thể coi X ~ P(np) . 61 Bài giảng k k n−k
−np (np)k
Tức là ta có công thức gần đúng P(X = k) = C p − ≈ , k = ; 0 n . n (1 p) e k! Nhận xét.
Cho X ~ B(n; p). Nếu p khá lớn (gần 1) và n khá lớn thì k = ;
0 n , ta có thể dùng phân
phối Poisson để tính gần đúng.
Thật vậy, X ~ B(n; p) thì Y ~ B(n 1
; − p), trong đó X là số lần biến cố A xuất hiện và
Y là số lần biến cố A xuất hiện.
Do p khá lớn nên 1− p khá bé. Do dó Y ~ P(n(1− p)). −n(1− p ) e
[n(1− p)]n−k
Khi đó P(X = k) = P(Y = n − k) = . (n − k)! Ví dụ 2.9.
Một cửa hàng sản xuất đĩa nhạc, trung bình sản xuất 1000 đĩa thì có 1 đĩa hỏng. Tìm
xác suất để khi hãng đó sản xuất 3000 đĩa thì có nhiều hơn 5 đĩa không bị hỏng. Giải 999
Xác suất để được đĩa không hỏng trong 1000 đĩa là p = . 1000  999  999
Gọi X là số đĩa không bị hỏng. Ta có X ~ B300 ; 0
 , ta có n = 3000 và p =  1000  1000 khá lớn. 1
Suy ra Y ~ P(λ) với λ = 3000. = 3 . 1000
Do Y = 3000 − X nên ta có 5
P(X > 5) = P(Y ≤ 5) = ∑ P(Y = k ) = 0 , 0 498 + 1 , 0 494 + L + 1 , 0 008 = 9 , 0 2 . k =0
2.6.3. Phân phối nhị thức và phân phối chuẩn. Định lí.
Cho X ~ B(n; p). Nếu p không quá gần 0 và 1, khi đó n khá lớn ( n ≥ 30 , np ≥ 10 ) thì
ta có thể coi X ~ N (np;npq).   1 T k k n−k k − np
ức là ta có công thức gần đúng P(X = k ) = C p 1 , k = ; 0 n , n ( − q)   ≈ f   npq  npq  2 trong 1 x − đó: f (x) 2 = e . 2π Ví dụ 2.10.
Biến cố A: “một anh B yêu một cô gái” có xác suất P(A) = p = , 0 25 không đổi. Tìm
xác suất để khi anh B quen với 243 người cô gái thì có đúng 70 lần biến cố A xảy ra. 62
Chương III. Các quy luật phân phối xác suất thường gặp. Giải.
Chú ý rằng, anh B quen với 243 người là một phép thử độc lập.
Gọi X là số lần biến cố A xảy ra trong 243 phép thử độc lập. Ta có X ~ B(243 , 0 ; 25) .
Do n = 243 > 30 và np = 243 , 0
. 25 > 10 nên ta xem X ~ (np;npq) với np = 243 , 0 . 25 và npq = 243 , 0 . 25 7 , 0 . 5.   V 1 70 − 243. , 0 25 1 ậy P(X = 70)   ≈ f = f ( 3 , 1 7) = 0 , 0 231. 243 , 0 . 25 7 , 0 . 5  243. , 0 25. , 0 75  7 , 6 5 
3. Đại lượng ngẫu nhiên nhiều chiều. 3.1. Khái niệm.
Ở các phần đã học, chúng ta đã xét các đại lượng ngẫu nhiên mà các giá trị có thể của
chúng được biểu diễn bằng một số. Các đại lượng ngẫu nhiên đó được gọi là đại lượng
ngẫu nhiên một chiều. Ngoài các đại lượng ngẫu nhiên một chiều, trong thực tế ta còn
gặp các đại lượng ngẫu nhiên mà các giá trị có thể có của nó được xác định bằng 2 ,
3 , K , n số. Những đại lượng ngẫu nhiên này được gọi là các đại lượng ngẫu nhiên
hai chiều, ba chiều, K, n chiều.
Xét đại lượng ngẫu nhiên hai chiều, kí hiệu là (X ;Y ). Trong đó, X và Y được gọi là
các thành phần của đại lượng ngẫu nhiên hai chiều. Hai đại lượng ngẫu nhiên X và Y
được xét đồng thời tạo nên hệ hai đại lượng ngẫu nhiên. Tương tự như vậy, đại lượng
ngẫu nhiên n chiều có thể xem là hệ của n đại lượng ngẫu nhiên. Ví dụ 3.1.
Một máy sản xuất một loại sản phẩm. Nếu kích thước của sản phẩm được đo bằng
chiều dài X và chiều rộng Y , thì ta có đại lượng ngẫu nhiên hai chiều (X ;Y ), còn nếu
tính thêm cả chiều cao Z nữa thì ta có đại lượng ngẫu nhiên ba chiều (X ;Y; Z ).
Trong thực tế, người ta cũng chia các đại lượng ngẫu nhiên nhiều chiều thành hai loại: rời rạc và liên tục.
Các đại lượng ngẫu nhiên nhiều chiều được gọi là rời rạc nếu các thành phần của nó là
đại lượng ngẫu nhiên rời rạc.
Các đại lượng ngẫu nhiên nhiều chiều được gọi là liên tục nếu các thành phần của nó
là đại lượng ngẫu nhiên liên tục.
Sau đây, ta xét các đại lượng ngẫu nhiên hai chiều.
3.2. Quy luật phân phối xác suất của đại lượng ngẫu nhiên hai chiều.
Đối với đại lượng ngẫu nhiên hai chiều, người ta cũng dùng bảng phân phối xác suất,
hàm phân phối xác suất, hàm mật độ xác suất để thiết lập quy luật phân phối xác suất của chúng.
* Bảng phân phối xác suất của đại lượng ngẫu nhiên hai chiều.
Bảng phân phối xác suất của đại lượng ngẫu nhiên hai chiều (X ;Y ) rời rạc là 63 Bài giảng Y 1 y y … 2 y ∑ h X j 1 p ( 1 x ) 1 x 1 p 1 1 p … 2 p h 1 x 1 p (x2 ) 2 p 21 p … 22 p2h M M M … M M x p p p p 1 (xk ) k k1 k 2 kh ∑ p p p 1 2 ( yh ) 2 ( y2 ) 2 ( 1 y ) i
trong đó p = P X = x ;Y = y là xác suất đồng thời để đại lượng X lấy giá trị x ; ij ( i j ) i i = ;
1 k và Y lấy giá trị y ; j = ;
1 h . Bảng này có thể vô hạn khi k , h nhận giá trị + ∞ . j Các tính chất. a) 0 ≤ p ≤ 1 ij k h b) ∑ ∑ p = 1. ij i 1 = j 1 =
3.3. Hàm phân phối của đại lượng ngẫu nhiên hai chiều.
Xét đại lượng ngẫu nhiên hai chiều (X ;Y ) có thể rời rạc hoặc liên tục. Xét x , y là hai
số thực bất kì, khi đó biến cố (X < x;Y < y) là biến cố để X nhận giá trị nhỏ hơn x , và
Y nhận giá trị nhỏ hơn y .
Hàm phân phối xác suất của đại lượng ngẫu nhiên hai chiều là
F (x; y) = P(X < x;Y < y)
Các phân phối biên của đại lượng ngẫu nhiên hai chiều rời rạc (X ;Y ) là: k
a) Phân phối xác suất của X là P(X = x p . i ) = ∑ ij j=1 h
b) Phân phối xác suất của Y là P(Y = y p . i ) = ∑ ij i=1 Ví dụ 3.2.
Cho bảng phân phối của đại lượng ngẫu nhiên 2 chiều (X ;Y ) như sau Y 1 2 3 X 1 1 , 0 0 , 0 25 1 , 0 0 2 1 , 0 5 , 0 05 3 , 0 5
Tìm bảng phân phối của các đại lượng X và Y sau đó tính F( ) 3 ; 1 , 2 ? Giải.
Lấy tổng hàng và tổng cột tương ứng, ta có các phân phối biên như sau 64
Chương III. Các quy luật phân phối xác suất thường gặp. X 1 2 P(X = x , 0 45 5 , 0 5 i ) và Y 1 2 3 P(Y = y , 0 25 3 , 0 0 , 0 45 j ) 2 3 Ta có: F( 3 ; 1 , 2
) = ∑ ∑ p = p + p + p + p = 1, 0 0 + , 0 25 + 1 , 0 5 + , 0 05 = 5 , 0 5 . ij 11 12 21 22 x <2 1 , y <3 i j 4. Bài tập chương. 1.
Tung hai con xúc xắc đồng thời. Gọi X là tổng số chấm xuất hiện trên hai con xúc xắc
đó. Lập bảng phân phối xác suất của X . 2.
Một đổi tuyển có 3 vận động viên. Xác suất thi đấu thắng trận của từng vận động viên lần lượt là , 0 4 ; 3 , 0 ; ,
0 6 . Mỗi vận động viên thi đấu độc lập một trận với đội bạn.
a) Tìm phân phối xác suất số trận thắng của đội tuyển.
b) Lập hàm phân phối xác suất số trận thắng của đội tuyển.
c) Tìm xác suất đội tuyển thắng ít nhất một trận. 3.
Trong một hộp có chứa 3 bi đỏ và 4 bi đen. Lấy ngẫu nhiên từng viên cho đến khi lấy
được bi đỏ thì dừng. Gọi X là số bi cần lấy. Lập bảng phân phối xác suất của X . 4.
Trong một hộp có 3 bi đỏ và 4 bi đen. Lấy ngẫu nhiên từ hộp ra 2 viên. Nếu được 2
bi đỏ thì bỏ trở lại hộp 4 bi đỏ, nếu được 1 bi đỏ thì bỏ trở lại hộp 2 bi đỏ, nếu có 2
viên đều đen thì thôi. Gọi X là biến ngẫu nhiên chỉ số bi đỏ sau khi thực hiện phép thử.
Lập bảng phân phối của X . 5.
Một hộp đựng 10 sản phẩm tốt, 2 sản phẩm xấu. Lấy ngẫu nhiên từng sản phẩm cho
đến khi lấy ra được sản phẩm tốt. Tìm phân phối xác suất số sản phẩm được lấy ra. 6.
Có hai hộp bi I , II . Hộp I có 8 bi xanh và 2 bi đỏ. Hộp II có 7 bi xanh và 2 bi đỏ.
Từ hộp I lấy ngẫu nhiên 2 bi bỏ vào hộp II , sau đó từ hộp II lấy ra 2 bi.
a) Tìm phân phối xác suất số bi xanh được lấy ra.
b) Lập hàm phân phối xác suất số bi xanh được lấy ra. 7.
Cho X là biến ngẫu nhiên có phân phối xác suất X 1 2 3 4 5 6 7 P a 2a 2a a 3 2 a 2 2a a 2 7 + a a) Xác định a .
b) Tính P(X ≥ 5), P(X < 3). 1
c) Tìm số k nhỏ nhất sao cho P(X ≤ k ) ≥ . 2 8.
Biến ngẫu nhiên rời rạc X có bảng phân phối xác suất X 0 1 2 3 4 P(X ) 0,05 0,2 0,3 0,3 0,15
a) Lập hàm phân phối F (x) và vẽ đồ thị của F(x). 65 Bài giảng
b) Tìm P(0 ≤ X ≤ 2), P(1 < X ≤ )
3 và P(X > 2). 9.
Trong các hàm sau đây, hàm nào là hàm mật độ xác suất:  , 0 x ∉ [ ] 1 ; 0 a) f (x) =  . 3 2 x , x ∈ [ ] 1 ; 0  2 , 0 x <  b) π f (x) =   1 1 2  cos , x ≥  2 x x π
Tìm E(X ), D(X ) , Mod(X ) và Med(X ) của biến ngẫu nhiên X tương ứng.  , 0 x < 2 
10. Cho biến ngẫu nhiên 2
X có hàm phân phối F . X (x ) = (
 x − 2) , 2 < x ≤ 3   , 1 x > 3
a) Tìm hàm mật độ f (x) .
b) Tính P[1 < X < , 1 6].   , 0 x ≤ −1  3 3 1
11. Cho biến ngẫu nhiên X có hàm phân phối F . X (x ) =  x + , −1 < x ≤ 4 4 3  1  , 1 x >  3
a) Tìm hàm mật độ của biến ngẫu nhiên X .
b) Tính P(− 2 < X < 0).  , 0
x ≤ 0 ∨ x > 2 
12. Cho hàm số f (x) =  2 ax , 0 < x ≤ 1 .  2
a(2 − x) , 1 < x ≤ 2
a) Tìm a để f (x) là hàm mật độ.
b) Tìm hàm phân phối tương ứng.   π π 
Acos x, x ∈  − ;    2 2 
13. Cho hàm số f (x) =  .   π π  , 0 x ∉  − ;    2 2 
a) Tìm A để f (x) là hàm mật độ của biến ngẫu nhiên nào đó.  π π 
b) Tìm hàm phân phối F . Tìm P − ≤ X <  . X (x )  6 3   , 0 x < 0
14. Cho hàm f (x) =  .  2 −2 Bx e x , x ≥ 0
a) Xác định để f (x) là hàm mật độ của biến ngẫu nhiên nào đó.
b) Tìm hàm phân phối F . X (x ) 66
Chương III. Các quy luật phân phối xác suất thường gặp. x  − 15. 2θ
Tìm k để hàm f (x) = ke
, x ≥ 0 (θ > 0) là hàm mật độ của biến X nào đó. Tìm  , 0 x < 0
hàm phân phối tương ứng.
16. Cho biến ngẫu nhiên X có hàm phân phối  , 0 x ≤ −2   F (x) 1 1 x =  +
arcsin , − 2 < x ≤ 2 2 π 2  ,1 x > 2
a) Tìm P(−1 < X < ) 1 .
b) Tìm hàm mật độ f (x) .  x − 1  e λ , x , 0 λ 0 17. > >
Cho hàm mật độ của biến ngẫu nhiên X là: f (x) = λ .   , 0 x ≤ 0
a) Tìm hàm phân phối của biến ngẫu nhiên X và tính xác suất P(0 ≤ X < λ) .
b) Tính kì vọng và phương sai của X .
18. Cho biến ngẫu nhiên X có bảng phân phối xác suất: X −1 0 1 2 P 1 , 0 3 , 0 , 0 2 , 0 4
a) Lập bảng phân phối xác suất của biến ngẫu nhiên 2 Y = X + 2008 .
b) Tính E(Y ), D(Y ).
19. Cho P(A) = 8 ,
0 . Tìm xác suất khi thực hiện 100 phép thử thì
a) Số lần xảy ra biến cố A lớn hơn 75.
b) Số lần xảy ra biến cố A không quá 75.
c) Số lần xảy ra biến cố A là nằm trong đoạn [75 9 ; 0].
Đáp số và hướng dẫn. 1. Ta có: X 2 3 4 5 6 7 8 9 10 11 12 P 1 2 3 4 5 6 5 4 3 2 1 36 36 36 36 36 36 36 36 36 36 36 2.
Gọi X là số trận thắng của đội tuyển. a) Ta có: X 0 1 2 3 P 1 , 0 68 , 0 436 3 , 0 24 , 0 072 b)  , 0 x ≤ 0  1, 0 6 , 8 0 < x ≤ 1  f (x) =  , 0 60 , 4 1 < x ≤ 2  9, 0 2 , 8 2 x 3  < ≤  ,1 x > 3 67 Bài giảng
c) Dễ thấy: P(X ≥ )
1 = 1− P(X = 0) = 1− 01 6 , 8 = 8 , 0 32 . 3.
Vì trong hộp có 4 bi đen nên ta chỉ lấy nhiều nhất là 5 bi là được bi đỏ. Bảng phân phối X 1 2 3 4 5 P 3 4 3 4 3 3 4 3 2 3 4 3 2 1 . . . . . . . . . 7 7 6 7 6 5 7 6 5 4 7 6 5 4 4.
Ta có X nhận các giá trị tương ứng là: 3 , 4 , 5 . X 3 4 5 P 2 C 1 1 C . 2 4 C C 3 4 3 2 C 2 2 7 C7 C7 5. Ta có X 1 2 3 P 4 8 1 5 45 45 6. Ta có a) X 0 1 2 P 82 916 1477 2475 2475 2475 7. a) 10 2
a + 9a = 1, a ≥ 0 ⇒ a = 1 , 0 , b) , 0 2 , c) 3 , 0 8. a)  , 0 x ≤ 0   0 , 0 , 5 0 < x ≤ 1 , 0 205 1 x 2 f (x)  < ≤ =   5 , 0 0 , 5 2 < x ≤ 3  8 , 0 0 , 5 3 < x ≤ 4   ,1 x > 4
b) P(0 ≤ X < 2) = P(X = 0) + P(X = ) 1 = ,
0 05 , P(1 < X ≤ )
3 = P(X = 2) + P(X = ) 3 = , 0 65 ,
P(X > 2) = 1 − P(X ≤ 2) = , 0 45. 9.
Cả hai hàm này là hàm mật độ xác suất.  , 0 x < 2 
10. a) f (x) = 2(x − 2), 2 ≤ x ≤ 3 , b) 0   , 0 x > 3   , 0 x ≤ −1  3 1 3
11. a) f (x) =  , −1 < x ≤ , b) P(− 2 < X < 0) = . 4 3 4  1  , 0 x >  3 68
Chương III. Các quy luật phân phối xác suất thường gặp. 3 12. a) a = . 2 1 13. A = . 2 +∞ +∞ 2 −2x 1
14. a) ∫ f (x)dx = 1 ⇒ ∫ Bx e dx = 1 ⇔ B = . 4 −∞ 0 1 15. k = . θ 2  , 0 x ≤ −2  1  1
16. a) P(−1 < X < )
1 = , b) f (x) =  , − 2 < x ≤ 2 . 3 π 4 − 2 x   , 0 x > 2  , 0 x ≤ 0
17. a) F(x) =  x
, b) E(X ) = λ , D(X ) 2 = λ .  − 1 − λ e , x > , 0 λ > 0
18. b) E(Y ) = 2009 9 , , D(Y ) = 9 , 3 .
C. Phương pháp giảng dạy.
- Ứng dụng Excel cho việc tính các giá trị của biến ngẫu nhiên có phân phối chuẩn,
phân phối Poisson, phân phối Student, phân phối chi bình phương.
- Giảng viên gửi bài giảng cho sinh viên đọc trước. Giảng viên trình bày bài giảng trên lớp
theo phương pháp thuyết trình hỏi đáp. Giao bài tập cho sinh viên về nhà làm. Giới thiệu một số tài liệu tham khảo.
D. Tài liệu tham khảo
[1] Đậu Thế Cấp, Xác suất thống kê: Lí thuyết và các bài tập, NXB Giáo dục, 2006.
[2] Đặng Công Hanh, Đặng Ngọc Dục, Giáo trình Lý thuyết xác suất và Thống kê
toán, trường Đại học Duy Tân,1996
[3] PGS. TS. Phạm Xuân Kiều, Giáo Trình xác suất và thống kê, NXB Giáo dục, 2005.
[4] Trần Văn Minh, Phí Thị Vân Anh, Xác suất thống kê, NXB Giao thông vận tải, 2008.
[5] Trần Văn Minh, Phí Thị Vân Anh, Hướng dẫn giải bài tập Xác suất thống kê,
NXB Giao thông vận tải, 2008. 69
Chương IV. Lí thuyết mẫu A. Mục tiêu.
- Giới thiệu các khái niệm: tổng thể, mẫu ngẫu nhiên, mẫu cụ thể, kích thước mẫu.
- Xây dựng các bảng phân phối thực nghiệm và vẽ biểu đồ của chúng.
- Xây dựng hàm phân phối mẫu và giới thiệu đa giác tần suất tích luỹ.
- Giới thiệu các đặc trưng của mẫu:trung bình mẫu, phương sai mẫu chưa hiệu chỉnh
và đã hiệu chỉnh, độ lệch chuẩn mẫu chưa hiệu chỉnh và đã hiệu chỉnh, tỉ lệ mẫu.
- Giới thiệu luật phân phối của các đặc trưng mẫu. B. Nội dung.
1. Tổng thể và mẫu.
1.1. Mở đầu.
Trong thực tế, ta thường phải nghiên cứu một tập hợp các phần tử theo một hay
nhiều dấu hiệu đặc trưng cho các phần tử. Nhưng tập hợp có quá nhiều phần tử thì
không thể nghiên cứu tất cả các phần tử, vì nếu làm như vậy sẽ tốn thời gian, công
sức, … Do đó, người ta thường nghiên cứu một phần, đặc biệt các phương pháp chọn mẫu.
Giả sử ta cần nghiên cứu một tập hợp gồm N phần tử, tập hợp này gọi là tổng thể,
mỗi phần tử của tập hợp này gọi là một cá thể, N gọi là kích thước của tổng thể.
Ta lấy ngẫu nhiên n phần tử, từ tổng thể gọi là một mẫu. Số n gọi là kích thước
mẫu. Từ những thông tin có được trên mẫu này ta suy ra kết luận của tổng thể, do đó
phải lấy mẫu như thế nào để đại diện cho tổng thể. Trong mỗi ngành, mỗi lĩnh vực
có các phương pháp riêng mang tính đặc thù của ngành, để sao cho việc lấy mẫu đại
diện trung thực cho tổng thể. Ví dụ 1.1.
Ta xét bài toán sau: Để có chiến lược cho chương trình dinh dưỡng quốc gia nhằm
tăng chiều cao của người dân, người ta đi tìm chiều cao của những người trưởng thành ở Việt Nam.
Khi đó, trong bài toán này:
a) Tập hợp gồm tất cả những người trưởng thành ở Việt Nam, ta gọi là tổng thể.
b) Mỗi người trong tổng thể, được gọi là một cá thể.
c) Chiều cao của người trong tổng thể là một đại lượng ngẫu nhiên. Bài giảng
d) Do số người trưởng thành ở Việt Nam là rất lớn, nên ta không thể đo chiều cao tất
cả được mà chỉ ra một số người (chẳng hạn 500 người) để đo chiều cao. Tập hợp
500 người này được gọi là một mẫu, số 500 được gọi là kích thước mẫu.
Ta nói rằng một mẫu là ngẫu nhiên nếu trong phép lấy mẫu đó, mỗi phần tử của tổng
thể đều được chọn một cách độc lập và có xác suất được chọn như nhau. Ngoài
phương pháp lấy mẫu ngẫu nhiên, ta còn có các phương pháp lấy mẫu khác nữa như
chọn mẫu với xác suất không đều, chọn mẫu theo nhóm trội, mẫu chùm v.v… Trong
bài giảng này, chúng ta giới thiệu cách lấy mẫu đơn giản nhất và được sử dụng rộng
rãi trong các lĩnh vực khác nhau.
Khi chọn mẫu nếu phần tử đã chọn loại ra khỏi tổng thể mới chọn phần tử tiếp theo
thì gọi là mẫu không hoàn lại, nếu phần tử đã chọn trả lại tổng thể mới chọn phần tử
tiếp theo thì gọi là mẫu có hoàn lại.
Khi kích thước của tổng thể đủ lớn thì có thể coi 2 cách lấy trên là như nhau.
1.2. Mẫu ngẫu nhiên, mẫu cụ thể.
Tiến hành n quan sát độc lập về biến ngẫu nhiên X nào đó trên tổng thể.
Ta gọi X là quan sát thứ i của biến ngẫu nhiên X , i = ; 1 n . i
Khi đó (X ; X ;K; X được gọi là mẫu ngẫu nhiên, trong đó 1 2
X , X , K , X độc n ) 1 2 n
lập và có cùng phân phối xác suất với X .
Ta gọi x là kết quả quan sát thứ i . Khi đó (x ; x ;K; x là n giá trị quan sát được. 1 2 n ) i
Đó là giá trị cụ thể của mẫu ngẫu nhiên (X ; X ;K; X nhận còn được gọi là m 1 2 ẫu n )
cụ thể (hoặc mẫu thực nghiệm). Chú ý.
+ Ta chỉ xét các kết quả quan sát độc lập.
+ Khi xét lí thuyết, ta dùng mẫu ngẫu nhiên, còn khi làm toán thì ta dùng mẫu cụ thể. Ví dụ 1.2.
Xét một tổng thể là một hộp gồm có 10 cây thước, trong đó có 3 cây thước dài 10
cm, 5 cây thước dài 20 cm và 2 cây thước dài 30 cm.
Gọi X là biến ngẫu nhiên đặc trưng cho chiều dài (xét về lượng) của cây thước.
Ta xét tổng thể về mặt định lượng.
Khi đó, X có bảng phân phối như sau: X 10 cm 20 cm 25 cm P 3 5 2 10 10 10
Ta thực hiện việc lấy ngẫu nhiên (có hoàn lại) 5 cây thước. Khi đó Gọi X i = X
i là chiều dài của cây thước được lấy ra lần thứ i , 5 ;
1 thì i có phân phối X 10 cm 20 cm 30 cm i 72
Chương IV. Lí thuyết mẫu. P 3 5 2 10 10 10 Như vậy, X , 1 X , K , 2
X là 5 biến ngẫu nhiên độc lập có cùng phân phối với 5 X .
(X ; X ;K; X là mẫu ngẫu nhiên. 1 2 n )
Ta thực hiện 5 lần lấy cây thước như sau: (x ; x ;K; x là mẫu cụ thể trong 5 lần 1 2 n )
quan sát, chẳng hạn là: X = x = 10cm , = = 10 , = = 30 , 1 1 X x cm 2 2 X x cm 3 3
X = x = 2 c 0 m , = = 30 . 4 4 X x cm 5 5
Vậy (x ; x ;K; x = 10 1 ; 0 3 ; 0 ;20 3 ; 0 . 1 2 n ) ( cm cm cm cm cm)
Bây giờ, ta xét tổng thể về mặt định tính.
Nếu ta xem những cây thước nhỏ hơn 20 cm là “không đạt yêu cầu”.
Lấy ngẫu nhiên 1 cây thước. Gọi X là số cây thước “không đạt yêu cầu”.
Ta có bảng phân phối xác suất của X là X 0 1 P 3 7 10 10
Gọi X là số cây thước “không đạt yêu cầu” khi lấy cây thước thứ i , i = 5 ; 1 . Ta thấy i
các X có cùng phân phối với X . (X ; X ;K; X là mẫu ngẫu nhiên. 1 2 n ) i
Ta xem chiều dài cụ thể của cây thước được lấy ra. Khi đó, chẳng hạn ta có kết quả sau (x ; x ;K;
được gọi là mẫu cụ thể. 1 2 x ) = n ( ) 1 ; 0 ; 0 ; 1 ; 1
1.3. Bảng phân phối tần số.
1.3.1. Phân loại mẫu và bảng phân phối tần số.
Giả sử mẫu (x x ;K; x có kích thước khác nhau khi đó mẫu ; 1 2
n , nếu các x , i = ; 1 n n ) i
gọi là mẫu đơn.
Nếu trong mẫu có k giá trị khác nhau với 1 x xuất hiện 1
n lần, x xuất hiện 2 n lần, 2
…, x xuất hiện n lần thì n + n + L + n = n và n gọi là tần số của x , i = ; 1 n . k k 1 2 k i i
Mẫu có các giá trị giống nhau gọi là mẫu lặp.
Nếu ta xếp x theo thứ tự tăng dần x < x < L < x và lập bảng gồm các x và tần số i 1 2 n i
n tương ứng thì ta được một bảng i X 1 x x … 2 x k Tần số 1 n n … 2 n k
gọi là bảng phân phối tần số. 73 Bài giảng
Trong trường hợp mẫu có kích thước lớn các giá trị của X khác nhau không nhiều,
để tiện lợi cho việc tính toán ta phân miền giá trị của X thành k khoảng (có thể chia
đều hoặc không đều) [a ; ; [a ;
; K ; [a ;a và nếu có n giá trị của mẫu k 1 − k ) 1 a2 ) 0 1 a ) i
xuất hiện trong khoảng [a ; ; thì bảng 0 1 a ) i = ; 1 k X [a ; [a ; … [a ;a k 1 − k ) 1 a2 ) 0 1 a ) Tần số 1 n n … 2 n k
gọi là bảng phân phối tần số phân lớp.
Ta quy ước đầu mút bên trái của một khoảng thuộc khoảng đó khi tính tần số của mỗi lớp. Ví dụ 1.3.
Thống kê cân nặng X của 370 trẻ sơ sinh, ta được bảng phân phối tần số phân lớp sau 0 , 3 − , 3 , 3 2 − , 3 4 X , 2 4 − 6 , 2 6 , 2 − 8 , 2 8 , 2 − 0 , 3 2 , 3 4 − 6 , 3 Tần số 6 44 76 100 95 49
Thông thường, người ta chia số liệu thành từ 5 đến 15 lớp. Nếu số lớp nhiều hơn có
thể giúp phân tích tốt hơn, nhưng sự cải thiện không nhiều, nếu số lớp ít quá, thì các
thông tin có thể bị mất khi xử lí.
Một bảng phân phối tần số phân lớp có thể đưa về bảng phân phối lặp bằng phép lấy
trung bình cộng của mỗi lớp. Ví dụ 1.4.
Xét Ví dụ 1.3, ta có: X 5 , 2 7 , 2 9 , 2 1 , 3 3 , 3 5 , 3 Tần số 6 44 76 100 95 49
1.3.2. Bảng phân phối tần suất. T n
ừ bảng phân phối, nếu ta đặt f i = , i = ;
1 k thì f được gọi là tần suất xuất hiện i n i của x , i = ; 1 k . Khi đó, bảng i x x … x i 1 x 2 k Tần suất f 1 f … 2 f k
được gọi là bảng phân phối tần suất, nó rất giống với bảng phân phối xác suất của
một biến ngẫu nhiên rời rạc.
Để có được một hình dung về phân phối mẫu, người ta thường dùng đồ thị để biểu
diễn bảng phân phối tần suất.
1.3.3. Đa giác tần suất
Trên đồ thị, nối các điểm có tọa độ (x ; f , i = ;
1 k ta được đường gấp khúc gọi là đa i i )
giác tần suất. 74
Chương IV. Lí thuyết mẫu.
1.3.4. Biểu đồ tần số.
Nếu mẫu cho bằng các khoảng phân lớp, ta xây dựng một biểu đồ gồm các hình chữ
nhật cạnh nhau có đáy bằng độ dài của khoảng phân lớp và có diện tích bằng tần số
của lớp và gọi là biểu đồ tần số.
Sau đây, là bảng phân phối tần suất, đa giác tần suất và biểu đồ tần số của Ví dụ 1.3. X 5 , 2 7 , 2 9 , 2 1 , 3 3 , 3 5 , 3 Tần số 6 44 76 100 95 49 Tần suất 0,162 0,119 0,205 0,270 0,257 0,132 0.3 0.25 0.2 t ấ u 0.1 s5 n ầ T0.1 0.05 0 2,5 2,7 2,9 3,1 3,3 3,5 x Đa giác tần suất 120 100 80 60 40 20 0 1 Biểu đồ tần số 75 Bài giảng
1.4. Hàm phân phối mẫu.
Với ĐLNN X , ta không thể biết được hàm phân phối xác suất F(x) của nó. Tuy
nhiên từ một mẫu thống kê (x ; x ;K; x của 1 2
X dựa vào bảng phân phối tần suất ta n )
có thể thu được những thông tin quan trọng về F(x).
Từ bảng phân phối tần suất, ta xây dựng hàm F như sau: F x f . Hay n ( ) = ∑ n (x ) i x <x i  , 0 x ≤ x1   f ,
x < x ≤ x 1 1 2  f + f ,
x < x ≤ x 1 2 2 3 F x n ( ) =  K K K
 f + f +L+ f , x < x ≤ x  1 2 n−1 n−1 n  ,1 x > xn F
được gọi là hàm phân phối thực nghiệm hoặc phân phối mẫu. n (x )  k 
Trên đồ thị, nối các điểm có tọa độ  x ; f , i = ;
1 k ta được được đường gấp khúc i ∑   i i=1 
gọi là đa giác tần suất tích lũy.
Sau đây, là biểu đồ đa giác tần suất tích lũy Ví dụ 1.1. 1.2 1 0.8 Y 0.6 0.4 0.2 0 2.5 2.7 2.9 3.1 3.3 3.5 3.7 3.9 X
Biểu đồ đa giác tần suất tích lũy.
2. Các tham số đặc trưng của mẫu
2.1. Tỉ lệ mẫu.
Ta gọi hàm phân phối xác suất của biến ngẫu nhiên này là hàm phân phối mẫu; kì
vọng, phương sai của biến ngẫu nhiên là trung bình mẫu và phương sai mẫu. Khi đó, ta có: 76
Chương IV. Lí thuyết mẫu.
Trung bình mẫu:
x n + x n + L + x n
x = x f + x f + L + x f 1 1 2 2 k k = 1 1 2 2 k k n
Phương sai mẫu: 2 2 2 s 2 ˆ = (x − x L 1
) f1 + (x − x 2
) f2 + + (x − x k ) fk ( 2 2 2 x − x L 1
) n1 + (x − x 2
) n2 + + (x − x k ) nk = n
x 2n + x 2n + L x 2n Đặt: x2 +
= x 2 f + x 2 f + L + x 2 f 1 1 2 2 k k . 1 1 2 2 = k k n k 2 ∑n x2 − n i i (x) Theo tính ch 2
ất phương sai, ta có s2 ˆ = x2 − (x) i 1 = = . n
Phương sai mẫu hiệu chỉnh: L 2 n 2 (x − x)2 1 1
n + (x − x)2 2 n2 + + (x − x k )2n s = ˆs = k . n − 1 n − 1
Tương tự với biến ngẫu nhiên, ta gọi 2
ˆs = ˆs là độ lệch mẫu và 2 s =
s là độ lệch mẫu hiệu chỉnh.
Để tính các đặc trưng này, ta thường lập bảng sau x n x n x 2n i i i i i i 2 1 x 1 n 1 x 1 n 1 x 1 n x 2 2 n 2 x 2 n2 x 2 n2 … … … … x n x n x2n k k k k k k ∑ n nx 2 nx k ∑ k x n ∑ x2n i i i i T n
ừ bảng này, ta có x i= = 1 , x2 i= = 1 , 2
ˆs = x − (x)2 2 và 2 2 s = ˆs . n n n −1 Ví dụ 2.1. Cho mẫu x 5 10 15 20 25 i n 15 25 30 20 10 i
a) Viết hàm phân phối mẫu.
b) Tính trung bình mẫu, phương sai mẫu, phương sai mẫu hiệu chỉnh. Giải. 77 Bài giảng
a) Bảng phân phối xác suất X 5 10 15 20 25 Tần suất 1 , 0 5 , 0 25 3 , 0 0 , 0 20 1 , 0 0
Từ đó, ta có hàm phân phối là:  , 0 x ≤ 5   1 , 0 , 5 5 < x ≤ 10  , 0 4 , 5 10 < x ≤ 15 F n (x ) =   7 , 0 , 0 15 < x ≤ 20  9 , 0 , 0 20 < x ≤ 25   ,1 x > 25 b) Ta có bảng tính x n x n x2n i i i i i i 5 15 75 375 10 25 250 2500 15 30 450 6750 20 20 400 8000 25 10 250 6250 ∑ 100 1425 23875 Từ bảng, ta có: 1425 2 23875 x = = 1 , 4 25; x = = 238 7 , 5 ; 100 100 2 n 2 100 ˆ2
s = x − (x)2 2 = 238 7 , 5 − (1 , 4 25)2 = 3 , 5 6875 ; s = ˆs = .35 6 , 875 = 36 0 , 480 . n − 1 99 Ví dụ 2.2.
Theo dõi số lượng bài tập ở một nhóm gồm 100 sinh viên giải trong một tuần, ta thu
được bảng số liệu sau: Tổng số 41 44 45 46 48 52 54 bài tập Số sinh viên 10 20 30 15 10 10 5 hoàn thành
a) Tính trung bình mẫu, phương sai mẫu chưa hiệu chỉnh, phương sai mẫu hiệu chỉnh.
b) Những sinh viên thực hiện xong một phép toán toán lớn hơn 48 bài là những sinh
sinh viên có tốc độ làm bài tập nhanh. Tính tỉ lệ sinh viên có tốc độ làm bài tập nhanh?
c) Tính trung bình mẫu, phương sai mẫu hiệu chỉnh của những học sinh viên có tốc độ làm bài tập nhanh. Giải. a) Ta lập bảng như sau: x n x n x 2n i i i i i i 78
Chương IV. Lí thuyết mẫu. 41 10 141 16810 44 20 880 38720 45 30 1350 60750 46 15 690 31740 48 10 480 23040 52 10 520 27040 54 5 270 14580 ∑ 100 4600 212680
Dựa vào bảng trên, ta có 4600
Số bài tập trung bình: x = = 46 bài. 100 2 2 2 212680
Phương sai mẫu chưa hiệu chỉnh: ˆs = x − (x) = − (46)2 = 10 8 , . 100 2 n 2 100
Phương sai mẫu hiệu chỉnh là: s = ˆs = .10 8 , = 10 9 , 09 . n −1 99 10 + 10 + 5
b) Tỉ lệ mẫu là f = = , 0 25 . 100 c) Ta có bảng x n x n x 2n i i i i i i 48 10 480 23040 52 10 520 27040 54 5 270 14580 ∑ 25 1270 64660 Khi đó, ta có: 1270 2 1 2 x = = 50 8 , , s = (64660 − 25 (.50 8,) )= 6. 25 n − 1
2.2. Số mốt (Mode) của mẫu.
Số mốt của mẫu ngẫu nhiên X , kí hiệu là Mod(X ), được xác định như sau: Nếu
mẫu được cho dưới bảng phân phối tần số thì Mode là giá trị có tần số lớn nhất.
Đối với trường hợp mẫu được cho dưới dạng bảng phân phối tần số phân lớp,
người ta định nghĩa khoảng Mode là khoảng có diện tích của hình chữ nhật dựng
trên khoảng đó là lớn nhất.
Mode là một chỉ tiêu thường được chú ý trong các bài toán về kinh tế. Chẳng hạn
một nhà máy sản xuất ô tô Civic muốn có một số lượng ô tô đủ đáp ứng nhu cầu của
người cần mua thì phải chú ý đến ô tô loại gì mà khách hàng thường hay hỏi mua nhất.
2.3. Số trung vị (Median) của mẫu.
Trung vị của một mẫu số liệu, kí hiệu bởi Med(X ), là một số có tính chất sau: Số
các giá trị của mẫu bé hơn hoặc bằng Med(X ) thì bằng số các giá trị của mẫu lớn
hơn hoặc bằng Med(X ). 79 Bài giảng
Xét trường hợp các giá trị của mẫu là phân biệt. Giả sử các giá trị của mẫu được sắp
xếp theo thứ tự tăng dần x < x < L < x . 1 2 n
Khi đó, dễ thấy nếu n lẻ thì lấy Med(X ) = x . n 1 + 2   1
Nếu n chẵn thì ta lấy Med(X )   =  x + x . n n  2  +1 2 2 
Trong trường hợp giá trị x có tần số n , gọi k là chỉ số bé nhất sao cho i i n L
. Lúc đó, ta định nghĩa Med(X ) . 1 n + n2 + + n ≥ = n k 2 k Ví dụ 2.3. Cho mẫu Tổng số 41 44 45 46 48 52 54 bài tập Số sinh viên 10 20 30 15 10 10 5 hoàn thành
Ta có n = 100. n 10 , n 20 , n 30 , n 15 , n 10 , n 10 , n 5. 1 = 2 = 3 = 4 = 5 = 6 = 7 = 100
Dễ thấy: số sinh viên hoàn thành ít hơn hoặc bằng 44 bài là n + n = 30 1 2 < 2 100
và số sinh viên hoàn thành ít hơn hoặc bằng 45 bài tập là n + n + n = 60 . 1 2 3 > 2
Vậy Med(X ) = 45 .
Trong trường hợp mẫu được cho dưới dạng bảng phân phối tần số phân lớp, ta định
nghĩa khái niệm trung vị như sau:
Giả sử, ta có m khoảng với các điểm chia là a < a < L < a , với C = a ; , 1 [ 0 1 a ) 0 1 m C = a ;
, K, C = a ;a , trong đó khoảng C có tần số là r , m [ m 1− m ) 2 [ 1 a2 ) i i
n + n + L + n = n . 1 2 m
Khoảng C được gọi là khoảng trung vị nếu k là số bé nhất sao cho k n L . 1 n + n2 + + n ≥ k 2
Số trung vị Med(X ) là số mà tại đó, đường thẳng x = m chia đôi diện tích của biểu
đồ tần số. Rõ ràng, số trung vị luôn luôn nằm trong khoảng trung vị. Ví dụ 2.4.
Tìm khoảng trung vị và số trung vị cho Ví dụ 1.3. Giải 370 Ta có 6 + 44 + 76 = 126 <
< 6 + 44 + 76 + 100 = 226 nên khoảng trung vị là 2 ( , 3 ; 0 , 3 2). 80
Chương IV. Lí thuyết mẫu. 100
Để tính số trung vị, ta nhận thấy: chiều cao của khoảng trung vị này là = 500 . , 0 2
Khi đó, ta chia hình chữ nhật dựng trên khoảng này là thành 2 phần có diện tích
phần bên trái là 185 −126 = 59 . 59 59
Ta có 500.AM = 59 hay AM =
. Vậy số trung vị Med(x) = 0 , 3 + . 500 500 C A B M
Hoặc ta có thể tính như sau:
Hình chữ nhật có diện tích phần bên phải là 226 −185 = 41. 41
Ta có 500.BM = 41 hay BM = . 500 41
Vậy số trung vị là Med(x) = , 3 2 − 500
Dựa vào bài toán này, ta có nhận xét sau. Nhận xét. k  n 
 ∑ n −  a − a i ( k k 1 ) Ta ch   ứng minh được 1 = 2 − Med (X ) i = a −
là số trung vị, trong đó k nk C = a
; a là khoảng trung vị. k [ k 1− k )
2.4. Các quy luật phân phối mẫu.
Người ta chứng minh được các kết quả sau: Định lí.
Cho X tuân theo phân phối chuẩn N( 2 µ;σ ) thì a) Nếu biết 2 σ thì  2 σ  + X ~ Nµ;  .  n 
+ X − µ . n ~ N( ) 1 ; 0 . σ b) Nếu chưa biết 2 σ thì + X − µ n ≤ 30 , ta có
. n ~ T (n − ) 1 . S 81 Bài giảng + X − µ n > 30 , ta có . n ~ N ( ) 1 ; 0 . S n ∑( 2 X − µ i )
c) Nếu biết µ thì i 1= 2 ~ χ (n). 2 σ
∑n(X − X i )2
d) Nếu chưa biết µ thì i 1= ~ 2 χ (n − ) 1 . 2 σ Chú ý.
Nếu không biết phân phối của biến ngẫu nhiên X nhưng với kích thước mẫu n > 30 ,
khi đó ta xem biến ngẫu nhiên X có phân phối chuẩn N( 2 µ;σ ). 82 3. Bài tập chương. 1.
Trọng lượng của 100 trẻ em của một trường mẫu giáo ghi nhận được như sau: Trọng lượng (kg) 41 44 45 46 48 52 54 Số trẻ em 10 20 30 15 10 10 5
a) Hãy xác định x là trọng lượng trung bình của các sinh viên và độ lệch mẫu hiệu chỉnh s .
b) Hãy xác định bảng phân phối xác suất. 2.
Kết quả thi học kì môn toán A1 của một khối sinh viên khóa 14 gồm 72 bạn như sau: Điểm 3 5 6 8 9 Số sinh viên 40 15 5 10 2
a) Hãy lập bảng phân phối tần số của các kết quả này.
b) Lập bảng phân phối tần suất và vẽ đa giác tần suất. 3.
Thống kê cân nặng của 400 trẻ sơ sinh, ta được bảng phân phối tần số phân lớp sau , 3 2 − , 3 X , 2 4 − 6 , 2 6 , 2 − 8 , 2 8 , 2 − 0 , 3 0 , 3 − , 3 2 , 3 2 − , 3 4 4 6 , 3 − 8 , 3 Tần số 6 44 76 100 95 30 49
a) Lập bảng phân phối tần số không phân lớp.
b) Lập bảng phân phối tần suất, vẽ đa giác tần suất và biểu đồ tần số.
c) Lập hàm phân phối mẫu và vẽ đa giác tần suất tích lũy.
d) Tìm Mod(X ) , xác định khoảng trung vị. 4.
Giá của một loại cổ phiếu bán trên thị trường chứng khoáng trong 100 phiên giao dịch được cho ở bảng sau Giá cổ phiếu 13 −15 15 −17 17 −19 19 − 21 21 − 23 (1000đ) Số phiên giao 5 18 42 27 8 dịch
Hãy tính các giá trị x , phương sai mẫu 2 ˆs , 2 s . 5.
Tuổi của 70 nhân viên trong một cơ quan được ghi lại như sau: Khoảng Tần số Dưới 20 7 20-30 13 30-40 26 40-50 15 50-60 6 Trên 60 3
Tìm khoảng trung vị, số trung vị, khoảng Mod. 6.
Để nghiên cứu nhu cầu tiêu thụ sữa hộp trong một khu vực, người ta tiến hành khảo sát
800 gia đình. Kết quả được cho ở bảng dưới đây: Nhu cầu (hộp/tháng) Số gia đình Nhu cầu (hộp/tháng) Số gia đình 30-34 35 55-59 142 35-39 48 60-64 94 40-44 83 65-70 50 45-49 159 70-74 10 50-54 189
b) Tìm số hộp sữa tiêu thụ trung bình.
Chương IV. Lí thuyết ước lượng
c) Tìm khoảng trung vị, số trung vị. 7.
Khi kiểm tra thể lực một nhóm sinh viên, ta có kết quả về cân nặng như sau: x 42 5 , − 47 5 , 47 5 , − 52 5 , 52 5 , − 57 5 , 57 5 , − 62 5 , 62 5 , − 67 5 , i (kg) Số 8 14 28 18 12 sinh viên n i
a) Tính x là cân nặng trung bình cho các sinh viên và tính độ lệch mẫu.
b) Lập bảng phân phối xác suất mẫu. 8.
Điều tra năng suất lúa trên diện tích 100 ha trồng lúa của một vùng, ta thu được bảng số liệu sau. Năng suất (tạ/ha) 41 44 45 46 48 52 54 Số ha có năng suất 10 20 30 15 10 10 5 tương ứng
a) Tính trung bình mẫu, phương sai mẫu, phương sai mẫu hiệu chỉnh.
b) Những thửa ruộng có năng suất từ 48 tạ trở lên gọi là những thửa ruộng có năng suất cao.
Tính tỉ lệ thửa ruộng có năng suất cao.
c) Tính trung bình mẫu, phương sai mẫu hiệu chỉnh của những thửa ruộng có năng suất cao.
C. Phương pháp giảng dạy.
- Phối hợp phương pháp thuyết trình và vấn đáp giải quyết vấn đề.
- Đưa ví dụ cụ thể để nêu rõ ý nghĩa của việc chọn mẫu.
- Từ trực quan sinh động đến tư duy trừu tượng. Áp dụng một số ví dụ thực tế.
- Yêu cầu SV đọc bài giảng trước khi lên lớp.
- Kiểm tra, đánh giá việc làm bài tập của SV.
- Sử dụng phương tiện dạy học hiện đại như Mic.
D. Tài liệu tham khảo
[1] Đậu Thế Cấp, Xác suất thống kê: Lí thuyết và các bài tập, NXB Giáo dục, 2006.
[2] Đặng Hùng Thắng, Thống kê và ứng dụng, NXB Giáo dục, 2008.
[3] PGS. TS. Phạm Xuân Kiều, Giáo Trình xác suất và thống kê, NXB Giáo dục, 2005.
[4] Trần Văn Minh, Phí Thị Vân Anh, Xác suất thống kê với các tính toán trên
Excel, NXB Giao Thông Vận tải, 2008.
[5] Đặng Công Hanh, Đặng Ngọc Dục, Giáo trình Lý thuyết xác suất và Thống kê
toán, trường Đại học Duy Tân,1996
[6] Trần Văn Minh, Phí Thị Vân Anh, Hướng dẫn giải bài tập Xác suất thống kê với
các tính toán trên Excel, NXB Giao Thông Vận tải, 2008. 84 Chương V.
Lí thuyết ước lượng A. Mục tiêu.
- Giới thiệu các khái niệm ước lượng: ước lượng điểm, ước lượng khoảng.
- Giới thiệu các loại ước lượng điểm: ước lượng không chệch, ước lượng hiệu quả, ước lượng vững.
- Giới thiệu các phương pháp ước lượng khoảng cho: kì vọng, phương sai, tỉ lệ. B. Nội dung.
Xét một tổng thể Ω và giả sử ta quan tâm đến biến lượng X đo lường một dấu hiệu
nào đó của tổng thể Ω . Khi đó X được coi là đại lượng ngẫu nhiên. Phân phối xác
suất của X thường rất khó nắm bắt, và thông thường ta giới hạn ở việc xác định một
số các tham số đặc trưng của X như các giá trị: E(X ), D(X ), Med(X ), Mod(X ), …
Các tham số này không thể xác định chính xác được (nếu không biết phân phối của
X ), mà phải ước lượng từ các giá trị của X trên một mẫu chọn ngẫu nhiên. Như vậy,
bài toán ước lượng tham số được phát biểu như sau:
Giả sử X là một đại lượng ngẫu nhiên có tham số đặc trưng θ nào đó (chưa biết) mà
ta quan tâm. Vấn đề đặt ra là: Căn cứ trên n giá trị 1 x , x , K , 2
x của X đo được trên n
một mẫu kích thước n được lấy từ tổng thể Ω , cần tìm một giá trị gần đúng θˆ của θ .
1. Ước lượng điểm. Định nghĩa. Một hàm ˆ θ T x ; x ;K =
; x của n giá trị
x , K , x được gọi là một ước lượng n ( 1 2 n ) 1 x , 2 n
điểm cho θ .
Như vậy, một ước lượng θˆ = T là một hàm của n đại lượng ngẫu nhiên X , X , K, n 1 2
X nên nó cũng là đại lượng ngẫu nhiên. Có nhiều hàm ước lượng ˆ θ T x ; x ;K = ; x n ( 1 2 n ) n
của tham số θ khác nhau. Tuy nhiên, việc lựa chọn một ước lượng nào là “tốt” được
dựa vào các tiêu chuẩn dưới đây. Định nghĩa. Hàm ước lượng ˆ θ T x ; x ;K =
; x được gọi là ước lượng không chệch nếu (θˆ E )= θ . n ( 1 2 n ) Bài giảng
Từ định nghĩa, ta thấy nếu ˆ θ T x ; x ;K =
; x là hàm ước lượng không chệch của θ n ( 1 2 n )
thì E(ˆθ −θ )= 0 .
Tính chất không chệch có nghĩa là ước lượng θˆ không có sai số hệ thống. Định nghĩa. Hàm ước lượng ˆ θ T x ; x ;K =
; x được gọi là ước lượng vững nếu với mọi ε > 0 thì n ( 1 2 n ) E( ˆ lim θ − θ < ε )= 1 hay E( ˆ lim
θ − ε < θ < θ + ε ) = 1. n→+∞ n→+∞
Tính chất vững đảm bảo cho ước lượng θˆ gần θ tùy ý với xác suất cao (gần 1) khi
kích thước mẫu n đủ lớn. Định nghĩa.
Ước lượng θˆ được gọi là một ước lượng hiệu quả của θ nếu nó là một ước lượng (θˆ D )
không chệch và có phương sai nhỏ nhất.
2. Ước lượng khoảng.
Ước lượng điểm dù tốt nhất cũng chỉ cho ta một giá trị trong tập vô hạn nên ta không
biết được độ chính xác cũng như xác suất để điểm ước lượng có độ chính xác, do đó
không đánh giá được sai lầm khi dùng θˆ thay cho θ .
Để khắc phục hạn chế đó, người ta đưa ra ước lượng khoảng tin cậy cho tham số θ ,
nghĩa là dựa vào một ước lượng θˆ , tìm một khoảng (θ ; với 1 θ 2 ) θ , 1 θ là hai 2 ước
lượng điểm của tham số θ sao cho P(θ < θ < θ . 1 2 ) = γ = 1 − α
Trong đó γ = 1−α là xác suất cho trước gọi là độ tin cậy của khoảng ước lượng, do đó
α là khả năng mắc sai lầm của khoảng ước lượng còn (θ ; gọi là khoảng tin cậy 1 θ 2 ) và θ được gọi là 2 − θ1
độ dài của khoảng tin cậy.
Ý nghĩa của khoảng tin cậy là ở chỗ có thể nói trong 100% trường hợp lấy mẫu khoảng (θ ; chứa tham số có thể tin cậy ở 1 θ 2 )
θ chưa biết thì khẳng định θ1 < θ < θ2 mức γ .
Để ước lượng một tham số θ , ta thực hiện quy tắc sau:
+ Chọn một hàm G G(X ; X ;K =
; X ;θ sao cho phân phối của 1 2
G xác định hoàn toàn n )
(không chứa tham số θ nữa).
+ Khi đó với độ tin cậy γ = 1− α cho trước, ta tìm cặp giá trị α 0 , α 0 sao cho 1 > 2 >
α + α = α và tương ứng với chúng là 1 2
các phân vị thỏa mãn điều kiện
P(G > g ) = α và P(G > g
= 1 − α ( P(G < g = α ) 1 α − ) 1 α − ) α 1 1 2 2 2 2 Khi đó, P(g
< G X ; X ;K; X ; < g = 1 − − = 1 − . 1 α − ( θ 1 2 n ) α ) α α α 1 2 2 1
+ Dùng các phép biến đổi tương đương, ta đưa bất đẳng thức trên về dạng P(θ < θ < θ . 1 2 ) = 1 − α 86
Chương V. Lí thuyết ước lượng Nhận xét. α 1 Trong Ch − γ
ương này, chúng ta chỉ xét trường hợp α = α . 1 2 = = 2 2
2.1. Ước lượng khoảng tin cậy cho kì vọng
Giả sử đại lượng ngẫu nhiên X có phân phối chuẩn X ~ N ( 2
µ;σ ) với tham số θ = µ
chưa biết. Từ một mẫu cụ thể (x ; x ;K; x của 1 2
X . Bài toán đặt ra là tìm khoảng tin n )
cậy cho E(X ) = µ .
2.1.1. Đã biết phương sai 2 2 σ = σ . 0 Ta ch X − µ
ọn hàm: G = Z =
n . Do X ~ N ( 2
µ;σ ) nên Z ~ N ( ) 1 ; 0 . σ 0   α     α P Z > z =    và P Z > z = 1 − . Dễ thấy z = −z . α  2  α  α α  1− 2 1− 2   2  2 2 Khi σ σ
đó − z < Z < z hay 0 0 X − z < µ < X + z . α α α α 2 2 n 2 n 2       Lại có       P − z < Z < z
= 1 − P Z < −z − P Z > z = 1 − α  . α α   α   α   2 2   2   2    Suy ra   P − z < Z < z = 1 − α  . α α   2 2    V σ σ ậy  P X − 0 z < µ 0  < X + z = 1 − α  . α α   n 2 n 2    Kho σ σ
ảng ước lượng tin cậy cho kì vọng là  0 0   X − z ; X + z
, trong đó z được α α  α  n 2 n 2  2   2 α 1 m t xác γ định từ công thức   Φ z = 1 − − = 2  với Φ(m) ∫ − = e dt . α  2 2 2  2  0 σ Đại lượng 0 ε =
z được gọi là độ chính xác của ước lượng, nó phản ánh độ lệch α n 2
trung bình của trung bình mẫu so với kì vọng lí thuyết với độ tin cậy γ = 1− α . 2 Khi σ
đó, độ dài khoảng tin cậy là 0 2ε = z . α n 2 Ví dụ 2.1.
Giả sử X là trọng lượng của em nam ở lứa tuổi lên 10 thuộc 4 quận ở thành phố Hà
Nội. Ta muốn biết E(X ), trọng lượng trung bình của các em nam ở lứa tuổi lên 10
thuộc 4 quận ở thành phố Hà Nội. Vì điều kiện về tài chính, thời gian nên ta không thể
lấy trọng lượng của mọi em trong khu vực này, ta chọn ngẫu nhiên 50 em. Qua trọng 87 Bài giảng
lượng của 50 em này, ta xác định được X = 32 kg. Giả sử phân phối của X có độ lệch tiêu chuẩn σ = 5 ,
2 kg (đã biết). Vậy, với độ tin cậy là γ = 95% , ta có thể nói trọng
lượng trung bình E(X ) nằm trong khoảng nào? Xét trường hợp trên với độ tin cậy γ = 95% . Giải Ta có σ = 5 , 2 đã biết.
Với độ tin cậy γ = 95% , ta có α = 5% . Khi đó z = 9 ,
1 6 . Khi đó, khoảng ước lượng tin α 2    5 , 2 5 , 2  c σ σ
ậy cho kì vọng E(X ) là  0 0   x − z ; x + z hay , 3 2 − . 9 , 1 6 , 3 ; 2 + 9 , 1 . 6 . α α     n  50 50  2 n 2  Ví dụ 2.2.
Một thầy giáo muốn ước lượng điểm môn Toán của toàn bộ sinh viên Đại học A. Giả
sử điểm môn Toán của sinh viên tuân theo phân phối chuẩn với σ 3 , 0 điểm. Thầy 0 =
giáo kiểm tra lớp có 100 sinh viên và biết được điểm môn Toán của 100 bạn này là như sau: Điểm 3 5 6 8 Số sinh viên 20 30 40 10
a) Ước lượng điểm trung bình môn Toán của toàn sinh viên Đại học A với độ tin cậy là 95% .
b) Với độ chính xác của ước lượng là ,
0 25 . Hãy xác định độ tin cậy. Giải. 530
a) Dựa vào bảng, ta có x = = 3 , 5 , σ 3 ,
0 , n = 100 , γ = 95% suy ra α = 0 , 0 5 và 100 0 = z = 9 , 1 6 . α 2   Khi σ σ
đó, khoảng ước lượng điểm trung bình là  0 0   x − z ; x + z α α   − 1 − 1 n 2 n 2  Hay (52 9 , 41 5 ; , 3 059). b) Ta có σ 0 n ε = z = , 0 25. Suy ra z = , 0 25 = 8 , 0 33 . α α n σ 2 2 0   Khi α 1 1 α đó, từ công thức   Φ z = 1 − − = −  ta có γ = 2Φ( 8 , 0 3 ) 3 ≈ 5 , 0 94 . α  2 2 2 2  2 
Vậy độ tin cậy là γ = 5 , 9 4% .
2.1.2. Chưa biết phương sai 2 σ .
Tương tự như trên, ta thay 2 σ bằng ph 0
ương sai mẫu hiệu chỉnh 2 s 88
Chương V. Lí thuyết ước lượng Ta ch X − µ
ọn hàm G = T = n . S
Ta xét 2 trường hợp sau: TH1. n ≤ 30 . Khi X − µ
n ≤ 30 thì hàm G = T =
n có phân phối Student với n −1 bậc tự do. Do T S có hàm m S S
ật độ đối xứng nên tương tự câu a), ta được X − t < µ < X + t . α α n− ; 1 n− ; 1 n 2 n 2   Kho S S
ảng ước lượng tin cậy cho kì vọng là    X − t ; X + t , trong đó t α α  α  n− ; 1 n− ; 1 n n− ; 1 2 n 2  2  
được xác định từ công thức   P T > t = α  . α   n; 2  Chú ý: t = −t . α α n− 1 ; 1 − n− ; 1 2 2 TH 2. n > 30 . Khi X − µ
n > 30 thì hàm G = T =
n có phân phối tiệm cận chuẩn N ( ) 1 ; 0 , và việc tìm S
khoảng ước lượng với độ tin cậy γ = 1− α được làm như câu a) với 2 σ bằng phương 0 sai mẫu hiệu chỉnh 2 s .   V S S
ậy khoảng ước lượng tin cậy cho kì vọng là    X − z ; X + z , trong đó z α α  α  n 2 n 2  2   2 α 1 γ m t
được xác định từ công thức   Φ z = 1 − − = 2  với Φ(m) ∫ − = e dt . α  2 2 2  2  0 Ví dụ 2.3.
Cân ngẫu nhiên 25 bao xi măng, ta thu được bảng kết quả sau: x (kg) 47 48 49 50 51 52 53 i n (số bao) 2 3 4 6 5 3 2 i
Tìm khoảng tin cậy 95% cho trọng lượng trung bình µ , biết trọng lượng X của bao xi
măng tuân theo phân phối chuẩn N( 2
µ;σ ) với σ chưa biết. Giải
Đây là bài toán ước lượng khoảng tin cậy cho giá trị trung bình với phương sai chưa biết. Do ch X − µ
ưa biết σ và n = 25 < 30 nên ta có G = T =
n ~ T (n − ) 1 . S
Ta có trung bình x = 5 ,
0 04 phương sai mẫu hiệu chỉnh s = 130 , 7 042 = 36 1 , 53. 89 Bài giảng Ta có t = t = ,
2 064 . Khi đó, khoảng tin cậy cho kì vọng là α 0,05 n− ; 1 24; 2 2   s s  36 1 , 53 36 1 , 53    x − t ; x + t = 50 0 , 4 − . , 2 064 5 ; 0 0 , 4 + . , 2 064  α α   n− ; 1 n− ; 1 n 2 n 2   5 5  Ví dụ 2.4.
Một nhà máy tiến hành một nghiên cứu xem trung bình một công nhân hoàn thành bao
nhiêu sản phẩm trong một tháng. Một mẫu ngẫu nhiên gồm 59 công nhân được chọn và kết quả như sau
14, 18, 22, 30, 36, 28, 42, 79, 36, 52, 15, 47, 95, 16, 27, 111, 37, 63, 127, 23, 31, 70,
27, 111, 30, 147, 72, 37, 25, 7, 33, 29, 35, 41, 48, 15, 29, 73, 26, 15, 26, 31, 57, 40, 18,
85, 28, 32, 22, 37, 60, 41, 35, 26, 20, 58, 33, 23, 35.
Hãy xây dựng khoảng ước lượng tin cậy trung bình µ số sản phẩm mà một công nhân
hoàn thành trong một tháng với độ tin cậy γ = 95% . Giải.
Từ bảng số liệu trên, ta có n = 59 , x = 41 0 , 5 , s = 27 9 , 9 , z = 9 , 1 6 . 0,05 2
Do n = 59 > 30 nên ta có khoảng tin cậy cho µ là    27 9 , 9 27 9 , 9   s s   X − z ; X + z = 41 0 , 5 − . 9 , 1 6 4 ; 1 0 , 5 + 9 , 1 . 6 . α α     n  59 59  2 n 2 
2.2. Ước lượng khoảng tin cậy cho phương sai.
Giả sử biến ngẫu nhiên X có phân phối chuẩn X ~ N ( 2 µ;σ ) với tham số θ = D(X ) 2
= σ chưa biết. Từ một mẫu cụ thể (x ; x ;K; x của 1 2
X . Bài toán đặt ra là n ) 2
tìm khoảng tin cậy cho phương sai σ .
2.2.1. Đã biết kỳ vọng toán E(X ) = µ = µ . 0 ∑n(X − µ i )2 0 Ta chọn hàm 2 i 1 G = χ = = , Ta có 2 χ có phân phối 2 2 χ ~ χ (n) 2 σ     Khi α α
đó, xét các phân vị sau đây 2 2  P χ > χ  = 2 2    và P χ > χ = 1 − . α   α  n; 2  n 1 ; − 2 2   2  ∑n n (X − µ X i )2 ∑ 0 ( − µ i )2 0 Ta có 2 2 2 χ < χ < χ hay i 1= 2 i 1 < σ = < . α α 2 2 n 1 ; − n; χ χ 2 2 α α n; n 1 ; − 2 2   Lại có  P χ 2
< χ 2 < χ 2  = 1 − α  . α α   n − 1 ; n; 2 2  90
Chương V. Lí thuyết ước lượng  n n 2 2   ∑(X − µ X i 0 ) ∑( − µ i 0 )  Vậy  i=1 2 i=1  P < σ < = 1 − α .  χ 2 χ 2  α α  n; n − 1 ;   2 2   n n 2 2   ∑(X − µ X i 0 ) ∑( − µ i 0 ) 
Khoảng ước lượng tin cậy cho phương sai là  i=1 i=1  .  ; 2 2  χ χ  α α n; n − 1 ;   2 2 
2.2.2. Chưa biết kỳ vọng toán E(X ) = µ .
∑n(X − X i )2 Ta chọn hàm 2 i 1 G = χ = = . 2 σ Ta có 2 χ có phân phối 2 χ ~ 2 χ (n − )
1 . Thực hiện tương tự a), ta thu được  n 2 n 2  ∑(X − X X X i ) ∑( − i )  Vậy  i=1 2 i=1  P < σ < = 1 − α .  χ 2 χ 2  α α  n− ; 1 n− − 1 ; 1   2 2   n 2 n 2  ∑(X − X X X i ) ∑( − i ) 
Khoảng ước lượng tin cậy cho phương sai là  i=1 i=1  .  ; 2 2  χ χ  α α n− ; 1 n− − 1 ; 1   2 2  Ví dụ 2.5.
Mức hao phí nguyên liệu cho một đơn vị sản phầm là đại lượng ngẫu nhiên X có phân phối chuẩn N( 2
µ;σ ). Quan sát 28 sản phẩm, ta thu được kết quả sau
Lượng nguyên liệu hao phí 19 19 5 , 20 20 5 , (kg) Số sản phẩm 5 6 14 3
Với độ tin cậy 90% , hãy ước lượng phương sai của X trong 2 trường hợp sau a) Biết µ = 20 kg. b) Chưa biết µ . Giải. 4
a) Đã biết µ = 20 kg. Ta có ∑ n X µ , 2 χ = 41 3 , 37 , 2 χ = 16 9 , 28 . i ( − i )2 = 7,25 28;0,05 28;0 ,95 i 1 =
Khi đó, với độ tin cậy γ = 90% , ta có khoảng ước lượng tin cậy cho phương sai là 91 Bài giảng  n n 2 2   ∑(x − µ x i 0 ) ∑( − µ i 0 )    7,25 7,25  i=1 i=1  =  ;  .  ; 2 2  χ χ  43 3 , 37 16 9 , 28   α α n; n − 1 ;   2 2  b) Ta có 4 ∑n x x , 2 χ = 40 1 , 13, 2 χ = 16 1
, 51. Khi đó, khoảng ước lượng tin i ( − i )2 = 7,25 28− ; 1 0,05 28 1 − ; 0,95 i 1 =  n 2 n 2  ∑ (x − x x x i ) ∑( − i )   7,25 7,25 
cậy cho phương sai là  i=1 i=1  =  ;  .  ; 2 2  χ χ  40 1 , 13 16 1 , 51  α α n− ; 1 n− − 1 ; 1   2 2 
2.3. Ước lượng khoảng tin cậy cho tỉ lệ.
Nếu trong phép lấy mẫu, ta chỉ quan tâm đến sự xuất hiện hoặc không xuất hiện tính
chất A nào đó. Gọi p là tỉ lệ phần tử có tính chất A trong toàn bộ tổng thể, p chưa
biết. Giả sử trong một mẫu kích thước n có k phần tử có tính chất A . Cơ sở toán học
cho việc xây dựng khoảng tin cậy cho tỉ lệ p (chưa biết) là định lí sau đây: Định lí. T k ần suất mẫu f =
là một đại lượng ngẫu nhiên có phân phối xấp xỉ chuẩn với kì n 1 np > 5 v p − p
ọng E( f ) = p và phương sai D( f ) ( ) = với điều kiện  . n
n(1 − p) > 5
Do ta không biết p nên ta không biết được D( f ). Tuy nhiên với một số điều kiện, ta có th f 1 − f
ể xấp xỉ p bởi f . Nghĩa là ta coi D( f ) ( ) ≈
. Để có thể dùng xấp xỉ này, ta n nf > 10 cần điều kiện sau  .
n(1 − f ) > 10
( f − p) ( f − p) Khi n
đó, đại lượng ngẫu nhiên =
sẽ có phân phối xấp xỉ chuẩn tắc Df f (1 − f ) N ( ) 1 ; 0 .
Khi đó, để ước lượng khoảng tin cậy cho tỉ lệ với độ tin cậy γ = 1− α Ta ch f − p
ọn hàm: G = Z =
n . Khi đó Z ~ N ( ) 1 ; 0 . f (1 − f ) f (1 − f ) f (1 − f )
Khi đó, − z < Z < z , hay f − z < p < f + z . α α α α n n 2 2 2 2   Từ đẳng thức   P − z < Z < z = 1 − α 
, sau khi biến đổi ta được α α   2 2  92
Chương V. Lí thuyết ước lượng  f (1 − f ) f (1 − f )    P f − z < p < f + z = 1 − α  . α α   n n 2 2 
Khi đó, khoảng ước lượng tin cậy cho tỉ lệ p là  f (1 − f ) f (1 − f )     f − z ; f + z
, trong đó z được xác định từ công thức α α  α  n n 2 2  2   2 1 α γ m t   Φ z = − = 2  với Φ(m) ∫ − = e dt . α  2 2 2  2  0 Ví dụ 2.6.
Kiểm tra ngẫu nhiên 500 xe máy của nhà máy A chuyên sản xuất xe máy thì có 360
xe máy đạt chất lượng tốt. Hãy ước lượng tỉ lệ tối thiểu xe máy đạt chất lượng tốt của
nhà máy A với độ tin cậy 95% . Giải.
Đây là bài toán ước lượng tỉ lệ. 360 f = = 7 , 0 Ta có 500 , nf = 500 7 , 0 .
= 350 > 10 , n(1− f ) = 150 > 10. f − p 7 , 0 Khi − p đó G = Z = n = 500 , γ = 95% = 9 , 0 5 , f (1 − f ) 7 , 0 . 3 , 0   1   α γ Φ z = − = = , 0 475  nên z = 9 , 1 6 . α  2 2 2 α  2  2
Vậy khoảng ước lượng tin cậy cho tỉ lệ là  f (1 − f ) f (1 − f )       , 0 7 3 , 0 . 7 , 0 . 3 , 0  f − z ; f + z =  . α α   7 , 0 − . 9 , 1 6 7 , 0 ; + 9 , 1 . 6  500 500 2 2   500 500 
Tỉ lệ tối thiểu xe máy đạt chất lượng là p = , 0 66 . Ví dụ 2.7.
Tại một rừng nguyên sinh, người ta đeo vòng cho 1000 con chim. Sau một thời gian,
bắt lại 200 con thì có 40 con có đeo vòng. Thử ước lượng số chim trong vùng với độ tin cậy 99% . Giải.
Đây là bài toán ước lượng tỉ lệ. Ta có: 40 f = = , 0 2. Ta có nf = 200 , 0
. 2 = 40 > 10 và n(1− f ) = 400 8 , 0 . = 32 > 10 . 200   Khi γ 9 , 0 0 đó, γ = 90% = 9 , 0 0 ,   Φ z = = = , 0 45  nên z = 6 , 1 45. α  2 2 α  2  2
Khi đó, khoảng ước lượng tin cậy cho tỉ lệ là 93 Bài giảng  f (1 − f ) f (1 − f )       9 , 0 1 , 0 . 9 , 0 . 1 , 0  f − z ; f + z =  α α   , 0 2 − , 1 . 64 , 0 ; 2 + , 1 . 64  500 500 2 2   200 200  Hay ( 1 , 0 7 , 0 ; 24).  2000 2000 
Khi đó, số chim trong vùng với độ tin cậy là  ;  .  , 0 24 1 , 0 7 
2.4. Ước lượng kích thước mẫu.
Với độ tin cậy γ đã cho, ta thấy có mối quan hệ giữa kích thước mẫu n và độ dài
khoảng tin cậy. Kích thước mẫu càng lớn thì khoảng tin cậy càng hẹp, nghĩa là độ
chính xác của ước lượng càng cao, sai số càng nhỏ. Tuy nhiên, kích thước mẫu càng
lớn thì đòi hỏi nhà nghiên cứu càng nhiều thời gian, tiền của và công sức.
Vậy bài toán đặt ra là: Cần chọn kích thước mẫu tối thiểu là bao nhiêu để đạt được
độ chính xác mong muốn.
2.4.1. Trường hợp ước lượng cho trung bình µ .
Giả sử muốn có ước lượng µ với sai số không quá ε cho trước với độ tin cậy γ .
Khi đó, với xác suất γ , ta xét 2 trường hợp sau TH1: N σ ếu biết phương sai 2
σ thì X − µ ≤ z
. Khi đó, ta cần có bất đẳng thức α n 2 2  σz  α σ   z ≤ ε hay 2 n ≥ 
 , trong đó z được xác định từ công thức α α n ε 2     2   2 1 α γ z t   Φ z = − = 2  với Φ(z) ∫ − = e dt . α  2 2 2  2  0
Vậy n là số nguyên dương nhỏ nhất thỏa mãn bất đẳng thức này. 2  σz   α 
TH2: Nếu không biết phương sai 2
σ thì ta thay σ trong công thức 2 n ≥   bởi s .  ε   
Do s phụ thuộc n nên ta thường lấy mẫu có kích thước m > 30 để tính x và s . Vậy n thỏa mãn công thức sau 2  sz   α  2 n ≥ 
 với điều kiện vế phải của công thức này lớn hơn hoặc bằng 30 .  ε    Ví dụ 2.8.
Biết rằng độ lệch tiêu chuẩn chiều cao người lớn là 3 inch, ta muốn xây dựng một
khoảng tin cậy với γ = 90% cho chiều cao trung bình µ với sai số không quá 5 , 0 inch.
Hãy xác định kích thước mẫu tối thiểu để đạt được yêu cầu trên. 94
Chương V. Lí thuyết ước lượng Giải
Ta biết phương sai σ = 3, ε = 5 ,
0 và độ tin cậy γ = 90% . 2  σz   α   3. 6 , 1 4 2  Ta có 2 n ≥   =   = 96 8 , 26 . Vậy n = 97 .  ε   5 , 0   
2.4.2. Trường hợp ước lượng cho tỉ lệ p .
Giả sử muốn có ước lượng p với sai số không quá ε cho trước với độ tin cậy γ . Ta 2 z f − f α (1 )
có n là số nguyên dương nhỏ nhất thỏa mãn 2 n ≥
, trong đó z được xác 2 ε α 2   2 1 α γ z t định từ công thức   Φ z = − = 2  với Φ(z) ∫ − = e dt . α  2 2 2  2  0 nf > 10 với điều kiện  .
n(1 − f ) > 10 Ví dụ 2.9.
Phòng cảnh sát giao thông muốn ước lượng tỉ lệ xe chở quá tải trên đường với độ tin
cậy γ = 95% và sai số không vượt quá ,
0 05 thì cần phải kiểm tra bao nhiêu lượt xe
chạy trên đường? Biết rằng trong 100 xe đã kiểm tra thì có 40 xe quá tải. Giải
Đây là bài toán ước lượng kích thức mẫu cho tỉ lệ. Ta có 40 f = = ,
0 4 , γ = 95% , z = z = 9 , 1 6 , ε = , 0 05 . 100 α 0,025 2 2 z f f α (1− ) 9 , 1 62. , 0 4 2 (.1− , 0 4) Khi đó, ta có: n ≥ = = 368 7 , 936 . 2 ε , 0 052
Do n là số tự nhiên nên ta chọn n = 369 .
Vây, số xe cần kiểm tra là 369 . 3. Bài tập chương. 1.
Đo sức bền của một loại kềm công nghiệp, người ta thu được bộ số liệu sau đây x 4500 4800 4900 5000 5125 5200 5375 6500 n 1 3 3 7 5 3 2 1 i
a) Biết rằng sức bền của kềm có phân phối chuẩn với độ lệch σ = 300 . Hãy xây dựng
khoảng tin cậy cho sức bền trung bình của kềm với độ tin cậy γ = 95% .
b) Tìm khoảng tin cậy cho sức bền trung bình của kềm với giả thiết là không biết phương sai 2 σ . 2.
Kiểm tra sức khỏe của sinh viên một trường đại học, ta thu được chiều cao của 500 sinh viên như sau. 95 Bài giảng Cao (cm) Số sinh viên 150-154 20 154-158 60 158-162 120 162-164 140 164-168 80 168-172 60 172-174 20
Biết độ lệch tiêu chuẩn của chiều cao người lớn là c
5 m . Tìm khoảng tin cậy cho chiều cao
trung bình của sinh viên trường đại học với độ tin cậy là 95% . 3.
Gọi X là mức tiêu thụ xăng của một loại ô tô (lít/ 100km ). Người ta kiểm tra 36 chiếc
và thu được kết quả sau. x 4,5 4,8 5,1 5,3 5,6 5,9 6,2 6,4 n 3 5 6 7 6 4 3 2 i
Với độ tin cậy γ = 95% , hãy xác định khoảng ước lượng cho mức hao phí xăng trung bình
cho 100 km của loại ô tô này? 4.
Thống kê tại một trạm đăng kí xe máy trong một tháng, trong 3600 xe mới đăng kí thì
có 240 xem Air Blade. Hãy ước lượng tỉ lệ phần trăm tối đa bán được của loại xe Air
Blade trên thị trường xe máy với độ tin cậy γ = 95% . 5.
Một nông dân muốn ước lượng tỉ lệ nảy mầm cho một giống lúa mới. Khi ông ta điều
tra 1000 hạt và thấy được 640 hạt nảy mầm.
a) Với độ tin cậy 95%, hãy ước lượng tỉ lệ nảy mầm cho giống lúa này.
b) Nếu muốn ước lượng tỉ lệ nảy mầm có sai số không vượt quá 2% và đạt độ tin cậy 95%
thì cần gieo ít nhất bao nhiêu hạt?
c) Với độ tin cậy 97%, hãy ước lượng số hạt giống nảy mầm tối thiểu khi gieo 10000 hạt. 6. Một kho hàng có 10 0
. 00 hộp sữa. Người ta nghi ngờ sữa bị hỏng, bằng cách lấy kiểm
tra 250 hộp thì thấy có 5 hộp bị hư.
a) Với độ tin cậy γ = 95% , hãy ước lượng tỉ lệ p số hộp sữa bị hư trong kho.
b) Ước lượng số hộp sữa bị hư trong kho với độ tin cậy γ = 95% . 7.
Cho X là năng suất lúa ở một khu vực (đơn vị tính tạ/ha). Điều tra ở một số thửa
ruộng, ta có kết quả sau đây: X 30-35 35-40 40-45 45-50 50-55 n (Số hecta) 6 10 28 40 16
a) Hãy ước lượng năng suất lúa trung bình của toàn vùng, với độ tin cậy γ = 95% .
b) Những thửa ruộng đạt năng suất từ 45 tạ/ha trở lên là những thửa ruộng đạt năng suất
cao. Hãy ước lượng tỉ lệ những thửa ruộng đạt năng suất cao của vùng này, với độ tin cậy γ = 95% .
c) Nếu muốn ước lượng năng suất lúa trung bình của toàn vùng đạt được độ chính xác ε = ,
1 4 tạ/ha thì độ tin cậy là bao nhiêu? 8.
Theo dõi chiều cao của 144 cây Bạch Đàn trồng trên đất phèn sau 1 năm, ta được kết quả sau đây. X (cm) 250-300 300-350 350-400 400-450 450-500 500-550 550-600 n 5 20 25 30 30 23 11
a) Tính chiều cao trung bình và độ lệch mẫu của X .
b) Hãy lập khoảng ước lượng của chiều cao trung bình loại cây Bạch Đàn sau 1 năm với độ tin cậy γ = 95% . 96
Chương V. Lí thuyết ước lượng
Đáp số và hướng dẫn. 1. a) (496 , 5 5 ; 4 20 , 0 6), b) (4938 5 ; 1 , 227 9 , ) 2.
n = 500 > 30 nên ta xem X ~ N (µ;σ ) . (16 , 2 28 1 ; 631 , 6). 3.
Ta có n = 36 > 30 nên ta xem X ~ N(µ;σ ) và chưa biết phương sai 2 σ . 4.
Khoảng ước lượng cho tỉ lệ là ( 0 , 0 45 0 , 0 ;
89) vậy, tỉ lệ phần trăm tối đa là 9 , 8 % . 5. a) ( 6 , 0 102 6 , 0 ; 69 )
8 b) n = 2213, c) 6115.
C. Phương pháp giảng dạy.
- Giới thiệu ứng dụng của ước lượng khoảng trong thực tế.
- Thuyết trình, vấn đáp, và làm bài tập.
- Sử dụng các bảng phụ lục cho việc tính các giá trị của hàm phân phối chuẩn, Poisson, Student, chi bình phương.
- Yêu cầu SV đọc bài giảng trước khi lên lớp.
- Kiểm tra, đánh giá việc làm bài tập của SV.
Giảng viên gửi bài giảng cho sinh viên đọc trước. Giảng viên trình bày bài giảng trên lớp theo
phương pháp thuyết trình hỏi đáp. Giao bài tập cho sinh viên về nhà làm. Giới thiệu một số tài liệu tham khảo.
D. Tài liệu tham khảo
[1] Đậu Thế Cấp, Xác suất thống kê: Lí thuyết và các bài tập, NXB Giáo dục, 2006.
[2] Đặng Hùng Thắng, Thống kê và ứng dụng, NXB Giáo dục, 2008.
[3] PGS. TS. Phạm Xuân Kiều, Giáo Trình xác suất và thống kê, NXB Giáo dục, 2005.
[4] Trần Văn Minh, Phí Thị Vân Anh, Xác suất thống kê với các tính toán trên
Excel, NXB Giao Thông Vận tải, 2008.
[5] Đặng Công Hanh, Đặng Ngọc Dục, Giáo trình Lý thuyết xác suất và Thống kê
toán, trường Đại học Duy Tân,1996
[6] Trần Văn Minh, Phí Thị Vân Anh, Hướng dẫn giải bài tập Xác suất thống kê
với các tính toán trên Excel, NXB Giao Thông Vận tải, 2008. 97 Chương VI.
Kiểm định giả thiết thống kê. A. Mục tiêu.
- Giới thiệu về khái niệm kiểm định giả thiết: cách đặt giả thiết H và đối thiết 0 H , 1
đưa ra các khả năng phạm sai lầm khi kiểm định.
- Nêu phương pháp chung khi thực hiện một bài toán kiểm định.
- Đưa ra phương pháp kiểm định cho: kì vọng, phương sai, tỉ lệ… trong từng trường hợp cụ thể. B. Nội dung.
1. Các khái niệm cơ bản
1.1. Đặt vấn đề:
Trong chương này, chúng ta sẽ giải quyết các bài toán dạng như sau:
Giả sử ta có hai giả thiết (hai khả năng) về một vấn đề nào đó, chẳng hạn:
1. Có ý kiến cho rằng tham số chưa biết θ của phân phối nhận giá giá trị θ , 0
nhưng lại có ý kiến cho rằng θ ≠ θ . 0
2. Có ý kiến cho rằng sau khi áp dụng phương pháp sản xuất mới, tỉ lệ sản phẩm
loại I của nhà máy tăng lên (có nghĩa là phương pháp sản xuất mới này có hiệu
quả), nhưng có ý kiến cho rằng tỉ lệ sản phẩm loại I không thay đổi (có nghĩa là
phương pháp sản xuất mới này không có hiệu quả).
3. Có ý kiến cho rằng Biến ngẫu nhiên đang xét tuân theo quy luật phân phối nhị
thức, lại có ý kiến không tán thành.
4. Có ý kiến cho rằng khả năng làm việc của con người phụ thuộc vào giới tính,
nhưng cũng có ý kiến cho rằng không ảnh hưởng.
Vấn đề đặt ra là ta phải chọn một trong hai giả thiết được nêu ra. Nói cách khác, ta
chọn giả thiết nào để khả năng đúng cao hơn, khả năng sai thấp hơn. Để cho tiện, ta
chọn một trong hai giả thiết là giả thiết H còn giả thiết kia là gi 0
ả thiết đối (đối thiết) H :θ = θ 0 0 H . Khi đó . 1  H :θ ≠ θ 1 0 Bài giảng Ví dụ 1.1.
Ông chủ của một cửa hàng buôn bán xe máy cho biết số xe máy bán được trong một
ngày của cửa hàng là 30 xe máy. Để kiểm tra lời tuyên bố này của ông chủ này là H :θ = 30
đúng hay sai, ta có thể đặt:  0 . H :θ ≠ 30 1 Ví dụ 1.2.
Khi tìm hiểu về chiều cao trung bình của một loại cây ở trong một khu rừng, với chiều
cao X của loại cây đó có phân phối chuẩn N ( 2
µ;σ ) ta có thể đưa ra giả thiết H như 0
sau: H : “Chiều cao trung bình của cây là µ = 20 m”. Khi đó, các đối thiết của 0 H có 0 thể là:
+ Đối thiết H : “Chiều cao trung bình của cây là µ ≠ 20 m”. 1
+ Đối thiết H : “Chiều cao trung bình của cây là µ < 20 m”. 1
+ Đối thiết H : “Chiều cao trung bình của cây là µ > 20 m”. 1
Để giải quyết bài toán này, thông tin duy nhất chúng ta có là mẫu ngẫu nhiên
(X ; X ;K; X . Vận dụng kết quả của lí thuyết xác suất, ta tìm miền 1 2 W , sao cho khi n )
mẫu (X ; X ;K; X ∈ thì ta bác bỏ giả thiết ; ;K; thì ta 1 2
H , còn khi (X X X ∉ 1 2 n ) W n ) W 0
chấp nhận giả thiết H cho đến khi có thông tin mới. Miền 0
W được gọi là miền bác bỏ.
Khi bác bỏ hoặc chấp nhận giả thiết H , chúng ta có thể mắc hai lo 0
ại sai lầm sau:
Sai lầm loại I: Bác bỏ H nhưng thực tế là 0 H là đúng. 0
Sai lầm loại II: Chấp nhận H nhưng thực tế là 0 H là sai. 0
Ta mong muốn chọn miền W sao cho cực tiểu cả hai khả năng phạm sai lầm. Nhưng
khi có mẫu cố định thì mong muốn này không thể thực hiện được, do đó thông thường
ta cho trước giới hạn trên của xác suất sai lầm loại I.
Kí hiệu α , α thường rất nhỏ α = 1% , 5% , 10% , K ta sẽ tìm miền W sao cho khả α
năng phạm sai lầm loại I không vượt quá α và khả năng phạm sai lầm loại II đạt cực tiểu.
Tùy theo hoàn cảnh cụ thể, sai lầm loại này có thể tai hại hơn sai lầm loại kia. Ví dụ 1.3.
a) Để tránh sai lầm cho điểm một học sinh giỏi thấp, thầy giáo cứ cho điểm cao một
cách dễ dàng, khi đó khả năng mắc phải sai lầm cho điểm một học sinh yếu kém cao
(đáng lẽ phải cho điểm thấp) là tăng lên.
b) Để tránh sai lầm cho việc bắt nhầm một người vô tội (bị oan), công an cứ thả người
này cách dễ dàng, nhưng khi đó khả năng mắc phải sai lầm thả nhầm một người có tội lại tăng lên.
Có hai cách dùng để khống chế khả năng mắc sai lầm:
Cách thứ nhất. Ta ấn định trước mức mắc phải sai lầm loại I và sai lầm loại II rồi tính
toán tìm một mẫu có kích thước ứng với hai mức sai lầm này.
Cách thứ hai. Ta ấn định trước xác suất sai lầm loại I (tức là có trước mức ý nghĩa α )
chọn miền bác bỏ W có xác suất sai lầm loại II nhỏ nhất. α
Trong bài giảng này, ta chọn cách thứ hai. 100
Chương VI. Kiểm định giả thiết thống kê
Cần chú ý rằng: Bác bỏ hoặc chấp nhận giả thiết tùy thuộc vào giá trị thực nghiệm của
tiêu chuẩn T và mức ý nghĩa α , kiểm định giả thuyết thống kê là một quy tắc hành
động sao cho khả năng mắc phải sai lầm nhỏ (ở mức nào đó).
1.2. Phương pháp kiểm định giả thiết thống kê
Có thể mô tả phương pháp kiểm định giả thiết thống kê như sau:
Xuất phát từ yêu cầu của bài toán thực tế, ta đưa ra một giả thiết H và giả thiết đối 0 H của nó. 1
Giả sử rằng H đúng, từ đó tìm một biến cố có xác suất đủ bé để có thể tin rằng biến 0
cố đó hầu như không thể xảy ra trong một phép thử. Muốn vậy, từ mẫu ngẫu nhiên
(X ; X ;K; X , ta chọn thống kê T f X ; X ;K = ; X ;θ sao cho nếu 1 2 T , ( 1 2 H đúng thì n 0 ) n ) 0
phân phối xác suất của T là xác định và thống kê T gọi là tiêu chuẩn kiểm định giả thiết H . 0
Do quy luật phân phối xác suất T đã biết, nên với α bé tùy ý, ta có thể tìm được miền
W sao cho P(T ∈W = . α ) α α
Miền W gọi là miền bác bỏ giả thiết H . Trong thực tế, ta thường lấy α ∈[ , 0 01 , 0 ; 0 ] 5 α 0
và α được gọi là mức ý nghĩa của kiểm định.
Thực hiện một phép thử đối với mẫu ngẫu nhiên (X ; X ;K; X , ta được mẫu cụ thể 1 2 n )
(x ; x ;K; x . Từ mẫu này, ta tính được giá trị của T = t f x ; x ;K = ; x ;θ . 1 2 T , ( 1 2 n 0 ) n )
Nếu t ∈W (tức là biến cố T ∈W xảy ra) thì ta bác bỏ H ; chấp nhận H . α α 0 1
Nếu t ∈W thì ta chấp nhận H . α 0 Chú ý.
Khi chấp nhận H , không có nghĩa 0
H đúng, mà chỉ có nghĩa là chưa có cơ sở bác bỏ 0
H , đành chấp nhận 0 H . 0
2. Kiểm định giả thiết về tham số.
2.1. Các loại kiểm định và phương pháp kiểm định giả thiết về các tham số.
Khi nghiên cứu một đặc tính hoặc một dấu hiệu nào đó của một tổng thể ta xét một
biến ngẫu nhiên X tác động lên tổng thể đó và thường là các dấu hiệu của tổng thể
được thể hiện qua các tham số đặc trưng của X hay phân phối của X , cho nên các giả
thiết về các tham số đặc trưng của X cũng là các giả thiết thường gặp.
Các loại kiểm định về tham số là:
1) Kiểm định hai phía đối với tham số, tức là kiểm định giả thiết H :θ = θ với đối 0 0
thiết H :θ ≠ θ với 1 0
θ là tham số đặc trưng nào đó của X chưa biết (thường là E(X )
hoặc là D(X )) và θ là một giá trị cụ thể được đưa ra dựa vào sự suy đoán nào đó. 0
2) Kiểm định phía phải đối với tham số là kiểm định giả thiết H :θ = θ với đối thiết 0 0 H : θ > θ . 1 0
3) Kiểm định phía trái đối với tham số là kiểm định giả thiết H :θ = θ với đối thiết 0 0 H : θ < θ . 1 0 101 Bài giảng
Để kiểm định giả thiết thống kê về các tham số như trên, người ta thường tiến hành theo các bước như sau:
Bước 1: Lập mẫu ngẫu nhiên của X là (X ; X ;K; X và chọn một hàm 1 2 n ) G
g(X ; X ;K =
; X ;θ và gọi là tiêu chu 1 2
ẩn kiểm định sao cho tìm được một qui tắc n 0 )
kiểm định tốt nhất của tham số θ . Sau đó tìm giá trị g(x ; x ;K; x ;θ ứng với một 1 2 n 0 )
mẫu thực nghiệm nào đó và gọi là giá trị thực nghiệm.
Bước 2: Với mức ý nghĩa α đã cho tìm miền bác bỏ W tương ứng (miền W phụ α α
thuộc vào các loại kiểm định).
Bước 3: Xét xem giá trị cụ thể g(x ; x ;K; x ;θ có thuộc 1 2 W hay không. n 0 ) α
+ Nếu g(x ; x ;K; x ;θ ∈
thì ta bác bỏ giả thiết 1 2
H và thừa nhận đối thiết H với n 0 ) Wα 0 1
mức ý nghĩa α (hay độ tin cậy γ = 1− α ).
+ Nếu g(x ; x ;K; x ;θ ∉
thì ta chưa có cơ sở bác bỏ giả thiết 1 2
H và thừa nhận đối n 0 ) Wα 0
thiết H với mức ý nghĩa 1 α .
Trong bài giảng này, chúng ta chỉ kiểm định giả thiết về các tham số đặc trưng của
biến ngẫu nhiên có phân phối chuẩn và về tỉ lệ của tổng thể; các bước kiểm định được
trình bày một cách ngắn gọn, chỉ nêu miền bác bỏ cho từng loại kiểm định.
2.2. Kiểm định giả thiết về trung bình của ĐLNN X~N(µ; σ2).
Giả sử trung bình của tổng thể (cũng chính là kì vọng toán của biến ngẫu nhiên X ) là µ chưa biết.
2.2.1. Trường hợp đã biết 2
D( X ) = σ .
a) Kiểm định hai phía đối với µ .
Cần kiểm định giả thiết: H : µ = µ với đối thiết H : µ ≠ µ (với µ là một giá trị nào 0 0 1 0 0 đó đã biết) H : µ = µ  0 0 H : µ ≠ µ 1 0 (X − µ0 )
* Ta chọn tiêu chuẩn kiểm định là G = Z =
n , biến ngẫu nhiên này có phân σ
phối chuẩn Z ~ N( ) 1 ; 0 .
* Với mức ý nghĩa α đã cho, ta xác định miền bác bỏ W như sau: α         W = − ∞;−z ∪ z
, trong đó z được xác định từ công thức α  α   ;+∞ α  α  2   2  2   2 α 1 γ m t   Φ z = 1 − − = 2  với Φ(m) ∫ − = e dt . α  2 2 2  2  0
* So sánh giá trị thực nghiệm z với z . α 2
+ Nếu z > z (nghĩa là z ∈W ) thì ta bác bỏ giả thiết H và thừa nhận đối thiết H α α 0 1 2 với mức ý nghĩa α . 102
Chương VI. Kiểm định giả thiết thống kê
+ Nếu z ≤ z (nghĩa là z ∉W ) thì ta chưa có cơ sở bác bỏ giả thiết H nên chấp nhận α α 0 2
giả thiết H với mức ý nghĩa α . 0
a) Kiểm định phía phải đối với µ .
Cần kiểm định giả thiết: H : µ = µ với đối thiết H : µ > µ 0 0 1 0 H : µ ≤ µ  0 0 H : µ > µ 1 0 (X − µ0 )
* Ta chọn tiêu chuẩn kiểm định là G = Z =
n , biến ngẫu nhiên Z này có σ
phân phối chuẩn N ( ) 1 ; 0 .
* Với mức ý nghĩa α đã cho, ta xác định miền bác bỏ W như sau: α 1 1 1 W = z
, trong đó z được xác định từ công thức Φ(z α ) = 1 − α − = − α = γ − α ( ;+∞ α ) α 2 2 2 2 m t với Φ(m) ∫ − = e 2 dt . 0
* So sánh giá trị thực nghiệm z với z . α
+ Nếu z > z (nghĩa là z ∈W ) thì ta bác bỏ giả thiết H và thừa nhận đối thiết H với α α 0 1 mức ý nghĩa α .
+ Nếu z ≤ z (nghĩa là z ∉W ) thì ta chưa có cơ sở bác bỏ giả thiết H nên chấp nhận α α 0
giả thiết H với mức ý nghĩa α . 0
c) Kiểm định phía trái đối với µ .
Cần kiểm định giả thiết: H : µ = µ với đối thiết H : µ < µ 0 0 1 0 H : µ ≥ µ  0 0 H : µ < 1 µ0 (X − µ0 )
* Ta chọn tiêu chuẩn kiểm định là G = Z =
n , biến ngẫu nhiên Z này có σ
phân phối chuẩn Z ~ N ( ) 1 ; 0 .
* Với mức ý nghĩa α đã cho, ta xác định miền bác bỏ W như sau: α W = − ∞; z , trong đó z = −z trong đó, α ( 1 α − ) α − 1 z
được xác định từ công thức α − 1 α 2 m t Φ(z với Φ(m) ∫ − = e 2 dt . α ) 1 1 1 = 1 − α − = − α = γ − 2 2 2 0
* So sánh giá trị thực nghiệm z với α− 1 z .
+ Nếu z < −z (nghĩa là z ∈W ) thì ta bác bỏ giả thiết H và thừa nhận đối thiết H α α 0 1 với mức ý nghĩa α .
+ Nếu z ≥ −z (nghĩa là z ∉W ) thì ta chưa có cơ sở bác bỏ giả thiết H nên chấp α α 0
nhận giả thiết H với mức ý nghĩa α . 0 Ví dụ 2.1.
Một máy đóng mì gói tự động quy định trọng lượng trung bình là µ 75 g, độ lệch 0 =
chuẩn σ = 15 g. Sau một thời gian sản xuất, kiểm tra 80 gói, ta có trọng lượng trung 103 Bài giảng
bình mỗi gói là 72 g. Cho kết luận về trọng lượng mì gói trung bình sản xuất với mức
ý nghĩa α = 5% có đúng quy định không. Giải
Trọng lượng trung bình cho mỗi gói mì là µ 75 g. 0 =
Trọng lượng trung bình thực tế sản xuất là µ chưa biết.
Ta đặt giả thuyết: H : µ = µ = 75; đối thiết H : µ ≠ µ = 75. 0 0 1 0
Trong đó, ta biết: σ = 15; α = 5% . (X − µ0 )
Do đã biết σ = 15 nên ta chọn tiêu chuẩn kiểm định là G = Z = n . σ
Đây là bài toán kiểm định hai phía.   Do 1   Φ z = − 0 , 0 25 = , 0 475  nên z = 9 , 1 6 0,05  2 0,05  2  2 Giá tr x − µ0 72 − 75 ị kiểm định: z = n = 80 ≈ − , 1 79 . σ 15 Ta có z ≈ 7 , 1 9 < 9 ,
1 6 nên ta chưa có cơ sở để bác bỏ H nên chấp nhận giả thuyết 0 H , 0
tức là sản xuất diễn ra bình thường. Ví dụ 2.2.
Một nhà máy cơ khí qui định chiều dài của chi tiết máy A là 20 cm. Ban giám đốc nhà
máy cho rằng có một tổ sản xuất loại chi tiết máy đó không đúng chiều dài quy định.
Hãy kiểm định nhận định đó với mức ý nghĩa α = 0 ,
0 5 , biết rằng sau khi chọn ngẫu
nhiên 25 chi tiết máy của tổ sản xuất đó thì kết quả đo đạc cho biết chiều dài trung bình của mẫu là 20 5
, cm và chiều dài X của loại chi tiết được sản xuất ra từ nhà máy
đó có phân phối chuẩn N ( 2 µ 1
; ), với σ = 1 đã biết. Giải
Ta đặt giả thiết H : µ 20 cm và đối thiết H : µ 20 cm. 0 = 1 ≠
Ta có n = 25, x = 20 5 , cm, σ = 1 (X − µ0 )
Do đã biết σ = 1 nên ta chọn tiêu chuẩn kiểm định là G = Z = n . Ta có σ Z ~ N ( ) 1 ; 0 . 20 5 , − 20 Ta có z = 25 = 5 , 2 1
Đây là bài toán kiểm định hai phía Với mức ý nghĩa α = 0 ,
0 5 , ta có z = z = 9 , 1 6 . α 0,05 2 2 Ta có z = 5 , 2 > 9 ,
1 6 nên ta bác bỏ giả thiết H và chấp nhận giả thiết 0 H với mức ý 1 nghĩa α = 0 , 0 5 .
Vậy kết luận của giám đốc là đúng. 104
Chương VI. Kiểm định giả thiết thống kê
2.1.2. Trường hợp chưa biết D(X ) .
Các bước kiểm định đối với các loại giả thuyết này hoàn toàn tương tự như trên nhưng (X − µ0 )
thay tiêu chuẩn kiểm định G = Z =
n bởi tiêu chuẩn kiểm định σ (X − µ0 ) G = T =
n , biến ngẫu nhiên này có phân phối Student T (n − ) 1 , với n −1 bậc S tự do.
+ Trong trường hợp n ≤ 30 , ta thay z , z và t , t và t . α α α − 1 z bởi α n α ; 1 − n− 1 ; 1 α − n− ; 1 2 2 (X − µ0 )
+ Trong trường hợp n > 30 , ta xem G = Z =
n có phân phối chuẩn N ( ) 1 ; 0 . S Ví dụ 2.3.
Trọng lượng của một loại sản phẩm do một xí nghiệp sản xuất theo qui định chung là
6 kg. Sau một thời gian sản xuất, người ta tiến hành kiểm tra 121 sản phẩm do xí
nghiệp đó sản xuất và tính được số trung bình x = 9 ,
5 75 kg và độ lệch tiêu chuẩn điều chỉnh là s = , 2 4 .
Biết rằng trọng lượng X của loại sản phầm do xí nghiệp đó sản xuất có phân phối chuẩn N( 2 µ;σ ).
Có người cho rằng trọng lượng sản phẩm do xí nghiệp sản xuất không đạt yêu cầu
(không đúng với qui định chung). Hãy cho kết luận về lời nhận xét đó với mức ý nghĩa α = 0 , 0 5 . Giải
Ta đặt giả thiết H : µ 6 kg và đối thiết H : µ 6 kg. 0 = 1 ≠ Ta có x = 9 ,
5 75 , n = 121, s = , 2 4 . (X − µ0 ) Do 2
σ chưa biết nên ta chọn tiêu chuẩn kiểm định là G = Z = n . S
Lại có n = 121 ≥ 30 nên Z ~ N( ) 1 ; 0 . ( 9 , 5 75 − 6) Ta có z = 121 ≈ − 1 , 0 146 . , 2 4
Đây là bài toán kiểm định hai phía. Với mức ý nghĩa α = 0 ,
0 5 , ta tính được z = 9 , 1 6 . 0,05 2 Ta có z = 1 , 0 146 < 9 ,
1 6 . Khi đó ta chưa có cơ sở để bác bỏ H nên ta có thể kết luận 0
rằng lời nhận xét trên là không đúng với α = 0 , 0 5 . Ví dụ 2.4.
Tuổi thọ trung bình của 1 loại bóng đèn do nhà máy A sản xuất khi chưa cải tiến kĩ
thuật sản xuất là 2000 giờ, sau thời gian cải tiến kĩ thuật người ta chọn ngẫu nhiên 25
bóng đèn do nhà máy A sản xuất và cho thắp kiểm tra thử nghiệm và kết quả cho biết
tuổi thọ trung bình của mẫu thực nghiệm là x = 2010 giờ và độ lệch tiêu chuẩn của
mẫu là s = 15 giờ với mức ý nghĩa α = 0 , 0 5 . 105 Bài giảng
Hãy cho biết kết luận về lời nhận định “tuổi thọ bóng đèn có tăng lên sau khi cải tiến
kĩ thuật”. Biết rằng biến ngẫu nhiên X chỉ tuổi thọ bóng đèn có phân phối chuẩn N ( 2 µ;σ ). Giải
Ta đặt giả thiết H : µ 2000 giờ và đối thiết H : µ 2000 giờ. 0 = 1 >
Ta có n = 25, s = 15. (X − µ0 ) Do 2
σ chưa biết nên ta chọn tiêu chuẩn kiểm định là G = Z = n . S
Lại có n = 25 < 30 nên Z ~ T (n − ) 1 .
Đây là bài toán kiểm định phía phải. Với mức ý nghĩa α = 0 ,
0 5 , ta tính được t = 0 , 2 64 . 25− ; 1 0,05 Ta có 2010 − 2000 10 z = .5 = . 15 3 10 Ta có z = > , 2 064 3
Do đó, ta bác bỏ giả thiết H và chấp nhận đối thiết 0
H tức là cho rằng sau khi cải tiến 1
kĩ thuật, tuổi thọ trung bình của loại bong đèn dó có tăng lên với mức ý nghĩa α = 0 , 0 5 .
2.3. Kiểm định giả thiết về phương sai của ĐLNN X~N(µ; σ2).
2.3.1. Trường hợp đã biết E(X ) = µ
a) Kiểm định hai phía.
Cần kiểm định giả thiết: 2 2 H : σ = σ với đối thiết 2 2 H : σ ≠ σ (với 2 σ là một giá trị 0 0 1 0 0 nào đó đã biết).  2 H : σ = 2 σ  0 0  2 H : σ ≠ 2 1 σ 0 ∑n(X − µ i )2
* Ta chọn tiêu chuẩn kiểm định là 2 i 1 G = χ = = , biến ngẫu nhiên 2 χ này có 2 σ 0
phân phối Chi bình phương với n bậc tự do 2 2 χ ~ χ (n) .
* Với mức ý nghĩa α đã cho, ta xác định miền bác bỏ W như sau: α      2   2  W = − ∞; χ ∪ χ , trong đó 2 χ , 2 χ
được xác định dựa vào bảng phân α  α   + ; ∞ α  α α  n − 1 ; n n 1 ; − n; 2   ; 2  2 2
phối Chi bình phương với n bậc tự do.
* So sánh giá trị thực nghiệm 2 χ với 2 χ , 2 χ . α α n 1 ; − n; 2 2 + Nếu 2 2 χ < χ hoặc 2 2 χ > χ
(nghĩa là z ∈W ) thì ta bác bỏ giả thiết H và thừa α α α 0 n 1 ; − n; 2 2
nhận đối thiết H với mức ý nghĩa α . 1 106
Chương VI. Kiểm định giả thiết thống kê + Nếu 2 2 2 χ ≤ χ ≤ χ
(nghĩa là z ∉W ) thì ta chưa có cơ sở bác bỏ giả thiết H nên α α α 0 n 1 ; − n; 2 2
chấp nhận giả thiết H với mức ý nghĩa α . 0
b) Kiểm định phía phải đối với 2 σ .
Cần kiểm định giả thiết: 2 2 H : σ = σ với đối thiết 2 2 H : σ > σ . 0 0 1 0  2 H : σ ≤ 2 σ  0 0  2 H : σ > 2 1 σ 0
Ta thực hiện các bước tương tự như trên nhưng miền bác bỏ của kiểm định bên phải là W = χ
. So sánh giá trị thực nghiệm 2 χ với 2 χ
, ta đưa ra điều kết luận. α ( 2 ;+∞ n;α ) n;α
c) Kiểm định phía trái đối với 2 σ .
Cần kiểm định giả thiết: 2 2 H : σ = σ với đối thiết 2 2 H : σ < σ . 0 0 1 0  2 H : σ ≥ 2 σ  0 0  2 H : σ < 2 1 σ 0
Ta thực hiện các bước tương tự như trên nhưng miền bác bỏ của kiểm định bên trái là W = − ∞ χ
. So sánh giá trị thực nghiệm 2 χ với 2 χ
, ta đưa ra điều kết luận. α ( 2 ; n 1; α − ) n 1 ; α −
2.3.2. Trường hợp chưa biết E(X ) = µ .
Trong thực tế, ta thường gặp kiểm định các tham số của biến ngẫu nhiên N( 2 µ;σ ) với
µ và σ chưa biết. Các bước kiểm định ta thực hiện tương tự như trong trường hợp đã biết E(X ) = µ , nhưng ta chọn tiêu chuẩn kiểm định là n ∑(X − X i )2 2 n −1 i 1 = ( ) 2 S G = χ = =
, với S là độ lệch mẫu hiệu chỉnh, biến ngẫu nhiên 2 2 σ 0 σ 0 2
χ này có phân phối Chi bình phương với n − 1 bậc tự do 2 χ ~ 2 χ (n − ) 1 .
Các cận của miền bác bỏ là 2 χ , 2 χ , 2 χ , 2 χ được thay bởi 2 χ , 2 χ , α α n 1 ; α − n;α α α n 1 ; − n; n− 1 ; 1 − n− ; 1 2 2 2 2 2 χ , 2 χ . n− 1 ; 1 α − n− ; 1 α Ví dụ 2.5.
Kiểm tra sự ổn định của một máy tự động về thời gian lắp ghép một bộ phận điện tử.
Người ta quan sát ngẫu nhiên 16 lần lắp ghép của máy tự động đó và tính được độ lệch
tiêu điều chỉnh của mẫu thực nghiệm là s = 15 giây, giả sử rằng thời gian lắp ghép X
các bộ phận điện tử của máy tự động đó có phân phối chuẩn N ( 2 µ;σ ) và máy được
xem là ổn định nếu độ lệch về thời gian không quá 5 giây. Hãy xét xem máy tự động
trên hoạt động có ổn định không, biết rằng mức ý nghĩa α = 0 , 0 5 ? Giải
Ta đặt giả thiết H : 2 σ = 52
25 và đối thiết H : 2 σ 25 . 0 = 1 > 2 (n − ) 2 1 Do không bi S
ết E(X ) = µ nên ta chọn tiêu chuẩn kiểm định là G = χ = . 2 σ 0 107 Bài giảng 2 (16 − ) 1 15 225
Ta có n = 16 , s = 15 . Khi dó χ = = ≈ 9 . 25 25
Đây là bài toán kiểm định bên phải đối với phương sai. Với mức ý nghĩa α = 0 , 0 5 , ta tính được 2 2 χ = χ = 25 n− ; 1 α 15;0,05
Ta có 9 < 25 nên ta chưa có cơ sở bác bỏ giả thiết H nên chấp nhận giả thiết 0 H với 0 mức ý nghĩa α = 0 , 0 5 .
2.4. Kiểm định giả thiết về tỉ lệ các phần tử có tính chất nào đó trong tổng thể.
Cho một tổng thể có hai loại đối tượng, kí hiệu là A và A . Gọi p là tỉ lệ số đối tượng
A có trong tổng thể. Đối với tham số p , ta có các loại kiểm định sau đây: * Kiểm định hai phía.
Cần kiểm định giả thiết: H :
với đối thiết H : (với 0 p = p0 1 p ≠ p0
p là một giá trị nào 0 đó đã biết).
H : p = p  0 0 H : p ≠ 1 p0
* Kiểm định phía phải.
Cần kiểm định giả thiết: H :
với đối thiết H : . 0 p = p0 1 p > p0
H : p ≤ p  0 0 H : p > 1 p0 * Kiểm định phía trái.
Cần kiểm định giả thiết: H :
với đối thiết H : . 0 p = p0 1 p < p0
H : p ≥ p  0 0 H : p < 1 p0
Như ta đã biết ở phần ước lượng tỉ lệ của tổng thể ở chương trước, nếu mẫu có kích n 1
thước n lớn thì tần suất X = ∑ X bằng số lần đối tượng A xuất hiện trong n lần i n i=1
chọn ngẫu nhiên một đối tượng từ tổng thể xấp xỉ biến ngẫu nhiên chuẩn
N (p; p(1 − p)) với n khá lớn.
Do đó, để kiểm định giả thiết về tỉ lệ p của tổng thể, ta chọn tiêu chuẩn kiểm định X − p G = Z 0 =
n với n khá lớn, biến ngẫu nhiên Z này có phân phối chuẩn p 1 0 ( − p0 ) N ( ) 1 ; 0 . Giá tr x − p f − p
ị thực nghiệm là z 0 = n 0 =
n với x = f là tỉ lệ đối tượng p 1 − 1 0 ( p0 ) p0 ( − p0 ) np > 10 0
A trong mẫu với  .
n(1 − p0 ) > 10
Với mức ý nghĩa α và n khá lớn tùy theo từng loại kiểm định, ta thực hiện như sau:
* Đối với kiểm định hai phía. 108
Chương VI. Kiểm định giả thiết thống kê
Ta tìm z rồi so sánh với z α 2
+ Nếu z > z thì ta bác bỏ giả thiết H và thừa nhận đối thiết H với mức ý nghĩa α . α 0 1 2
+ Nếu z ≤ z thì ta chưa có cơ sở bác bỏ giả thiết H nên chấp nhận giả thiết H với α 0 0 2 mức ý nghĩa α .
* Đối với kiểm định phía phải.
Ta tìm z rồi so sánh với z α
+ Nếu z > z thì bác bỏ giả thiết H và thừa nhận đối thiết H với mức ý nghĩa α . α 0 1
+ Nếu z ≤ z thì ta chưa có cơ sở bác bỏ giả thiết H nên chấp nhận giả thiết H với α 0 0 mức ý nghĩa α .
* Đối với kiểm định phía trái. Ta tìm α− 1 z
rồi so sánh với z + Nếu z < z
= −z thì bác bỏ giả thiết H và thừa nhận đối thiết H với mức ý nghĩa α − 1 α 0 1 α . + Nếu z ≥ z
= −z thì ta chưa có cơ sở bác bỏ giả thiết H nên chấp nhận giả thiết α − 1 α 0
H với mức ý nghĩa α . 0 Ví dụ 2.6.
Một nhà máy sản xuất sản phẩm với tỉ lệ sản phẩm loại I lúc đầu là , 0 20 . Sau khi áp
dụng phương pháp sản xuất mới, kiểm tra 500 sản phẩm thấy số sản phầm loại I là 150
sản phẩm. Cho kết luận về phương pháp sản xuất mới này với mức ý nghĩa α = 1% . Giải
Tỉ lệ sản phẩm loại I lúc đầu là p , 0 20 . 0 =
Tỉ lệ sản phẩm loại I khi áp dụng phương pháp mới là p chưa biết.
Ta đặt giả thiết: H : p = p = ,
0 2 ; H : p ≠ p = , 0 2 . 0 0 1 0 np > 10 150 Ta có  0 , f = = 3 , 0 ; n = 500 ; n(1 − p 500 0 ) > 10   Do 1   Φ z = − 0 , 0 05 = , 0 495  nên z = z = 5 , 2 8 0,01  2 0,01 0,995  2  2 Giá tr f − p ị kiểm định: z n 0 = n p 1 0 ( − p0 ) 3 , 0 − , 0 2 Khi đó: z = 500 ≈ 5 , 5 9 , 0 2(1− , 0 2) Ta có z ≈ 5 , 5 9 > z = 5 ,
2 8 nên ta bác bỏ giả thuyết H , tức là p ≠ p . α 0 0 2
Khi đó, phương pháp sản xuất mới đã làm thay đổi tỉ lệ sản phẩm loại I. 109 Bài giảng Ví dụ 2.7. M 2
ột công ti A sản xuất bánh kẹo tuyên bố rằng số trẻ em thích ăn bánh của công ti. 3
Trong một mẫu gồm 100 trẻ em được hỏi, có 55 em tỏ ra thích bánh của công ti A .
Với mức ý nghĩa 5% , số liệu nói trên có chứng tỏ là lời tuyên bố của công ti là hơi
quá đáng không? Giải 2 2
Ta có giả thiết H : , đối thiết H : . 0 p = p0 = p 3 0 < 3
Đây là kiểm định bên trái đối với tỉ lệ. Dựa vào các số liệu của mẫu, ta có: np > 10 55  0 , f = = 5 , 0 5 , α = 5% nên z = −z = − 6 , 1 4 1−0,05 0,05 n(1 − p 100 0 ) > 10 2 5 , 0 5 − Khi f − p đó 0 3 z = n = 100 = − , 2 49 < − , 1 64 . p0 (1 − p0 ) 2  2  1  −  3  3 
Vậy, lời tuyên bố của công ti là quá sự thật. Ví dụ 2.8.
Tỉ lệ phế phẩm ở một nhà máy lúc ban đầu là 10% . Sau một thời gian, nhà máy cải
tiến kĩ thuật sản xuất, điều tra ngẫu nhiên 400 sản phẩm thấy có 30 phế phẩm. Với mức ý nghĩa α = 0 ,
0 25 , hãy xét xem việc cải tiến kĩ thuật của nhà máy có làm giảm tỉ
lệ phế phẩm của nhà máy không? Giải
Ta có giả thiết H : p = p = 1 ,
0 , đối thiết H : p 1 , 0 . 0 0 0 < 30 n = 400 , f = = 0 , 0 75 . 400
Đây là bài toán kiểm định bên trái đối với tỉ lệ. Với mức ý nghĩa α = 0 , 0 25 , ta có z = −z = − 9 , 1 6 . 1−0,025 0,025 Khi dó f − p0 0 , 0 75 − 1 , 0 z = n = 400 = − , 1 66 p0 (1 − p0 ) ( 1 , 0 1− ) 1 , 0 Ta có z > z
ta chưa có cơ sở bác bỏ giả thiết 0,025
H nên chấp nhận giả thiết 0 H với 0 mức ý nghĩa α = ,
0 025 . Tức là việc cải tiến kĩ thuật chưa làm tỉ lệ phế phẩm giảm xuống.
2.5. Kiểm định giả thiết về hai kì vọng của hai ĐLNN chuẩn độc lập.
Giả sử ta có hai ĐLNN chuẩn X ~ N ( 2 µ ;
có mẫu ngẫu nhiên là (X ; X ;K; X và 1 2 n ) 1 σ 1 ) Y ~ N ( 2 µ ;
có mẫu ngẫu nhiên là (Y ;Y ;K;Y . 1 2 m ) 2 σ 2 )
2.5.1. Trường hợp đã biết 2 σ1 , 2 σ 2 .
a) Kiểm định hai phía của µ . 1 110
Chương VI. Kiểm định giả thiết thống kê
Cần kiểm định giả thiết: H : µ = µ với đối thiết: H : µ ≠ µ (với 0 1 2 1 1 2
p là một giá trị 0 nào đó đã biết). H : µ = µ  0 1 2 H : µ ≠ µ 1 1 2 * Ta ch X − Y
ọn tiêu chuẩn kiểm định là G = Z =
, biến ngẫu nhiên này có phân 2 2 σ σ 1 2 + n m
phối chuẩn N ( ) 1 ; 0 .
* Với mức ý nghĩa α đã cho, ta xác định miền bác bỏ W như sau: α         W = − ∞ − ; z ∪ z
, trong đó z được xác định từ công thức α  α   ;+∞ α  α  2   2  2   2 α 1 γ m t   Φ z = 1 − − = 2  với Φ(m) ∫ − = e dt . α  2 2 2  2  0
* So sánh giá trị thực nghiệm z với z . α 2
+ Nếu z > z (nghĩa là z ∈W ) thì ta bác bỏ giả thiết H và thừa nhận đối thiết H α α 0 1 2 với mức ý nghĩa α .
+ Nếu z ≤ z (nghĩa là z ∉W ) thì ta chưa có cơ sở bác bỏ giả thiết H nên chấp nhận α α 0 2
giả thiết H với mức ý nghĩa α . 0
b) Kiểm định phía phải của µ . 1
Cần kiểm định giả thiết: H : µ = µ với đối thiết: H : . 0 1 2 1 µ1 > µ2 H : µ ≤ µ  0 1 2 H : µ > µ 1 1 2 * Ta ch X − Y
ọn tiêu chuẩn kiểm định là G = Z =
, biến ngẫu nhiên này có phân 2 2 σ σ 1 2 + n m
phối chuẩn N ( ) 1 ; 0 .
* Với mức ý nghĩa α đã cho, ta xác định miền bác bỏ W như sau: α 1 1 1 W = z
, trong đó z được xác định từ công thức Φ(z α ) = 1 − α − = − α = γ − α ( ;+∞ α ) α 2 2 2 2 w t với Φ(w) ∫ − = e 2 dt . 0
* So sánh giá trị thực nghiệm z với z . α
+ Nếu z > z (nghĩa là z ∈W ) thì ta bác bỏ giả thiết H và thừa nhận đối thiết H với α α 0 1 mức ý nghĩa α .
+ Nếu z ≤ z (nghĩa là z ∉W ) thì ta chưa có cơ sở bác bỏ giả thiết H nên chấp nhận α α 0
giả thiết H với mức ý nghĩa α . 0
c) Kiểm định phía trái của µ . 1 111 Bài giảng
Cần kiểm định giả thiết: H : µ = µ với đối thiết: H : µ < µ . 0 1 2 1 1 2 H : µ ≥ µ  0 1 2 H : µ < µ 1 1 2 * Ta ch X − Y
ọn tiêu chuẩn kiểm định là G = Z =
, biến ngẫu nhiên này có phân 2 2 σ σ 1 2 + n m
phối chuẩn N ( ) 1 ; 0 .
* Với mức ý nghĩa α đã cho, ta xác định miền bác bỏ W như sau: α 1 1 W = − ∞; z , trong đó z
= −z được xác định từ công thức Φ(z α ) = − α = γ − α ( 1 α − ) α − 1 α 2 2 2 w t với Φ(w) ∫ − = e 2 dt . 0
* So sánh giá trị thực nghiệm z với α− 1 z . + Nếu z < z (nghĩa là
) thì ta bác bỏ giả thiết 1 z ∈W
H và thừa nhận đối thiết H α − α 0 1 với mức ý nghĩa α . + Nếu z ≥ z (nghĩa là
) thì ta chưa có cơ sở bác bỏ giả thiết 1 z ∉W H nên chấp α − α 0
nhận giả thiết H với mức ý nghĩa α . 0
2.5.2. Trường hợp chưa biết 2 σ1 , 2
σ 2 và mẫu lớn m + n > 30 .
Các bước kiểm định ta thực hiện tương tự như trong trường hợp đã biết 2 σ và 2 1 σ , 2 nh X − Y
ưng ta chọn tiêu chuẩn kiểm định là G = Z = , trong đó, 2 S , 2 1 S là 2 S 2 S 2 1 2 + n m
phương sai mẫu hiệu chỉnh. Ví dụ 2.9.
Người ta cân ngẫu nhiên 75 trẻ sơ sinh ở khu vực A và 100 trẻ sơ sinh ở khu vực B,
kết quả cho theo bảng sau đây Các tham số Số trẻ được cân
Trọng lượng trung Phương sai điều bình chỉnh Khu vực A 75 2 x = 0 , 3 s , 3 0 1 = B 100 2 y = , 3 2 s 0 , 5 2 =
Có người cho rằng trọng lượng trung bình của các trẻ sơ sinh ở hai khu vực trên là như
nhau. Hãy kiểm định lời nhận xét đó với mức ý nghĩa α = 0 ,
0 5 . Giả sử trọng lượng X
và trọng lượng Y của trẻ sơ sinh ở khu vực A và khu vực B đều có phân phối chuẩn. Giải
Gọi µ là kì vọng toán của biến ngẫu nhiên 1
X (trọng lượng trung bình của toàn bộ trẻ
sơ sinh ở khu vực A) và µ là kì vọng toán của biến ngẫu nhiên 2
Y (trọng lượng trung
bình của toàn bộ trẻ sơ sinh ở khu vực B). 112
Chương VI. Kiểm định giả thiết thống kê
Ta đặt giả thiết H : µ = µ và đối thiết H : µ ≠ µ . 0 1 2 1 1 2
Do chưa biết các phương sai 2 σ , 2 1
σ nên ta chọn tiêu chuẩn kiểm định 2 X − Y G = Z = . S 2 S 2 1 2 + n m Ta có x = 0 ,
3 , n = 75 , m = 100 , x = , 3 0 , y = , 3 2 , 2 s , 3 0 và 2 s 0 , 5 nên 1 = 2 = 0 , 3 − , 3 2 10 2 z = = − , 0 2. = − 0 , 3 0 , 5 3 3 + 75 100
Đây là bài toán kiểm định hai phía Với mức ý nghĩa α = 0 ,
0 5 , ta có z = z = 9 , 1 6 . α 0,05 2 2 2 Ta có z = < 9 ,
1 6 = z nên ta chưa có cơ sở bác bỏ giả thiết H nên chấp nhận giả 3 α 0 2
thiết H với mức ý nghĩa α = 0 ,
0 5 . Nghĩa là cho rằng trọng lượng trung bình của trẻ 0
sơ sinh ở hai khu vực là như nhau với mức ý nghĩa α = 0 , 0 5 .
2.4.3. Trường hợp 2 2 σ ch n + m − 2 . 1 = σ 2 ưa biết và ≤ 30
Các bước kiểm định ta thực hiện tương tự như trong trường hợp đã biết 2 σ và 2 1 σ , 2
(X −Y) n + m − 2
nhưng ta chọn tiêu chuẩn kiểm định là G = T = , biến  1 1   +  ([n − ) 2 1 S + m −1 1 ( ) 2 S2 ]  n m 
ngẫu nhiên này có phân phối Student T (n + m − 2) với n + m − 2 bậc tự do. Trong đó, 2 S , 2 1
S là phương sai mẫu hiệu chỉnh và ta thay 2 z , z và t , α α α − 1 z bởi α n+m−2; 2 2 t , t . n+m−2 α ; n+m−2 1 ; α −
2.6. Kiểm định giả thiết thống kê về hai tỉ lệ của hai ĐLNN. * Ta ch F − F
ọn tiêu chuẩn kiểm định là G = Z = 1 2
, ĐLNN này có phân F ( 1 1 1− F )   +   1 n n2  n F + n F
phối chuẩn N ( ) 1 ; 0 , trong đó 1 1 2 2 F = 1 n + n2 Giá tr f − f n f + n f
ị thực nghiệm là z = 1 2 , trong đó 1 1 2 2 f = . 1 n + n2 f ( 1 1 1− f )   +   1 n n2 
a) Kiểm định hai phía của 1 p .
* Cần kiểm định giả thiết: H :
với đối thiết H : (với 0 1 p = p2 1 1 p ≠ p2
p là một giá trị 0 nào đó đã biết). 113 Bài giảng
H : p = p  0 1 2 H : p ≠ 1 1 p2
* Với mức ý nghĩa α đã cho, ta xác định miền bác bỏ W như sau: α         W = − ∞;−z ∪ z
, trong đó z được xác định từ công thức α  α   ;+∞ α  α  2   2  2   2 α 1 γ m t   Φ z = 1 − − = 2  với Φ(m) ∫ − = e dt . α  2 2 2  2  0
* So sánh giá trị thực nghiệm z với z . α 2
+ Nếu z > z (nghĩa là z ∈W ) thì ta bác bỏ giả thiết H và thừa nhận đối thiết H α α 0 1 2 với mức ý nghĩa α .
+ Nếu z ≤ z (nghĩa là z ∉W ) thì ta chưa có cơ sở bác bỏ giả thiết H nên chấp nhận α α 0 2
giả thiết H với mức ý nghĩa α . 0
b) Kiểm định phía phải của 1 p .
Cần kiểm định giả thiết: H :
với đối thiết H : . 0 1 p = p2 1 1 p > p2
H : p = p  0 1 2 H : p > 1 1 p2
* Với mức ý nghĩa α đã cho, ta xác định miền bác bỏ W như sau: α 1 1 1 W = z
, trong đó z được xác định từ công thức Φ(z α ) = 1 − α − = − α = γ − α ( ;+∞ α ) α 2 2 2 2 w t với Φ(w) ∫ − = e 2 dt . 0
* So sánh giá trị thực nghiệm z với z . α
+ Nếu z > z (nghĩa là z ∈W ) thì ta bác bỏ giả thiết H và thừa nhận đối thiết H với α α 0 1 mức ý nghĩa α .
+ Nếu z ≤ z (nghĩa là z ∉W ) thì ta chưa có cơ sở bác bỏ giả thiết H nên chấp nhận α α 0
giả thiết H với mức ý nghĩa α . 0
c) Kiểm định phía trái của 1 p .
Cần kiểm định giả thiết: H :
với đối thiết H : . 0 1 p ≥ p2 1 1 p < p2
H : p ≥ p  0 1 2 H : p < 1 1 p2
* Với mức ý nghĩa α đã cho, ta xác định miền bác bỏ W như sau: α W = − ∞; z , trong đó α ( 1 α − ) α − 1 z được xác định từ công thức 2 w t Φ(z α α γ với Φ(w) ∫ − = e 2 dt . −α ) 1 1 1 = 1 1 − − = − = − 2 2 2 0
* So sánh giá trị thực nghiệm z với α− 1 z . 114
Chương VI. Kiểm định giả thiết thống kê + Nếu z < z (nghĩa là
) thì ta bác bỏ giả thiết 1 z ∈W
H và thừa nhận đối thiết H α − α 0 1 với mức ý nghĩa α . + Nếu z ≥ z (nghĩa là
) thì ta chưa có cơ sở bác bỏ giả thiết 1 z ∉W H nên chấp α − α 0
nhận giả thiết H với mức ý nghĩa α . 0
2.7. Kiểm định giả thiết thống kê về quy luật phân phối.
Ta đã biết rằng khi n khá lớn thì hàm phân phối thực nghiệm F xấp xỉ hàm phân n (x )
phối F(x) của biến ngẫu nhiên X , nhưng nhiều khi dựa vào sự suy đoán, ta có thể
nhận biết được dạng hàm phân phối F(x) của biến ngẫu nhiên X .
Ta đặt giả thiết H : F
và đối thiết H : F . 1
(x) ≠ F0 (x) 0
(x) = F0 (x)
Để kiểm định giả thiết H , người ta dùng quy tắc kiểm định Chi bình ph 0 ương như sau:
+ Ta lập mẫu ngẫu nhiên (X ; X ;K; X của ; ;K; , 1 2
X và mẫu thực nghiệm là (x x x 1 2 n ) n )
ta sắp xếp mẫu thực nghiệm theo dạng các bảng phân phối không chia lớp hoặc chia lớp. Xét xác suất:
+ p = P X = a hoặc p = P a ≤ X < a , i = ;
1 m nếu mẫu thực nghiệm của X sắp i ( i−1 i ) i ( i )
xếp theo bảng phân phối thực nghiệm không chia lớp hoặc chia lớp và xác định các tần m su n ất f i =
(với n = ∑ n ) của các giá trị hoặc của các lớp trong mẫu thực nghiệm, ta i n i i =1 xem lớp [a ; là (− ; ∞
và lớp [a ;a là lớp [a + ; ∞ . m−1 ) m 1 − m ) 1 a ) 0 1 a ) X 1 x x … 2 x m n n … n i 1 n 2 m X [a ;a = − ; [a ; … [a ;a a ; m−1 m ) = [ +∞ m−1 ) 1 a2 ) 0 1 ) ( ∞ 1 a ) n n … n i 1 n 2 k Theo lu n
ật số lớn Bernoulli, ta biết rằng: i P 
 → p , khi n   → +∞ , i = ; 1 m . i n m 2 ( 2 n − np 2 i i ) m Bi n ến ngẫu nhiên G i = χ = ∑ = ∑
− n có phân phối Chi bình phương i=1 npi i=1 npi
với m − r −1 bậc tự do với n khá lớn, m là số lượng các giá trị khác nhau hoặc số lớp
ứng với mẫu thực nghiệm cho theo bảng phân phối thực nghiệm không chia lớp vả r
là số lượng các tham số chưa biết của F(x), các tham số này được ước lượng bằng
phương pháp hợp lí cực đại.
Ta có quy tắc kiểm định sau đây: m 2 ( 2 n − np 2 i i ) m * Xác n
định giá trị thực nghiệm: i χ = ∑ = ∑ − n . i=1 npi i=1 npi
* Với mức ý nghĩa α , ta tìm số 2 χ
từ bảng phân phối Chi bình phương rồi so m−r − , 1 α sánh với 2 χ . 115 Bài giảng + Nếu 2 2 χ
< χ thì bác bỏ giả thiết H và thừa nhận đối thiết H với mức ý nghĩa m−r − ; 1 α 0 1 α . + Nếu 2 2 χ
≥ χ thì ta chưa có cơ sở bác bỏ giả thiết H nên chấp nhận giả thiết m−r − ; 1 α 0
H với mức ý nghĩa α . 0 Chú ý.
Các phân phối cơ bản cần kiểm định.
1. Nhị thức: X ~ B(n; p).
+ Nếu n đã biết, p đã biết thì r = 0 .
+ Nếu n đã biết, p chưa biết thì r = 1.
+ Nếu n chưa biết, p chưa biết thì r = 2 .
2. Poisson: X ~ P(λ) . λ chưa biết, ta thay λ = x , r = 1
3. Chuẩn: X ~ N ( 2 µ;σ ) n 1 N 2
ếu µ , σ chưa biết, ta thay µ = x , σ = s với s =
∑(x − x là phương sai mẫu i ) n −1 i=1
hiệu chỉnh, r = 2 . Ví dụ 2.10.
Có thể cho rằng số mặt sấp xuất hiện khi tung bốn đồng tiền là đại lượng ngẫu nhiên
tuân theo quy luật phân phối xác suất nhị thức B(n; p) được không, nếu biết mức ý nghĩa α = 0 , 0 1.
Khi tung 100 lần thì người ta được kết quả sau đây x (số mặt sấp) 0 1 2 3 4 i
n (số lần xuất hiện) 8 20 42 22 8 i Giải
Gọi F(x) là hàm phân phối xác suất của X và F
là hàm phân phối của biến ngẫu 0 (x)
nhiên có phân phối nhị thức B(n; p). Ta có P(X = k) k k = C p 1 p − − . n ( )n k
Đặt giả thiết H : F
và đối thiết H : F . 0
(x) ≠ F0(x) 0
(x) = F0 (x) 1
Ta có n = 4 , p = = 5 , 0 . 2
Nếu X có phân phối nhị thức B( 5 , 0 ; 4
) thì các xác suất p được xác định như sau i i i p = 4 C − 5 , 0 1− 5 , 0 ; i = 4 ; 0 i+1 4 ( ) i Khi đó, ta có: p 0 , 0 625 , p , 0 25 , p 3 , 0 75 , p , 0 25 , p , 0 0625 . 1 = 2 = 3 = 3 = 4 = m 2 ( 2 n − np i i ) Để tính χ = ∑ , ta lập bảng sau đây 1 np i= i x n p np n − np ( 2 n − np i i ) i i i i i i npi 0 8 , 0 0625 , 6 25 , 1 75 , 0 49 116
Chương VI. Kiểm định giả thiết thống kê 1 20 , 0 25 25 − 5 1 2 42 3 , 0 75 37 5 , 5 , 4 5 , 0 4 3 22 , 0 25 25 − 3 3 , 0 6 4 8 , 0 0625 , 6 25 , 1 75 , 0 49 5 2 (n − np i i )2 Khi đó, ta có χ = ∑ = 8 , 2 8 . np i 1 = i Với mức ý nghĩa α = 0 ,
0 1, m = 5 và r = 1, ta có: 2 2 2 χ = χ = χ = 5 , 4 41. m−r − , 1 α 5 1 − − ; 1 0,01 ; 3 0,01 Ta có 2 2 χ
> χ nên ta chưa có cơ sở bác bỏ giả thiết H nên chấp nhận giả thiết m−r − ; 1 α 0
H với mức ý nghĩa α = 0 ,
0 1. Khi đó, ta cho rằng số mặt sấp xuất hiện tuân theo phân 0 phối nhị thức. Ví dụ 2.11.
Gọi X là số lần khách đến bán ĐTDĐ ở một cửa hàng trong 96 ngày được cho theo bảng sau đây
X (số lần khách đến) 0 1 2 3 4 n (Số ngày) 17 22 26 20 11 i Với mức ý nghĩa α = 0 ,
0 1, ta có xem X có phân phối Poisson được không? Giải
Gọi F(x) là hàm phân phối xác suất của X và F
là hàm phân phối của biến ngẫu 0 (x) −λ 2 nhiên có phân ph e λ
ối Poisson P(λ). Ta có: P(X = x = i ) x ! i
Đặt giả thiết H : F
và đối thiết H : F . 0
(x) ≠ F0(x) 0
(x) = F0 (x)
Dựa vào bảng, ta tính được x = 2 .
Nếu X có phân phối Poisson P(2) thì các xác suất p được xác định như sau i 2 e 2 xi p = ; i = 5 ; 1 i x ! i Ta có: p 1 , 0 353 , p , 0 2707 , p , 0 2707 , p 1 , 0 804 , p 0 , 0 902 . 1 = 2 = 3 = 4 = 5 = m 2 ( 2 n − np i i ) Để tính χ = ∑ , ta lập bảng sau đây 1 np i= i x n p np n − np ( 2 n − np i i ) i i i i i i npi 0 17 1 , 0 353 13 5 , 3 , 3 47 8 , 0 9 1 22 , 0 2707 27 0 , 7 − 0 , 5 7 9 , 0 5 2 26 , 0 2707 27 0 , 7 − , 1 07 , 0 04 3 20 1 , 0 804 18 0 , 4 9 , 1 6 , 0 21 4 11 , 0 0902 0 , 9 2 9 , 1 8 , 0 43 5 2 (n − np i i )2 Khi đó, ta có χ = ∑ = 8 , 2 9 np i 1 = i 117 Bài giảng Với mức ý nghĩa α = 0 ,
0 1, m = 5 và r = 1, ta có: 2 2 2 χ = χ = χ = 1 , 1 3 , 45 . m−r − , 1 α 5 1 − − ; 1 0,01 ; 3 0,01 Ta có 2 2 χ
> χ nên ta chưa có cơ sở bác bỏ giả thiết H nên chấp nhận giả thiết m−r − ; 1 α 0
H với mức ý nghĩa α = 0 ,
0 1. Khi đó, ta cho rằng số lần 0
X khách bán ĐTDĐ có phân phối Poisson. Ví dụ 2.12.
Điểm trung bình học tập của 100 sinh viên được cho ở bảng số liệu sau đây
[a ;a n i 1 − i ) i 0-3 8 3-5 11 5-7 50 7-8 22 8-10 9 Với mức ý nghĩa α = 0 ,
0 5 , kiểm định giả thiết nói rằng điểm trung bình học tập của
sinh viên tuân theo luật phân phối chuẩn. Giải
Gọi F(x) là hàm phân phối xác suất của X và F
là hàm phân phối của biến ngẫu 0 (x) nhiên chu  x − µ  1 ẩn N ( 2
µ;σ ), F(x = Φ  . 0 ) +  σ  2
Đặt giả thiết H : F
và đối thiết H : F 0
(x) ≠ F0(x) 0
(x) = F0 (x)
Dựa vào bảng số liệu, ta tính được: x = 0 , 6 2 , 2 2 s = 8 , 1 4
Nếu X có phân phối chuẩn thì X ~ N( 2 , 6 02 8 , 1
; 4 ) và các xác suất p được tính như i sau:  − 
p = P(X < 3 = F = Φ  1 ) (3) 3 , 6 02 1 + = 0 , 0 51  8 , 1 4  2  −   −  p = P ≤ X < = F − F = Φ  − Φ  2 (3 5) (5) (3) 5 , 6 02 3 0 , 6 2 = ,0239  8 , 1 4   8 , 1 4   −   −  p = P ≤ X < = F − F = Φ  − Φ  3 (5 7) (7) (5) 7 , 6 02 5 , 6 02 = ,0412  8 , 1 4   8 , 1 4   −   −  p = P ≤ X < = F − F = Φ  − Φ  4 (7 8) (8) (7) 8 0 , 6 2 7 , 6 02 = 1, 0 56  8 , 1 4   8 , 1 4   − 
p = P(X ≥ 8 = − F = − Φ  5 ) 1 (3) 1 8 0 , 6 2 = 1, 0 41 2  8 , 1 4  m 2 ( 2 n − np i i ) Để tính χ = ∑ , ta lập bảng sau đây 1 np i= i n p np n − np ( 2 n − np i i ) i i i i i npi 8 0,051 5,069 2,931 1,694 11 0,239 23,934 -12,934 6,99 118
Chương VI. Kiểm định giả thiết thống kê 50 0,412 41,246 8,754 1,858 22 0,156 15,610 6,390 2,616 9 0,141 14,140 -5,140 1,869 5 2 (n − np i i )2 Khi đó, ta có χ = ∑ = 15 0 , 26 . np i 1 = i Với mức ý nghĩa α = 0 ,
0 5 , m = 5 và r = 2 , ta có: 2 2 2 χ = χ = χ = 9 , 5 92 . m−r − , 1 α 5−2− ; 1 0,05 2;0,05 + Nếu 2 2 χ
< χ thì bác bỏ giả thiết H và thừa nhận đối thiết H với mức ý nghĩa m−r − ; 1 α 0 1
α . Như vậy, ta không thể coi điểm trung bình học tập của sinh viên có phân phối chuẩn. Ví dụ 2.13.
Kiểm tra ngẫu nhiên 130 cây có trong một khu rừng và đo chiều cao của chúng, kết
quả thu được cho theo bảng sau đây: [a ;a 30-36 36-42 42-48 48-54 54-60 60-66 66-72 i 1 − i ) n 2 8 35 43 22 15 5 i
Có người cho rằng chiều cao X của loại cây này có phân phối chuẩn N( 2 µ;σ ). Hãy
kiểm định lời nhận định này với mức ý nghĩa α = 0 , 0 5 . Giải
Gọi F(x) là hàm phân phối xác suất của X và F
là hàm phân phối của biến ngẫu 0 (x)  x − µ  1 nhiên chuẩn N( 2
µ;σ ), F(x = Φ  . 0 ) +  σ  2
Đặt giả thiết H : F
và đối thiết H : F . 0
(x) ≠ F0(x) 0
(x) = F0 (x)
Dựa vào bảng, ta tính được x = 51 5 , và s = 7 6 , 8 . Nếu 2
X có phân phối chuẩn thì X ~ N (51 ; 5 , ( ,
7 68) ) và các xác suất p được tính như i sau:  −  p = P X < = F = Φ  . 1 ( 36) 0 (36) 36 51 5 , 1 + = , 0 022  7 6 , 8  2  −   −  p = P ≤ X < = F − F = Φ  − Φ  2 (36 42) 0 (42) 0 (36) 42 51 5 , 36 51 5 , = , 0 087  7 6 , 8   7 6 , 8   −   −  p = P ≤ X < = F − F = Φ  − Φ  3 (42 48) 0 (48) 0 (42) 48 51 5 , 42 51 5 , = , 0 217  7,68   7,68   −   −  p = P ≤ X < = F − F = Φ  − Φ  4 (48 54) 0 (54) 0 (48) 54 51 5 , 48 51 5 , = 3 , 0 03  7 6 , 8   7,68   −   −  p = P ≤ X < = F − F = Φ  − Φ  5 (54 60) 0 (54) 0 (48) 60 51 5 , 54 51 5 , = , 0 237  7,68   7 6 , 8   −   −  p = P ≤ X < = F − F = Φ  − Φ  6 (60 66) 0 (66) 0 (48) 66 51 5 , 60 51 5 , = 1 , 0 04  7,68   7 6 , 8   − 
p = P(X ≥ 66 = − Φ  7 ) 1 66 51 5 , = , 0 029 2  7 6 , 8  119 Bài giảng m 2 ( 2 n − np i i ) Để tính χ = ∑ , ta lập bảng sau đây 1 np i= i n p np n − np ( 2 n − np i i ) i i i i i npi 2 , 0 022 8 , 2 6 − 8 , 0 6 , 0 26 8 , 0 087 11 3 , − 3 , 3 9 , 0 6 35 , 0 217 2 , 8 23 7 , 6 7 , 1 62 43 3 , 0 03 3 , 9 45 5 , 3 5 3 , 0 2 22 , 0 237 30 8 , 6 − 8.86 5 , 2 5 15 1 , 0 04 13 5 , 1 , 1 49 1 , 0 6 5 , 0 029 7 , 3 9 , 1 21 3 , 0 9 m 2 (n − np i i )2 Khi đó, ta có χ = ∑ = , 6 26 . np i 1 = i Với mức ý nghĩa α = 0 ,
0 5 , m = 7 và r = 2 , ta có: 2 2 2 χ = χ = χ = 5 , 9 . m−r − , 1 α 7−2− ; 1 0,05 4;0,05 Ta có 2 2 χ
> χ nên ta chưa có cơ sở bác bỏ giả thiết H nên chấp nhận giả thiết m−r − ; 1 α 0
H với mức ý nghĩa α = 0 ,
0 5 . Khi đó, ta cho rằng chiều cao 0
X của loại cây trên có
phân phối chuẩn với mức ý nghĩa α = 0 , 0 5 .
2.8. Kiểm định giả thiết thống kê về tính độc lập.
Giả sử ta có mẫu ngẫu nhiên hai quan sát đồng thời về hai ĐLNN X và Y . Từ mẫu có
kích thước n , ta có bảng số liệu sau đây (X ;Y ) 1 y y K 2 y Tổng h x 1 1 n 1 1 n K 2 n1h 1 n x 2 n 21 n K 22 n2 n h 2 K K K K K K x n n K n n k k1 k 2 kh k Tổng 1 m m K 2 m ∑= n h Trong đó, h n = n , i = ; 1 k , i ∑ ij j =1 k k h m = m , j = ;
1 h , và n = ∑∑ n j ∑ ij ij i=1 i j
Ta đặt giả thiết: H : 0
X và Y độc lập. Đối thiết: H : 1
X và Y không độc độc lập.
Với mức ý nghĩa α cho trước. Hãy kiểm định giả thiết H . 0 120
Chương VI. Kiểm định giả thiết thống kê  2 k h n  Biến ngẫu nhiên 2  ij 
G = χ = n∑ ∑
−1 có phân phối Chi bình phương với  1 1 n m i= j= i j  (k − ) 1 (h − ) 1 bậc tự do.
Ta có quy tắc kiểm định sau đây:  2 k h n 
* Xác định giá trị thực nghiệm: 2  ij  χ = n∑∑ −1 .  1 1 n m i= j = i j 
* Với mức ý nghĩa α , ta tìm số 2 χ t (
ừ bảng phân phối Chi bình phương rồi so k 1 − )(h 1 − );α sánh với 2 χ . + Nếu 2 2 χ thì bác b ( < χ
ỏ giả thiết H và thừa nhận đối thiết H với mức ý k 1 − )(h 1 − );α 0 1 nghĩa α . + Nếu 2 2 χ thì ta ch ( ≥ χ
ưa có cơ sở bác bỏ giả thiết H nên chấp nhận giả thiết k 1 − )(h 1 − );α 0
H với mức ý nghĩa α . 0 Ví dụ 2.14.
Trong một nhà máy dệt may, một nhà thống kê theo dõi 1000 công nhân làm việc
trong một năm và thấy số ngày nghỉ việc của họ được cho trong bảng sau
Số ngày nghỉ việc trong năm Nam Nữ 0-10 300 500 10-20 80 70 20 trở lên 20 30
Với mức ý nghĩa α = 5% , nhà thống kê này có thể cho rằng số ngày nghỉ của công
nhân có phụ thuộc vào giới tính không? Giải
Gọi X là số ngày nghỉ của công nhân, Y là giới tính của công nhân.
Dựa vào bảng số liệu, ta có: (X ;Y ) 1 y y Tổng 2 1 x 300 500 800 x 80 70 150 2 x 20 30 50 3 Tổng 400 600 1000
Đây là bài toán kiểm định giả thiết về tính độc lập của X và Y .
Ta đặt giả thiết: : H : 0
X và Y độc lập. Đối thiết: H : 1
X và Y không độc độc lập.  2 k h n 
Ta chọn giá trị kiểm định: 2  ij  χ = n∑∑ −1 .  1 1 n m i= j = i j  Khi đó, ta có: 121 Bài giảng  3002  2 5002 802 702 202 302 χ = 1000 + + + + + −1 = 13 1 , 9   800 4 . 00 800 6 . 00 150.400 150 6 . 00 50.400 50.600  
Với mức ý nghĩa α = 5% , k = 3, h = 2 , ta có 2 2 χ = χ = 9 , 5 92 . (k 1 − )(h 1 − );α 2;0,05 Ta có 2 2 χ thì bác b ( < χ
ỏ giả thiết H và thừa nhận đối thiết H với mức ý k 1 − )(h 1 − );α 0 1
nghĩa 5% . Vậy số ngày nghỉ của công nhân phụ thuộc vào giới tính. 3. Bài tập chương. 1.
Trọng lượng X của sản phẩm do một nhà máy sản xuất ra là một biến ngẫu nhiên có
phân phối chuẩn N ( 2
µ;σ ) với σ = 2 kg và trọng lượng trung bình là µ = 20 kg. Nghi
ngờ nhà máy hoạt động không bình thường làm thay đổi trọng lượng trung bình của sản
phẩm, người ta cân 100 sản phẩm và kết quả thu được cho theo bảng sau:
x : trọng lượng sản phẩm 18 19 20 21 22 i
n : số sản phẩm tương ứng 5 25 40 20 10 i
Hãy kiểm định điều nghi ngờ trên với mức ý nghĩa α = 0 ,
0 5 với giả thiết: H : µ 20 kg và 0 = đối thiết H : µ 20 . 0 ≠ 2.
Theo kỹ thuật quy định thiết kế quy định chiều dài trung bình của một chi tiết máy do
nhà máy A sản xuất là 20 cm. Sau một thời gian sản xuất, có ý kiến cho rằng nhà máy
A sản xuất loại chi tiết máy trên không đạt yêu cầu. Để kiểm tra, người tra chọn ngẫu
nhiên 64 chi tiết và đo (phép đo không có sai số) kết quả thu được: chiều dài trung bình x = 20 5
, cm và độ lệch tiêu chuẩn hiệu chỉnh là s = 1 cm. Biết rằng chiều dài loại chi
tiết trên là biến ngẫu nhiên chuẩn N ( 2
µ;σ ). Hãy kiểm định điều nghi ngờ trên với mức ý nghĩa α = 0 ,
0 5 với giả thiết: H : µ
20 cm và đối thiết H : µ 20 cm. 0 = 0 ≠ 3.
Một nhà thống kê theo dõi mức thu nhập của một số người ở Công ty May và thu được số liệu như sau. X (trăm ngàn) 8 11 13 15 17 19 21 23 n (Số người) 4 16 25 30 26 20 15 8
a) Tính thu nhập trung bình của X và độ lệch chuẩn điều chỉnh s của thu nhập X .
b) Với độ tin cậy γ = 95% . Hãy ước lượng thu nhập trung bình của toàn bộ công nhân ở Công ty May.
c) Nếu nhà thống kê cho rằng thu nhập mỗi tháng X ≥ 7 ,
1 triệu là cao. Hãy ước lượng tỉ lệ
p của những người có thu nhập cao trong Công ty với độ tin cậy γ = 99% .
d) Nếu ban giám đốc báo cáo rằng thu nhập trung bình là 6 ,
1 triệu. Nhà thống kê dựa vào
mẫu kết quả ở trên với mức ý nghĩa α = 5% . Nhà thống kê có thể tin cậy vào ý kiến này không? 4.
Điều tra doanh số bán hàng X (triệu đồng/tháng) của các hộ kinh doanh một loại hàng
năm nay, ta được số liệu sau đây X (triệu/tháng) 11 11,5 12 12,5 13 13,5 Số hộ 10 15 20 30 15 10
a) Nếu biết rằng những hộ có doanh số trên 12,5 triệu / tháng là những hộ có doanh số cao.
Có bài báo công bố rằng tỉ lệ hộ có doanh số cao là 35% . Cho nhận xét về tỉ lệ những
hộ có doanh số cao trong bài báo này với mức ý nghĩa 5% . 122
Chương VI. Kiểm định giả thiết thống kê
b) Năm trước, doanh số bán hàng của các hộ này là 120 triệu / năm (tức là 10 triệu /
tháng). Có thể cho rằng doanh số bán hàng của các hộ này năm nay tăng lên không với mức ý nghĩa 1% . 5.
Một công ti kinh doanh xe đạp điện tuyên bố rằng 60% khách hàng ưa thích sản phẩm
của công ti. Điều tra 400 khách hàng thì có 230 khách hàng ưa thích sản phẩm của tông
ti này. Với mức ý nghĩa α = 5% , hãy xem tỉ lệ trong tuyên bố của công ti có đúng không? 6.
Trọng lượng của một gói bột ngọt do một máy tự động đóng theo thiết kế là 500
gram/gói. Nghi ngờ máy tự động đóng gói này làm việc không bình thường làm cho
trọng lượng của gói bột ngọt có xu hướng giảm sút. Người ta lấy ngẫu nhiên 30 gói, cân
thử và được trọng lượng trung bình là 495 gram và độ lệch tiêu chuẩn hiệu chỉnh s = 10
gram. Với mức ý nghĩa α = 5% , hãy cho kết luận về nghi ngờ này. 7.
Trước đây, định mức tiêu dùng điện của một hộ gia đình trong một tháng là 140 kW. Do
đời sống nâng cao, người ta theo dõi 100 hộ gia đình và thu được số liệu sau đây Lượng tiêu dùng 100-120 120-140 140-160 160-180 180-200 (kW) Số hộ gia đình 14 25 30 20 11
a) Với mức ý nghĩa α = 5% , theo bạn có nên tăng định mức lên không?
b) Nếu trước đây, độ biến động của mức tiêu dùng điện cho một hộ gia đình là 400 (kW)2 .
Vậy, hiện nay, độ biến động tăng không? Hãy cho kết luận với mức ý nghĩa α = 5% . 8.
Một đại lí xe máy đã kí hợp đồng với 2 nhà cung cấp A và B sản xuất thử linh kiện
khung cho xe Dream II. Dựa vào kết quả thử khung, đại lí sẽ chọn nhà cung cấp nào cho
đại lí của mình. Nhà cung cấp A đã sản xuất thử được 10 cái với độ bền trung bình là
4,8 tháng và độ lệch tiêu chuẩn là 1,1 tháng; nhà cung cấp B sản xuất thử 13 cái có độ
bền trung bình là 4,3 tháng và độ lệch tiêu chuẩn là 0,9 tháng. Cho mức ý nghĩa
α = 10% , giả sử độ bền của hai loại khung do các nhà cung cấp A và B sản xuất có
phân phối chuẩn. Nếu biết độ ổn định về độ bền (phương sai) của hai loại khung là như
nhau, hãy xem tuổi thọ trung bình của hai loại khung có khác nhau không? 9.
Độ lệch tiêu chuẩn của trọng lượng X của một loại sản phẩm là 0,1 kg. Nghi ngờ độ
đồng đều của trọng lượng sản phẩm giảm sút, người ta cân thử 25 sản phẩm và thu được số liệu sau đây X (kg) 2,1 2,2 2,3 2,4 2,5 Số sản phầm 2 4 15 3 1
Với mức ý nghĩa α = 5% , hãy cho biết kết luận về điều nghi ngờ trên. Giả thiết trọng lượng
sản phẩm có phân phối chuẩn.
C. Phương pháp giảng dạy.
- Đưa ví dụ cụ thể để thấy rõ ứng dụng của kiểm định.
- Sử dụng các bảng phụ lục cho việc tính các giá trị của hàm phân phối chuẩn, Poisson, Student, chi bình phương.
- Phối hợp phương pháp thuyết trình và vấn đáp giải quyết vấn đề.
- Yêu cầu SV đọc bài giảng trước khi lên lớp.
- Kiểm tra, đánh giá việc làm bài tập của SV.
D. Tài liệu tham khảo
[1] Đậu Thế Cấp, Xác suất thống kê: Lí thuyết và các bài tập, NXB Giáo dục, 2006. 123 Bài giảng
[2] Đặng Hùng Thắng, Thống kê và ứng dụng, NXB Giáo dục, 2008.
[3] PGS. TS. Phạm Xuân Kiều, Giáo Trình xác suất và thống kê, NXB Giáo dục, 2005.
[4] Trần Văn Minh, Phí Thị Vân Anh, Xác suất thống kê với các tính toán trên Excel,
NXB Giao Thông Vận tải, 2008.
[5] Đặng Công Hanh, Đặng Ngọc Dục, Giáo trình Lý thuyết xác suất và Thống kê
toán, trường Đại học Duy Tân,1996
[6] Trần Văn Minh, Phí Thị Vân Anh, Hướng dẫn giải bài tập Xác suất thống kê với
các tính toán trên Excel, NXB Giao Thông Vận tải, 2008. 124 Các bảng số Các bảng số
Bảng 1. Bảng phân phối Poisson: −λ k λ − . 0 1 e × . 0 11 P(X = ) e k = , POISSON( 0 , 1 . 0 , 1 ) = 0 , 0 905 , P(X = ) 1 = k! ! 1 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 (k;λ)
0 0.9048 0.8187 0.7408 0.6703 0.6065 0.5488 0.4966 0.4493 0.4066
1 0.0905 0.1637 0.2222 0.2681 0.3033 0.3293 0.3476 0.3595 0.3659
2 0.0045 0.0164 0.0333 0.0536 0.0758 0.0988 0.1217 0.1438 0.1647
3 0.0002 0.0011 0.0033 0.0072 0.0126 0.0198 0.0284 0.0383 0.0494
4 0.0000 0.0001 0.0003 0.0007 0.0016 0.0030 0.0050 0.0077 0.0111
5 0.0000 0.0000 0.0000 0.0001 0.0002 0.0004 0.0007 0.0012 0.0020
6 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0002 0.0003 (k;λ) 1 1.5 2 2.5 3 3.5 4 4.5 5 0 0.3679 0.2231 0.1353 0.0821 0.0498 0.0302 0.0183 0.0111 0.0067 1 0.3679 0.3347 0.2707 0.2052 0.1494 0.1057 0.0733 0.0500 0.0337 2 0.1839 0.2510 0.2707 0.2565 0.2240 0.1850 0.1465 0.1125 0.0842 3 0.0613 0.1255 0.1804 0.2138 0.2240 0.2158 0.1954 0.1687 0.1404 4 0.0153 0.0471 0.0902 0.1336 0.1680 0.1888 0.1954 0.1898 0.1755 5 0.0031 0.0141 0.0361 0.0668 0.1008 0.1322 0.1563 0.1708 0.1755 6 0.0005 0.0035 0.0120 0.0278 0.0504 0.0771 0.1042 0.1281 0.1462 125 Các bảng số
Bảng 2. Giá trị tích phân Laplace: 2 z t 1   1 0 0 . 5 Φ(z) ∫ − =
e 2 dt , Ví dụ: NORMDIST ( . 1 9 , 6 ) 1 , 1 , 0 = 0 4 , 75 ,   Φ z = − . 2  .005  π 2 2 0  2  z 0 1 2 3 4 5 6 7 8 9
0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990 126 Các bảng số
Bảng 3. Phân vị α của phân phối Student       P T > t = α    . Ví dụ: TINV (24 . 0 , 0 ) 5 = 0 .
2 639 , P T > t = 0.05 α   . 0 05   n; 24; 2   2  (n;α) 0.200 0.100 0.050 0.025 0.010 0.005 1 3.0777 6.3138 12.7062 25.4517 63.6567 127.3213 2 1.8856 2.9200 4.3027 6.2053 9.9248 14.0890 3 1.6377 2.3534 3.1824 4.1765 5.8409 7.4533 4 1.5332 2.1318 2.7764 3.4954 4.6041 5.5976 5 1.4759 2.0150 2.5706 3.1634 4.0321 4.7733 6 1.4398 1.9432 2.4469 2.9687 3.7074 4.3168 7 1.4149 1.8946 2.3646 2.8412 3.4995 4.0293 8 1.3968 1.8595 2.3060 2.7515 3.3554 3.8325 9 1.3830 1.8331 2.2622 2.6850 3.2498 3.6897 10 1.3722 1.8125 2.2281 2.6338 3.1693 3.5814 11 1.3634 1.7959 2.2010 2.5931 3.1058 3.4966 12 1.3562 1.7823 2.1788 2.5600 3.0545 3.4284 13 1.3502 1.7709 2.1604 2.5326 3.0123 3.3725 14 1.3450 1.7613 2.1448 2.5096 2.9768 3.3257 15 1.3406 1.7531 2.1314 2.4899 2.9467 3.2860 16 1.3368 1.7459 2.1199 2.4729 2.9208 3.2520 17 1.3334 1.7396 2.1098 2.4581 2.8982 3.2224 18 1.3304 1.7341 2.1009 2.4450 2.8784 3.1966 19 1.3277 1.7291 2.0930 2.4334 2.8609 3.1737 20 1.3253 1.7247 2.0860 2.4231 2.8453 3.1534 21 1.3232 1.7207 2.0796 2.4138 2.8314 3.1352 22 1.3212 1.7171 2.0739 2.4055 2.8188 3.1188 23 1.3195 1.7139 2.0687 2.3979 2.8073 3.1040 24 1.3178 1.7109 2.0639 2.3909 2.7969 3.0905 25 1.3163 1.7081 2.0595 2.3846 2.7874 3.0782 26 1.3150 1.7056 2.0555 2.3788 2.7787 3.0669 27 1.3137 1.7033 2.0518 2.3734 2.7707 3.0565 28 1.3125 1.7011 2.0484 2.3685 2.7633 3.0469 29 1.3114 1.6991 2.0452 2.3638 2.7564 3.0380 30 1.3104 1.6973 2.0423 2.3596 2.7500 3.0298 127 Các bảng số
Bảng 4. Phân vị α của phân phối Chi bình phương P(χ 2 > χ 2 = . Ví dụ: CHIINV ( , 5 0 . 0 ) 1 = 15 0 . 863 , P( 2 2 χ > χ . 5;0 0 . 1 ) = 0 . 0 1 n α ; ) α (n;α) 0.010 0.025 0.050 0.950 0.975 0.990 1 6.6349 5.0239 3.8415 0.0039 0.0010 0.0002 2 9.2103 7.3778 5.9915 0.1026 0.0506 0.0201 3 11.3449 9.3484 7.8147 0.3518 0.2158 0.1148 4 13.2767 11.1433 9.4877 0.7107 0.4844 0.2971 5 15.0863 12.8325 11.0705 1.1455 0.8312 0.5543 6 16.8119 14.4494 12.5916 1.6354 1.2373 0.8721 7 18.4753 16.0128 14.0671 2.1673 1.6899 1.2390 8 20.0902 17.5345 15.5073 2.7326 2.1797 1.6465 9 21.6660 19.0228 16.9190 3.3251 2.7004 2.0879 10 23.2093 20.4832 18.3070 3.9403 3.2470 2.5582 11 24.7250 21.9200 19.6751 4.5748 3.8157 3.0535 12 26.2170 23.3367 21.0261 5.2260 4.4038 3.5706 13 27.6882 24.7356 22.3620 5.8919 5.0088 4.1069 14 29.1412 26.1189 23.6848 6.5706 5.6287 4.6604 15 30.5779 27.4884 24.9958 7.2609 6.2621 5.2293 16 31.9999 28.8454 26.2962 7.9616 6.9077 5.8122 17 33.4087 30.1910 27.5871 8.6718 7.5642 6.4078 18 34.8053 31.5264 28.8693 9.3905 8.2307 7.0149 19 36.1909 32.8523 30.1435 10.1170 8.9065 7.6327 20 37.5662 34.1696 31.4104 10.8508 9.5908 8.2604 21 38.9322 35.4789 32.6706 11.5913 10.2829 8.8972 22 40.2894 36.7807 33.9244 12.3380 10.9823 9.5425 23 41.6384 38.0756 35.1725 13.0905 11.6886 10.1957 24 42.9798 39.3641 36.4150 13.8484 12.4012 10.8564 25 44.3141 40.6465 37.6525 14.6114 13.1197 11.5240 26 45.6417 41.9232 38.8851 15.3792 13.8439 12.1981 27 46.9629 43.1945 40.1133 16.1514 14.5734 12.8785 28 48.2782 44.4608 41.3371 16.9279 15.3079 13.5647 29 49.5879 45.7223 42.5570 17.7084 16.0471 14.2565 30 50.8922 46.9792 43.7730 18.4927 16.7908 14.9535 128
Document Outline