65 trang 713 lượt tải

Bài giảng thống kê Xã hội học 2022│Đại học Sư phạm Hà Nội

1.4 K

Bài giảng thống kê Xã hội học 2022│Đại học Sư phạm Hà Nội được biên soạn theo phân phối chương trình học. Bao gồm các thông tin được sắp xếp theo trật tự logic nhằm cung cấp cho người học kiến thức và kỹ năng nhất định, sẽ làm tăng tính sinh động của môn học, từ đó giúp sinh viên có thể tiếp thu kiến thức một cách dễ dàng và linh hoạt hơn.

Môn: Thống kê xã hội học 104 tài liệu

Trường: Trường Đại học Sư Phạm Hà Nội 3.6 K tài liệu

Tác giả:

VietJack

1 năm trước

Tải xuống Báo cáo

Danh sách Quiz

Bài giảng Thống kê Xã hội học

Khoa Toán Tin

Trường Đại học Sư phạm Hà Nội

2020

Mục

lục

MỘT SỐ KIẾN THỨC XÁC SUẤT CƠ SỞ

1.1 Định nghĩa xác suất . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.1.1 Phép thử ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.1.2 Không gian mẫu và Biến cố sơ cấp . . . . . . . . . . . . . . . . . . . . . . . .

1.1.3 Biến cố . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.1.4 Phép toán trên các biến cố . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.1.5 Mối quan hệ giữa các biến cố . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.1.6 Định nghĩa xác suất cổ điển

. . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.1.7 Tính chất của xác suất . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.1.8 Định nghĩa xác suất theo thống kê . . . . . . . . . . . . . . . . . . . . . . . . 10

1.2 Sự độc lập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.2.1 Hai biến cố độc lập

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.2.2 Dãy biến cố độc lập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.2.3 Dãy phép thử Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.2.4 Công thức xác suất nhị thức . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1.3 Biến ngẫu nhiên rời rạc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.3.1 Định nghĩa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

1.3.2 Phân phối của biến ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . . . . 14

1.3.3 Các số đặc trưng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

1.3.4 Ý nghĩa của kỳ vọng và phương sai . . . . . . . . . . . . . . . . . . . . . . . . 14

1.3.5 Phân phối nhị thức

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

1.3.6 Tính chất của kỳ vọng và phương sai

. . . . . . . . . . . . . . . . . . . . . . . 15

1.4 Biến ngẫu nhiên liên tục và Phân phối chuẩn

. . . . . . . . . . . . . . . . . . . . . .

1.4.1 Biến ngẫu nhiên liên tục . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

1.4.2 Hàm mật độ

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

1.4.3 Các số đặc trưng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

1.4.4 Phân phối chuẩn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

1.4.5 Tính chất của phân phối chuẩn . . . . . . . . . . . . . . . . . . . . . . . . . . 17

1.4.6 Xấp xỉ phân phối nhị thức bằng phân phối chuẩn . . . . . . . . . . . . . . .

MẪU NGẪU NHIÊN

2.1 Giới thiệu về Thống kê . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2.1.1 Mẫu và quần thể . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2.1.2 Quy trình nghiên cứu thống kê . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2.1.3 Các bài toán thống kê sẽ học: . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2.2 Thu thập dữ liệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2.2.1 Xác định dữ liệu cần thu thập

. . . . . . . . . . . . . . . . . . . . . . . . . . . 22

2.2.2

Dữ liệu sơ cấp và thứ cấp

............................................................................................

2.2.3

Lấy mẫu hoàn lại và không hoàn lại

..........................................................................

2.2.4

Quy tắc lấy mẫu

............................................................................................................

2.2.5

Phương pháp lấy mẫu giản đơn

..................................................................................

2.2.6

Các phương pháp lấy mẫu khác

.................................................................................

2.3

Trình bày dữ liệu bằng bảng và biểu đồ

................................................................................

2.3.1

Biểu đồ thân-lá (stem-and-leaf diagram)

..................................................................

2.3.2

Tần số

.............................................................................................................................

2.3.3

Bảng tần số

....................................................................................................................

2.4

Biểu đồ tần số

............................................................................................................................

2.4.1

Biểu đồ tần suất

............................................................................................................

2.5

Số liệu và các số đặc trưng

......................................................................................................

2.5.1

Biến

số

...........................................................................................................................

2.5.2

Phân loại biến số

..........................................................................................................

2.5.3

Các số đo giá trị trung tâm

..........................................................................................

2.5.4

Các số đo độ phân tán

................................................................................................

2.5.5

Thống kê

........................................................................................................................

3 KHOẢNG ƯỚC LƯỢNG 31

3.1

Khoảng ước lượng cho trung bình

..........................................................................................

3.1.1

Đặt vấn đề

.....................................................................................................................

3.1.2 Khoảng ước lượng.........................................................................................................32

3.1.3

Khoảng ước lượng cho trung bình µ khi σ

đã biết

.................................................

3.1.4

Khoảng ước lượng cho trung bình µ của mẫu cỡ lớn

..............................................

3.1.5

Khoảng ước lượng cho mẫu nhỏ có phân phối chuẩn với σ

chưa biết

................

3.1.6

Vấn đề xác định cỡ mẫu

..............................................................................................

3.2

Khoảng ước lượng cho tỷ lệ

....................................................................................................

3.2.1

Đặt vấn đề

.....................................................................................................................

3.2.2

Công thức khoảng ước lượng cho tỷ lệ

.....................................................................

3.2.3

Vấn đề xác định cỡ mẫu

..............................................................................................

4 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 40

4.1

Tình huống thực tế

...................................................................................................................

4.2

Bài toán kiểm định giả thuyết tổng quát

................................................................................

4.2.1

Miền tiêu chuẩn

............................................................................................................

4.2.2

Các loại sai lầm

............................................................................................................

4.3

Bài toán kiểm định giả thuyết cho giá trị trung bình một mẫu

...........................................

4.3.1

Bài toán 1: So sánh trung bình của mẫu có phân phối chuẩn với phương sai

đã biết

.......................................................................................................................

4.3.2

Bài toán 2: So sánh giá trị trung bình của mẫu cỡ lớn với phương sai chưa biết 44

4.3.3

Bài toán 3: So sánh giá trị trung bình của mẫu có phân phối chuẩn với

phương sai chưa biết

....................................................................................................

4.4

Bài toán kiểm định giả thuyết về tỉ lệ

....................................................................................

4.4.1

Tình huống thực tế

.......................................................................................................

4.4.2

Bài toán kiểm định giả thuyết cho tỉ lệ

......................................................................

4.4.3

Tiêu chuẩn kiểm định

..................................................................................................

4.5

Bài toán so sánh hai giá trị trung bình

....................................................................................

4.5.1

Tình huống thực tế

.......................................................................................................

4.5.2

So sánh hai giá trị trung bình

......................................................................................

4.5.3

Bài toán 1: So sánh giá trị trung bình của hai mẫu có phân phối chuẩn với

phương sai đã biết

.......................................................................................................

4.5.4

Bài toán 2: So sánh hai giá trị trung bình của hai mẫu có phân phối chuẩn

với phương sai σ

= σ

chưa biết

..................................................................

4.6

Bài toán so sánh hai tỉ lệ

..........................................................................................................

4.6.1

Tình huống thực tế

.......................................................................................................

4.6.2

So sánh hai tỉ lệ

............................................................................................................

5 Hồi quy tuyến tính đơn 58

5.1

Tình huống thực tế

...................................................................................................................

5.2

Mô hình hồi quy tuyến tính đơn

.............................................................................................

5.2.1

Khoảng tin cậy cho σ

.........................................................................................................................................

5.2.2

Khoảng tin cậy cho β

.........................................................................................................................................

5.2.3

Khoảng tin cậy cho β

.........................................................................................................................................

5.2.4

Khoảng dự báo

..............................................................................................................

Giới thiệu học phần

Thống kê Xã hội học

Một số vấn đề thực tế

•

Làm thế nào để biết cân nặng trung bình của trẻ sơ sinh ở một địa phương?

–

Một nhà điều tra thử tính cân nặng trung bình của 50 trẻ sơ sinh ở một địa phương

thì được kết quả là 3,1kg. Có thể nói gì về cân nặng của trẻ sơ sinh toàn địa

phương đó?

–

Một nhà quản lý cho rằng cân nặng trung bình của tất cả các trẻ sơ sinh ở địa

phương đó là 3,3kg. Tuyên bố của nhà quản lý có đúng không?

•

Làm thế nào để so sánh hiệu quả của hai phác đồ điều trị cho một bệnh nào đó?

–

Có hai phác đồ điều trị cho cùng một bệnh. Trong 200 bệnh nhân điều trị theo phác đồ

1 có 150 khỏi bệnh. Trong 50 người điều trị theo phác đồ 2 thì có 40 người khỏi bệnh.

Hỏi phác đồ 2 có thực sự tốt hơn phác đồ 1 hay không?

•

Con của bạn sẽ cao bao nhiêu cm?

–

Chiều cao của con bị ảnh hưởng bởi chiều cao của bố hay chiều cao của mẹ?

–

Chiều cao của bố/mẹ và con liên quan như thế nào đến nhau?

–

Biết chiều cao của bố/mẹ thì có thể dự đoán được chiều cao của con không?

Thống kê là gì?

Thống kê là khoa học về việc thu thập, xử lý, biểu diễn, phân tích mẫu số liệu thu thập được

từ một quần thể để rút ra được các kết luận có độ tin cậy cho toàn bộ quần thể đó.

Cơ sở khoa học của Thống kê là Lý thuyết xác suất.

MỤC LỤC 5

Nội dung học phần

Chương 1: Một số kiến thức xác suất cơ sở

Chương 2: Mẫu ngẫu nhiên

3. Chương 3: Khoảng ước lượng

Chương 4: Kiểm định giả thuyết thống kê

5. Chương 5: Hồi quy

Mục tiêu của học phần

Hiểu được ý nghĩa và tính được xác suất, kì vọng, phương sai trong một số trường hợp đơn

giản.

Vận dụng phân phối nhị thức và phân phối chuẩn giải quyết một số bài toán thực tế.

Hiểu được phương pháp lấy mẫu ngẫu nhiên.

Biết phân loại số liệu và tính toán các đặc trưng của mẫu số liệu. Trình bày số liệu dưới

dạng

biểu đồ cột, biểu đồ quạt.

Hiểu được ý nghĩa và tính khoảng ước lượng cho trung bình và tỉ lệ.

Hiểu được ý nghĩa bài toán kiểm định giả thuyết. Vận dụng để so sánh tỉ lệ và trung bình.

Hiểu được ý nghĩa và giải quyết được bài toán hồi quy tuyến tính đơn.

Chương

MỘT SỐ KIẾN THỨC XÁC SUẤT CƠ SỞ

Nội dung của chương:

Định nghĩa xác suất cổ điển và định nghĩa xác suất theo thống kê.

2. Sự độc lập

Biến ngẫu nhiên rời rạc.

Biến ngẫu nhiên liên tục

Phân phối nhị thức và Phân phối chuẩn

Các số đặc trưng của biến ngẫu nhiên.

Mục tiêu của chương

Hiểu được các khái niệm cơ bản của xác suất: phép thử ngẫu nhiên, không gian mẫu,

biến cố, mối quan hệ giữa các biến cố.

Hiểu được ý nghĩa của khái niệm độc lập.

Hiểu được ý nghĩa và tính được xác suất, kì vọng, phương sai trong một số trường hợp đơn

giản.

Vận dụng phân phối nhị thức và phân phối chuẩn giải quyết một số bài toán thực tế.

1.1

Định nghĩa xác suất

1.1.1

Phép thử ngẫu nhiên

•

Phép thử: việc thực hiện một tổ hợp các hành động nào đó.

•

Phép thử ngẫu nhiên: phép thử mà ta không biết trước được kết quả của nó

1.1.2 Không gian mẫu và Biến cố sơ cấp

Không gian mẫu là tập hợp tất cả các kết quả có thể xảy ra của phép thử. Ta thường kí hiệu

không gian mẫu bởi Ω.

•

Biến cố sơ cấp là một phần tử của không gian mẫu.

Ví dụ 1.1.1. Trong hộp có 1 bi xanh, 1 bi đỏ và 1 bi vàng. Hãy xác định không gian mẫu và số biến

cố sơ cấp của các phép thử sau:

Lấy ra ngẫu nhiên 1 bi từ hộp.

Lấy ra ngẫu nhiên đồng thời 2 bi từ hộp.

Lấy ra lần lượt 2 bi từ hộp.

Lấy ra ngẫu nhiên 1 bi từ hộp, xem màu, trả lại hộp rồi lại lấy ra ngẫu nhiên 1 bi nữa.

Lời giải. a) Lấy ra ngẫu nhiên 1 bi từ hộp

Ω =

X, Đ, V

Lấy ra ngẫu nhiên đồng thời 2 bi từ hộp

Ω =

{X, Đ}, {X, V }, {Đ, V }

Lấy ra lần lượt 2 bi từ hộp

Ω =

XĐ, XV, ĐX, ĐV, V X, V Đ

(X, Đ), (X, V ), (Đ, X),

(Đ, V ), (V, X), (V, Đ)

•

Lấy ra ngẫu nhiên 1 bi từ hộp, xem màu, trả lại hộp rồi lại lấy ra ngẫu nhiên 1 bi nữa

Ω =

XX, XĐ, XV, ĐX, ĐV, ĐĐ, V X, V Đ, V V

(X, X), (X, Đ), (X, V ), (Đ, X),

(Đ, Đ), (Đ, V ), (V, X), (V, Đ), (V, V )

1.1.3 Biến cố

Biến cố là một sự kiện liên quan đến phép thử. Một biến cố có thể xảy ra hoặc không xảy

sau khi phép thử được thực hiện. Mỗi biến cố là một tập con của không gian mẫu.

•

Biến cố chắc chắn là biến cố luôn xảy ra.

•

Biến cố rỗng (trống) là biến cố luôn không xảy ra.

Ví dụ 1.1.2. Xét phép thử gieo hai con xúc xắc cân đối. Hãy xác định không gian mẫu và biểu

diễn các biến cố sau dưới dạng tập hợp.

•

A là b/c xuất hiện hai mặt 1 chấm.

•

B là b/c xuất hiện hai mặt 4 chấm.

•

C là b/c xuất hiện hai mặt cùng chấm.

•

D là b/c tổng số chấm bằng 8.

•

E là b/c tích số chấm xuất hiện là số lẻ.

Lời giải.

Ω = {(1, 1), (1, 2), . . . , (6, 6)}

= {(i, j) : 1 ≤ i, j ≤

•

A = {(1, 1)}.

•

B = {(4, 4)}.

•

C là b/c xuất hiện hai mặt cùng chấm

C = {(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)}.

•

D là b/c tổng số chấm bằng 8

D = {(2, 6), (3, 5), (4, 4), (5, 3), (6, 2)}.

•

E là b/c tích số chấm xuất hiện là số lẻ

E = {(1, 1), (1, 3), (1, 5), (3, 1), (3, 3), (3, 5), (5, 1), (5, 3), (5, 5)}.

1.1.4

Phép toán trên các biến cố

•

A ∪ B: Hợp của hai biến cố A và B.

•

A ∩ B = AB: Giao của hai biến cố A và B.

•

A \ B: Hiệu của hai biến cố A cho B.

Ví dụ 1.1.3. Trong phép thử gieo hai con xúc xắc, hãy xác định biến cố hợp, giao và hiệu của

các biến cố C và D.

1.1.5 Mối quan hệ giữa các biến cố

•

Biến cố A được gọi là thuận lợi cho biến cố B nếu khi A xảy ra thì B cũng xảy ra. Kí hiệu là

A ⊂ B.

•

Biến cố A được gọi là xung khắc với biến cố B nếu khi A xảy ra thì B không xảy ra và

ngược lại. Hai biến cố xung khắc không thể đồng thời cùng xảy ra. Kí hiệu là A ∩ B = ∅.

Ví dụ 1.1.4. Trong các biến cố A, B, C, D, E ở phép thử gieo hai con xúc xắc

•

hãy chỉ ra biến cố nào thuận lợi cho biến cố nào;

•

hãy chỉ ra các cặp biến cố xung khắc.

•

Biến cố A và B là đối nhau nếu luôn chỉ có đúng một trong hai biến cố xảy ra.

A ∩ B =

∅

A ∪ B =

Ω

Kí hiệu biến cố đối của biến cố A là

⇔ A = Ω \ B.

Hai biến cố A và B được gọi là đồng khả năng nếu chúng có khả năng xuất hiện như

nhau trong mỗi phép thử.

Ví dụ 1.1.5. Trong phép thử gieo hai con xúc xắc, hãy xác định biến cố đối của các biến cố C, D, E.

1.1.6

Định nghĩa xác suất cổ điển

Giả sử một phép thử có n kết quả khác nhau và có cùng khả năng xảy ra, trong đó có m

kết quả thuận lợi cho biến cố A. Khi đó xác suất để biến cố A xảy ra là

) =

Số kết quả thuận lợi cho A

Tổng số kết quả

Ví dụ 1.1.6. Giả sử hai con xúc xắc là cân đối và đồng chất.

Tính xác suất của các biến cố A, B, C, D, E.

Tính xác suất của các biến cố C ∩ D, C ∪ D, C \ D, D \ C.

1.1.7 Tính chất của xác suất

•

Với mọi biến cố A:

0 ≤ P(A) ≤ 1.

•

Với mọi biến cố xung khắc A và B:

•

Với mọi biến cố A:

P(A ∪ B) = P(A) + P(B).

(

)

= 1 − P(A).

1.1.8

Định nghĩa xác suất theo thống kê

Thực hiện lặp đi lặp lại phép thử n lần và gọi m là số lần biến cố A xuất hiện trong n lần thử.

• Tỉ

số

được gọi là xác suất thực nghiệm của biến cố A trong n lần thử.

•

Nếu xác suất thực

nghiệm

hội tụ đến một giá trị p

nào đó thì ta nói p

là xác suất của

iến cố A theo nghĩa thống kê.

(

•

1.2

Sự độc lập

Tung một đồng xu hai lần. Nếu biết được kết quả lần gieo thứ nhất thì có đoán được kết quả

lần gieo thứ hai hay không?

1.2.1

Hai biến cố độc lập

Hai biến cố A và B được gọi là độc lập nếu việc A có xảy ra hay không cũng không ảnh

hưởng tới khả năng xảy ra của B và ngược lại. Theo xác suất thì

P(A ∩ B) = P(A)P(B).

Ví dụ 1.2.1. Tung một đồng xu hai lần. Gọi A và B lần lượt là biến cố lần tung thứ nhất và thứ

hai xuất hiện mặt sấp thì A và B là hai biến cố độc lập.

Mệnh đề 1.2.2. Nếu A và B độc lập thì các cặp biến cố sau cũng độc lập:

•

và B;

•

A và

;

•

và

1.2.2

Dãy biến cố độc lập

Dãy biến cố A

, A

, . . . , A

được gọi là độc lập nếu việc một biến cố A

nào đó trong dãy có

xảy ra hay không cũng không ảnh hưởng tới khả năng xảy ra của các biến cố còn lại và ngược

lại. Theo xác suất thì

P(A

∩ A

∩ . . . ∩ A

) = P(A

)P(A

) . . . P(A

với mọi 2 ≤ k ≤ n, mọi 1 ≤ i

< i

< . . . < i

≤ n.

Ví dụ 1.2.3. Gieo hú hoạ một con xúc xắc n lần, gọi A

là biến cố lần gieo thứ k được mặt 6

chấm. Khi đó A

, A

, . . . , A

là dãy các biến cố độc lập.

1.2.3 Dãy phép thfi Bernoulli

Một dãy phép thử được gọi là dãy phép thử Bernoulli nếu

•

Kết quả của mỗi phép thử hoặc là thành công, hoặc là thất bại.

•

Xác suất thành công của mỗi lần thử đều bằng nhau.

•

Kết quả của từng lần thử là dãy biến cố độc lập.

Ví

dụ:

•

Gieo 3 hạt giống và quan sát sự nảy mầm của mỗi hạt.

Lần lượt chọn ngẫu nhiên hồ sơ sức khoẻ của 10 trẻ 4 tuổi và kiểm tra xem trẻ có bị suy

dinh dưỡng hay không?

Ví dụ 1.2.4. Gieo 3 hạt giống. Xác suất nảy mầm của mỗi hạt là 0,8. Tính xác suất để

Cả 3 hạt đều nảy mầm.

Cả 3 hạt đều không nảy mầm.

Có đúng 2 hạt nảy mầm.

Lời giải. Gọi A

là biến cố hạt thứ k này mầm, k = 1, 2, 3.

Xác suất cả 3 hạt đều nảy mầm là

P(A

) = P(A

)P(A

) = 0, 8

Xác suất cả 3 hạt đều không nảy mầm là

(

)

(

)

(

)

(

)

= 0, 2

Xác suất có đúng 2 hạt nảy mầm là

(

)

(

)

(

)

= 3 ×

× 0, 2.

1.2.4 Công thfíc xác suất nhị thfíc

Gọi p là xác suất thành công trong mỗi lần thử.

Xác suất để có đúng k lần thành công trong n lần thử độc lập là

Luyện

tập

(1 −

n−

, 0 ≤ k ≤ n.

1.2.1.

Tỉ lệ trẻ 4 tuổi bị suy dinh dưỡng trong một cộng đồng là 5%. Lần lượt chọn ngẫu nhiên

hồ sơ sức khoẻ của 10 trẻ 4 tuổi. Tính xác suất của các biến cố

Cả 10 trẻ đều không bị suy dinh dưỡng.

Có đúng 2 trẻ bị suy dinh dưỡng.

Có ít nhất 2 trẻ bị suy dinh dưỡng.

1.2.2.

Trong trò chơi "Bầu, cua, cá, cọp, gà, tôm" nhà cái sẽ gieo ba con xúc xắc. Mỗi con xúc

xắc

sáu mặt được dán bởi sáu hình "Bầu, cua, cá, cọp, gà, tôm". Người chơi sẽ chọn một hình

để đặt cược (chẳng hạn hình cá).

Tính xác suất để có 3 mặt cá xuất hiện.

•

Tính xác suất để không có mặt cá nào.

Tính xác suất để có ít nhất 1 mặt cá.

1.3

Biến ngẫu nhiên rời rạc

1.3.1

Định nghĩa

Biến ngẫu nhiên là một quan sát nhận giá trị bằng số kết quả của phép thử.

Ví dụ 1.3.1.

1. Tung hai đồng xu, số mặt sấp xuất hiện là một biến ngẫu nhiên.

Gieo hai con xúc xắc, tổng số chấm xuất hiện là một biến ngẫu nhiên.

Gieo hai con xúc xắc, tích số chấm xuất hiện là một biến ngẫu nhiên.

Một người đi thi cho đến khi đỗ thì số lần thi của người này cũng là biến ngẫu nhiên.

Ví dụ 1.3.2. Gieo hai đồng xu cân đối và đồng chất. Gọi X là số mặt sấp xuất hiện.

Biến ngẫu nhiên X nhận các giá trị nào?

Hãy tính xác suất để X nhận mỗi giá trị chỉ ra ở trên.

Lời

giải. 1. Biến ngẫu nhiên X nhận các giá 0, 1, 2

Không gian mẫu

ta có

Ω = {SS, SN, NS, NN }.

P[X = 0] =

, P[X = 1] =

, P[X = 2] =

4 4 2 4

Do kết quả của hai đồng xu là độc lập và xác suất để xuất hiện mặt sấp là 1/2 nên ta

cũng có thể tính các xác suất trên bằng công thức xác suất nhị thức.

Ta có bảng sau gọi là bảng phân phối xác suất của X.

P[X = x]

0 1 2

1 1 1

4 2 4

√

1 2

1.3.2

Phân phối của biến ngẫu nhiên

X được gọi là bnn rời rạc nếu nó nhận các giá trị x

, x

, . . .

Kí hiệu p

= P[X = x

] với k = 1, 2, . . .

Bảng phân phối của X:

Chú ý:

1.3.3 Các số đặc trưng

+ p

+ . . . + p

= 1.

Để đánh giá biến ngẫu nhiên X, ta thường dùng các giá trị sau

Kỳ

vọng:

E[X] = x

+ x

+ · · · + x

Phương sai: V ar(X) = x

+ x

+ · · ·

− (E[X]) .

σ(X) = V ar(X) là độ lệch chuẩn của X.

Với mỗi hàm số ϕ : R → R ta có

E[ϕ(X)] = ϕ(x

+ ϕ(x

+ · · · + ϕ(x

Ví dụ 1.3.3. Cho biến ngẫu nhiên X và Y có phân phối xác suất như sau:

-2 -1

1 2

P 0, 2 0, 3 0, 3 0, 2

-1

1 20

P 0, 2 0, 3 0, 3 0, 2

Hãy tính kì vọng và phương sai của X và của Y .

Tính xác suất X ≥ 0 và xác suất Y ≤ 1.

Lời giải. E[X] = E[Y ] = 0, V ar(X) = 2, 2, V ar(Y ) = 320, 6. Nhận xét: X và Y có giá trị trung

bình

như nhau nhưng độ phân tán của Y cao hơn so với độ phân tán của X.

P[X ≥ 0] = P[X = 1] + P[X = 2] = 0, 5.

P[Y ≤ 1] = 1 − P[Y > 1] = 1 − P[Y = 20] = 0, 8.

1.3.4

Ý nghĩa của kỳ vọng và phương sai

•

Kỳ vọng đặc trưng cho giá trị trung bình mà biến ngẫu nhiên có thể nhận.

Phương sai đặc trưng cho độ phân tán của giá trị của biến ngẫu nhiên xung quanh giá

trị trung bình của nó. Độ phân tán của biến ngẫu nhiên càng rộng thì phương sai càng

lớn.

P[X = x]p

· ·

•

2 2

∫

1.3.5

Phân phối nhị thfíc

Gọi X là số phép thử thành công trong dãy n phép thử Bernoulli.

P[X = k] = C

(1 − p)

n−k

, k = 0, 1, . . . , n.

X có phân phối nhị thức, kí hiệu là B(n, p).

E[X] = np, V ar(X) = np(1 − p).

1.3.6 Tính chất của kỳ vọng và phương sai

Với mọi số thực a, b, c và mọi bnn X và Y :

• E[c] = c.

• E[aX + bY ] = aE[X] + bE[Y ].

•

Nếu X ≥ Y thì E[X] ≥ E[Y ].

•

V ar(X) = E[(X − E[X]) ] = E[X ] − (E[X]) .

• V ar(X + c) = V ar(X).

•

V ar(aX) = a V ar(X).

1.4

Biến ngẫu nhiên liên tục và Phân phối chuẩn

1.4.1

Biến ngẫu nhiên liên tục

Trên thực tế có nhiều đại lượng ngẫu nhiên nhận giá trị là các số thực

•

Cân nặng của một trẻ sơ sinh.

•

Thời gian bạn đi từ nhà đến trường mỗi ngày.

•

Chiều cao của cây bạch đàn 1 năm tuổi.

Ta gọi mỗi đại lượng trên là một biến ngẫu nhiên liên tục.

1.4.2 Hàm mật độ

Hàm

: R → [0, ∞) được gọi là hàm mật độ của biến ngẫu nhiên liên tục X nếu

với mọi số thực a <

P[a < X < b]

(x)dx,

(

(µ, σ

)

√

P[a ≤ X ≤ b] = P[a < X ≤ b] = P[a ≤ X

< b] =

1.4.3 Các số đặc trưng

(x)dx.

•

Kỳ

vọng

E[X]

∞

xf (x)dx.

−∞

• Kỳ vọng của X

E[X

]

∞

(x)dx.

−∞

•

Phương sai

2 2

V ar(X) = E[X ] − (E[X]) .

Ví dụ 1.4.1. Thời gian mỗi lần Lan đi từ nhà đến quê nội (đơn vị: giờ) là một đại lượng ngẫu nhiên

X có hàm mật độ

(

) =

nếu 1 ≤ x ≤ 2,

0 nếu x < 1 hoặc x > 2.

Tính xác suất để Lan đi từ nhà đến quê nội hết hơn 90 phút.

Tính kì vọng và phương sai của X.

1.4.4

Phân phối chuẩn

Bnn X được gọi là có phân phối chuẩn N

nếu hàm mật độ của X xác định bởi

Ta tính được

f (x) =

2πσ

E[X] = µ và

—

2σ

V ar(X) = σ .

Khi µ = 0 và σ = 1 thì ta nói X có phân phối chuẩn tắc.

Hàm Φ xác định như sau được gọi là hàm phân phối chuẩn tắc

Φ(z) =

−∞

2π

—

dx.

Hàm Φ đóng vai trò quan trọng trong thống kê. Tuy nhiên vì không tính được trực tiếp nên

ta sẽ dùng bảng để tra giá trị của nó.

∫

—

1.4.5

Tính chất của phân phối chuẩn

Nếu X ∼

Do đó

(µ,

)

thì

−

sẽ có phân phối chuẩn tắc.

P[X < a] = Φ(

−

)

P[X > b] = 1 Φ(

−

)

P[a <

< b] = Φ(

−

) − Φ(

−

)

σ σ

2)Φ(−x) = 1 − Φ(x).

Ví dụ 1.4.2. Cho biết Φ(1, 96) = 0, 975 và Φ(2, 58) = 0, 995, hãy tính Φ(−1, 96) và Φ(−2, 58).

Lời giải. Ta sử dụng tính chất của phân phối chuẩn tắc Φ(−x) = 1 − Φ(x) thì

• Φ(−1, 96) = 1 − Φ(1, 96) = 0, 025.

• Φ(−2, 58) = 1 − Φ(2, 58) = 0, 005.

Ví dụ 1.4.3. Trọng lượng trẻ sơ sinh là một biến ngẫu nhiên có phân phối chuẩn với trung

bình

3,2kg và độ lệch tiêu chuẩn 0,4kg. Một trẻ sơ sinh được gọi là bình thường nếu có trọng

lượng từ

2,688kg đến 3,712kg. Tính xác suất để một đứa trẻ sơ sinh có trọng lượng bình

thường.

√np(1 − p)

−

√

] ≈ Φ

k + 0 , 5

−

0 , 5

−

√

≤

] ≈ Φ

+ 0 , 5

−

0 ,

−

+ 0 , 5 −

Lời giải. Gọi X là trọng lượng một trẻ sơ sinh, X

là

N (3, 2; (0, 4) ). Xác suất để 1 trẻ bình thường

P(2, 688 < X < 3, 712) = P1, 28 <

− 3

< 1, 28

0, 4

= Φ(1, 28) − Φ(−1, 28)

= 2Φ(1, 28) − 1 = 2 × 0, 9 − 1

= 0, 8.

1.4.6

Xấp xỉ phân phối nhị thfíc bằng phân phối chuẩn

Ví dụ 1.4.4. Trong một thành phố có 40% người dân có mức thu nhập cao. Chọn ngẫu nhiên

300 người (chọn từng người).Tính xác xuất để trong 300 người được chọn có đúng 140 người

lương cao?

Theo công thức của phân phối nhị thức, xác suất để có 140 người thu nhập cao trong 300

người là

140

(0, 4)

140

(0, 6)

160

Khi sử dụng máy tính bỏ túi thông thường, kết quả sẽ hiện là error! Có điều này là do C

140

là số

quá lớn còn (0, 4)

140

lại là số quá nhỏ nên máy tính không hiển thị được.

Mệnh đề 1.4.5. Giả sử X có phân phối nhị thức B(n, p). Khi n lớn thì

np(1 − p)

(k − np)

≈

√

2πnp(1 − p)

exp

−

np(1 −

P[X ≤

] ≈

√

np(1 − p)

√

np(1 − p)

√

np(1 − p)

P[X ≥ k

] ≈ 1

−

√

Ví dụ 1.4.6. Gọi X là số người có mức lương cao trong 300 người được chọn. Ta có np = 300 ×

0, 4 = 120 và np(1 − p) = 72. Xác suất để X nhận giá trị 140 là

P(X = 140) = P(139, 5 ≤ X < 140, 5)

140 , 5 120

≈ Φ

√

139 , 5 120

—

√

≈ Φ(2, 42) − Φ(2, 30)

≈ 0, 9920 − 0, 9893 = 0, 0027.

Ví dụ 1.4.7. Một loại hạt giống có xác suất nảy mầm là 0,7. Tìm xác suất để trong 100 hạt giống

có

Có hơn 65 hạt nảy mầm.

Ít hơn 72 hạt nảy mầm.

Có đúng 70 hạt nảy mầm.

Lời giải. Gọi X là số hạt nảy mầm trong 100 hạt, X có phân phối B(n = 100; p = 0, 7). Ta có

np = 70 và np(1 − p) = 21.

65 , 5 −

P[X < 72] ≈

71 , 5

√

≈ Φ(0, 33).

3. P[X = 70] = P[69, 5 ≤

< 70, 5] ≈ 2Φ(0, 11) − 1.

1. P[X > 65] ≈ 1

−

= Φ(0,

98).

Bấm Tải xuống để xem toàn bộ.

Bài giảng thống kê Xã hội học 2022│Đại học Sư phạm Hà Nội

Tài liệu liên quan:

Nhóm 28- KẾ TOÁN CÁC KHOẢN PHẢI THU KHÁCH HÀNG- PHẢI TRẢ NHÀ CUNG CẤP

LUẬN MÔN PHƯƠNG PHÁP NGHIÊN CỨU KHOA

Đề cương Xã hội học đại cương | Trường Đại học Sư Phạm Hà Nội

Đề thi kết thúc học phần môn Thống kế xã hội học | Trường Đại học Sư phạm Hà Nội

Câu hỏi Ôn tập Thống kê xã hội học | Trường Đại học Sư Phạm Hà Nội