Bài giảng Thống kê Xã hội học Khoa Toán Tin | Trường Đại học Sư phạm Hà Nội

Bài giảng Thống kê Xã hội học Khoa Toán Tin | Trường Đại học Sư phạm Hà Nộivới những kiến thức và thông tin bổ ích giúp sinh viên tham khảo, ôn luyện và phục vụ nhu cầu học tập của mình cụ thể là có định hướng, ôn tập, nắm vững kiến thức môn học và làm bài tốt trong những bài kiểm tra, bài tiểu luận, bài tập kết thúc học phần, từ đó học tập tốt và có kết quả cao cũng như có thể vận dụng tốt những kiến thức mình đã học vào thực tiễn cuộc sống.

Bài giảng Thống hội học
Khoa Toán Tin
Trường Đại học phạm Nội
2020
Mục lục
1 MỘTSỐ KIẾN THỨC XÁC SUẤT SỞ 6
1.1 Định nghĩa xác suất . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.1.1 Phép thử ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.1.2 Không gian mẫu Biến cố cấp . . . . . . . . . . . . . . . . . . . 7
1.1.3 Biến cố . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.1.4 Phép toán trên các biến cố . . . . . . . . . . . . . . . . . . . . . . . . 9
1.1.5 Mối quan hệ giữa các biến cố . . . . . . . . . . . . . . . . . . . . . . 9
1.1.6 Định nghĩa xác suất cổ điển . . . . . . . . . . . . . . . . . . . . . . . 10
1.1.7 Tính chất của xác suất . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.1.8 Định nghĩa xác suất theo thống . . . . . . . . . . . . . . . . . . . 11
1.2 Sự độc lập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.1 Hai biến cố độc lập . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.2 Dãy biến cố độc lập . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2.3 Dãy phép thử Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2.4 Công thức xác suất nhị thức . . . . . . . . . . . . . . . . . . . . . . . 13
1.3 Biến ngẫu nhiên rời rạc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.3.1 Định nghĩa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.3.2 Phân phối của biến ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . 14
1.3.3 Các số đặc trưng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.3.4 Ý nghĩa của kỳ vọng phương sai . . . . . . . . . . . . . . . . . . . 15
1.3.5 Phân phối nhị thức . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.3.6 Tính chất của kỳ vọng phương sai . . . . . . . . . . . . . . . . . . 15
1.4 Biến ngẫu nhiên liên tục Phân phối chuẩn . . . . . . . . . . . . . . . . . 16
1.4.1 Biến ngẫu nhiên liên tục . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4.2 Hàm mật độ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4.3 Các số đặc trưng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4.4 Phân phối chuẩn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.4.5 Tính chất của phân phối chuẩn . . . . . . . . . . . . . . . . . . . . . 18
1.4.6 Xấp xỉ phân phối nhị thức bằng phân phối chuẩn . . . . . . . . . . 19
2 MẪUNGẪUNHIÊN 21
2.1 Giới thiệu về Thống . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.1.1 Mẫu quần thể . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.1.2 Quy trình nghiên cứu thống . . . . . . . . . . . . . . . . . . . . . 22
1
MỤC LỤC 2
2.1.3 Các bài toán thống sẽ học: . . . . . . . . . . . . . . . . . . . . . . 22
2.2 Thu thập dữ liệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.2.1 Xác định dữ liệu cần thu thập . . . . . . . . . . . . . . . . . . . . . . 23
2.2.2 Dữ liệu cấp thứ cấp . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.2.3 Lấy mẫu hoàn lại không hoàn lại . . . . . . . . . . . . . . . . . . . 24
2.2.4 Quy tắc lấy mẫu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.2.5 Phương pháp lấy mẫu giản đơn . . . . . . . . . . . . . . . . . . . . . 24
2.2.6 Các phương pháp lấy mẫu khác . . . . . . . . . . . . . . . . . . . . . 25
2.3 Trình bày dữ liệu bằng bảng biểu đồ . . . . . . . . . . . . . . . . . . . . . 25
2.3.1 Biểu đồ thân-lá (stem-and-leaf diagram) . . . . . . . . . . . . . . . 25
2.3.2 Tần số . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.3.3 Bảng tần số . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.4 Biểu đồ tần số . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.4.1 Biểu đồ tần suất . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.5 Số liệu các số đặc trưng . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.5.1 Biến số . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.5.2 Phân loại biến số . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.5.3 Các số đo giá trị trung tâm . . . . . . . . . . . . . . . . . . . . . . . . 30
2.5.4 Các số đo độ phân tán . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.5.5 Thống . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3 KHOẢNGƯỚC LƯỢNG 33
3.1 Khoảng ước lượng cho trung bình . . . . . . . . . . . . . . . . . . . . . . . . 33
3.1.1 Đặt vấn đề . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.1.2 Khoảng ước lượng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.1.3 KƯL cho trung bình µ khi σ
2
đã biết . . . . . . . . . . . . . . . . . . 34
3.1.4 KƯL cho trung bình µ của mẫu cỡ lớn . . . . . . . . . . . . . . . . . 37
3.1.5 KƯL cho mẫu nhỏ phân phối chuẩn với σ
2
chưa biết . . . . . . . 38
3.1.6 Vấn đề xác định cỡ mẫu . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.2 Khoảng ước lượng cho tỷ lệ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.2.1 Đặt vấn đề . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.2.2 Công thức khoảng ước lượng cho tỷ lệ . . . . . . . . . . . . . . . . . 40
3.2.3 Vấn đề xác định cỡ mẫu . . . . . . . . . . . . . . . . . . . . . . . . . 41
4 KIỂM ĐỊNH GIẢ THUYẾT THỐNG 43
4.1 Tình huống thực tế . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.2 Bài toán kiểm định giả thuyết tổng quát . . . . . . . . . . . . . . . . . . . . 44
4.2.1 Miền tiêu chuẩn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.2.2 Các loại sai lầm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.3 Bài toán kiểm định giả thuyết cho giá trị trung bình một mẫu . . . . . . . . 46
4.3.1 Bài toán 1: So sánh trung bình của mẫu phân phối chuẩn với
phương sai σ
2
đã biết . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4.3.2 Bài toán 2: So sánh giá trị trung bình của mẫu cỡ lớn với phương
sai chưa biết . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
MỤC LỤC 3
4.3.3 Bài toán 3: So sánh giá trị trung bình của mẫu phân phối chuẩn
với phương sai chưa biết . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.4 Bài toán kiểm định giả thuyết về tỉ lệ . . . . . . . . . . . . . . . . . . . . . . 52
4.4.1 Tình huống thực tế . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.4.2 Bài toán kiểm định giả thuyết cho tỉ lệ . . . . . . . . . . . . . . . . . 53
4.4.3 Tiêu chuẩn kiểm định . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.5 Bài toán so sánh hai giá trị trung bình . . . . . . . . . . . . . . . . . . . . . 55
4.5.1 Tình huống thực tế . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.5.2 So sánh hai giá trị trung bình . . . . . . . . . . . . . . . . . . . . . . 56
4.5.3 Bài toán 1: So sánh giá trị trung bình của hai mẫu phân phối
chuẩn với phương sai đã biết . . . . . . . . . . . . . . . . . . . . . . 56
4.5.4 Bài toán 2: So sánh hai giá trị trung bình của hai mẫu phân phối
chuẩn với phương sai σ
X
= σ
Y
= σ
2
chưa biết . . . . . . . . . . . . . 57
4.6 Bài toán so sánh hai tỉ lệ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.6.1 Tình huống thực tế . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.6.2 So sánh hai tỉ lệ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
Giới thiệu học phần
Thống hội học
Một số vấn đề thực tế
Làm thế nào để biết cân nặng trung bình của trẻ sinh một địa phương?
Một nhà điều tra thử tính cân nặng trung bình của 50 trẻ sinh một địa
phương thì được kết quả 3,1kg. thể nói về cân nặng của tr sinh
toàn địa phương đó?
Một nhà quản cho rằng cân nặng trung bình của tất cả các trẻ sinh địa
phương đó 3,3kg. Tuyên bố của nhà quản đúng không?
Làm thế nào để so sánh hiệu quả của hai phác đồ điều trị cho một bệnh nào đó?
hai phác đồ điều trị cho cùng một bệnh. Trong 200 bệnh nhân điều trị theo
phác đồ 1 150 khỏi bệnh. Trong 50 người điều trị theo phác đồ 2 thì 40
người khỏi bệnh. Hỏi phác đồ 2 thực sự tốt hơn phác đồ 1 hay không?
Con của bạn sẽ cao bao nhiêu cm?
Chiều cao của con bị ảnh hưởng bởi chiều cao của bố hay chiều cao của mẹ?
Chiều cao của bố/mẹ con liên quan như thế nào đến nhau?
Biết chiều cao của bố/mẹ thì thể dự đoán được chiều cao của con không?
4
MỤC LỤC 5
Thống gì?
Thống khoa học về việc thu thập, xử , biểu diễn, phân tích mẫu số liệu thu thập
được từ một quần thể để rút ra được các kết luận độ tin cậy cho toàn bộ quần thể đó.
sở khoa học của Thống thuyết xác suất.
Nội dung học phần
1. Chương 1: Một số kiến thức xác suất sở
2. Chương 2: Mẫu ngẫu nhiên
3. Chương 3: Khoảng ước lượng
4. Chương 4: Kiểm định giả thuyết thống
5. Chương 5: Hồi quy
Mục tiêu của học phần
1. Hiểu được ý nghĩa tính được xác suất, vọng, phương sai trong một số trường
hợp đơn giản.
2. Vận dụng phân phối nhị thức phân phối chuẩn giải quyết một số bài toán thực
tế.
3. Hiểu được phương pháp lấy mẫu ngẫu nhiên.
4. Biết phân loại số liệu tính toán các đặc trưng của mẫu số liệu. Trình bày số liệu
dưới dạng biểu đồ cột, biểu đồ quạt.
5. Hiểu được ý nghĩa tính khoảng ước lượng cho trung bình tỉ lệ.
6. Hiểu được ý nghĩa bài toán kiểm định giả thuyết. Vận dụng để so sánh tỉ lệ trung
bình.
7. Hiểu được ý nghĩa giải quyết được bài toán hồi quy tuyến tính đơn.
Chương 1
MỘT SỐ KIẾN THỨC XÁC SUT SỞ
Nộidung của chương:
1. Định nghĩa xác suất cổ điển định nghĩa xác suất theo thống kê.
2. Sự độc lập
3. Biến ngẫu nhiên rời rạc.
4. Biến ngẫu nhiên liên tục
5. Phân phối nhị thức Phân phối chuẩn
6. Các số đặc trưng của biến ngẫu nhiên.
Mụctiêu của chương
1. Hiểu được các khái niệm bản của xác suất: phép thử ngẫu nhiên, không gian
mẫu, biến cố, mối quan hệ giữa các biến cố.
2. Hiểu được ý nghĩa của khái niệm độc lập.
3. Hiểu được ý nghĩa tính được xác suất, vọng, phương sai trong một số trường
hợp đơn giản.
4. Vận dụng phân phối nhị thức phân phối chuẩn giải quyết một số bài toán thực
tế.
6
CHƯƠNG 1. MỘT SỐ KIẾN THỨC XÁC SUẤT SỞ 7
1.1 Định nghĩa xác suất
1.1.1 Phép thử ngẫu nhiên
Phép thử: việc thực hiện một tổ hợp các hành động nào đó.
Phép thử ngẫu nhiên: phép thử ta không biết trước được kết quả của
1.1.2 Không gian mẫu Biếncố cấp
Không gian mẫu tập hợp tất cả các kết quả thể xảy ra của phép thử. Ta thường
hiệu không gian mẫu bởi .
Biến cố cấp một phần tử của không gian mẫu.
dụ 1.1.1. Trong hộp 1 bi xanh, 1 bi đỏ 1 bi vàng. Hãy xác định không gian mẫu
số biến cố cấp của các phép thử sau:
a) Lấy ra ngẫu nhiên 1 bi từ hộp.
b) Lấy ra ngẫu nhiên đồng thời 2 bi từ hộp.
c) Lấy ra lần lượt 2 bi từ hộp.
d) Lấy ra ngẫu nhiên 1 bi từ hộp, xem màu, trả lại hộp rồi lại lấy ra ngẫu nhiên 1 bi nữa.
Lời giải. a) Lấy ra ngẫu nhiên 1 bi từ hộp
=
n
X, Đ, V .
o
b) Lấy ra ngẫu nhiên đồng thời 2 bi từ hộp
=
n
{ }X, Đ} {, X, V }, {Đ, V
o
.
c) Lấy ra lần lượt 2 bi từ hộp
=
n
XĐ Đ Đ Đ, XV, X, V, V X, V
o
=
n
( ) (X, Đ , ( )X, V , Đ, X),
( ( )
Đ, V ), V, X , ( )V, Đ
o
CHƯƠNG 1. MỘT SỐ KIẾN THỨC XÁC SUẤT SỞ 8
d) Lấy ra ngẫu nhiên 1 bi từ hộp, xem màu, trả lại hộp rồi lại lấy ra ngẫu nhiên 1 bi
nữa
=
n
XX, X , V VĐ, XV, ĐX, ĐV, ĐĐ, V X, V Đ
o
=
n
( ) ) (X, X , (X, Đ , ( )X, V , Đ, X),
( ) ( ) ( )
Đ Đ, , Đ, V , (V, X), V, Đ), (V, V
o
.
1.1.3 Biến cố
Biến cố một sự kiện liên quan đến phép thử. Một biến cố thể xảy ra hoặc
không xảy ra sau khi phép thử được thực hiện. Mỗi biến cố một tập con của
không gian mẫu.
Biến cố chắc chắn biến cố luôn xảy ra.
Biến cố rỗng (trống) biến cố luôn không xảy ra.
dụ 1.1.2. Xét phép thử gieo hai con xúc xắc cân đối. Hãy xác định không gian mẫu
biểu diễn các biến cố sau dưới dạng tập hợp.
A b/c xuất hiện hai mặt 1 chấm.
B b/c xuất hiện hai mặt 4 chấm.
C b/c xuất hiện hai mặt cùng chấm.
D b/c tổng số chấm bằng 8.
E b/c tích số chấm xuất hiện số lẻ.
Lời giải.
= {(1 1) (1 2) (6 6), , , , . . . , , }
= {(i, j) : 1 i, j 6}
CHƯƠNG 1. MỘT SỐ KIẾN THỨC XÁC SUẤT SỞ 9
A = {(1 1), }.
B = {(4 4), }.
C b/c xuất hiện hai mặt cùng chấm
C = {(1, , , , , ,1) (2, ,2) (3 3), (4 4), (5, 5) (6 6)}.
D b/c tổng số chấm bằng 8
D = {(2, ,6), ,(3, 5) (4 4), , , ,(5 3) (6 2)}.
E b/c tích số chấm xuất hiện số lẻ
E = {(1, , , , , , ,1), (1, 3) (1 5), , , ,(3 1) (3 3) (3 5), ,(5 1) (5 3), (5, 5)}.
1.1.4 Phép toán trêncác biến cố
A B: Hợp của hai biến cố A .B
A B = AB: Giao của hai biến cố A B.
A \ B: Hiệu của hai biến cố A cho B.
dụ 1.1.3. Trong phép thử gieo hai con xúc xắc, hãy xác định biến cố hợp, giao hiệu
của các biến cố C .D
1.1.5 Mốiquan hệ giữa các biến cố
Biến cố A được gọi thuận lợi cho biến cố B nếu khi A xảy ra thì B cũng xảy ra.
hiệu .A B
Biến cố A được gọi xung khắc với biến cố B nếu khi A xảy ra thì B không xảy
ra ngược lại. Hai biến cố xung khắc không thể đồng thời cùng xảy ra. hiệu
A B = .
CHƯƠNG 1. MỘT SỐ KIẾN THỨC XÁC SUẤT SỞ 10
dụ 1.1.4. Trong các biến cố A, B, C, D, E phép thử gieo hai con xúc xắc
hãy chỉ ra biến cố nào thuận lợi cho biến cố nào;
hãy chỉ ra các cặp biến cố xung khắc.
Biến cố A B đối nhau nếu luôn chỉ đúng một trong hai biến cố xảy ra.
(
A B =
A
B =
A = \ B.
hiệu biến cố đối của biến cố
A
¯
A.
Hai biến cố A B được gọi đồng khả năng nếu chúng khả năng xuất hiện
như nhau trong mỗi phép thử.
dụ 1.1.5. Trong phép thử gieo hai con xúc xắc, hãy xác định biến cố đối của các biến
cố .C, D, E
1.1.6 Định nghĩa xác suất cổ điển
Giả sử một phép thử n kết quả khác nhau cùng khả năng xảy ra, trong đó
m kết quả thuận lợi cho biến cố A. Khi đó xác suất để biến cố A xảy ra
P
(A) =
Số kết quả thuận lợi cho A
Tổng số kết quả
=
m
n
.
dụ 1.1.6. Giả sử hai con xúc xắc cân đối đồng chất.
1. Tính xác suất của các biến cố .A, B, C, D, E
2. Tính xác suất của các biến cố .C D, C D, C \ D, D \ C
1.1.7 Tínhchất của xác suất
Với mọi biến cố :A
0 P(A) 1.
Với mọi biến cố xung khắc A :B
P P P(A B) = (A) + ( )B .
Với mọi biến cố :A
P
(
¯
A A .) = 1 P( )
| 1/64

Preview text:

Bài giảng Thống kê Xã hội học Khoa Toán Tin
Trường Đại học Sư phạm Hà Nội 2020 Mục lục
1 MỘT SỐ KIẾN THỨC XÁC SUẤT CƠ SỞ 6
1.1 Định nghĩa xác suất . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.1.1 Phép thử ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.1.2 Không gian mẫu và Biến cố sơ cấp . . . . . . . . . . . . . . . . . . . 7
1.1.3 Biến cố . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.1.4 Phép toán trên các biến cố . . . . . . . . . . . . . . . . . . . . . . . . 9
1.1.5 Mối quan hệ giữa các biến cố . . . . . . . . . . . . . . . . . . . . . . 9
1.1.6 Định nghĩa xác suất cổ điển . . . . . . . . . . . . . . . . . . . . . . . 10
1.1.7 Tính chất của xác suất . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.1.8 Định nghĩa xác suất theo thống kê . . . . . . . . . . . . . . . . . . . 11
1.2 Sự độc lập . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.1 Hai biến cố độc lập . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.2 Dãy biến cố độc lập . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2.3 Dãy phép thử Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2.4 Công thức xác suất nhị thức . . . . . . . . . . . . . . . . . . . . . . . 13
1.3 Biến ngẫu nhiên rời rạc . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.3.1 Định nghĩa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.3.2 Phân phối của biến ngẫu nhiên . . . . . . . . . . . . . . . . . . . . . 14
1.3.3 Các số đặc trưng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.3.4 Ý nghĩa của kỳ vọng và phương sai . . . . . . . . . . . . . . . . . . . 15
1.3.5 Phân phối nhị thức . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.3.6 Tính chất của kỳ vọng và phương sai . . . . . . . . . . . . . . . . . . 15
1.4 Biến ngẫu nhiên liên tục và Phân phối chuẩn . . . . . . . . . . . . . . . . . 16
1.4.1 Biến ngẫu nhiên liên tục . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4.2 Hàm mật độ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4.3 Các số đặc trưng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4.4 Phân phối chuẩn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.4.5 Tính chất của phân phối chuẩn . . . . . . . . . . . . . . . . . . . . . 18
1.4.6 Xấp xỉ phân phối nhị thức bằng phân phối chuẩn . . . . . . . . . . 19 2 MẪU NGẪU NHIÊN 21
2.1 Giới thiệu về Thống kê . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.1.1 Mẫu và quần thể . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.1.2 Quy trình nghiên cứu thống kê . . . . . . . . . . . . . . . . . . . . . 22 1 MỤC LỤC 2
2.1.3 Các bài toán thống kê sẽ học: . . . . . . . . . . . . . . . . . . . . . . 22
2.2 Thu thập dữ liệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.2.1 Xác định dữ liệu cần thu thập . . . . . . . . . . . . . . . . . . . . . . 23
2.2.2 Dữ liệu sơ cấp và thứ cấp . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.2.3 Lấy mẫu hoàn lại và không hoàn lại . . . . . . . . . . . . . . . . . . . 24
2.2.4 Quy tắc lấy mẫu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.2.5 Phương pháp lấy mẫu giản đơn . . . . . . . . . . . . . . . . . . . . . 24
2.2.6 Các phương pháp lấy mẫu khác . . . . . . . . . . . . . . . . . . . . . 25
2.3 Trình bày dữ liệu bằng bảng và biểu đồ . . . . . . . . . . . . . . . . . . . . . 25
2.3.1 Biểu đồ thân-lá (stem-and-leaf diagram) . . . . . . . . . . . . . . . 25
2.3.2 Tần số . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.3.3 Bảng tần số . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.4 Biểu đồ tần số . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.4.1 Biểu đồ tần suất . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.5 Số liệu và các số đặc trưng . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.5.1 Biến số . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.5.2 Phân loại biến số . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.5.3 Các số đo giá trị trung tâm . . . . . . . . . . . . . . . . . . . . . . . . 30
2.5.4 Các số đo độ phân tán . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.5.5 Thống kê . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3 KHOẢNG ƯỚC LƯỢNG 33
3.1 Khoảng ước lượng cho trung bình . . . . . . . . . . . . . . . . . . . . . . . . 33
3.1.1 Đặt vấn đề . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.1.2 Khoảng ước lượng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.1.3 KƯL cho trung bình µ khi σ2 đã biết . . . . . . . . . . . . . . . . . . 34
3.1.4 KƯL cho trung bình µ của mẫu cỡ lớn . . . . . . . . . . . . . . . . . 37
3.1.5 KƯL cho mẫu nhỏ có phân phối chuẩn với σ2 chưa biết . . . . . . . 38
3.1.6 Vấn đề xác định cỡ mẫu . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.2 Khoảng ước lượng cho tỷ lệ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.2.1 Đặt vấn đề . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.2.2 Công thức khoảng ước lượng cho tỷ lệ . . . . . . . . . . . . . . . . . 40
3.2.3 Vấn đề xác định cỡ mẫu . . . . . . . . . . . . . . . . . . . . . . . . . 41
4 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 43
4.1 Tình huống thực tế . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.2 Bài toán kiểm định giả thuyết tổng quát . . . . . . . . . . . . . . . . . . . . 44
4.2.1 Miền tiêu chuẩn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.2.2 Các loại sai lầm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.3 Bài toán kiểm định giả thuyết cho giá trị trung bình một mẫu . . . . . . . . 46
4.3.1 Bài toán 1: So sánh trung bình của mẫu có phân phối chuẩn với
phương sai σ2 đã biết . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4.3.2 Bài toán 2: So sánh giá trị trung bình của mẫu cỡ lớn với phương
sai chưa biết . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 MỤC LỤC 3
4.3.3 Bài toán 3: So sánh giá trị trung bình của mẫu có phân phối chuẩn
với phương sai chưa biết . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.4 Bài toán kiểm định giả thuyết về tỉ lệ . . . . . . . . . . . . . . . . . . . . . . 52
4.4.1 Tình huống thực tế . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.4.2 Bài toán kiểm định giả thuyết cho tỉ lệ . . . . . . . . . . . . . . . . . 53
4.4.3 Tiêu chuẩn kiểm định . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.5 Bài toán so sánh hai giá trị trung bình . . . . . . . . . . . . . . . . . . . . . 55
4.5.1 Tình huống thực tế . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.5.2 So sánh hai giá trị trung bình . . . . . . . . . . . . . . . . . . . . . . 56
4.5.3 Bài toán 1: So sánh giá trị trung bình của hai mẫu có phân phối
chuẩn với phương sai đã biết . . . . . . . . . . . . . . . . . . . . . . 56
4.5.4 Bài toán 2: So sánh hai giá trị trung bình của hai mẫu có phân phối
chuẩn với phương sai σX = σY = σ2 chưa biết . . . . . . . . . . . . . 57
4.6 Bài toán so sánh hai tỉ lệ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.6.1 Tình huống thực tế . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.6.2 So sánh hai tỉ lệ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 Giới thiệu học phần
Thống kê Xã hội học

Một số vấn đề thực tế
• Làm thế nào để biết cân nặng trung bình của trẻ sơ sinh ở một địa phương?
Một nhà điều tra thử tính cân nặng trung bình của 50 trẻ sơ sinh ở một địa
phương thì được kết quả là 3,1kg. Có thể nói gì về cân nặng của trẻ sơ sinh toàn địa phương đó?
Một nhà quản lý cho rằng cân nặng trung bình của tất cả các trẻ sơ sinh ở địa
phương đó là 3,3kg. Tuyên bố của nhà quản lý có đúng không?
• Làm thế nào để so sánh hiệu quả của hai phác đồ điều trị cho một bệnh nào đó?
Có hai phác đồ điều trị cho cùng một bệnh. Trong 200 bệnh nhân điều trị theo
phác đồ 1 có 150 khỏi bệnh. Trong 50 người điều trị theo phác đồ 2 thì có 40
người khỏi bệnh. Hỏi phác đồ 2 có thực sự tốt hơn phác đồ 1 hay không?
• Con của bạn sẽ cao bao nhiêu cm?
Chiều cao của con bị ảnh hưởng bởi chiều cao của bố hay chiều cao của mẹ?
Chiều cao của bố/mẹ và con liên quan như thế nào đến nhau?
Biết chiều cao của bố/mẹ thì có thể dự đoán được chiều cao của con không? 4 MỤC LỤC 5 Thống kê là gì?
Thống kê là khoa học về việc thu thập, xử lý, biểu diễn, phân tích mẫu số liệu thu thập
được từ một quần thể để rút ra được các kết luận có độ tin cậy cho toàn bộ quần thể đó.
Cơ sở khoa học của Thống kê là Lý thuyết xác suất. Nội dung học phần
1. Chương 1: Một số kiến thức xác suất cơ sở
2. Chương 2: Mẫu ngẫu nhiên
3. Chương 3: Khoảng ước lượng
4. Chương 4: Kiểm định giả thuyết thống kê 5. Chương 5: Hồi quy
Mục tiêu của học phần
1. Hiểu được ý nghĩa và tính được xác suất, kì vọng, phương sai trong một số trường hợp đơn giản.
2. Vận dụng phân phối nhị thức và phân phối chuẩn giải quyết một số bài toán thực tế.
3. Hiểu được phương pháp lấy mẫu ngẫu nhiên.
4. Biết phân loại số liệu và tính toán các đặc trưng của mẫu số liệu. Trình bày số liệu
dưới dạng biểu đồ cột, biểu đồ quạt.
5. Hiểu được ý nghĩa và tính khoảng ước lượng cho trung bình và tỉ lệ.
6. Hiểu được ý nghĩa bài toán kiểm định giả thuyết. Vận dụng để so sánh tỉ lệ và trung bình.
7. Hiểu được ý nghĩa và giải quyết được bài toán hồi quy tuyến tính đơn. Chương 1
MỘT SỐ KIẾN THỨC XÁC SUẤT CƠ SỞ
Nội dung của chương:
1. Định nghĩa xác suất cổ điển và định nghĩa xác suất theo thống kê. 2. Sự độc lập
3. Biến ngẫu nhiên rời rạc.
4. Biến ngẫu nhiên liên tục
5. Phân phối nhị thức và Phân phối chuẩn
6. Các số đặc trưng của biến ngẫu nhiên.
Mục tiêu của chương
1. Hiểu được các khái niệm cơ bản của xác suất: phép thử ngẫu nhiên, không gian
mẫu, biến cố, mối quan hệ giữa các biến cố.
2. Hiểu được ý nghĩa của khái niệm độc lập.
3. Hiểu được ý nghĩa và tính được xác suất, kì vọng, phương sai trong một số trường hợp đơn giản.
4. Vận dụng phân phối nhị thức và phân phối chuẩn giải quyết một số bài toán thực tế. 6
CHƯƠNG 1. MỘT SỐ KIẾN THỨC XÁC SUẤT CƠ SỞ 7
1.1 Định nghĩa xác suất
1.1.1 Phép thử ngẫu nhiên
• Phép thử: việc thực hiện một tổ hợp các hành động nào đó.
• Phép thử ngẫu nhiên: phép thử mà ta không biết trước được kết quả của nó
1.1.2 Không gian mẫu và Biến cố sơ cấp
• Không gian mẫu là tập hợp tất cả các kết quả có thể xảy ra của phép thử. Ta thường
kí hiệu không gian mẫu bởi Ω.
• Biến cố sơ cấp là một phần tử của không gian mẫu.
Ví dụ 1.1.1. Trong hộp có 1 bi xanh, 1 bi đỏ và 1 bi vàng. Hãy xác định không gian mẫu
và số biến cố sơ cấp của các phép thử sau:
a) Lấy ra ngẫu nhiên 1 bi từ hộp.
b) Lấy ra ngẫu nhiên đồng thời 2 bi từ hộp.
c) Lấy ra lần lượt 2 bi từ hộp.
d) Lấy ra ngẫu nhiên 1 bi từ hộp, xem màu, trả lại hộp rồi lại lấy ra ngẫu nhiên 1 bi nữa.
Lời giải. a) Lấy ra ngẫu nhiên 1 bi từ hộp n o Ω = X, Đ, V .
b) Lấy ra ngẫu nhiên đồng thời 2 bi từ hộp n o
Ω = {X, Đ}, {X, V }, {Đ, V } .
c) Lấy ra lần lượt 2 bi từ hộp n o
Ω = XĐ, XV, ĐX, ĐV, V X, V Đ n = (X, Đ), (X, V ), (Đ, X),o (Đ, V ), (V, X), (V, Đ)
CHƯƠNG 1. MỘT SỐ KIẾN THỨC XÁC SUẤT CƠ SỞ 8
d) Lấy ra ngẫu nhiên 1 bi từ hộp, xem màu, trả lại hộp rồi lại lấy ra ngẫu nhiên 1 bi nữa n o
Ω = XX, XĐ, XV, ĐX, ĐV, ĐĐ, V X, V Đ, V V n
= (X, X), (X, Đ), (X, V ), (Đ, X), o
(Đ, Đ), (Đ, V ), (V, X), (V, Đ), (V, V ) . 1.1.3 Biến cố
• Biến cố là một sự kiện liên quan đến phép thử. Một biến cố có thể xảy ra hoặc
không xảy ra sau khi phép thử được thực hiện. Mỗi biến cố là một tập con của không gian mẫu.
• Biến cố chắc chắn là biến cố luôn xảy ra.
• Biến cố rỗng (trống) là biến cố luôn không xảy ra.
Ví dụ 1.1.2. Xét phép thử gieo hai con xúc xắc cân đối. Hãy xác định không gian mẫu và
biểu diễn các biến cố sau dưới dạng tập hợp.
• A là b/c xuất hiện hai mặt 1 chấm.
• B là b/c xuất hiện hai mặt 4 chấm.
• C là b/c xuất hiện hai mặt cùng chấm.
• D là b/c tổng số chấm bằng 8.
• E là b/c tích số chấm xuất hiện là số lẻ. Lời giải.
Ω = {(1, 1), (1, 2), . . . , (6, 6)} = {(i, j) : 1 ≤ i, j ≤ 6}
CHƯƠNG 1. MỘT SỐ KIẾN THỨC XÁC SUẤT CƠ SỞ 9 • A = {(1, 1)}. • B = {(4, 4)}.
• C là b/c xuất hiện hai mặt cùng chấm
C = {(1, 1), (2, 2), (3, 3), (4, 4), (5, 5), (6, 6)}.
• D là b/c tổng số chấm bằng 8
D = {(2, 6), (3, 5), (4, 4), (5, 3), (6, 2)}.
• E là b/c tích số chấm xuất hiện là số lẻ
E = {(1, 1), (1, 3), (1, 5), (3, 1), (3, 3), (3, 5), (5, 1), (5, 3), (5, 5)}.
1.1.4 Phép toán trên các biến cố
• A ∪ B: Hợp của hai biến cố A và B.
• A ∩ B = AB: Giao của hai biến cố A và B.
• A \ B: Hiệu của hai biến cố A cho B.
Ví dụ 1.1.3. Trong phép thử gieo hai con xúc xắc, hãy xác định biến cố hợp, giao và hiệu
của các biến cố C và D.
1.1.5 Mối quan hệ giữa các biến cố
• Biến cố A được gọi là thuận lợi cho biến cố B nếu khi A xảy ra thì B cũng xảy ra. Kí hiệu là A ⊂ B.
• Biến cố A được gọi là xung khắc với biến cố B nếu khi A xảy ra thì B không xảy
ra và ngược lại. Hai biến cố xung khắc không thể đồng thời cùng xảy ra. Kí hiệu là A ∩ B = ∅.
CHƯƠNG 1. MỘT SỐ KIẾN THỨC XÁC SUẤT CƠ SỞ 10
Ví dụ 1.1.4. Trong các biến cố A, B, C, D, E ở phép thử gieo hai con xúc xắc
• hãy chỉ ra biến cố nào thuận lợi cho biến cố nào;
• hãy chỉ ra các cặp biến cố xung khắc.
• Biến cố A và B là đối nhau nếu luôn chỉ có đúng một trong hai biến cố xảy ra. ( ⇔ A = Ω \ B. A ∩ A B ∪ = B ∅ = Ω
Kí hiệu biến cố đối của biến cố A là ¯ A.
• Hai biến cố A và B được gọi là đồng khả năng nếu chúng có khả năng xuất hiện
như nhau trong mỗi phép thử.
Ví dụ 1.1.5. Trong phép thử gieo hai con xúc xắc, hãy xác định biến cố đối của các biến cố C, D, E.
1.1.6 Định nghĩa xác suất cổ điển
Giả sử một phép thử có n kết quả khác nhau và có cùng khả năng xảy ra, trong đó có
m kết quả thuận lợi cho biến cố A. Khi đó xác suất để biến cố A xảy ra là
Số kết quả thuận lợi cho A m P(A) = = . Tổng số kết quả n
Ví dụ 1.1.6. Giả sử hai con xúc xắc là cân đối và đồng chất.
1. Tính xác suất của các biến cố A, B, C, D, E.
2. Tính xác suất của các biến cố C ∩ D, C ∪ D, C \ D, D \ C.
1.1.7 Tính chất của xác suất • Với mọi biến cố A: 0 ≤ P(A) ≤ 1.
• Với mọi biến cố xung khắc A và B: P(A ∪ B) = P(A) + P(B). • Với mọi biến cố A: P( ¯ A) = 1 − P(A).