Thống kê xã hội học đại cương Bài | Đại học Sư Phạm Hà Nội

Thống kê xã hội học đại cương Bài | Đại học Sư Phạm Hà Nội với những kiến thức và thông tin bổ ích giúp sinh viên tham khảo, ôn luyện và phục vụ nhu cầu học tập của mình cụ thể là có định hướng, ôn tập, nắm vững kiến thức môn học và làm bài tốt trong những bài kiểm tra, bài tiểu luận, bài tập kết thúc học phần, từ đó học tập tốt và có kết quả cao cũng như có thể vận dụng tốt những kiến thức mình đã học vào thực tiễn cuộc sống.

THỐNG KÊ XÃ HỘI HỌC
Thống kê là gì?
- Thống kê là khoa học về việc thu nhập, xử lý, biểu
diễn, phân tích mẫu số liệu thu nhập được từ một
quần thể rút ra được các kết luận có độ tin cậy cho
toàn bộ quần thể đó
- Cơ sở khoa học của Thống kê là Lý thuyết xác suất
(probability)
CHƯƠNG 1: Một số kiến thức xác suất cơ sở
1. Định nghĩa xác suất
- Phép thử: việc thực hiện một tổ hợp các hành động
nào đó
- Phép thử ngẫu nhiên: phép thử mà ta không biết
trước được kết quả là gì
Vd: tung đồng xu, tung xúc xắc
- Không gian mẫu: là tập hợp tất cả các kết quả có
thể xảy ra của phép thử. Ta thường kí hiệu không
gian mẫu bởi (ômega)
- Biến cố sơ cấp: là một phần tử của không gian mẫu
- Biến cố (event): là một sự kiện liên quan đến phép
thử. Một biến có thể xảy ra hoặc không xảy ra sau
khi phép thử được thực hiện. Mỗi biến cố là một tập
con của không gian mẫu
+ Biến cố chắc chắn: là biến cố luôn xảy ra
+ Biến cố rỗng (trống): là biến cố luôn không xảy ra
VD: trong hộp có 1 bi xanh, 1 bi đỏ và 1 bi vàng.
Hãy liệt kê tất cả các kết quả có thể xảy ra của phép
thử sau:
a) Lấy ra ngẫu nhiên 1 bi từ hộp
KGM = { X, Đ, V}
b) Lấy ra ngẫu nhiên đồng thời 2 bi từ hộp
KGM = { {X,Đ}, {X,V}, {Đ,V} }
c) Lấy ra lần lượt 2 bi từ hộp
KGM = {XD, XV, DV, DX, VS, VD}
d) Lấy ra ngẫu nhiên 1 bi từ hộp, xem màu, trả lại
hộp rồi lấy ra ngẫu nhiên 1 bi nữa
KGM = {XX, XD, XV, DV, DX, Đ, VX, VD, VV}
- Phép toán trên các biến cố:
+ A B: hợp của 2 biến cố A và B
+ A B= AB giao của 2 biến cố A và B
+ A \ B: hiều của hai biến cố A và B
- Biến cố A được gọi là thuận lợi cho biến B nếu khi
A xảy ra thì B cũng xảy ra A B
- Biến cố A được gọi là xung khắc với biến cố nếu khi
A xảy ra thì B không xảy ra và ngược lại. Hai biến cố
xung khắc không thể đồng thời cùng xảy ra
A B =
VD: Xét phép thử gieo 2 con xúc xắc cân đối. Hãy
xác định không gian và biểu diễn các biến cố sau
dưới dang tập hợp:
A là bc xuất hiện hai mặt 1 chấm A= {(1;1)}
B là bc xuất hiện hai mặt 4 chấm B = {(4;4)}
C là bc xuất hiện hai mặt cùng chấm C = 6 = {(1;1)
(2;2) (3;3)...(6;6)}
D là bc tổng số chấm bằng 8 D = {(2;6)
(3;5) (4;4) (5;3) (6;2)}
E là bc tích số chấm xuất hiện số lẻ
E = {(1;1) (1;3) (1;5) (3;1) (3;3) (3;5) (5;1) (5;3)
(5;5)}
B
A
B
A
- Mối quan hệ giữa các biến cố:
+ Biến cố A và B đối nhau nếu luôn chỉ có đúng 1
trong 2 biến cố xảy ra
A B = O
A = \B
A B =
Kí hiệu biến cố đối của biến cố A là A
C = \ C = { (i;j); i # j }
+ Hai biến cố A và B được gọi là đồng khả năng nếu
chúng có khả năng xuất hiện như nhau trong mỗi
phép thử
- Định nghĩa xác suất cổ điển
Giả sử một phép thử ngẫu nhiên có không gian mẫu
gồm kết quả khác nhau và có cùng khả năng xảy n
ra, trong đó có kết quả thuận lợi cho biến cố A. m
Khi đó xác xuất để biến cố A xảy ra là:
Số kết quả thuận lợi cho A m
P (A) = =
Tổng số kết quả của KGM n
- Định nghĩa xác suất theo thống kê
Thực hiện lặp đi lặp lại phép thử n lần và gọi m là số
lần biến cố A xuất hiện trong n lần thử
+ Tỉ số m/n được gọi là xác suất thực nghiệm của
biến cố A trong n lần thử
+ Nếu xác suất thực nghiệm m/n hội tự đến giá trị
Po nào đó thì ta nói Po là của biến cố A xác suất
theo nghĩa thống kê
- Tính chất của xác suất:
+ với mọi biến cố A: 0 <= P(A)
<= 1
+ với mọi biến cố xung khắc A và B: P(A B) = P
(A) + P(B)
+ với mọi biến cố A: P(A) = 1 -
P(A)
2. Sự độc lập
Hai biến cố độc lập: hai biến cố A và B được gọi
là độc lập nếu việc A có xảy ra hay không cũng
không ảnh hưởng tới khả năng xảy ra của B và
ngược lại. Theo xác suất thì P ( A B) = P (A).
P(B)
VD: tung 1 đồng xu 2 lần, gọi A và B lần lượt là biến
cố lần tung thứ nhất và thứ hai xuất hiện mặt sấp
thì A và B là 2 biến cố độc lập
Nếu A và B độc lập thì các cặp biến cố sau đây cũng
độc lập:
+ A và B
+ A và B
+ A và B
y biến cố độc lập
y biến cố A1, A2,...An được gọi là độc lập nếu một
biến cố Ai nào trong đó dãy đó có xảy ra hay không
cũng không ảnh hưởng tới khả năng xảy ra của các
biến cố còn lại và ngược lại
y phép thử Bernoulli
Một dãy phép thử được gọi là dãu phép thử
Bernoulli nếu
+ kết quả của mỗi phép thử hoặc là thành công,
hoặc là thất bại
+ Xác suất thành công của mỗi lần thử đều bằng
nhau
+ Kết quả của từng lần thử là dãy biến cố độc lập
VD gieo 3 hạt giống và quan sát sự nảy mầm của
mỗi hạt. Xác suất của mỗi hạt nảy mầm là 0,8. Tính
xác suất
+ cả 3 hạt nảy mầm P(A1A2A3)= P(A1) P(A2) P(A3)
= 0,8
3
+ cả 3 hạt đều không nảy mầm P(A1A2A3) = tích =
0,2
3
+ có đúng 2 hạt nảy mầm
P(A1A2A3) + P(A1A2A3) + P(A1A2A3) = 3 x 0,8
3
x
0,2
Công thức xác suất nhị thức
Gọi p là xác suất thành công trong mỗi lần thử. Xác
suất để có đúng k lần thành công trong n lần thử
độc lập là
C
k
n
p
k
(1-p) 0<= k <= n
n-k
3. Biến ngẫu nhiên rời rạc
Biến ngẫu nhiên là một quan sát nhận giá trị
bằng số liên quan đến kết quả của phép thử
- Ví dụ: tung 2 đồng xu, số mặt sấp xuất hiện là một
biến ngẫu nhiên (3 giá trị gồm: không xuất hiện,
xuất hiện 1 mặt, xuất hiện2 mặt)
Biến ngẫu nhiên rời rạc:
+ định nghĩa: biến ngẫu nhiên X được gọi là biến
ngẫu nhiên rời rạc nếu nó nhận các giá trị
x1,x2,x3....,xn
- Bảng phân phối xác suất:
Kí hiệu p = P[ X= x ] với k =1,2,3...,n khi đó ta có
k k
bảng phân phối xác suất của X như sau:
x x1 x2 ... x
k
... x
n
P [X= x] p1 p2 ... p ... p
k n
Chú ý: p1 + p2 + p3 +...+ p = 1
k
Các số đặc trưng:
+ Kỳ vọng: (expectation) E[X] = x1p1 + x2p2 +...+
xnpn
+ Phương sai: (variance) Var(X) = x1 p1 + x2 p2
2 2
+...+ xn pn - (E[X])
2 2
+ Độ lệch chuẩn: (X) = Var (X)
Ý nghĩa của kỳ vọng và phương sai
+ kỳ vọng đặc trưng cho giá trị trung bình mà biến
ngẫu nhiên có thể nhận
+ Phương sai đặc trưng cho độ phân tán của giá trị
của biến ngẫu nhiên xung quanh giá trị trung bình
của nó. Độ phân tán của biến ngẫu nhiên càng rộng
thì phương sai càng lớn
Tính chất: giáo trình
Phân phối nhị thức:
+ gọi X là số phép thử thành công trong dãy n phép
thử Bernoulli. Theo công thức xác suất nhị thức ta
P[X=k] = C k = 0,1,2,3,...
n
k
p
k
(1-p)
n-k
Khi đó biến ngẫu nhiên X được gọi là có phân phối
nhị thức, kí hiệu B(n,p)
4. Biến ngẫu nhiên liên tục
Hàm mật độ
Hàm f : R --> [0, ) được gọi là hàm mật độ của biến
ngẫu nhiên liên tục X nếu
P [a < X < b ] = f(x)dx với mọi số
b
thực a < b
a
Các số đặc trưng
- Kỳ vọng E[X] =
| 1/7

Preview text:

THỐNG KÊ XÃ HỘI HỌC Thống kê là gì?
- Thống kê là khoa học về việc thu nhập, xử lý, biểu

diễn, phân tích mẫu số liệu thu nhập được từ một
quần thể rút ra được các kết luận có độ tin cậy cho
toàn bộ quần thể đó
- Cơ sở khoa học của Thống kê là Lý thuyết xác suất
(probability)
CHƯƠNG 1: Một số kiến thức xác suất cơ sở
1. Định nghĩa xác suất
- Phép thử: việc thực hiện một tổ hợp các hành động nào đó
- Phép thử ngẫu nhiên: phép thử mà ta không biết

trước được kết quả là gì
Vd: tung đồng xu, tung xúc xắc

- Không gian mẫu: là tập hợp tất cả các kết quả có
thể xảy ra của phép thử. Ta thường kí hiệu không gian mẫu bởi (ômega)
- Biến cố sơ cấp: là một phần tử của không gian mẫu
- Biến cố (event): là một sự kiện liên quan đến phép

thử. Một biến có thể xảy ra hoặc không xảy ra sau
khi phép thử được thực hiện. Mỗi biến cố là một tập con của không gian mẫu
+ Biến cố chắc chắn: là biến cố luôn xảy ra
+ Biến cố rỗng (trống): là biến cố luôn không xảy ra
VD: trong hộp có 1 bi xanh, 1 bi đỏ và 1 bi vàng.

Hãy liệt kê tất cả các kết quả có thể xảy ra của phép thử sau:
a) Lấy ra ngẫu nhiên 1 bi từ hộp KGM = { X, Đ, V}
b) Lấy ra ngẫu nhiên đồng thời 2 bi từ hộp
KGM = { {X,Đ}, {X,V}, {Đ,V} }
c) Lấy ra lần lượt 2 bi từ hộp
KGM = {XD, XV, DV, DX, VS, VD}
d) Lấy ra ngẫu nhiên 1 bi từ hộp, xem màu, trả lại
hộp rồi lấy ra ngẫu nhiên 1 bi nữa
KGM = {XX, XD, XV, DV, DX, Đ, VX, VD, VV}
- Phép toán trên các biến cố:
+ A B: hợp của 2 biến cố A và B
+ A B= AB giao của 2 biến cố A và B
+ A \ B: hiều của hai biến cố A và B
- Biến cố A được gọi là thuận lợi cho biến B nếu khi

A xảy ra thì B cũng xảy ra A B B A
- Biến cố A được gọi là xung khắc với biến cố nếu khi
A xảy ra thì B không xảy ra và ngược lại. Hai biến cố
xung khắc không thể đồng thời cùng xảy ra A B = A B
VD: Xét phép thử gieo 2 con xúc xắc cân đối. Hãy
xác định không gian và biểu diễn các biến cố sau dưới dang tập hợp:
A là bc xuất hiện hai mặt 1 chấm A= {(1;1)}
B là bc xuất hiện hai mặt 4 chấm B = {(4;4)}
C là bc xuất hiện hai mặt cùng chấm C = 6 = {(1;1)
(2;2) (3;3)...(6;6)}
D là bc tổng số chấm bằng 8 D = {(2;6)
(3;5) (4;4) (5;3) (6;2)}
E là bc tích số chấm xuất hiện số lẻ
E = {(1;1) (1;3) (1;5) (3;1) (3;3) (3;5) (5;1) (5;3)
(5;5)}
- Mối quan hệ giữa các biến cố:
+ Biến cố A và B đối nhau nếu luôn chỉ có đúng 1

trong 2 biến cố xảy ra A B = O A = \B A B =
Kí hiệu biến cố đối của biến cố A là A C = \ C = { (i;j); i # j }
+ Hai biến cố A và B được gọi là đồng khả năng nếu

chúng có khả năng xuất hiện như nhau trong mỗi phép thử
- Định nghĩa xác suất cổ điển
Giả sử một phép thử ngẫu nhiên có không gian mẫu

gồm n kết quả khác nhau và có cùng khả năng xảy
ra, trong đó m có kết quả thuận lợi cho biến cố A.
Khi đó xác xuất để biến cố A xảy ra là:
Số kết quả thuận lợi cho A m P (A) = =
Tổng số kết quả của KGM n
- Định nghĩa xác suất theo thống kê
Thực hiện lặp đi lặp lại phép thử n lần và gọi m là số

lần biến cố A xuất hiện trong n lần thử
+ Tỉ số m/n được gọi là xác suất thực nghiệm của
biến cố A trong n lần thử
+ Nếu xác suất thực nghiệm m/n hội tự đến giá trị

Po nào đó thì ta nói Po là của biến cố A xác suất theo nghĩa thống kê
- Tính chất của xác suất:
+ với mọi biến cố A: 0 <= P(A)
<= 1
+ với mọi biến cố xung khắc A và B: P(A B) = P
(A) + P(B)
+ với mọi biến cố A: P(A) = 1 -
P(A) 2. Sự độc lập
Hai biến cố độc lập: hai biến cố A và B được gọi
là độc lập nếu việc A có xảy ra hay không cũng
không ảnh hưởng tới khả năng xảy ra của B và
ngược lại. Theo xác suất thì P ( A B) = P (A). P(B)
VD: tung 1 đồng xu 2 lần, gọi A và B lần lượt là biến
cố lần tung thứ nhất và thứ hai xuất hiện mặt sấp
thì A và B là 2 biến cố độc lập
Nếu A và B độc lập thì các cặp biến cố sau đây cũng
độc lập: + A và B + A và B + A và B
Dãy biến cố độc lập
Dãy biến cố A1, A2,...An được gọi là độc lập nếu một
biến cố Ai nào trong đó dãy đó có xảy ra hay không
cũng không ảnh hưởng tới khả năng xảy ra của các
biến cố còn lại và ngược lại
Dãy phép thử Bernoulli
Một dãy phép thử được gọi là dãu phép thử Bernoulli nếu
+ kết quả của mỗi phép thử hoặc là thành công,
hoặc là thất bại
+ Xác suất thành công của mỗi lần thử đều bằng
nhau
+ Kết quả của từng lần thử là dãy biến cố độc lập
VD gieo 3 hạt giống và quan sát sự nảy mầm của

mỗi hạt. Xác suất của mỗi hạt nảy mầm là 0,8. Tính xác suất
+ cả 3 hạt nảy mầm P(A1A2A3)= P(A1) P(A2) P(A3)
= 0,83
+ cả 3 hạt đều không nảy mầm P(A1A2A3) = tích =
0,23
+ có đúng 2 hạt nảy mầm
P(A1A2A3) + P(A1A2A3) + P(A1A2A3) = 3 x 0,83 x
0,2
Công thức xác suất nhị thức
Gọi p là xác suất thành công trong mỗi lần thử. Xác
suất để có đúng k lần thành công trong n lần thử độc lập là Ck n-k n pk (1-p) 0<= k <= n
3. Biến ngẫu nhiên rời rạc
Biến ngẫu nhiên là một quan sát nhận giá trị
bằng số liên quan đến kết quả của phép thử
- Ví dụ: tung 2 đồng xu, số mặt sấp xuất hiện là một
biến ngẫu nhiên (3 giá trị gồm: không xuất hiện,
xuất hiện 1 mặt, xuất hiện2 mặt)
Biến ngẫu nhiên rời rạc:
+ định nghĩa: biến ngẫu nhiên X được gọi là biến
ngẫu nhiên rời rạc nếu nó nhận các giá trị x1,x2,x3....,xn
- Bảng phân phối xác suất:
Kí hiệu pk = P[ X= xk ] với k =1,2,3...,n khi đó ta có

bảng phân phối xác suất của X như sau: x x1 x2 ... xk ... xn P [X= x] p1 p2 ... pk ... pn
Chú ý: p1 + p2 + p3 +...+ pk = 1

Các số đặc trưng:
+ Kỳ vọng: (expectation) E[X] = x1p1 + x2p2 +...+ xnpn
+ Phương sai: (variance) Var(X) = x12p1 + x22p2
+...+ xn2pn - (E[X])2
+ Độ lệch chuẩn: (X) =
Var (X)
Ý nghĩa của kỳ vọng và phương sai
+ kỳ vọng đặc trưng cho giá trị trung bình mà biến
ngẫu nhiên có thể nhận
+ Phương sai đặc trưng cho độ phân tán của giá trị

của biến ngẫu nhiên xung quanh giá trị trung bình
của nó. Độ phân tán của biến ngẫu nhiên càng rộng
thì phương sai càng lớn Tính chất: giáo trình
Phân phối nhị thức:

+ gọi X là số phép thử thành công trong dãy n phép
thử Bernoulli. Theo công thức xác suất nhị thức ta có P[X=k] = C k
n pk (1-p)n-k k = 0,1,2,3,...
Khi đó biến ngẫu nhiên X được gọi là có phân phối
nhị thức, kí hiệu B(n,p)
4. Biến ngẫu nhiên liên tục Hàm mật độ
Hàm f : R --> [0, ) được gọi là hàm mật độ của biến
ngẫu nhiên liên tục X nếu
P [a < X < b ] = b f(x)dx với mọi số thực a < b a Các số đặc trưng - Kỳ vọng E[X] =