Tóm tắt công thức môn xác suất thống kê| Đại học Kinh tế Quốc Dân

Đại học Kinh tế Quốc dân với những kiến thức và thông tin bổ ích giúp các bạn định hướng và họp tập dễ dàng hơn. Mời bạn đọc đón xem. Chúc bạn ôn luyện thật tốt và đạt điểm cao trong kì thi sắp tới

Trường:

Đại học Kinh Tế Quốc Dân 3 K tài liệu

Thông tin:
22 trang 11 tháng trước

Bình luận

Vui lòng đăng nhập hoặc đăng ký để gửi bình luận.

Tóm tắt công thức môn xác suất thống kê| Đại học Kinh tế Quốc Dân

Đại học Kinh tế Quốc dân với những kiến thức và thông tin bổ ích giúp các bạn định hướng và họp tập dễ dàng hơn. Mời bạn đọc đón xem. Chúc bạn ôn luyện thật tốt và đạt điểm cao trong kì thi sắp tới

43 22 lượt tải Tải xuống
LÝ THUY T XÁC SU T VÀ THNG KÊ TOÁN
THNG KÊ MÔ T
Tng th
Quan sát
Biến, phân loi bi ến, thang đo
Điề u tra t ng th u tra hay điề
mu?
(Mu)
Thu th p d li u
X lý d liu
Mô t d li u
Dùng b ng
Dùng đồ th
Dùng th ng kê b ng s
LÝ THUY T XÁC SU T
THNG KÊ SUY DI N
Tng th và Biến ngu nhiên gc 𝑋
Mu ng u nhiên và m u c th
Phân ph i c a th ng kê trên m u
Bài toán ước lượng
Bài toán ki nh ểm đị
𝑋 𝑁(𝜇, 𝜎
2
)
𝑥 m t t nh t c a là ước lượng điể 𝜇
Khong tin cy cho 𝜇
Kiểm định 𝐻
0
: 𝜇 = 𝜇
0
ƯL và kiểm định cho 𝜎
2
𝑋
1
𝑁 𝜇
(
1
, 𝜎
1
2
)
, 𝑋
2
𝑁(𝜇
2
, 𝜎
2
2
)
Khong tin cy cho 𝜇
1
𝜇
2
Kiểm định 𝐻
0
: 𝜇
1
𝜇
2
= 0
ƯL và kiểm định cho 𝜎
1
2
/𝜎
2
2
BNN g c phân ph i Không M t
Kiểm định phi tham s
Vấn đề khác
Phép th
(th nghim
/ quan sát)
Biến c, liên h gia các biến c
Xác su t c a bi n c ế
Tính theo định nghĩa
Tính theo công th c (c ng, nhân, ..)
Biến ngu nhiên
BNN 1 chi u r i r c
Bng PPXS, hàm PPXS
Tham s đặc trưng
𝐴
(
𝑝
)
, 𝐵 𝑛,𝑝 , 𝑃 ,
( ) (
𝜆
)
BNN 1 chi u liên t c
Hàm m XS, hàm PPXS ật độ
Tham s đặc trưng
𝑈
(
𝑎, 𝑏
)
, 𝑵 𝝁, 𝝈
(
𝟐
)
, 𝜒 , 𝑇, 𝐹,
2
BNN 2 chi u r i r c
Bảng XS đồng thi (𝑋, 𝑌)
Bng XS biên, kì v ọng, phương sai
Bảng XS điều kin
Kì v u ki n, ọng điề hàm h i quy
Hip sphương sai, hệ tương quan
BNN 2 chi u liên t c
BNN n chi u
𝑃 (𝑋
𝑡
𝛼
2
(
𝑛−1
)
𝑆
𝑛
< 𝜇 < 𝑋
+ 𝑡
𝛼
1
(
𝑛−1
)
𝑆
𝑛
) = 1 𝛼
𝐻
0
và TK kđ
𝐻
1
𝐻
0
: 𝜇 = 𝜇
0
𝑇
𝑞𝑠
=
𝑥 𝜇
0
𝑠/
𝑛
𝜇 𝜇
0
𝜇 > 𝜇
0
𝜇 < 𝜇
0
𝑃 𝑣𝑎𝑙𝑢𝑒 < 𝛼 bác bỏ 𝐻
0
1
THNG KÊ MÔ T
1. Khái ni n ệm cơ bả
Tng th là t p h p tt c các phn t c c ần quan tâm. Có kích thướ 𝑁 hu hn hoc vô hn.
Quan sát là t p h p các k t qu c c áp d ng cho m t ph n t b t kì. ế ủa các phép đo đượ
Bi nế là một đặ c điểm/tính cht ca các ph n t.
Thang đo gồm: định danh (nominal) th b kho ng (interval) t l (ratio) c (ordinal)
Phân loi bi n: ế
Biến định tính: chia tp hp (tng th, mu) thành các nhóm, ng không có đơn vị đo lườ
- Biến nh phân: ch có 2 nhóm, ví d gi i tính (nam, n ữ), thích/không thích, …
- Biến đị ỗi nhóm đượnh danh: m c gn tên và không th sp xếp th t, ví d quê quán ca sinh viên
- Biến th b c: m n tên (s ho s p th t , VD size qu n áo, gi y dép ỗi nhóm được g c ch) và có th
Bi ng:ến định lượ ng có đơn vị đo lườ
- Biến định lượng ri rc: nhn các giá tr tách ri nhau, ví d tuổi, đi m thi THPT môn toán, …
- Biến định lượng liên t c: nh n các giá tr l ấp đầy ít nh t m t kho ng trên tr c s , ví d th i gian hoàn
thành m t bài thi c a sinh viên, k t qu u cao c t ng ế phép đo chiề a m ọn núi, …
Ví d 1.
Làm báo cáo v nhân s c a công ty
Làm danh sách sn ph m trong kho
Tình hình các xã trong 1 huyn
Nghiên c u các công ty kh i nghi c CNTT ệp trong lĩnh vự
Nghiên c t trên HOSE v ứu các công ty đang niêm yế
Cần xác định
Tng th ? 1 ph n t ? 1 quan sát?
Biến? phân lo nào? ại? đo thế
Có điều tra toàn b tng th c không? (N u tra mđượ ếu không thì điề u)
Nếu điề ẫu thì điều tra m u tra bao nhiêu quan sát? (Dùng TK suy din để tr li)
Lp k ho ch p d li u X lí d li u ế Thu th
Mô t d li u (t ng th u): b ng b ng, b th , b ng th ng kê mô t s . /m ằng đồ
2
2. Mô t d li u
a. Dùng b ng
b. Dùng đồ th (xem slide)
c. Dùng thng kê mô t b ng s
Thng kê mô t b ng s tính t d li u c ng th g i là tham s a t
Thng kê mô t b ng s tính t d li u c u g i là th ng kê a m
Bng các th ng kê mô t c li u v 1 bi n a s ế
Tên th ng kê mô t
Tng th
{𝑥
1
,𝑥
2
, , 𝑥
𝑁
}
Mu
{𝑥
1
,𝑥
2
, , 𝑥
𝑛
}
Trung bình (mean)
𝜇 =
∑𝑥
𝑖
𝑁
𝑥 =
∑𝑥
𝑖
𝑛
Trung v = Q
2
T c đọ
Mt
T c đọ
Q
1
, Q
3
Phương sai (variance)
𝜎
2
=
(
𝑥
𝑖
𝜇
)
2
𝑁
𝑠
2
=
(
𝑥
𝑖
𝑥
)
2
𝑛 1
Độ lch chun (SD)
𝜎 =
𝜎
2
𝑠 =
𝑠
2
H s bi n thiên ế
𝐶𝑉
=
𝜎
𝜇
× 100%
𝐶𝑉
=
𝑠
𝑥
× 100%
Khong bi n thiên ế
T c đọ
Khong t phân v
T c đọ
H s b i x ng ất đố
𝛼
3
=
∑(
𝑥
𝑖
𝜇
)
3
/𝑁
𝜎
3
𝑎
3
=
∑(
𝑥
𝑖
𝑥
)
3
/𝑛
𝑠
3
H s nh n
𝛼
4
=
∑(
𝑥
𝑖
𝜇
)
4
/𝑁
𝜎
4
𝑎
4
=
∑(
𝑥
𝑖
𝑥
)
4
/𝑛
𝑠
4
Thng kê mô t liên quan s li u 2 bi n ế (liên h tương quan)
Tên đại lượng
Tng th
Mu
Hiệp phương sai
𝐶𝑜𝑣 𝑋, 𝑌
( )
=
(
𝑥
𝑖
𝜇
𝑋
)(
𝑦
𝑖
𝜇
𝑌
)
𝑁
Chú ý:
𝐶𝑜𝑣 𝑋, 𝑋 = 𝜎
( )
𝑋
2
𝑐𝑜𝑣 𝑋, 𝑌
( )
=
(
𝑥
𝑖
𝑥 𝑦
)(
𝑖
𝑦
)
𝑛 1
Chú ý:
𝐶𝑜𝑣 𝑋, 𝑋 = 𝑠
( )
𝑋
2
H s tương quan
(Correlation)
𝜌
𝑋,𝑌
=
𝐶𝑜𝑣 𝑋, 𝑌
( )
𝜎
𝑋
𝜎
𝑌
𝑟
𝑋,𝑌
=
𝐶𝑜𝑣 𝑋, 𝑌
( )
𝑠
𝑋
𝑠
𝑌
Nhn xét Corr, tính giá tr tuy i ệt đố
|𝐶𝑜𝑟𝑟|
0
0,4
0,7
0,8
0,95
1
Nhn xét
TQ y u ế
TQ trung bình
TQ khá cht
TQ ch t
TQ r t ch t
LÝ THUY T XÁC SU T
Phép th (th nghi m, quan sát): thc hiện các điề ện cơ bản để ện tượu ki quan sát các hi ng xy ra.
Biến c: là s ki n, hi ng có th x y ra (có th không x y ra) trong k t qu c ện tượ ế a phép th.
Biến ng u nhiên: là 1 bi n s mà trong k t qu c nó chế ế a phép th nh trong các giá trận đúng 1 giá trị
th có c a nó.
3
1. BI N C
Gm: biến c không th n c ch n, bi n c ng u nhiên có, biế c ch ế
Xác su t (probability) c a bi n c , là con s t hi n ế A là 𝑃(𝐴) đặc trưng cho khả năng khách quan xuấ
biến c khi th c hi n phép th 𝐴
Xác su u kiất có điề n (condition probability) ca v u ki n , là xác su t c n c 𝐴 ới điề 𝐵 𝑃(𝐴|𝐵) a biế
𝐴 đượ c tính v i điều kin biến c 𝐵 đã xảy ra.
Liên h gi a 2 bi n c ế (v i nhi u bi n c ) ế tương tự
Liên h
Kí hiu
Khái nim
A thun l i cho B
𝐴 𝐵
khi A x y ra ảy ra thì B cũng xả
Bng nhau
A = B
Khi A thu n l i cho B và B thu n l i cho A
Tích
A.B
𝐴 𝐵
A.B xy ra khi c A và B cùng x y ra
Độc lp
Biến c này x y ra hay không không n xác su t c ảnh hưởng đế a bi n ế
c kia
Tng
A + B
𝐴 𝐵
A + B xy ra khi có ít nh t 1 trong 2 bi n c thành ph n x y ra ế
Xung khc
Là hai biến c ng th i x y ra trong k t qu c a phép th không đồ ế
Chú ý: A, B xung kh c 𝐴.𝐵 =
A, B xung kh thu c ắc → phụ
c A, B độc lập → không x. khắ
Nhóm đầy đủ các
biến c
Là nhóm 𝑛 2 bi n c mà sau khi th n phép th ế c hi s xảy ra đúng 1
biến c trong nhóm
Đối lp
A và
𝐴
Là 2 biến c t ạo thành nhóm đầy đủ
Các công th c xác su t c a bi n c ế
Công th n: c c điể 𝑃
(
𝐴
)
=
Số kết cục sơ cấp thuận lợi cho A
Số sơ cấp của phép thử
kết cc
(gi thi t: các k t c ng kh ế ế ục sơ cấp là đồ năng)
Công th c nhân: A, B b t kì: P(AB) = P(A)P(B|A); 𝑃
(
𝐵
|
𝐴
)
=
𝑃(𝐴𝐵)
𝑃(𝐴)
p A, B độc l P(AB) = P(A)P(B)
Công th ng: A, B b t kì: P(A+B) = P(A) + P(B) P(AB) c c
A, B xung kh c P(A+B) = P(A) + P(B) (không suy ngược lại được)
Công th c Bernoulli: th n n phép th p, xác su t xu t hi n bi n c A trong m i l n th c hi độc l ế
đều là p. Xác sut sau n phép th, biến c A xut hi n là: ện đúng k lầ
𝑃
(
𝑥|𝑛, 𝑝 = 𝐶
)
𝑛
𝑥
𝑝
𝑥
(1 𝑝)
𝑛−𝑥
; x = 0;1;…;n
Công th , Bayes: ức đầy đủ
Vi H các bi n c , A x y ra cùng v i H
1
, …, H
n
là nhóm đầy đủ ế
i
nào đó thì:
CT đ
ầy đủ: 𝑃 𝑃
(
𝐴
)
=
(
𝐻
𝑖
)
𝑃(𝐴|𝐻
𝑖
)
𝑛
𝑖=1
CT Bayes:
𝑃
(
𝐻
𝑖
|
𝐴
)
=
𝑃
(
𝐻
𝑖
)
𝑃(𝐴|𝐻
𝑖
)
𝑃(𝐻
𝑗
)𝑃(𝐴|𝐻
𝑗
)
𝑛
𝑗=1
2. BI N NGU NHIÊN 1 CHI U
Có 2 lo i bi n ng u nhiên (BNN, bnn) là bnn r i r c và bnn liên t c ế
BNN r i r c
BNN liên t c
Định nghĩa
Là BNN có t p giá tr c đế m đư
Là BNN có t
p giá tr l y ấp đấ
(
𝑎, 𝑏 𝑅
)
Phân ph i
Bng PPXS
Hàm m XS:
ật độ 𝑓
(
𝑥
)
= 𝐹′(𝑥)
4
xác su t
(PPXS)
X
P
p
1
p
2
p
n
a) 𝑝
𝑖
0
b)
𝑝
𝑖𝑖
= 1
c)
𝑃
(
𝑎 < 𝑥 < 𝑏 𝑝
)
=
𝑖𝑖 < <𝑏
a)
𝑓
(
𝑥
)
0, 𝑥
b)
𝑓
(
𝑥
)
𝑑𝑥
+∞
−∞
= 1
c)
𝑃
(
𝑎 < 𝑋 < 𝑏
)
=
𝑓
(
𝑥
)
𝑑𝑥
𝑏
𝑎
Hàm PPXS:
𝐹
(
𝑥
)
= 𝑃 𝑋 < 𝑥
( )
Hàm PPXS:
𝐹
(
𝑥
)
= 𝑃 𝑋 < 𝑥
( )
Tham s
đặc trưng
Kì vng toán (trung bình):
𝐸
(
𝑋
)
=
𝑥 𝑝
𝑖 𝑖𝑖
Kì vng toán (trung bình):
𝐸
(
𝑋
)
=
𝑥𝑓
(
𝑥
)
𝑑𝑥
+∞
−∞
T/c: E(a.X+b.Y+c) = a.E(X) + b.E(Y) + c; X và Y độc lp thì E(X.Y) = E(X).E(Y)
Phương sai:
𝑉
(
𝑋
)
= 𝐸
(
𝑋
2
)
[
𝐸(𝑋)
]
2
Phương sai:
𝑉
(
𝑋
)
= 𝐸
(
𝑋
2
)
[
𝐸(𝑋)
]
2
𝐸
(
𝑋
2
)
= 𝑥
𝑖
2
𝑝
𝑖
𝑖
𝐸
(
𝑋
2
)
= 𝑥
2
𝑓
(
𝑥
)
𝑑𝑥
+∞
−∞
T/c: X và Y đ
c lp thì V(a.X+b.Y+c) = a V(X) + b
2 2
V(Y)
X và Y không độc lp thì V(a.X+b.Y+c) = a
2
V(X) + b V(Y) + 2ab.Cov(X,Y)
2
Giá tr
t i h n m c c , kí hi u , là giá tr th 𝛼 a bnn 𝑋 𝑥
𝛼
a mãn 𝑃
(
𝑋 > 𝑥
𝛼
)
= 𝛼
PPXS
thông dng
Không M t (Bernoulli): A(p)
𝑃
(
𝑋 = 𝑥 = 𝑝
)
𝑥
(
1 𝑝
)
1−𝑥
; 𝑥 = 0; 1
𝐸
(
𝑋
)
= 𝑝; 𝑉 = 𝑝 1 𝑝
(
𝑋
) ( )
X
0
1
P
1-p
p
Đều: U(a,b)
𝑓
(
𝑥
)
= {
0 𝑛ế𝑢 𝑥
(
𝑎, 𝑏
)
1
𝑏 𝑎
𝑛ế𝑢 𝑥
(
𝑎, 𝑏
)
𝐸
(
𝑋
)
=
𝑎 + 𝑏
2
; 𝑉
(
𝑋
)
=
(
𝑏 𝑎
)
2
12
Nh th c: B(n,p)
𝑃
(
𝑋 = 𝑥 = 𝐶
)
𝑛
𝑥
𝑝
𝑥
( )
1 𝑝
𝑛−𝑥
;𝑥 = 0, 𝑛
𝐸
(
𝑋 𝑋
)
= 𝑛𝑝; 𝑉
( )
= 𝑛𝑝
(
1 𝑝
)
𝑀𝑜𝑑𝑒: 𝑚 𝑁;
0
𝑛𝑝 𝑛𝑝+ 𝑝 1 𝑚
0
+ 𝑝
𝑋
1
, , 𝑋
𝑛
p, cùng phân ph i độc l
𝐴(𝑝) ∑𝑋 thì
𝑖
𝐵(𝑛, 𝑝)
𝑋 𝐵(𝑛, 𝑝) 𝑛 v i 100 thì coi như
𝑋 𝑁 𝜇 = 1 𝑝
( 𝑛𝑝; 𝜎
2
= 𝑛𝑝
( )
)
Chu
n: 𝑵
(
𝝁, 𝝈
𝟐
)
𝑓
(
𝑥
)
=
1
𝜎
2𝜋
𝑒
( )
𝑥−𝜇
2
2𝜎
2
𝐸
(
𝑋 𝑋
)
= 𝑚 = 𝑚
𝑑 0
= 𝜇; 𝑉
( )
= 𝜎
2
𝛼
3
= 0 ; 𝛼
(
𝑆𝑘𝑒𝑤𝑛𝑒𝑠𝑠
)
4
= 3(𝐾𝑢𝑟𝑡𝑜𝑠𝑖𝑠)
𝑃
(
𝑋 < 𝑏 = Φ
)
(
𝑏−𝜇
𝜎
)
𝑡𝑐
: Φ −𝑢 + Φ = 1
( ) (
𝑢
)
𝑢 5 thì coi như Φ
(
𝑢
)
= 1
𝑋 𝑁 𝜇 , 𝜎
(
1 1
2
)
;𝑌 𝑁(𝜇
2
, 𝜎
2
2
) và độc lp
vi nhau thì 𝑍 = 𝑁(𝑎𝜇𝑎𝑋 + 𝑏𝑌
1
+
𝑏𝜇 ,𝑎 𝜎
2
2
1
2
+ 𝑏
2
𝜎
2
2
)
Poisson: 𝑃(𝜆)
𝑃
(
𝑋 = 𝑥
)
=
𝑒
−𝜆
𝜆
𝑥
𝑥!
; 𝑥 = 0,1,2,
𝐸
(
𝑋 𝑋
)
= 𝜆;𝑉
( )
= 𝜆; 𝜆 1 𝑚 𝜆
0
Lũy thừa: 𝐸(𝜆)
𝑓
(
𝑥
)
= {
𝜆𝑒
−𝜆𝑥
nếu 𝑥 0
0 nếu 𝑥 < 0
𝐸
(
𝑋
)
=
1
𝜆
; 𝑉
(
𝑋
)
=
1
𝜆
2
Khi : bình phương 𝝌
𝟐
(𝒏)
𝑋
1
, , 𝑋
𝑛
p, cùng PP chu n là n bnn độc l
hóa thì bnn
𝑁(0,1) 𝑋 = ∑𝑋
𝑖
2
𝜒
2
(𝑛)
Giá tr t i h n: 𝜒
𝛼
2
(
𝑛
)
;𝜒
𝑛,𝛼
2
Student
5
𝑈 𝑁 0,1 ;𝑉 𝜒
( )
2
(
𝑛
)
và độc lập thì
𝑇 =
𝑈
𝑉/𝑛
𝑇(𝑛)
Giá tr t i h n: 𝑡
(𝑛)
;𝑡
𝑛,𝛼
Fisher Snedecor
𝑈 𝜒
2
(
𝑛
1
)
,𝑉 𝜒
2
(
𝑛
2
)
,độc lập thì
𝐹 =
𝑈/𝑛
1
𝑉/𝑛
2
𝐹(𝑛
1
,𝑛
2
)
Giá tr t i h n: 𝑓
𝛼
(𝑛 ,𝑛
1 2
)
3. BI N NGU NHIÊN HAI CHI U R I RC
Xét đồng th i 2 bnn r i r c thì có bnn 2 chi u r i r c
a. B ảng PPXS đồng thi và bng PPXS biên
X Y
y
1
y
2
y
3
X
P(x)
x
1
p
11
p
12
p
13
x
1
P(x +p
1
) = p
11
+
12 13
x
2
p
21
p
22
p
23
x
2
P(x
2
)
x
3
p
31
p
32
p
33
x
3
P(x
3
)
Y
y
1
y
2
y
3
𝑝
𝑖𝑗
3
𝑗=1
= 1
3
𝑖=1
P(y)
P(y
1
) = p
11
+ p + p
21 31
P(y
2
)
P(y
3
)
T b ng PP biên có th tính E(X), E(Y), V(X), V(Y).
𝑋
𝑌 độc lp 𝑝
𝑖𝑗
= 𝑃 𝑥
(
𝑖
)
𝑃(𝑦
𝑗
), ∀𝑖, 𝑗
N
ếu t n t i 𝑖, 𝑗 để 𝑝 𝑃 𝑥
𝑖𝑗
(
𝑖
)
𝑃(𝑦
𝑗
) thì nói ph thu c. 𝑋 𝑌
b. B n ảng PPXS có điều ki c a Y khi X = x . Ch
1
xét dòng x , ta có
1
(Y X=x|
1
)
y
1
y
2
y
3
P
𝑃
(
𝑌 = 𝑦
1
|
𝑋 = 𝑥
1
)
=
𝑝
11
𝑃(𝑥
1
)
𝑃
(
𝑌 = 𝑦
2
|
𝑋 = 𝑥
1
)
=
𝑝
12
𝑃(𝑥
1
)
𝑃
(
𝑌 = 𝑦
3
|
𝑋 = 𝑥
1
)
=
𝑝
13
𝑃(𝑥
1
)
T b ng này có th tính E(Y X= x ) vi t g n là E(Y|x c V(Y|x ). |
1
ế
1
), tính đượ
1
Tương tự ọng, phương sai điề có th to các bng (Y|X=x ); (X|Y=y
i j
) và tính các kì v u kin
c. Kì v u ki n và Hàm h i quy ọng điề
Ví d . Cho là thu nh p, : tri ng) c a cá nhân. Cho b ng th i c a 𝑋 𝑌 là chi tiêu (đơn vị ệu đồ ảng PPXS đồ (𝑋, 𝑌)
như sau:
𝑋 𝑌
5
8
10
Tng
10
0,1
0,2
0,1
0,4
15
0,1
0,2
0,3
0,6
Tng
0,2
0,4
0,4
1
Tìm hàm h i quy:
Bảng PPXS có điều kin ca khi 𝑌 (𝑋 = )10
(𝑌|𝑋 = )10
5
8
10
𝐸
(
𝑌
|
𝑋 = 10
)
= 5 × 0,25 + 8 × 0,5 + 10 × 0,25
= 7,75 (tr.đ)
𝑃
0,1
0,2
0,1
6
( )
Bảng PPXS có điều kin ca khi 𝑌 (𝑋 = )15
𝑌|(𝑋 = )15
5
8
10
𝐸
(
𝑌
|
𝑋 = 15
)
= 5 ×
0,1
0,6
+ 8 ×
0,2
0,6
+ 10 ×
0,3
0,6
= 8,5 (tr.đ)
𝑃
0,1/0,6
0,2/0,6
0,3/0,6
Có:
𝐸
(
𝑌
|
𝑋 = = 7,10
)
75
𝐸
(
𝑌
|
𝑋 = 15
)
= 8,5
𝐸 𝑋 = 𝑥 = 𝑓 + 𝑏 = 𝑥 +
(
𝑌
| ) (
𝑥
)
= 𝑎𝑥 0,15 6,25: là hàm h i quy c a 𝑌 theo 𝑋, cho bi t trung bình c a ế 𝑌
thay đổ thay đổi thế nào khi 𝑋 i
(7, = 𝑎. + 𝑏75 10 + 𝑏; 8,5 = 𝑎. 15 , gii h c ) pt, tìm đượ 𝑎 = 0, ; 𝑏 = 6,15 25
+
𝐸
(
𝑌
|
𝑋 = 0 = 𝐸 = 0, × 0 + 6,
) (
𝑌
|
0
)
15 25 = 6,25: n u không có thu nh ế ập thì chi tiêu trung bình là 6,25 tr.đ
+
𝐸
(
𝑌
|
𝑥 + 1 𝐸 = 0, 𝑥 + 1 + 6, 0, 𝑥 6,
) (
𝑌
|
𝑥
)
15
( )
25 15 25 = 0,15 > 0: khi thu nhập tăng thêm 1 tr.đ thì
chi tiêu trung bình tăng thêm 0,15 tr.đ
Tg t :
𝐸
(
𝑋 𝑋
|
𝑌 = 5 ,5; 𝐸 𝑌 = 8 ,5; 𝐸 𝑌 = 𝐸
)
= 12
(
𝑋
| )
= 12
(
𝑋
|
10 13 75
)
= ,
( |
𝑦 𝑦
)
= 𝑓
( )
= 𝑎𝑦 + 𝑐
2
+ 𝑏𝑦
d. Hi ệp phương sai:
𝐶𝑜𝑣 𝑋, 𝑌 = 𝐸 𝑋 𝐸 𝑌 𝐸 = 𝐸 𝐸 𝐸(𝑌) = 𝑥 𝑦
( ) ([ (
𝑋
)][ (
𝑌
)]) (
𝑋𝑌
) (
𝑋
)
𝑖 𝑗
𝑃(𝑥
𝑖
,𝑦
𝑗
)
𝑚
𝑗=1
𝐸(𝑋)𝐸(𝑌)
𝑛
𝑖=1
Có đơn vị đo là tích đơn vị đo của X và đơn vị đo củ a Y
𝐶𝑜𝑣(𝑋, 𝑌) 𝐶𝑜𝑣(𝑌, 𝑋) =
𝑋, 𝑌 𝐶𝑜𝑣(𝑋, 𝑌) độc lp = 0
Cho bi i nhau không: thì ết X và Y có tương quan v 𝐶𝑜𝑣(𝑋, 𝑌) > 0 𝑋, 𝑌 có “tương quan dương”
thì 𝐶𝑜𝑣(𝑋, 𝑌) < 0 𝑋, 𝑌 có “tương quan âm”
e. H
s tương quan: 𝜌
𝑋,𝑌
=
𝐶𝑜𝑣(𝑋,𝑌)
𝜎
𝑋
.𝜎
𝑌
𝐶𝑜𝑣 𝑋, 𝑌 = 𝜌 𝜎
( )
𝑋,𝑌 𝑋
𝜎
𝑌
H s tương quan không có đơn v đo
Tính cht c s : 1 a h tương quan
X
,Y
1
X,Y
=
Y,X
X
,Y
> 0: tương quan dương,
X
,Y
< 0: tương quan âm
X
,Y
= 0: không tương quan (chưa chắc đã độc lp)
𝑋, 𝑌 độc lp
X
,Y
= 0
X
,Y
= 1: hàm s b c 1 v i nhau 𝑋, 𝑌 có quan h
THNG KÊ SUY DI N
Tng th: là t p h đồp có nhiu phn t ng nht theo mt du hiu nghiên cu.
Du hi u nghiên c nh tính ho i di ng hóa b i bi n ng u nhiên g ). ứu: đ ặc định lượng → đạ n và lượ ế c (𝑋
Trung bình tng th = 𝜇 = 𝐸(𝑋) = 𝑉(𝑋); Phương sai tổng th = 𝜎
2
Nghiên cu tham s ca tng th đồng nht vi nghiên cu tham s ca bnn gc 𝑋
VD: Cho t ng th pp Chu n = Cho t ng th v i BNN g c pp theo quy lu t Chu n
Nếu điều tra đượ ảng, đồc tng th thì có tht s liu tng th bng b th và tính được các tham s
ca t ng th (chính là các th ng kê mô t c ng th - bài 1) a t
Thc t u tra t ng th ế không điề điều tra m u
M
u ng u nhiên: trước khi điề u tra thì có mu ng u nhiên
(
𝑋
1
, , 𝑋
𝑛
)
{
𝑋
1
, , 𝑋
𝑛
độc lập với nhau
𝑋
1
, , 𝑋
𝑛
có cùng PPXS với X
7
Trung bình mu = 𝑋
=
∑𝑋
𝑖
𝑛
là bnn, là th ng kê, hàm ng; ước lượ 𝐸
(
𝑋
)
= 𝜇; 𝑉
(
𝑋
)
=
𝜎
2
𝑛
Phương sai mẫu = 𝑆
2
=
−𝑋
(
𝑋
𝑖
)
2
𝑛−1
=
𝑛
𝑛−1
(
∑𝑋
𝑖
2
𝑛
𝑋
2
) là bnn, là th ng kê, hàm ng; ướ c lư 𝐸
(
𝑆
2
)
= 𝜎
2
Nếu bnn g c thì 𝑋 𝑁(𝜇, 𝜎
2
) 𝑋
𝑁 (𝜇,
𝜎
2
𝑛
) ; 𝑍 =
𝑋
−𝜇
𝜎
𝑛
𝑁 0,1
( )
; 𝑇 =
𝑋
−𝜇
𝑆
𝑛
𝑇(𝑛 1)
𝜒
2
=
( )
𝑛−1 𝑆
2
𝜎
2
𝜒
2
(𝑛 1)
Áp d ng: Tính XS
𝑃
(
𝑎 < 𝑋
< 𝑏
)
=?
Tìm a (ho
ặc b) để 𝑃
(
𝑋
> 𝑎
)
= 1 𝛼 (ho c 𝑃
(
𝑋
< 𝑏
)
= 1 𝛼) u (suy đoán mẫ
Nếu 𝑋
1
𝑁 𝜇
(
1
, 𝜎
1
2
)
, 𝑋
2
𝑁(𝜇
2
, 𝜎
2
2
) thì …
Nếu 𝑋 𝐴(𝑝) thì …
1. BÀI TOÁN ƯỚC LƯỢNG
Gi s bi n ng u nhiên g c ế có phân ph i xác su ất đã biết (thường g ) ). ặp là A(p), N(µ, σ
2
Ước lượng: xác đị ần đúng giá trị θ củnh mt cách g c a tham s a tng th.
a. Cách 1: Ước lượng điểm ch trương tìm 𝜃
là ước lượng ca 𝜃
+ N u xét (tính) trên m u c th thì ế 𝜃
là m t s , g m (estimate) c a . ọi là ước lượng điể 𝜃
+ N u xét trên m u ng u nhiên thì ế 𝜃
là m t bi n ng u nhiên, g ng (estimator). ế ọi là hàm ước lượ
Các tính ch t c ng ủa hàm ước lượ
+ Ước lượng không chch: 𝐸(𝜃
) = 𝜃.
+ Tính hi u qu ng không ch nh t trong l ng không ch ch ả: ước lượ ệch có phương sai nhỏ ớp các ước lượ
trên cùng 1 m u g ng hi u qu . ọi là ước lượ
+ Tính v ng: n u ế 𝜃
h i t theo xác su n ng v ng c a . ất đế 𝜃 thì nó là ước lượ 𝜃
Nếu thì ch𝑋 𝑁(𝜇, 𝜎
2
) ứng minh được 𝑋
là ước lượng không ch ch, hi u qu và v ng c a 𝜇; do đó
𝑥 ng t i nh t c a là ước lượ 𝜇
Nếu ) thì ng không ch i hi u qu ) c a , 𝑋 𝑁(𝜇, 𝜎
2
𝑆
2
là ước lượ ệch (nhưng không ph 𝜎
2
𝑀𝑆 = 𝑋
2
𝑋
2
ng v ng c a là ước lượ 𝜎
2
Phương pháp ước lượng hp lí tối đa
Biến ng u nhiên g c X bi t hàm m XS c a X là . ết PPXS → biế ật độ 𝑓(𝑥, 𝜃)
Vi m u c th , tìm hàm h p lí trên m u: 𝑤 = (𝑥 , , 𝑥
1 𝑛
)
𝐿
(
𝑤, 𝜃 = 𝐿 𝑥 , , 𝑥 ,𝜃 = 𝑓 𝑥 ,𝜃 𝑓 𝑥 , 𝜃 . 𝑓(𝑥 ,𝜃)
) (
1 𝑛
) (
2
) (
1
)
𝑛
Nếu hàm h p lí t c i t i 𝐿 đạ ực đạ 𝜃
thì 𝜃
ng h p lí t a tham s . là ước lượ ối đa củ 𝜃
Cách gi i: tìm nghi m c o hàm b a , kí hi u là ủa đạ c 1 c ln (𝐿) 𝜃
Ch o hàm b a âm t i nghi c ứng minh đạ c 2 c ln (𝐿) ệm tìm đượ
b. ch Cách 2: ng b ng kho ng tin c y Ước lượ trương tìm khoảng (𝑔
1
, 𝑔
2
) chưa ới độ𝜃 v tin cy (khá
ln) c. cho trướ
+ Kho ng ng u nhiên (𝐺
1
,𝐺
2
) là kho ng tin c y v tin c y c n u th a mãn ới độ 1 𝛼 a tham s 𝜃 ế
𝑃
(
𝐺
1
< 𝜃 < 𝐺
2
)
= 1 𝛼
8
V i m u c th , 𝐺
1
,𝐺
2
nh n giá tr c th 𝑔
1
,𝑔
2
g tin c (1 𝛼) ọi là độ ậy (ĐTC)
𝐼 = 𝐺 𝐺
2 1
g dài kho ng tin c y (KTC) i là đ
+ Cách xây d ng KTC cho và công th u t i thi u. 𝜇 ức xác định kích thưc m
xây d ng KTL cho t , t ng th phân ph i Chu n Ví d. 𝜇 khi chưa biế 𝜎
2
Ch n th ng kê
𝑇 =
𝑋
−𝜇
𝑆
𝑛
𝑇(𝑛 1)
V ch n ới ĐTC (1 𝛼) 𝛼 > 0; 𝛼 > 0
1 2
𝛼 = 𝛼 = 𝛼
1 2
𝑡
1−𝛼
1
(𝑛−1)
< 𝑡
𝛼
2
(𝑛−1)
n) (do ĐTC lớ
𝑃(𝑡
1−𝛼
1
(𝑛−1)
< 𝑇 < 𝑡
𝛼
2
(𝑛−1)
) = 1 𝛼
𝑃 (−𝑋
𝑡
𝛼
1
(
𝑛−1
)
𝑆
𝑛
< −𝜇 < −𝑋
+ 𝑡
𝛼
2
(𝑛−1)
𝑆
𝑛
) = 1 𝛼
𝑃 (+𝑋
+ 𝑡
𝛼
1
(
𝑛−1
)
𝑆
𝑛
> +𝜇 > +𝑋
𝑡
𝛼
2
(𝑛−1)
𝑆
𝑛
) = 1 𝛼
BT ước lượng trung bình tng th ( ng th𝜇) khi chưa biết phương sai tổ ( ): 𝜎
2
𝑋
𝑡
𝛼
2
(
𝑛−1
)
.
𝑆
𝑛
< 𝜇 < 𝑋
+ 𝑡
𝛼
1
(
𝑛−1
)
.
𝑆
𝑛
KTC tối đa: 𝜇 < 𝑋
+ 𝑡
𝛼
(
𝑛−1
)
.
𝑆
𝑛
KTC ti thi u: 𝑋
𝑡
𝛼
(
𝑛−1
)
.
𝑆
𝑛
< 𝜇
KTC đối xng: 𝑋
𝑡
𝛼/2
(
𝑛−1
)
.
𝑆
𝑛
< 𝜇 < 𝑋
+ 𝑡
𝛼/2
(
𝑛−1
)
.
𝑆
𝑛
Độ i xdài KTC đố ng: 𝐼 = 2𝑡
𝛼/2
(
𝑛−1
)
.
𝑆
𝑛
Sai s c ng (sai s biên, ME):
ủa ước lượ 𝜀 =
𝐼
2
= 𝑡
𝛼/2
(
𝑛−1
)
.
𝑆
𝑛
Bài toán tìm kích thướ ểu đểc mu ti thi …:
𝐼 𝐼
0
𝑛
0
4𝑆
2
𝐼
0
2
[𝑡
𝛼/2
(
𝑛−1
)
]
2
𝜀 𝜀 𝑛
0 0
𝑆
2
𝜀
0
2
[𝑡
𝛼/2
(
𝑛−1
)
]
2
2. BÀI TOÁN KIỂM ĐỊNH GI THUYT
Gi thuy t th ng kê: ế là gi thuy t v ế
+ Tham s n ng u nhiên đặc trưng của biế
+ Phân ph i xác su t c a BNN
+ S p c a các BNN độc l
Gi thuy t gế c: 𝐻
0
(kđ tham số thì 𝐻
0
là phát bi u ch u b ng ( ) ) a d =, ≥,
Gi thuy i: ết đố 𝐻
1
thì (kđ tham số 𝐻
0
là phát bi u không ch u b ng ( ) ) a d ≠, <, >
Viết c p gi thuy t cho các phát bi u sau ế
Chiu cao trung bình ca nam thanh niên VN b ng 168 cm
9
g g
Phương sai hơn 25 g v cân nng ca sn phm nh
2
Độ lch chun v thu nhp ca h gia đình không vượt quá 3 triu
T l phế phm c ủa lô hàng ít hơn 5%
VN, t l lnam cao hơn tỉ n (gi s gi i tính g m nam và n )
Điểm trung bình c thi chi u ủa ca thi sáng cao hơn ca
Độ phân tán ca thi gian hoàn thành bài thi trc nghiệm cao hơn so với bài thi t lun.
Th nh)ng kê ki nh (tiêu chu n kiểm đị ểm đị là th ng kê trên m u ng u nhiên 𝐺 (𝑋
1
,𝑋
2
, , 𝑋
𝑛
) sao
cho phân phi xác su t c a nh khi 𝐺 là xác đị 𝐻
0
đúng.
Phương pháp kiểm định
Gi s 𝐻
0
phân ph i c a , tìm m t bi n cđúng, từ 𝐺 ế 𝐴 (liên quan ) có XS nh n c 𝐺 coi như biế
𝐴 không x y ra khi th (theo nguyên lí XS nh ).
Thc hi n phép th u c th c thì thu được m ể, tìm đượ 𝐺
𝑞𝑠
Nếu x y ra gi s𝐴 𝐻
0
đúng là không chính xác bác b 𝐻
0
.
Nếu không x y ra k t lu n 𝐴 chưa có cơ sở để ế 𝐻
0
đúng
Các lo i sai l m
Phương pháp kiểm định N ếu x𝐴 y ra thì bác b 𝐻
0
, trong khi thc tế 𝐻
0
có th Có th đúng
mc sai l m, g i là sai l m lo i I.
Sai l m lo i I ( gi thuy t type I error): bác b ế 𝐻
0
trong khi 𝐻
0
đúng
Sai l m lo i II ( ): không bác b gi thuy t type II error ế 𝐻
0
trong khi 𝐻
0
sai
Tình hu ng th c tế
Quy nhết đị
𝑯
𝟎
đúng
𝑯
𝟎
sai
Bác b 𝐻
0
Sai l m lo i I
Xác su t kí hi u là 𝛼
Đúng, không sai lm
Xác su t = 1 𝛽
Không bác b 𝐻
0
Đúng, không sai lm
Xác su t = 1 𝛼
Sai l m lo i II
Xác su t kí hi u là 𝛽
Khi gi m thì i. 𝛼 𝛽 tăng và ngược l
Mức ý nghĩa ( ) là m t m m lo i I, hay m . significant level c xác su c sai l ức ý nghĩa𝜶
ng dùng m Thườ ức ý nghĩa 0,05; 0,1; 0,01 (hay 5%, 10% 1%)
Mi n bác b ( ) reject area gi thuy t ế 𝐻
0
v i m , kí hi u ức ý nghĩa 𝛼 𝑊
𝛼
, là mi n trên tr th c s a mãn
𝑃
(
𝐺 𝑊
𝛼
|
𝐻
0
)
= 𝛼
T nh phương pháp kiểm đị 𝐴 = (𝐺 𝑊
𝛼
)
𝑊
𝛼
đượ c xác đ nh b i các giá tr t i hn c a thng kê ( ) 𝐺 critical value
𝑷 𝒗𝒂𝒍𝒖𝒆, còn g i là m t mà n u m ức ý nghĩa quan sát được, là m c xác su ế ức ý nghĩa (𝛼) vượt qua
nó thì gi thuy t ế 𝐻
0
b bác b .
Hay: là m c xác su t th p nh bác b 𝑃 𝑣𝑎𝑙𝑢𝑒 t để 𝐻
0
Hai cách ki nh ểm đị
Dùng mi n bác b (hay giá tr t i h n)
Dùng 𝑷 𝒗𝒂𝒍𝒖𝒆
10
Bước 1
ế ế {
𝐻
0
: =, ≥, phát biểu ứa dấu bằngch
( )
𝐻
( ) biể khô dấ bằh
Bước 2
Xác định tiêu chun kiểm đị nh (tra công thc) + mu c th giá tr quan sát 𝐺
𝑞𝑠
Bước 3
Tìm min bác b (tra công th c) và tra
giá tr t i h ng ạn tương ứ 𝑊
𝛼
Tính 𝑃 𝑣𝑎𝑙𝑢𝑒 theo công th c
XSTK: tra tài liu TH; KTL: cho s n
Bước 4
+ 𝐺
𝑞𝑠
𝑊
𝛼
bác b 𝐻
0
+ 𝐺
𝑞𝑠
𝑊
𝛼
không bác b 𝐻
0
+ bác b𝑃 𝑣𝑎𝑙𝑢𝑒 < 𝛼 𝐻
0
+ không bác b𝑃 𝑣𝑎𝑙𝑢𝑒 > 𝛼 𝐻
0
Bước 5
Tính xác sut m c sai l m lo i II
Kiểm định trung bình (mt) tng th
𝑯
𝟎
, thống kê KĐ
𝑯
𝟏
Bác b khi 𝑯
𝟎
𝑷 𝒗𝒂𝒍𝒖𝒆
𝑯 :𝝁 = 𝝁
𝟎 𝟎
𝑇
𝑞𝑠
=
𝑥 𝜇
0
𝑠/
𝑛
𝜇 𝜇
0
|𝑇
𝑞𝑠
| > 𝑡
𝛼/2
(
𝑛−1
)
2 × 𝑃 𝑛 1 𝑇
[𝑇
( )
> |
𝑞𝑠
|]
𝜇 > 𝜇
0
𝑇
𝑞𝑠
> 𝑡
𝛼
(
𝑛−1
)
𝑃
[𝑇
(
𝑛 1 > 𝑇
)
𝑞𝑠
]
𝜇 < 𝜇
0
𝑇
𝑞𝑠
< −𝑡
𝛼
(
𝑛−1
)
𝑃
[𝑇
(
𝑛 1 < 𝑇
)
𝑞𝑠
]
Kiểm đị (chưa biết 2 phương sai và 2 phương sai khác nhau)nh trung bình hai tng th
𝑯
𝟎
, thống kê KĐ
𝑯
𝟏
Bác b khi 𝑯
𝟎
𝑷 𝒗𝒂𝒍𝒖𝒆
𝑯 :𝝁 = 𝝁
𝟎 𝟏 𝟐
𝒏
𝟏
> 𝟑𝟎, 𝒏
𝟐
> 𝟑𝟎
T
qs
=
𝑥
1
𝑥
2
√𝑠
1
2
/𝑛
1
+ 𝑠
2
2
/𝑛
2
𝜇
1
𝜇
2
|𝑇
𝑞𝑠
| > 𝑧
𝛼/2
2 × 𝑃 𝑍 > 𝑇( |
𝑞𝑠
|)
𝜇
1
> 𝜇
2
𝑇
𝑞𝑠
> 𝑧
𝛼
𝑃(𝑍 > 𝑇
𝑞𝑠
)
𝜇
1
< 𝜇
2
𝑇
𝑞𝑠
< −𝑧
𝛼
𝑃(𝑍 < 𝑇
𝑞𝑠
)
Ki nểm định Jarque-Bera v phân phi Chu
𝐻
0
: bi n phân ph i Chu n ế 𝑋
𝐻
1
: bi n không phân ph i Chu n ế 𝑋
Th
ng kê: 𝐽𝐵
𝑞𝑠
= 𝑛 (
𝑎
3
2
6
+
(
𝑎
4
−3
)
2
24
)
Trong đó 𝑎 , 𝑎
3 4
là h s b i xất đố ng và h s nhn c a m u
Min bác b: 𝑊
𝛼
= {𝐽𝐵 𝐽𝐵: > 𝜒
𝛼
2
(
2
)
}
Các ki m nh khác: t c đị đọ
+ Ki m nh ph l c a m t t ng th , hai t ng th đị ương sai, tỷ
+ Ki m nh s p c a hai d u hi u nh tính đị độc l đị
11
| 1/22

Preview text:

LÝ THUYT XÁC SUT VÀ THNG KÊ TOÁN
THNG KÊ MÔ T
LÝ THUYT XÁC SUT
THNG KÊ SUY DIN ▪ Tổng thể
▪ Tổng thể và Biến ngẫu nhiên gốc 𝑋
▪ Biến cố, liên hệ giữa các biến cố ▪ Quan sát
▪ Mẫu ngẫu nhiên và mẫu cụ thể
▪ Xác suất của biến cố
▪ Biến, phân loại biến, thang đo
▪ Phân phối của thống kê trên mẫu
▪ Điều tra tổng thể hay điều tra • Tính theo định nghĩa
▪ Bài toán ước lượng mẫu?
• Tính theo công thức (cộng, nhân, ..) ▪ Bài toán kiểm định Phép thử ▪ (Mẫu)
▪ 𝑋 ∼ 𝑁(𝜇, 𝜎2) (thử nghiệm ▪ Thu thập dữ liệu
• 𝑥 là ước lượng điểm tốt nhất của 𝜇 / quan sát) ▪ Xử lý dữ liệu
Biến ngu nhiên
• Khoảng tin cậy cho 𝜇 ▪ Mô tả dữ liệu ▪ BNN 1 chiều rời rạc
𝑃 (𝑋 − 𝑡(𝑛−1) 𝑆 (𝑛−1) 𝑆 𝛼
< 𝜇 < 𝑋 + 𝑡𝛼 ) = 1 − 𝛼 • Dùng bảng • Bảng PPXS, hàm PPXS 2 √𝑛 1 √𝑛 • Dùng đồ thị • Tham số đặc trưng
• Kiểm định 𝐻0: 𝜇 = 𝜇0
• Dùng thống kê bằng số
• 𝐴(𝑝), 𝐵(𝑛, 𝑝), 𝑃(𝜆), … 𝐻0 và TK kđ 𝐻1 Bác bỏ 𝐻0 khi ▪ BNN 1 chiều liên tục 𝐻0: 𝜇 = 𝜇0 𝜇 ≠ 𝜇0 |𝑇 (𝑛−1) 𝑞𝑠| > 𝑡𝛼/2
• Hàm mật độ XS, hàm PPXS 𝑥 − 𝜇 𝑇 0 (𝑛−1) 𝑞𝑠 = 𝜇 > 𝜇0 𝑇 • Tham số đặc trưng 𝑠/√𝑛 𝑞𝑠 > 𝑡𝛼 𝜇 < 𝜇 (𝑛−1) 0 𝑇
• 𝑈(𝑎, 𝑏), 𝑵(𝝁, 𝝈𝟐), 𝜒2, 𝑇, 𝐹, … 𝑞𝑠 < −𝑡𝛼
𝑃 − 𝑣𝑎𝑙𝑢𝑒 < 𝛼 ⇔ bác bỏ 𝐻0 ▪ BNN 2 chiều rời rạc
• ƯL và kiểm định cho 𝜎2
• Bảng XS đồng thời (𝑋, 𝑌) • 𝑋 2 2
1 ∼ 𝑁(𝜇1, 𝜎1 ), 𝑋2 ∼ 𝑁(𝜇2, 𝜎2 )
• Bảng XS biên, kì vọng, phương sai
• Khoảng tin cậy cho 𝜇1 − 𝜇2 • Bảng XS điều kiện
• Kiểm định 𝐻0: 𝜇1 − 𝜇2 = 0
• Kì vọng điều kiện, hàm hi quy
• ƯL và kiểm định cho 𝜎2 2 1 /𝜎2
• Hiệp phương sai, hệ số tương quan
• BNN gốc phân phối Không – Một ▪ BNN 2 chiều liên tục
• Kiểm định phi tham số ▪ BNN n – chiều • Vấn đề khác 1
THNG KÊ MÔ T Ví d 1.
• Làm báo cáo về nhân sự của công ty
• Làm danh sách sản phẩm trong kho
• Tình hình các xã trong 1 huyện
• Nghiên cứu các công ty khởi nghiệp trong lĩnh vực CNTT
• Nghiên cứu các công ty đang niêm yết trên HOSE về … … Cần xác định
▪ Tổng thể? 1 phần tử? 1 quan sát?
▪ Biến? phân loại? đo thế nào?
▪ Có điều tra toàn bộ tổng thể được không? (Nếu không thì điều tra mẫu)
▪ Nếu điều tra mẫu thì điều tra bao nhiêu quan sát? (Dùng TK suy diễn để trả lời)
▪ Lập kế hoạch → Thu thập dữ liệu → Xử lí dữ liệu
▪ Mô tả dữ liệu (tổng thể/mẫu): bằng bảng, bằng đồ thị, bằng thống kê mô tả số. ▪ …
1. Khái niệm cơ bản
Tng th là tập hợp tất cả các phần tử cần quan tâm. Có kích thước 𝑁 – hữu hạn hoặc vô hạn.
Quan sát là tập hợp các kết quả của các phép đo được áp dụng cho một phần tử bất kì.
Biến là một đặc điểm/tính chất của các phần tử.
Thang đo gồm: định danh (nominal) → thứ bậc (ordinal) → khoảng (interval) → tỉ lệ (ratio)
Phân loi biến:
Bi
ến định tính: chia tập hợp (tổng thể, mẫu) thành các nhóm, không có đơn vị đo lường
- Biến nhị phân: chỉ có 2 nhóm, ví dụ giới tính (nam, nữ), thích/không thích, …
- Biến định danh: mỗi nhóm được gắn tên và không thể sắp xếp thứ tự, ví dụ quê quán của sinh viên
- Biến thứ bậc: mỗi nhóm được gắn tên (số hoặc chữ) và có thể sắp thứ tự, VD size quần áo, giầy dép
Biến định lượng: có đơn vị đo lường
- Biến định lượng rời rạc: nhận các giá trị tách rời nhau, ví dụ tuổi, điểm thi THPT môn toán, …
- Biến định lượng liên tục: nhận các giá trị lấp đầy ít nhất một khoảng trên trục số, ví dụ thời gian hoàn
thành một bài thi của sinh viên, kết quả phép đo chiều cao của một ngọn núi, …
2. Mô t d liu
a. Dùng bng
b. Dùng đồ th (xem slide)
c.
Dùng thng kê mô t bng s
Thống kê mô tả bằng số tính từ dữ liệu của tổng thể gọi là tham số
Thống kê mô tả bằng số tính từ dữ liệu của mẫu gọi là thống kê
Bng các thng kê mô tả của số liệu về 1 biến Tên thống kê mô tả
Tng th Mu {𝑥1,𝑥2,… ,𝑥𝑁}
{𝑥1,𝑥2,… ,𝑥𝑛} Trung bình (mean) ∑𝑥 ∑𝑥 𝜇 = 𝑖 𝑖 𝑁 𝑥 = 𝑛 Trung vị = Q2 Tự đọc 2 Mốt Tự đọc Q1, Q3 Phương sai (variance) ∑(𝑥 ∑(𝑥 𝜎2 = 𝑖 − 𝜇)2 𝑖 − 𝑥)2 𝑁 𝑠2 = 𝑛 − 1 Độ lệch chuẩn (SD) 𝜎 = √𝜎2 𝑠 = √𝑠2 Hệ số biến thiên 𝜎 𝑠 𝐶𝑉 = 𝜇 × 100% 𝐶𝑉 = 𝑥 × 100% Khoảng biến thiên Tự đọc Khoảng tứ phân vị Tự đọc Hệ số bất đối xứng ∑(𝑥 ∑(𝑥 𝛼 𝑖 − 𝜇)3/𝑁 𝑖 − 𝑥)3/𝑛 3 = 𝜎3 𝑎3 = 𝑠3 Hệ số nhọn ∑(𝑥 ∑(𝑥 𝛼 𝑖 − 𝜇)4/𝑁 𝑖 − 𝑥)4/𝑛 4 = 𝜎4 𝑎4 = 𝑠4
Thng kê mô t liên quan s liu 2 biến (liên hệ tương quan) Tên đại lượng Tổng thể Mẫu Hiệp phương sai ∑(𝑥 ∑(𝑥 )( 𝐶𝑜𝑣(𝑋, 𝑌) =
𝑖 − 𝜇𝑋)(𝑦𝑖 − 𝜇𝑌) ( )
𝑖 − 𝑥 𝑦𝑖 − 𝑦) 𝑁 𝑐𝑜𝑣 𝑋, 𝑌 = 𝑛 − 1
Chú ý: 𝐶𝑜𝑣(𝑋, 𝑋) = 𝜎2 2 𝑋
Chú ý: 𝐶𝑜𝑣(𝑋, 𝑋) = 𝑠𝑋 Hệ số tương quan 𝐶𝑜𝑣(𝑋, 𝑌) 𝐶𝑜𝑣(𝑋, 𝑌) (Correlation) 𝜌𝑋,𝑌 = 𝜎 𝑟𝑋,𝑌 = 𝑋𝜎𝑌 𝑠𝑋𝑠𝑌
Nhận xét Corr, tính giá trị tuyệt đối |𝐶𝑜𝑟𝑟| 0 0,4 0,7 0,8 0,95 1 Nhận xét TQ yếu TQ trung bình TQ khá chặt TQ chặt TQ rất chặt
LÝ THUY
T XÁC SUT
Phép th (th nghim, quan sát): thực hiện các điều kiện cơ bản để quan sát các hiện tượng xảy ra.
Biến c: là sự kiện, hiện tượng có thể xảy ra (có thể không xảy ra) trong kết quả của phép thử.
Biến ngu nhiên: là 1 biến số mà trong kết quả của phép thử nó chỉ nhận đúng 1 giá trị trong các giá trị có thể có của nó.
1. BIN C
Gm: biến cố không thể có, biến cố chắc chắn, biến cố ngẫu nhiên
Xác su
t (probability) của biến cố A là 𝑃(𝐴), là con số đặc trưng cho khả năng khách quan xuất hiện
biến cố 𝐴 khi thực hiện phép thử
Xác suất có điều kin (condition probability) của 𝐴 với điều kiện 𝐵 là 𝑃(𝐴|𝐵), là xác suất của biến cố
𝐴 được tính với điều kiện biến cố 𝐵 đã xảy ra.
Liên h gia 2 biến cố (với nhiều biến cố tương tự) Liên hệ Kí hiệu Khái niệm A thuận lợi cho B
𝐴 ⊂ 𝐵 khi A xảy ra thì B cũng xảy ra Bằng nhau
A = B Khi A thuận lợi cho B và B thuận lợi cho A Tích A.B
A.B xảy ra khi cả A và B cùng xảy ra 𝐴 ∩ 𝐵 3 Độc lập
Biến cố này xảy ra hay không không ảnh hưởng đến xác suất của biến cố kia Tổng
A + B A + B xảy ra khi có ít nhất 1 trong 2 biến cố thành phần xảy ra 𝐴 ∪ 𝐵 Xung khắc
Là hai biến cố không đồng thời xảy ra trong kết quả của phép thử
Chú ý: A, B xung khắc ⇔ 𝐴. 𝐵 = ∅
A, B xung khắc → phụ thuộc
A, B độc lập → không x. khắc Nhóm đầy đủ các
Là nhóm 𝑛 ≥ 2 biến cố mà sau khi thực hiện phép thử sẽ xảy ra đúng 1 biến cố biến cố trong nhóm Đối lập
A và 𝐴 Là 2 biến cố tạo thành nhóm đầy đủ
Các công thc xác sut ca biến c
• Công thức cổ điển: 𝑃(𝐴) = Số kết cục sơ cấp thuận lợi cho A (giả thiết: các kết cục sơ cấp là đồng khả năng)
Số kết cục sơ cấp của phép thử
• Công thức nhân: A, B bất kì: P(AB) = P(A)P(B|A); 𝑃(𝐵|𝐴) = 𝑃(𝐴𝐵) 𝑃(𝐴)
A, B độc lập ⇔ P(AB) = P(A)P(B)
• Công thức cộng: A, B bất kì: P(A+B) = P(A) + P(B) – P(AB)
A, B xung khắc ⇒ P(A+B) = P(A) + P(B) (không suy ngược lại được)
• Công thức Bernoulli: thực hiện n phép thử độc lập, xác suất xuất hiện biến cố A trong mỗi lần thử
đều là p. Xác suất sau n phép thử, biến cố A xuất hiện đúng k lần là:
𝑃(𝑥|𝑛, 𝑝) = 𝐶𝑥𝑛𝑝𝑥(1 − 𝑝)𝑛−𝑥; x = 0;1;…;n
• Công thức đầy đủ, Bayes:
Với H1, …, Hn là nhóm đầy đủ các biến cố, A xảy ra cùng với Hi nào đó thì:
CT đầy đủ: 𝑃(𝐴) = ∑𝑛𝑖=1 𝑃(𝐻𝑖)𝑃(𝐴|𝐻𝑖)
CT Bayes: 𝑃(𝐻𝑖|𝐴) = 𝑃(𝐻𝑖)𝑃(𝐴|𝐻𝑖)
∑𝑛𝑗=1 𝑃(𝐻𝑗)𝑃(𝐴|𝐻𝑗)
2. BIN NGU NHIÊN 1 CHIU
Có 2 loại biến ngẫu nhiên (BNN, bnn) là bnn rời rạc và bnn liên tục
BNN ri rc BNN liên tc
Định nghĩa Là BNN có tập giá trị đếm được
Là BNN có tập giá trị lấp đấy (𝑎, 𝑏) ⊂ 𝑅 Phân phối Bảng PPXS
Hàm mật độ XS: 𝑓(𝑥) = 𝐹′(𝑥) xác suất X (PPXS) P p1 p2 … pn a) 𝑓(𝑥 + ) ∞ ≥ 0, ∀𝑥 b) ∫ 𝑓(𝑥)𝑑𝑥 a) 𝑝 = 1 𝑖 ≥ 0 −∞ b) ∑ 𝑏 𝑖 𝑝𝑖 = 1
c) 𝑃(𝑎 < 𝑥 < 𝑏) = ∑
c) 𝑃(𝑎 < 𝑋 < 𝑏) = ∫𝑎 𝑓(𝑥)𝑑𝑥 𝑖 < <𝑏 𝑝𝑖
Hàm PPXS: 𝐹(𝑥) = 𝑃(𝑋 < 𝑥)
Hàm PPXS: 𝐹(𝑥) = 𝑃(𝑋 < 𝑥) Tham số
Kì vọng toán (trung bình):
Kì vọng toán (trung bình): đặc trưng 𝐸(𝑋) = ∑ +∞ 𝑖 𝑥𝑖𝑝𝑖
𝐸(𝑋) = ∫ 𝑥𝑓(𝑥)𝑑𝑥 −∞
T/c: E(a.X+b.Y+c) = a.E(X) + b.E(Y) + c; X và Y độc lập thì E(X.Y) = E(X).E(Y)
Phương sai: 𝑉(𝑋) = 𝐸(𝑋2) − [𝐸(𝑋)]2
Phương sai: 𝑉(𝑋) = 𝐸(𝑋2) − [𝐸(𝑋)]2 4 𝐸( +∞
𝑋2) = ∑ 𝑥2𝑖𝑝𝑖
𝐸(𝑋2) = ∫ 𝑥2𝑓(𝑥)𝑑𝑥 𝑖 −∞
T/c: X và Y độc lập thì V(a.X+b.Y+c) = a2V(X) + b2V(Y)
X và Y không độc lập thì V(a.X+b.Y+c) = a2V(X) + b2V(Y) + 2ab.Cov(X,Y)
Giá trị tới hạn mức 𝛼 của bnn 𝑋, kí hiệu 𝑥 , là giá tr th 𝛼
ị ỏa mãn 𝑃(𝑋 > 𝑥𝛼) = 𝛼 PPXS
Không – Một (Bernoulli): A(p) Đều: U(a,b) thông dụng
𝑃(𝑋 = 𝑥) = 𝑝𝑥(1 − 𝑝)1−𝑥; 𝑥 = 0; 1
0 𝑛ế𝑢 𝑥 ∉ (𝑎, 𝑏)
𝐸(𝑋) = 𝑝; 𝑉(𝑋) = 𝑝(1 − 𝑝) 𝑓(𝑥) = { 1 X 0 1
𝑏 − 𝑎 𝑛ế𝑢 𝑥 ∈ (𝑎, 𝑏) P 1-p p 𝑎 + 𝑏 (𝑏 − 𝑎)2
𝐸(𝑋) = 2 ; 𝑉(𝑋) = 12 Nhị thức: B(n,p)
Chun: 𝑵(𝝁, 𝝈𝟐) 𝑃(𝑋 = 𝑥) = 𝐶𝑥 𝑛−𝑥 𝑛 𝑝𝑥(1 − 𝑝) ; 𝑥 = 0, 𝑛 𝑥−𝜇 2
𝐸(𝑋) = 𝑛𝑝; 𝑉(𝑋) = 𝑛𝑝(1 − 𝑝) 𝑒−( ) 2𝜎2 • 𝑓(𝑥) = 1 𝜎√2𝜋 𝑀𝑜𝑑𝑒: 𝑚 ) = 𝑚𝑑 = 𝑚 ) = 𝜎2 0 ∈ 𝑁; • 𝐸(𝑋 0 = 𝜇; 𝑉(𝑋
𝑛𝑝 + 𝑝 − 1 ≤ 𝑚 𝛼
(𝑆𝑘𝑒𝑤𝑛𝑒𝑠𝑠) 0 ≤ 𝑛𝑝 + 𝑝 3 = 0
; 𝛼4 = 3(𝐾𝑢𝑟𝑡𝑜𝑠𝑖𝑠)
• 𝑋1, … , 𝑋𝑛 độc lập, cùng phân phối
• 𝑃(𝑋 < 𝑏) = Φ (𝑏−𝜇 ) 𝐴(𝑝) thì ∑𝑋 𝜎 𝑖 ∼ 𝐵(𝑛, 𝑝)
𝑡𝑐: Φ(−𝑢) + Φ(𝑢) = 1
• 𝑋 ∼ 𝐵(𝑛, 𝑝) với 𝑛 ≥ 100 thì coi như
𝑢 ≥ 5 thì coi như Φ(𝑢) = 1
𝑋 ∼ 𝑁(𝜇 = 𝑛𝑝; 𝜎2 = 𝑛𝑝(1 − 𝑝)) • 𝑋 ∼ 𝑁(𝜇 2 2
1, 𝜎1 ); 𝑌 ∼ 𝑁(𝜇2, 𝜎2 ) và độc lập
với nhau thì 𝑍 = 𝑎𝑋 + 𝑏𝑌 ∼ 𝑁(𝑎𝜇1 + 𝑏𝜇 2 2 2 2, 𝑎 𝜎1 + 𝑏2𝜎2 ) Poisson: 𝑃(𝜆) Lũy thừa: 𝐸(𝜆) 𝑒−𝜆𝜆𝑥 𝑃(𝑋 = 𝑥) =
𝑓(𝑥) = {𝜆𝑒−𝜆𝑥 nếu 𝑥 ≥ 0 𝑥! ; 𝑥 = 0,1,2, … 0 nếu 𝑥 < 0
𝐸(𝑋) = 𝜆; 𝑉(𝑋) = 𝜆; 𝜆 − 1 ≤ 𝑚 1 1 0 ≤ 𝜆
𝐸(𝑋) = 𝜆; 𝑉(𝑋) =𝜆2
Khi bình phương: 𝝌𝟐(𝒏)
• 𝑋1, … , 𝑋𝑛 là n bnn độc lập, cùng PP chuẩn
hóa 𝑁(0,1) thì bnn 𝑋 = ∑𝑋2𝑖 ∼ 𝜒2(𝑛) 2(𝑛) 2
• Giá trị tới hạn: 𝜒𝛼 ; 𝜒𝑛,𝛼 Student
• 𝑈 ∼ 𝑁(0,1); 𝑉 ∼ 𝜒2(𝑛) và độc lập thì 𝑈 𝑇 = (𝑛) ∼ 𝑇(𝑛) ; 𝑡 • Giá trị tới hạn: √ 𝑡 𝑉/𝑛𝑛,𝛼 Fisher Snedecor
• 𝑈 ∼ 𝜒2(𝑛1), 𝑉 ∼ 𝜒2(𝑛2), độc lập thì 𝑈/𝑛 𝐹 = 1
𝑉/𝑛 ∼ 𝐹(𝑛1, 𝑛2) 2 (𝑛1,𝑛
• Giá trị tới hạn: 𝑓 2) 𝛼 5
3. BIN NGU NHIÊN HAI CHIU RI RC
Xét đồng thời 2 bnn rời rạc thì có bnn 2 chiều rời rạc
a. Bảng PPXS đồng thi và bng PPXS biên X Y y1 y2 y3 → X P(x) x1 p11 p12 p13 → x1 P(x1) = p11+12+p13 x2 p21 p22 p23 → x2 P(x2) x3 p31 p32 p33 → x3 P(x3) ↓ ↓ ↓ ↓ Y y 3 3 1 y2 y3 P(y) P(y1) = p11+ p21+ p31 P(y2) P(y3) ∑ ∑ 𝑝𝑖𝑗 = 1 𝑖=1 𝑗=1
Từ bảng PP biên có thể tính E(X), E(Y), V(X), V(Y).
𝑋 và 𝑌 độc lập ⇔ 𝑝𝑖𝑗 = 𝑃(𝑥𝑖)𝑃(𝑦𝑗),∀𝑖, 𝑗
Nếu tồn tại 𝑖, 𝑗 để 𝑝𝑖𝑗 ≠ 𝑃(𝑥𝑖)𝑃(𝑦𝑗) thì nói 𝑋 và 𝑌 phụ thuộc.
b. Bảng PPXS có điều kin của Y khi X = x1. Chỉ xét dòng x1, ta có (Y|X=x1) y1 y2 y3 P 𝑝 𝑝 𝑝 𝑃(𝑌 = 𝑦 11 12 13
1|𝑋 = 𝑥1) = 𝑃(𝑥1) 𝑃(𝑌 = 𝑦2|𝑋 = 𝑥1) = 𝑃(𝑥1) 𝑃(𝑌 = 𝑦3|𝑋 = 𝑥1) = 𝑃(𝑥1)
Từ bảng này có thể tính E(Y|X= x1) viết gọn là E(Y|x1), tính được V(Y|x1).
Tương tự có thể tạo các bảng (Y|X=xi); (X|Y=yj) và tính các kì vọng, phương sai điều kiện
c. Kì vọng điều kin và Hàm hi quy
Ví d. Cho 𝑋 là thu nhập, 𝑌 là chi tiêu (đơn vị: triệu đồng) của cá nhân. Cho bảng PPXS đồng thời của (𝑋, 𝑌) như sau: 𝑋 𝑌 5 8 10 Tổng 10 0,1 0,2 0,1 0,4 15 0,1 0,2 0,3 0,6 Tổng 0,2 0,4 0,4 1
Tìm hàm hi quy:
Bảng PPXS có điều kiện của 𝑌 khi (𝑋 = 1 ) 0 (𝑌|𝑋 = 1 ) 0 5 8 10 𝑃 0,1 0,2 0,1
𝐸(𝑌|𝑋 = 10) = 5 × 0,25 + 8 × 0,5 + 10 × 0,25 = 7,75 (tr.đ) ( ) Bảng P 𝑌|P(X 𝑋 S c = ó1 đ
5 i)ề u kiện 5c ủa 𝑌 khi (𝑋8 = 1 ) 5 10 𝑃 0,1/0,6 0,2/0,6
0,3/0,6 𝐸(𝑌|𝑋 = 15) = 5 × 0,1 + 8 × 0,2 + 10 × 0,3 = 8,5 (tr.đ) 0,6 0,6 0,6
Có: 𝐸(𝑌|𝑋 = 10) = 7,75 𝐸(𝑌|𝑋 = 15) = 8,5
⇒ 𝐸(𝑌|𝑋 = 𝑥) = 𝑓(𝑥) = 𝑎𝑥 + 𝑏 = 0,1 𝑥
5 + 6,25: là hàm hồi quy của 𝑌 theo 𝑋, cho biết trung bình của 𝑌
thay đổi thế nào khi 𝑋 thay đổi
(7,75 = 𝑎. 10 + 𝑏; 8,5 = 𝑎. 15 + 𝑏, giải hệ pt, tìm được 𝑎 = 0,1 ; 5 𝑏 = 6,2 ) 5
+ 𝐸(𝑌|𝑋 = 0) = 𝐸(𝑌|0) = 0,15 × 0 + 6,25 = 6,25: nếu không có thu nhập thì chi tiêu trung bình là 6,25 tr.đ
+ 𝐸(𝑌|𝑥 + 1) − 𝐸(𝑌|𝑥) = 0,15(𝑥 + 1) + 6,25 − 0,1 𝑥
5 − 6,25 = 0,15 > 0: khi thu nhập tăng thêm 1 tr.đ thì
chi tiêu trung bình tăng thêm 0,15 tr.đ
Tg tự: 𝐸(𝑋|𝑌 = 5) = 1 ,
2 5; 𝐸(𝑋|𝑌 = 8) = 12,5; 𝐸(𝑋|𝑌 = 10) = 13,75 → 𝐸(𝑋|𝑦) = 𝑓(𝑦) = 𝑎𝑦2 + 𝑏𝑦 + 𝑐 6
d. Hiệp phương sai: 𝑛 𝑚
𝐶𝑜𝑣(𝑋, 𝑌) = 𝐸([𝑋 − 𝐸(𝑋)][𝑌 − 𝐸(𝑌)]) = 𝐸(𝑋𝑌) − 𝐸(𝑋)𝐸(𝑌) = ∑ ∑ 𝑥𝑖𝑦𝑗𝑃(𝑥𝑖,𝑦𝑗) − 𝐸(𝑋)𝐸(𝑌) 𝑖=1 𝑗=1
Có đơn vị đo là tích đơn vị đo của X và đơn vị đo của Y
𝐶𝑜𝑣(𝑋, 𝑌) = 𝐶𝑜𝑣(𝑌, 𝑋)
𝑋, 𝑌 độc lập  𝐶𝑜𝑣(𝑋, 𝑌) = 0
Cho biết X và Y có tương quan với nhau không: 𝐶𝑜𝑣(𝑋, 𝑌) > 0 thì 𝑋, 𝑌 có “tương quan dương”
𝐶𝑜𝑣(𝑋, 𝑌) < 0 thì 𝑋, 𝑌 có “tương quan âm”
e. H s tương quan: 𝜌𝑋,𝑌 = 𝐶𝑜𝑣(𝑋,𝑌) ⇔ 𝐶𝑜𝑣(𝑋, 𝑌) = 𝜌𝑋,𝑌𝜎 𝜎 𝑋𝜎 𝑋.𝜎𝑌 𝑌
Hệ số tương quan không có đơn vị đo
Tính chất của hệ số tương quan: –1  X,Y  1 X,Y = Y,X
X,Y > 0: tương quan dương, X,Y < 0: tương quan âm
X,Y = 0: không tương quan (chưa chắc đã độc lập)
𝑋, 𝑌 độc lập  X,Y = 0
X,Y =  1: 𝑋, 𝑌 có quan hệ hàm số bậc 1 với nhau
THNG KÊ SUY DIN
Tng th: là tập hợp có nhiều phần tử đồng nhất theo một dấu hiệu nghiên cứu.
• Dấu hiệu nghiên cứu: định tính hoặc định lượng → đại diện và lượng hóa bởi biến ngẫu nhiên gốc (𝑋).
• Trung bình tổng thể = 𝜇 = 𝐸(𝑋); Phương sai tổng thể = 𝜎2 = 𝑉(𝑋)
→ Nghiên cứu tham số của tổng thể đồng nhất với nghiên cứu tham số của bnn gốc 𝑋
VD: Cho tổng thể pp Chuẩn = Cho tổng thể với BNN gốc pp theo quy luật Chuẩn
• Nếu điều tra được tổng thể thì có thể mô tả số liệu tổng thể bằng bảng, đồ thị và tính được các tham số
của tổng thể (chính là các thống kê mô tả của tổng thể - bài 1)
• Thực tế không điều tra tổng thể → điều tra mẫu
Mu ngu nhiên: trước khi điều tra thì có mẫu ngẫu nhiên (𝑋1, … , 𝑋𝑛) ⇔ {𝑋1, … , 𝑋𝑛 độc lập với nhau
𝑋1,… , 𝑋𝑛 có cùng PPXS với X
• Trung bình mẫu = 𝑋 = ∑𝑋𝑖 là bnn, là thống kê, hàm ước lượng; )2
𝐸(𝑋) = 𝜇; 𝑉(𝑋) = 𝜎2𝑛 𝑛(𝑋
• Phương sai mẫu = 𝑆2 = ∑ 𝑖−𝑋 = 𝑛 2
(∑𝑋𝑖 − 𝑋2) là bnn, là thống kê, hàm ước lượng; 𝐸(𝑆2) = 𝜎2 𝑛−1   𝑛−1 𝑛 −𝜇 −𝜇
• Nếu bnn gốc 𝑋 ∼ 𝑁(𝜇, 𝜎2) thì 𝑋 ∼ 𝑁 (𝜇, 𝜎2) ; 𝑍 = 𝑋 𝜎 𝑆 𝑛
∼ 𝑁(0,1); 𝑇 = 𝑋 ∼ 𝑇(𝑛 − 1) 𝑛−1 𝑆2 √𝑛 √𝑛 𝜒2 = ( ) ∼ 𝜒2(𝑛 − 1) 𝜎2
Áp dụng: Tính XS 𝑃(𝑎 < 𝑋 < 𝑏) =?
Tìm a (hoặc b) để 𝑃(𝑋 > 𝑎) = 1 − 𝛼 (hoặc 𝑃(𝑋 < 𝑏) = 1 − 𝛼) (suy đoán mẫu • Nếu 𝑋 2 2
1 ∼ 𝑁(𝜇1, 𝜎1 ), 𝑋2 ∼ 𝑁(𝜇2, 𝜎2) thì …
• Nếu 𝑋 ∼ 𝐴(𝑝) thì … 7
1. BÀI TOÁN ƯỚC LƯỢNG
Giả sử biến ngẫu nhiên gốc có phân phi xác suất đã biết (thường gặp là A(p), N(µ, σ2) ).
Ước lượng: xác định một cách gần đúng giá trị của tham số θ của tổng thể.
a. Cách 1: Ước lượng điểm chủ trương tìm 𝜃 là ước lượng của 𝜃
+ Nếu xét (tính) trên mẫu cụ thể thì 𝜃 là một số, gọi là ước lượng điểm (estimate) của 𝜃.
+ Nếu xét trên mẫu ngẫu nhiên thì 𝜃 là một biến ngẫu nhiên, gọi là hàm ước lượng (estimator).
Các tính chất của hàm ước lượng
+ Ước lượng không chệch: 𝐸(𝜃) = 𝜃.
+ Tính hiệu quả: ước lượng không chệch có phương sai nhỏ nhất trong lớp các ước lượng không chệch
trên cùng 1 mẫu gọi là ước lượng hiệu quả.
+ Tính vững: nếu 𝜃 hội tụ theo xác suất đến 𝜃 thì nó là ước lượng vững của 𝜃.
• Nếu 𝑋 ∼ 𝑁(𝜇, 𝜎2) thì chứng minh được 𝑋 là ước lượng không chệch, hiệu quả và vững của 𝜇; do đó
𝑥 là ước lượng tối nhất của 𝜇
• Nếu 𝑋 ∼ 𝑁(𝜇, 𝜎2) thì 𝑆2 là ước lượng không chệch (nhưng không phải hiệu quả) của 𝜎2, 𝑀𝑆 = 𝑋  2
 − 𝑋2 là ước lượng vững của 𝜎2
Phương pháp ước lượng hợp lí tối đa
Biến ngẫu nhiên gốc X biết PPXS → biết hàm mật độ XS của X là 𝑓(𝑥, 𝜃).
Với mẫu cụ thể 𝑤 = (𝑥1, … , 𝑥 , tìm hàm h p lí trên m u: 𝑛) ợ ẫ
𝐿(𝑤, 𝜃) = 𝐿(𝑥1,…, 𝑥𝑛,𝜃) = 𝑓(𝑥2,𝜃) … 𝑓(𝑥1,𝜃). 𝑓(𝑥𝑛,𝜃)
Nếu hàm hợp lí 𝐿 đạt cực đại tại 𝜃 thì 𝜃 là ước lượng hợp lí tối đa của tham số 𝜃.
Cách giải: tìm nghiệm của đạo hàm bậc 1 của ln (𝐿), kí hiệu là 𝜃
Chứng minh đạo hàm bậc 2 của ln (𝐿) âm tại nghiệm tìm được
b. Cách 2: Ước lượng bng khong tin cy chủ trương tìm khoảng (𝑔1, 𝑔2) chưa 𝜃 với độ tin cậy (khá lớn) cho trước.
+ Khoảng ngẫu nhiên (𝐺1, 𝐺2) là khoảng tin cậy với độ tin cậy 1 − 𝛼 của tham số 𝜃 nếu thỏa mãn
𝑃(𝐺1 < 𝜃 < 𝐺2) = 1 − 𝛼
Với mẫu cụ thể, 𝐺1, 𝐺2 nhận giá trị cụ thể là 𝑔1, 𝑔2
(1 − 𝛼) gọi là độ tin cậy (ĐTC)
𝐼 = 𝐺2 − 𝐺1 gọi là độ dài khoảng tin cậy (KTC)
+ Cách xây dựng KTC cho 𝜇 và công thức xác định kích thước mẫu tối thiểu.
Ví d. xây dựng KTL cho 𝜇 khi chưa biết 𝜎2, tổng thể phân phối Chuẩn
Chọn thống kê 𝑇 = 𝑋−𝜇 𝑆 ∼ 𝑇(𝑛 − 1) √𝑛
Với ĐTC (1 − 𝛼) chọn 𝛼 (𝑛−1) (𝑛−1)
1 > 0; 𝛼2 > 0 và 𝛼1 = 𝛼2 = 𝛼 → 𝑡1−𝛼 < 𝑡 (do ĐTC lớn) 1 𝛼2 𝑃(𝑡(𝑛−1) (𝑛−1) 1−𝛼 < 𝑇 < 𝑡 ) = 1 − 𝛼 1 𝛼2 8
𝑃 (−𝑋 − 𝑡(𝑛−1) 𝑆 (𝑛−1) 𝑆 𝛼
< −𝜇 < −𝑋 + 𝑡 ) = 1 − 𝛼 1 √𝑛 𝛼2 √𝑛
𝑃 (+𝑋 + 𝑡(𝑛−1) 𝑆 (𝑛−1) 𝑆 𝛼
> +𝜇 > +𝑋 − 𝑡 ) = 1 − 𝛼 1 √𝑛 𝛼2 √𝑛
BT ước lượng trung bình tổng thể (𝜇) khi chưa biết phương sai tổng thể (𝜎2): 𝑆 𝑆 𝑋− 𝑡 (𝑛−1) (𝑛−1) 𝛼 . < 𝜇 < 𝑋 + 𝑡 . 2 √𝑛 𝛼1 √𝑛
KTC tối đa: 𝜇 < 𝑋 + 𝑡(𝑛−1) 𝛼 . 𝑆 √𝑛
KTC tối thiểu: 𝑋 − 𝑡(𝑛−1) 𝛼 . 𝑆 < 𝜇 √𝑛
KTC đối xứng: 𝑋 − 𝑡(𝑛−1) (𝑛−1)
𝛼/2 . 𝑆 < 𝜇 < 𝑋 + 𝑡 . 𝑆 √𝑛 𝛼/2 √𝑛
Độ dài KTC đối xứng: 𝐼 = 2𝑡(𝑛−1) 𝛼/2 . 𝑆 √𝑛
Sai số của ước lượng (sai số biên, ME): 𝜀 = 𝐼 = 𝑡 (𝑛−1). 𝑆 2 𝛼/2 √𝑛
Bài toán tìm kích thước mẫu tối thiểu để …: 4𝑆2 𝐼 ≤ 𝐼 (𝑛−1) 0 ⇔ 𝑛0 ≥ ]2 𝐼2 [𝑡𝛼/2 0 𝑆2 𝜀 ≤ 𝜀 (𝑛−1)
0 ⇔ 𝑛0 ≥ 𝜀2 [𝑡𝛼/2 ]2 0
2. BÀI TOÁN KIỂM ĐỊNH GI THUYT
Gi thuyết thng kê: là giả thuyết về
+ Tham số đặc trưng của biến ngẫu nhiên
+ Phân phối xác suất của BNN
+ Sự độc lập của các BNN
Giả thuyết gốc: 𝐻0 (kđ tham số thì 𝐻0 là phát biểu chứa dấu bằng (=, ≥, ≤) )
Giả thuyết đối: 𝐻1 (kđ tham số thì 𝐻0 là phát biểu không chứa dấu bằng (≠, <, >) )
Viết cặp giả thuyết cho các phát biểu sau
• Chiều cao trung bình của nam thanh niên ở VN bằng 168 cm g g
• Phương sai về cân nặng của sản phẩm nhỏ hơn 25 g2
• Độ lệch chuẩn về thu nhập của hộ gia đình không vượt quá 3 triệu
• Tỉ lệ phế phẩm của lô hàng ít hơn 5%
• Ở VN, tỉ lệ nam cao hơn tỉ lệ nữ (giả sử giới tính gồm nam và nữ)
• Điểm trung bình của ca thi sáng cao hơn ca thi chiều
• Độ phân tán của thời gian hoàn thành bài thi trắc nghiệm cao hơn so với bài thi tự luận.
Thng kê kiểm định (tiêu chun kiểm định) là thống kê 𝐺 trên mẫu ngẫu nhiên (𝑋1, 𝑋2, … , 𝑋𝑛) sao
cho phân phối xác suất của 𝐺 là xác định khi 𝐻0 đúng.
Phương pháp kiểm định
▪ Giả sử 𝐻0 đúng, từ phân phối của 𝐺, tìm một biến cố 𝐴 (liên quan 𝐺) có XS nhỏ → coi như biến cố
𝐴 không xảy ra khi thử (theo nguyên lí XS nhỏ). 9
▪ Thực hiện phép thử thì thu được mẫu cụ thể, tìm được 𝐺𝑞𝑠
• Nếu 𝐴 xảy ra → giả sử 𝐻0 đúng là không chính xác→ bác bỏ 𝐻0.
• Nếu 𝐴 không xảy ra → chưa có cơ sở để kết luận 𝐻0 đúng
Các loi sai lm
▪ Phương pháp kiểm định ⇒ Nếu 𝐴 xảy ra thì bác bỏ 𝐻0, trong khi thực tế 𝐻0 có thể đúng ⇒ Có thể
mắc sai lầm, gọi là sai lầm loại I.
▪ Sai lầm loại I (type I error): bác bỏ giả thuyết 𝐻0 trong khi 𝐻0 đúng
▪ Sai lầm loại II (type II error): không bác bỏ giả thuyết 𝐻0 trong khi 𝐻0 sai
Tình hung thc tế Quyết định 𝑯𝟎 đúng 𝑯𝟎 sai Bác bỏ 𝐻0
Sai lm loi I Đúng, không sai lầm
Xác suất kí hiệu là 𝛼 Xác suất = 1 − 𝛽 Không bác bỏ 𝐻0 Đúng, không sai lầm
Sai lm loi II Xác suất = 1 − 𝛼
Xác suất kí hiệu là 𝛽
▪ Khi 𝛼 giảm thì 𝛽 tăng và ngược lại.
Mức ý nghĩa (significant level) là mức xác suất mắc sai lầm loại I, hay mức ý nghĩa𝜶.
Thường dùng mức ý nghĩa 0,05; 0,1; 0,01 (hay 5%, 10% 1%)
Min bác b (reject area) giả thuyết 𝐻0 với mức ý nghĩa 𝛼, kí hiệu 𝑊𝛼, là miền trên trục số thỏa mãn
𝑃(𝐺 ∈ 𝑊𝛼|𝐻0) = 𝛼
Từ phương pháp kiểm định → 𝐴 = (𝐺 ∈ 𝑊𝛼)
𝑊𝛼 được xác định bởi các giá trị tới hạn của thống kê 𝐺 (critical value)
𝑷 − 𝒗𝒂𝒍𝒖𝒆, còn gọi là mức ý nghĩa quan sát được, là mức xác suất mà nếu mức ý nghĩa (𝛼) vượt qua
nó thì giả thuyết 𝐻0 bị bác bỏ.
Hay: 𝑃 − 𝑣𝑎𝑙𝑢𝑒 là mức xác suất thấp nhất để bác bỏ 𝐻0
Hai cách kiểm định
Dùng min bác b (hay giá tr ti hn)
Dùng 𝑷 − 𝒗𝒂𝒍𝒖𝒆 Bước 1
phát biểu chứa dấu bằng ( ) ế ế {𝐻0: =, ≥, ≤ 𝐻 há biể khô hứ dấ bằ ( ) Bước 2
Xác định tiêu chuẩn kiểm định (tra công thức) + mẫu cụ thể → giá trị quan sát 𝐺𝑞𝑠 Bước 3
Tìm miền bác bỏ (tra công thức) và tra
Tính 𝑃 − 𝑣𝑎𝑙𝑢𝑒 theo công thức
giá trị tới hạn tương ứng → 𝑊𝛼
XSTK: tra tài liệu TH; KTL: cho sẵn Bước 4
+ 𝐺𝑞𝑠 ∈ 𝑊𝛼 ⇒ bác bỏ 𝐻0
+ 𝑃 − 𝑣𝑎𝑙𝑢𝑒 < 𝛼 ⇒ bác bỏ 𝐻0
+ 𝐺𝑞𝑠 ∉ 𝑊𝛼 ⇒ không bác bỏ 𝐻0
+ 𝑃 − 𝑣𝑎𝑙𝑢𝑒 > 𝛼 ⇒ không bác bỏ 𝐻0 Bước 5
Tính xác suất mắc sai lầm loại II 10
Kiểm định trung bình (mt) tng th
𝑯𝟎, thống kê KĐ 𝑯𝟏
Bác b 𝑯 khi 𝟎 𝑷 − 𝒗𝒂𝒍𝒖𝒆 𝑯𝟎:𝝁 = 𝝁𝟎 𝜇 ≠ 𝜇0 |𝑇 (𝑛−1)
2 × 𝑃[𝑇(𝑛 − 1) > |𝑇𝑞𝑠|] 𝑥 − 𝜇 𝑞𝑠| > 𝑡𝛼/2 𝑇 0 𝑞𝑠 = 𝑠/√𝑛 𝜇 > 𝜇 (𝑛−1) 0 𝑇𝑞𝑠 > 𝑡 ) 𝛼
𝑃[𝑇(𝑛 − 1 > 𝑇𝑞𝑠] 𝜇 < 𝜇0 𝑇 (𝑛−1) 𝑞𝑠 < −𝑡 ) 𝛼
𝑃[𝑇(𝑛 − 1 < 𝑇𝑞𝑠]
Ki
ểm định trung bình hai tng th (chưa biết 2 phương sai và 2 phương sai khác nhau)
𝑯𝟎, thống kê KĐ 𝑯𝟏
Bác b 𝑯 khi 𝟎 𝑷 − 𝒗𝒂𝒍𝒖𝒆 𝑯𝟎:𝝁𝟏 = 𝝁𝟐 𝜇1 ≠ 𝜇2
|𝑇𝑞𝑠| > 𝑧𝛼/2
2 × 𝑃(𝑍 > |𝑇𝑞𝑠|)
𝒏𝟏 > 𝟑𝟎,𝒏𝟐 > 𝟑𝟎 𝑥  𝜇 T 1  − 𝑥2 1 > 𝜇2 𝑇𝑞𝑠 > 𝑧𝛼 𝑃(𝑍 > 𝑇𝑞𝑠) qs = √𝑠2 2 1 /𝑛1 + 𝑠2 /𝑛2 𝜇1 < 𝜇2 𝑇𝑞𝑠 < −𝑧𝛼 𝑃(𝑍 < 𝑇𝑞𝑠)
Ki
ểm định Jarque-Bera v phân phi Chun
𝐻0: biến 𝑋 phân phối Chuẩn
𝐻1: biến 𝑋 không phân phối Chuẩn 2
Thng kê: 𝐽𝐵𝑞𝑠 = 𝑛 (𝑎3 + (𝑎4−3)2) 6 24
Trong đó 𝑎3, 𝑎4 là hệ số bất đối xứng và hệ số nhọn của mẫu
Min bác b: 𝑊 2(2)
𝛼 = {𝐽𝐵: 𝐽𝐵 > 𝜒𝛼 }
Các ki
m định khác: t đọc
+ Kiểm định phương sai, tỷ lệ của một tổng thể, hai tổng thể
+ Kiểm định sự độc lập của hai dấu hiệu định tính 11