Bài 1: Gii thiêu chung v th ng kê
1. Th ng kê là gì
- là khoa h c v thu th p, t ch c, trình bày, phân tích, di n gi i d li u ph c v
quá trình ra quyết định
2. Mt s khái ni ệm thường dùng trong thng kê
a. T ng th và m u:
- T ng th bao g m toàn b các đơn vị ạm vi đố thuc ph i tượng điu tra
+ Tham s : Các m bi u hi m c a t ng th ức độ ện đặc điể
+ T u tra: thu th p d li u cho toàn b t ng th ổng điề
- M u: là m t ph n c a t ng th
+ Th ng kê: Các m bi u hi m c a m u ức độ ện đặc điể
+ Điều tra ch n m u: thu th p d li u c a m u
b. Bi ến và d li u
- Bi m c t ng th ho c m c ch nghiên c u. ến là đặc điể ủa đơn vị ẫu đượ ọn ra để
- D li u là bi u hi c c a m t bi n ện quan sát đượ ế
- Bi n bao g m ế
+ Đị không đo đượnh tính c bng s
+ Định lượng: r i r c + liên t c
3. Thang đo trong thống kê:
Định danh D li c bi u hi n ệu đượ
bằng các đặc đim, tính
cht
không có quan h
hơn kém
Biến định tính
Th b c
có quan h th b c,
hơn kém
Khong biu hi n b ng con s
có đơn vị đo lườ ng c
th
nm trong m t
khong
Biến định lượng
T l bắt đầu t 0
4. Th ng kê mô t và thng kê suy di n:
- Th ng kê mô t : t ch c, tóm t t, trình bày d li u
- Th ng suy di t lu n v các tham s t ng th d a trên các th ng n: đưa ra kế
kê m u
Bài 2: Trình bày d li u b ng b th ảng và đồ
1. Trình bày d li n ệu đơn biế
a. B ng:
- B ng t n s phân ph i:
+ T n s : là s l n xu t hi n m t giá tr lượng bi n c th ế nào đó
+ B ng t n s phân ph i li t kê s l n xu t hi n c a các giá tr lượng biến
dưới dng bng
- B ng t n s phân ph i gi ản đơn:
+ K thu t: coi m i giá tr lượng bi n là m t t ế
+ Ph m vi áp d ng: Bi nh tính + Bi n r i r c có ít giá tr ến đị ế
- B ng t n s phân ph i có kho ng cách t :
+ K thu t: ghép m t ph ạm vi lượng biến vào m t t
+ Ph m vi áp d ng: Bi n r i r c có nhi u giá tr + Bi n liên t c ế ế
+ Lý do ti n hành phân t v i kho ng cách t ế
+ G m: B ng t n s kho ng cách t b ng nhau + B ng t n s kho ng
cách t không b ng nhau
- M t s thu t ng :
+ Gi i h ạn dưi (ghd): giá tr thp nh t c a m t t .
+ Gi i h n trên (ght): giá tr cao nh t c a m t t
+ KCT: ph ng bi n c a m t t t ạm vi lượ ế ghd đến ght
+ D y s ph n ph i c n c t n g i l d y s thu c t nh (ph n t theo bi n ó à ế
đị ượnh tnh) và dy s l ng biến (phn t theo bi nh lến đị ượng).
b. Đồ th :
Biến định
tính bi n ế
ri r c
Biểu đồ hình ct
giản đơn
- 1 tr c bi u di n c c thu c t nh á
- Tr c c n l i l t n s ho c tu n su t xu t hi n à
ca t ng lo i thu c t nh
Biểu đồ hình tròn - S d ng bi tròn khi mu n mô t , so sánh ểu đồ
t l % xu t hi n c a các bi n. ế
- Bi tròn ng mô t t n su t. ểu đồ thườ
Biến liên tc Biểu đồ t n s phân
phi
- Bi t n s ph n ph i m t th ng tin trong ểu đồ ô ô
các b ng t n s ph n ph i c kho ng c ch t d i ó á ướ
dạng đồ th
0
5
Category 1Category 2Category 3Category 4
Series 2
Series 2
Sales
1st Qtr 2nd Qtr 3rd Qtr 4th Qtr
+ Đối xng
+ L ch ph i
+ L ch trái
+ nh) Bimondal (2 đỉ
Biểu đồ hp
Đa giác tần s - Đa giác tần st t n s và tr s gi a c a t
cho các b ng t n s phân ph i kho ng cách t .
2. Trình bày d li n: ệu đa biế
Biến định nh
bi n r i r c ế
ít giá tr
Bng d li u chéo - Cross- c s dtable đượ ụng để nghiên cu mi
liên h gi a hai bi nh tính ho ến đị c bi n r i r c ế
vi ít giá tr .
- ng cross-table ph nh Lưu ý: khi xy dự ải xác đị
được biến ph thu c (dependent) và bi c l p ến độ
(independent) để đưa vào dng c t cho phù
hp.
Biểu đồ thanh
Biến liên tc Đồ th phân tán
Bài 3: Các m th ng kê mô t c độ
1. Th ng kê mô t cho mt bi n: ế
a. S tuy i và sệt đố i tương đố
- S tuy i trong th ng kê bi u hi n quy mô, s ng c a hi ng nghiên ệt đố lượ ện tượ
cu ti th m c th . ời gian, địa điể
+ tính: Đơn vị
Đơn vị hin vt: cái, con, qu , chi c, m, kg, gi , ngày... ế
Đơn vị giá tr: VND, USD,...
- S i trong th ng kê bi u hi n quan h so sánh gi a hai m tương đố ức độ nào đó
ca hi ng ện tượ
+ tính: Đơn vị
ln, ph ần trăm (%), phần nghìn (‰)
Đơn vị kép: ngườ i/km2, s n ph i... ẩm/ngườ
- Các lo i s i tương đ
[1, 5]
(5, 9]
(9, 13]
(13, 17]
(17, 21]
(21, 25]
0
5
10
15
20
25
Tiêu đề Biểu đồ
S ng thái (t phát tri n) tương đối độ ốc độ
t = 𝑦1
𝑦0(100)
S i k tương đố ế
hoch
S i nhitương đố m v
KH
Kn = 𝑦𝐾𝐻
𝑦0 (100)
S i thtương đố c hi n
KH
Kt = 𝑦1
𝑦𝐾𝐻 (100)
S i k t c u tương đố ế
Phn ánh t trng c a t ng b ph n c u
thành trong m t t ng th .
Di= 𝑦1
∑𝑦1 (100)
S i không gian tương đố
so sánh
˗ hai hi ng cùng loện tượ ại nhưng khác
nhau v không gian
˗ hai mức độ gi a hai b ph n trong m t
tng th
S tương đối cường độ
so sánh ch tiêu c a hai hi ng khác ện tượ
nhau nhưng có quan hệ vi nhau.
b. Các m trung tâm ức độ
(i) S trung bình
- m trung bình c ng: Đặc điể
• Dữ ụng thang đo kho liu s d ng, t l
• Tất cc giá tr trong t ng th u tham gia vào công th c tính đề
• Chỉ tnh đượ c mt giá tr trung bình
• Tổng chênh lch ca các giá tr so v i trung bình c ng b ng 0
• Chị ảnh hưởu ng ca giá tr đột xut
(ii) S trung v
- Giá tr ng bi n c ng v trí chính gi a trong dãy s ng bi n lượ ế ủa đơn vị đứ lượ ế
+ S t ng th l ( = 2m+1): Me = x đơn vị ∑𝑓𝑖 m+1
+ S t ng th ch n ( =2m): Me = đơn vị ∑𝑓𝑖 𝑥𝑚 𝑥𝑚+ +1
2
- m: Đặc điể
+ Không b ng c a giá tr t xu t ảnh hưở độ
+ D li u s d b c, kho ng, t l ụng thang đo thứ
(iii) Mt
- M t là bi u hi n xu t hi n ph bi n nh t trong dãy s ế
- Xác định da vào tn s
- c m: Đặ điể
+ D li u s d ng t t c các lo ại thang đo
+ Không b ng c a giá tr t xu t (ngo i lai) ảnh hưở độ
+ M t s ng h p không có m t ho c có nhi u m t trườ
(iv) So sánh trung bình, trung v , m t
c. Các m bi n thiên ức độ đo độ ế
- Kho ng bi n thiên: Là chênh l ch gi a giá tr ế l n nh t và nh nh t trong dãy s .
R = xmax - xmin
- Kho ng t phân v :
+ T phân v : Các giá tr chia t p h p d li ệu (đ được sp xếp t nh đến
ln) thành 4 ph n b ng nhau.
+ Th p phân v : Các giá tr chia t p h p d li ệu (đđược sp x p t nh ế
đến ln) thành 10 phn bng nhau.
+ Bách phân v : Các giá tr chia t p h p d li c s p x p t nh ệu (đ đượ ế
đến ln) thành 100 phn bng nhau.
+ nh bách phân v : Cách xác đị
Xác nh v trí c a phân vđị th p: Lp =(n+1) p
Tính giá tr c a phân v th p d a vào v trí
+ Kho ng t phân v là: Là chênh l ch gi a giá tr t phân v th ba t
phân v th nh t. IQR = Q3 Q1
- trung bình c ng c a t l ch so v i s trung Phương sai: ổng bình phương độ
bình
- l ch chu n: c hai c Độ Là căn bậ ủa phương sai
+ Độ ể: σ = lch chun ca tng th √σ 2
+ Độ lch chun ca mu: S= √𝑆2
- H s bi n thiên: ế
+ L s t i (%) t nh b ng c ch so s nh gi l ch chu n v i s à ương đố á á ữa độ
trung b nh c ng ì
V = S/𝑥 × 100
+ L th bi n thi n t i, c th d so s nh gi a c c à ước đo độ ế ương đố ó ng để á á
hin tượng kh c lo i ho c c ng lo i v c s b nh qu n kh c nhau á à ó ì á
d. Hình dáng phân phi dãy s:
- H s Skewness: là thước đo độ đối xng ca phân phi
- Bi h p ria mèo (boxplot) bi u di n 5 m th ng t : giá tr l n ểu đồ ức độ
nht (max), giá tr nh nh t (min), t phân v th nh t (Q1), t phân v th ba
(Q3) và trung v (Q2)
- Quy t i vắc 3 sigma: Đố i phân ph i chu n:
+ Kho ng 68% c quan sát n m trong ph m vi (+) (-) 1 l ần độ lch
chun so v i trung bình
+ Kho ng 95% c quan sát n m trong ph m vi (+) (-) 2 l ần độ lch
chun so v i trung bình
+ Kho ng 99,7% các quan sát n m trong kho ng (+) (-) 3 l l ch ần độ
chun so v i trung bình
2. Th ng kê mô t ph n ánh m i liên h :
a. Hi ệp phương sai: ều hướ Phn ánh chi ng ca m i liên h
b. H s Ph n ánh chi ctương quan: ều hướng và cường độ a mi liên
h
Bài 4: T ng quan v xác su nh lí gi i h n trung tâm ất và đị
1. T ng quan v xác su t:
a. Khái nim v xác su t, bi n ng u nhiên: ế
- Xác su t là:
+ kh t s ki n có th x y ra. năng mà mộ
+ X/S cung c p m i liên h gi a t ng th và m u.
- X là bi n ng u nhiên n u giá tr c a X=x là hoàn toàn ng u nhiên. ế ế
- Xác su X nh n giá tr x là p(x)=P(X=x). ất để
- N u m t bi n ng u X nh n giá tr ế ế xi, khi đó
1. 0<p(xi)<1 for all xi
2. ∑𝑝(𝑥𝑖)
𝑥𝑖 =1
b. Phân ph i xác su t ca bi n ngế u nhiên liên t c:
- Phân ph i chu n:
+ D i x ng qua giá tr nh tạng hình chuông, đố trung tm μ, có đỉ ại x=μ, đ
th ti m c ận 0 khi x→±∞.
1. E(X)=μ; V(X)=σ2
2. Di n tích dưới ng cong=1 đườ
3. Kí hi u: X~N(μ,σ2).
4. Giá tr trung bình khácnhau trí thay i d c theo tr c x v đổ
5. Phương sai khác nhau–đồ th nh n ho c tho i
+ Chu n hoá: Là quá trình chuy n m t bi n phân ph i chu n v phân ph i ế
chun hóa
+ Nếu X~N(μ,σ2), sử ức dưới đy để dng công th chun hóa:
Z = 𝑋−𝜇
𝜎 N(0,1) ~
-> S d ng b tra X/S ảng Z để
+ Quy t i x ng: ắc đố
P(Z<-a) = P(Z>a)
P(Z>a) = 1 P(Z<a)
P(a<Z<b) = P(Z<b) P(Z<a)
2. Định lí gii hn trung tâm:
a. Phân phi ca mu:
- Khi c m c bi n vô h n và ti m c n v quy mô c a t ng ẫu tăng ln (đặ ệt tăng đế
th), phân phi ca m u s ti m c n v phân ph i chu n.
b. Phân phi ca trung bình mu:
- B t k bi n ng ế ẫu nhin ban đầu có d ng phân ph ối như thế nào, khi c m ẫu tăng
lên phân ph i c a các trung bình m u ti m c n v phân ph i chu n.
- B t k bi n ng ế ẫu nhin ban đầu có d ng phân ph ối như thế nào, v i m t c m u
n, độ lch chun ca các trung bình m u (sai s bình quân ch n m u) b ng 𝜎
√𝑛, kí
hiu là SE (Standard error of the mean).
-> B t k t ng th phân ph i th nào (chu n hay không chu n), khi c m ế ẫu đủ
ln phân phi c a các trung nh m u s tuân theo quy lu t phân ph i chu n và
chúng ta có th s d ng th tính xác su t cho b t k giá tr trung bình ống k Z để
nào
c. Định lí gii hn trung tâm:
- N u X là m t bi n ng u nhiên có giá tr ế ế trung bình là μ và phương
sai là σ2, t
𝑥 N(𝜇,𝜎2
𝑛)
𝑥−𝜇
𝜎
√𝑛 Z ~ N (0,1) as n
Bài 5: Ước lư ểm địng và ki nh gi thuyết th ng kê
1. Ước lượng th ng kê:
a. Ước lưng (suy r ng) k t qu u tra: ế điề
- Ước lượng điểm/ trung bình: thngtính t m ẫu được dng để ước lượng các
tham s c a t ng th
- ng b ng kho ng tin c y: kho ng giá tr nh t th ng Ước lượ được xác đị
mu mà v i xác su t c th , tham s c a t ng th s thu c kho ảng đó
- z,t làh s tin c y(giá tr t i h n m c c a phân ph i chu n hoá phân ph i α
Student)
- m t m c sai l m) α – ức ý nghĩa (xác suấ
- (1-α) là xác suất hay trình độ tin cy
- Trong trường hp t ng th là h u h ạn, Chúng ta điều chnh ph m vi sai s trong
công th nh kho ng tin c y. ức xác đị
FPC=𝑁−𝑛
𝑁−1
b. Xác định kích thưc (quy mô) mu:
- Các y u t ng tế ảnh hưở ới kch thước mu:
+ H s tin c ậy (z)/ Độ ủa ước lượ tin cy c ng
+ Phương sai (độ đồng đề u) ca tng th
+ Ph m vi sai s ch n m u/sai s ch n m u cho phép ( ) 𝜀
- M t s ng th : phương pháp xác định phương sai tổ
+ L n nh t ho c t l g n vấy phương sai lớ i 0,5 nh t trong các l u ần điề
tra trước (nếu có)
+ S d ng k t qu c a nghiên c u có tính ch ế ất tương tự
+ Ti n hành nghiên c u th nghi m ế
+ L y t l b ng 0,5 ho ặc ước lượng phương sai da vào kho ng bi n thiên ế
𝜎 = 𝑅
6= 𝑥𝑚𝑎𝑥− 𝑥𝑚𝑖𝑛
6
2. Ki m định gi thuyết thng kê
a. Nh ng v chung v ki m ấn đề định giá thuy t thế ng kê:
- Gi thuy t: là m t tuyên b v tham s c a t ng th c c ch ng minh ế ần đượ
- Ki nh gi thuy t 1 quy trình d a trên b ng ch ng m u thuy t xác ểm đị ế ế
suất để xác đ ết đưa ra có phả nh xem gi thuy i là 1 tuyên b hp lí hay không
1) c 1: Nêu gi thuy t ế
- Gi thuy t không (H0): tuyên b v giá tr c a tham s t ng th nh m m c ế
đch kiểm tra trn cơ ở bng ch ng c th
- Gi thuy i (H1): tuyên b c ch p nh n n u d li u m u cho h ết đố đượ ế ấy đủ
bng ch ng ch ng minh gi thuy t là không sai ế
2) L a ch n m ức ý nghĩa
- Sai l m lo i I: bác b H0 khi H0 đúng
- Sai l m lo i II: ch p nh n H0 khi H0 sai
3) L a ch n tiêu chu n ki nh ểm đị
- Tiêu chu n ki nh là giá tr nh t d li u m c s d ểm đị được xác đị ẫu, đượ ụng để
ra quyết định bác b gi thuy t không ế
- Bi t PS t ng th ( ): Zqs= ế 𝜎2 𝑥−𝜇0
𝜎
√𝑛
- Chưa biết PS tng th ( ): Tqs= 𝑠2 𝑥−𝜇0
𝑠
√𝑛
4) Xác đị ết định quy tc ra quy nh:
- Quy t c ra quy nh d a vào mi n bác b ết đị
+ N u giá tr tiêu chu n ki nh thu c mi n bác b (W ế ểm đ ), đủ sở
để bác b H0
+ N u giá tr c a tiêu chu n ki nh không thu c mi n bác bế ểm đị ỏ, chưa đ
cơ sở để bác b H0
- Quy t c ra quy nh d a vào P-value: ết đị
+ P-value là xác su t c a giá tr tiêu chu n ki nh t ểm đị ngưỡng tnh được
da trên thông tin m u v i gi nh gi thuy đị ết không là đúng.
+ Các nguyên t c ra quy bác b gi thuy t H0 v i P-value là: ết định để ế
Nếu p-value lớn hơn hoặc bằng α, chưa đ sở để bác b gi thuy t ế
H0.
Nế u p-value nh gihơn α, bác bỏ thuyết H0.
- Quy t c ra quy nh d a vào Kho ng tin c y: Bác b gi thuy t H0 khi 0 ết đ ế 𝜇
không thu c kho ng tin c y (1 - 𝛼) c ng giá tr trung bình. ủa ước lượ
5) Ra quy nh ết đị
- Xác đị ểm định giá tr tiêu chun ki nh t mu quan sát
- Da vào các quy t c ra quy ra quy nh. ết định để ết đị
6) Nêu k t luế n
- ng h p: Có 2 trườ
+ N u giá tr tiêu chu n ki nh thu c miế ểm đị n bác b /Giá tr xác su t nh
hơn => Có đủ cơ sở𝛼 để bác b gi thuyết H0
+ N u giá tr tiêu chu n ki nh không thu c mi n bác bế ểm đị /Giá tr xác
sut l c b ng ớn hơn hoặ 𝛼 bác b gi thuy t H0 => Chưa đủ cơ sở để ế
b. Ki ểm định giá tr trung bình ca 1 tng th:
- Gi s nghiên c u bi n ng u nhiên X phân ph i chu n ế
- Chưa để đị biết song có 𝜇 s gi nh nó bng 0 (H0:𝜇 𝜇 = 𝜇 0)
- ki nh gi thuy t trên, l y ng t tính các th ng Để ểm đị ế ẫu nhin n đơn vị đó
mu.
- Tiêu chu n ki nh ểm đị
- Bi t PS t ng th ( ): Zqs= ế 𝜎2 𝑥−𝜇0
𝜎
√𝑛
Nếu H0 đúng -> th ng kê Z s tuân theo quy lu t pp chu n hoá
- Chưa biết PS tng th ( ): Tqs= 𝑠2 𝑥−𝜇0
𝑠
√𝑛
Nếu -> thH0 đúng ng kê T s tuân theo quy lu t phân ph i Student v i b c t
do là n-1
c. Ki ểm định t l c a 1 t ng th :
- Gi s nghiên c u m t t ng th , t l chung là p.
- Chưa để đị biết p song có s gi nh nó b ng p0 (H0:p=p0)
- Để ki nh gi thuy t trên, l y mểm đị ế ẫu n đơn vị t đó tnh c thống kê ca m u.
- Tiêu chu n ki nh ểm đị
Bài 6: Phân tích tương quan và hồi quy
1. Mi liên h gi a các hi ng ện tượ
a. Liên h hàm s :
- Khái ni m: liên h hàm s là m i liên h hoàn toàn ch t ch
- m: Liên h c bi u hiĐặc điể đượ n trên t cá biừng đơn vị t
b. Liên h tương quan:
- Khái ni m: liên h i liên h không hoàn toàn ch t ch . tương quan là mố
- m: Liên h c bi u hi n trên t cá bi t mà ph i quan Đặc điể không đượ ừng đơn vị
sát s l n
2. Phân tích tương quan:
- m các k thuPhn tch tương quan g ật đo lường mi liên h gi a hai bi n ế
- H s ng m ch t ch c a m i liên h n tương quan đo lườ ức độ tương quan tuyế
tính gi a hai bi n ế
r= (𝑥−𝑥)(𝑦−𝑦)
( )𝑛−1 𝑆𝑥𝑆𝑦
- Tác d ng:
+ nh chi ng c a m i liên h Xác đị ều hướ
+ chĐánh giá mức độ t ch c a liên h n tính tương quan tuyế
3. Phân tích hi quy
a. Phân tích h ồi quy đơn:
- Đường h i quy lý thuy ết: là đường điều chnh bù tr các chênh l ch ng u nhiên
nêu ra mi liên h n c a hi ng. cơ bả ện tượ
- nh v trí c ng h i quy Phương trình hồi quy: phương trình xác đ ủa đườ
thuyết
- Mô hình h i quy t ng th :
𝛼: ph n ánh ảnh hưởng ca các nguyên nhân khác (ngoài nguyên nhân x)
ti k t qu y ế
• β: phản ánh ảnh hưởng trc ti p c a nguyên nhân x t i k t qu y. C th , ế ế
khi x tăng thm 1 đơn vị thì y thay đổi trung bình β đơn vị
+ β > 0: x và y có mối liên h thun (cùng chiu)
+ β < 0: x và y có mố ịch (ngượi liên h ngh c chiu)
- Phương trình hồi quy mu:
- Tìm các tham s sao cho t ch Phương pháp OLS: ổng bình phương các chnh l
gia giá tr th c t và giá tr lý thuy t cế ế a tiêu th c k t qu là nh nh t. ế
+ Gi thi t OLS: ế
Gi thiết 1: Mô hình được ước lượng trn cơ sở mu ngu nhiên
Gi thiế t 2: K v ng toán c a sai s b ng không
Gi thiết 3: Sai s tuân theo quy lu t phân b chu n
Gi thi a sai sết 4: Phương sai củ b i) ằng nhau (không đổ
Gi thi a các ph ết 5: Không tương quan gi ần (không t
tương quan)
Gi ế thi t 6: Gia các bi c lến độ ập không tương quan tuyến tính
hoàn h ng tuy n) - i v i h i quy b i. ảo (đa c ế Đố
+ N i dung:
b= ∑(𝑥𝑖−𝑥
𝑛
𝑖=1 )(𝑦𝑖−𝑦 )
∑(𝑥𝑖−𝑥
𝑛
𝑖=1 )^2
a=𝑦 𝑥-b
- Tính , ,∑𝑥 ∑𝑦 ∑𝑥 𝑦, 𝑥^2, 𝑦^2,
a= 𝑦 𝑥2 𝑥 𝑥y
𝑛∑𝑥 𝑥2−(∑ )2
b= 𝑛∑ 𝑥y− 𝑥∑𝑦
𝑛∑𝑥2−(∑𝑥)2
b. Phân tích hi quy bi
- Bj: ph n ánh ng thu n c a nguyên nhân xj t i k t qu y (khi các y u t ảnh hưở ế ế
khác không đổ ể, khi xj tăng thm 1 đơn v thì y thay đổi trung bình βj i). C th
đơn vị

Preview text:

Bài 1: Gii thiêu chung v th ng kê
1. Thng kê là gì - là khoa h c v ọ ề thu thập, t ch ổ
ức, trình bày, phân tích, diễn giải dữ liệu ph c v ụ ụ
quá trình ra quyết định
2. Mt s khái niệm thường dùng trong thng kê a. Tổng thể và mẫu: - Tổng thể bao g m toàn b ồ
ộ các đơn vị thuộc phạm vi đối tượng điều tra
+ Tham số: Các mức độ biểu hiện đặc điểm của t ng th ổ ể
+ Tổng điều tra: thu thập dữ liệu cho toàn bộ t ng th ổ ể
- Mẫu: là một phần c a t ủ ng ổ thể + Th ng kê: Các m ố
ức độ biểu hiện đặc điểm c a m ủ ẫu + Điều tra ch n m ọ
ẫu: thu thập dữ liệu c a m ủ ẫu b. Biến và dữ liệu
- Biến là đặc điểm của đơn vị t ng th ổ
ể hoặc mẫu được chọn ra để nghiên cứu.
- Dữ liệu là biểu hiện quan sát được c a m ủ t bi ộ ến - Biến bao g m ồ
+ Định tính – không đo đượ c bằng số
+ Định lượng: rời rạc + liên t c ụ
3. Thang đo trong thống kê: Định danh
Dữ liệu được biểu hiện không có quan hệ Biến định tính
bằng các đặc điểm, tính hơn kém chất Thứ bậc có quan hệ thứ bậc, hơn kém Khoảng
biểu hiện bằng con số và nằm trong m t ộ Biến định lượng
có đơn vị đo lường cụ khoảng Tỉ lệ thể bắt đầu từ 0
4. Thng kê mô t và thng kê suy din: - Th ng kê mô t ố ả: t ch ổ
ức, tóm tắt, trình bày dữ liệu - Th ng ố
kê suy diễn: đưa ra kết luận về các tham số t ng ổ thể dựa trên các th ng ố kê mẫu
Bài 2: Trình bày d liu b ng b
ảng và đồ th
1. Trình bày d liệu đơn biến a. Bảng: - Bảng tần s phân ph ố i: ố + Tần số: là s l
ố ần xuất hiện m t giá tr ộ ị lượng biến c th ụ ể nào đó + Bảng tần s phân ph ố i ố liệt kê s l
ố ần xuất hiện của các giá trị lượng biến dưới dạng bảng - B ng t ả n s ầ ố phân ph i g ố i ản đơn: + K thu ỹ
ật: coi mỗi giá trị lượng biến là m t t ộ ổ + Phạm vi áp d ng
ụ : Biến định tính + Biến rời rạc có ít giá trị - B ng t ả n s ầ ố phân ph i có kho ố ng cách t ả : ổ + K thu ỹ ật: ghép m t
ộ phạm vi lượng biến vào m t t ộ ổ + Phạm vi áp d ng
ụ : Biến rời rạc có nhiều giá trị + Biến liên t c ụ
+ Lý do tiến hành phân t v ổ ới khoảng cách tổ + Gồm: Bảng tần s ố có khoảng cách t
ổ bằng nhau + Bảng tần số có khoảng cách t không b ổ ằng nhau - M t s ộ thu ố ật ngữ:
+ Giới hạn dưới (ghd): giá trị thấp nhất c a m ủ t t ộ ổ. + Giới h n t
ạ rên (ght): giá trị cao nhất c a m ủ ột tổ
+ KCT: phạm vi lượng biến c a m ủ t t ộ ổ từ ghd đến ght + D y s  ố ph n ph  ối c n c  t ó n g i l ọ à dy s t
ố huộc tnh (phn t theo ổ biến
định tnh) và dy số lượng biến (phn tổ theo biến định lượng). b. Đồ thị: Biến
định Biểu đồ hình cột - 1 tr c bi ụ ểu diễn các thu c t ộ nh tính và biến giản đơn - Tr c ụ c n
 lại là tần số hoặc tuần suất xuất hiện rời rạc của từng loại thu c t ộ nh Series 2 5 0
Category 1Category 2Category 3Category 4 Series 2
Biểu đồ hình tròn - Sử d ng ụ biểu đồ tròn khi mu n ố mô tả, so sánh
tỉ lệ % xuất hiện c a các bi ủ ến.
- Biểu đồ tròn thường mô tả tần suất. Sales 1st Qtr 2nd Qtr 3rd Qtr 4th Qtr
Biến liên tục Biểu đồ tần s ố phân - Biểu đồ tần s ố phn phối m t ô ả th ng tin ô trong phối các bảng tần s ố phn phối c ó khoảng cách t ổ dưới dạng đồ thị + Đối xứng + Lệch phải + Lệch trái + Bimondal (2 đỉnh) Tiêu đề Biểu đồ 25 20 15 10 5 0 (5, 9] (13, 17] (21, 25] [1, 5] (9, 13] (17, 21] Biểu đồ hộp Đa giác tần số
- Đa giác tần số mô tả tần số và trị số giữa c a t ủ ổ cho các bảng tần s
ố phân phối có khoảng cách tổ.
2. Trình bày d liệu đa biến:
Biến định tính Bảng dữ liệu chéo - Cross-table được sử dụng để nghiên cứu mối và biến rời rạc
liên hệ giữa hai biến định tính hoặc biến rời rạc ít giá trị với ít giá trị.
- Lưu ý: khi xy dựng cross-table phải xác định được biến ph thu ụ c (dependent) và bi ộ ến độc lập (independent) để đưa
vào dng và cột cho phù hợp. Biểu đồ thanh Biến liên tục Đồ thị phân tán Bài 3: Các m th c độ ng kê mô t
1. Thng kê mô t cho mt biến:
a. S tuyệt đối và s tương đối - S tuy ố ệt đối trong th ng kê bi ố
ểu hiện quy mô, số lượng của hiện tượng nghiên
cứu tại thời gian, địa điểm c ụ thể. + Đơn vị tính:
• Đơn vị hiện vật: cái, con, quả, chiếc, m, kg, giờ, ngày...
• Đơn vị giá trị: VND, USD,... - S
ố tương đối trong th ng kê bi ố
ểu hiện quan hệ so sánh giữa hai mức độ nào đó của hiện tượng + Đơn vị tính:
• lần, phần trăm (%), phần nghìn (‰)
• Đơn vị kép: người/km2, sản phẩm/người... - Các loại s ố tương đ i ố t = 𝑦1
Số tương đối động thái (tốc độ phát triển) 𝑦0(100) Số tương đối kế
Số tương đối nhiệm vụ Kn = 𝑦𝐾𝐻 hoạch KH 𝑦0 (100)
Số tương đối thực hiện Kt = 𝑦1 𝑦𝐾𝐻 (100) KH
Phản ánh tỷ trọng của từng bộ phận cấu
Số tương đối kết cấu thành trong m t t ộ ổng thể. Di= 𝑦1 ∑𝑦1 (100) so sánh
˗ hai hiện tượng cùng loại nhưng khác
Số tương đối không gian nhau về không gian
˗ hai mức độ giữa hai b ph ộ ận trong m t ộ tổng thể
Số tương đối cường độ
so sánh chỉ tiêu của hai hiện tượng khác
nhau nhưng có quan hệ với nhau.
b. Các mức độ trung tâm (i) Số trung bình
- Đặc điểm trung bình c ng: ộ
• Dữ liệu sử ụng thang đo kho d ảng, t l ỷ ệ
• Tất cả các giá trị trong tổng thể đều tham gia vào công thức tính • Chỉ t
nh được một giá trị trung bình
• Tổng chênh lệch của các giá trị so với trung bình c ng b ộ ằng 0 • Chị ảnh hưở u
ng của giá trị đột xuất (ii) Số trung vị
- Giá trị lượng biến của đơn vị đứng ở vị trí chính giữa trong dãy s ố lượng biến + S ố đơn vị t ng th ổ
ể lẻ (∑𝑓𝑖= 2m+1): Me = xm+1 + S ố đơn vị t ng th ổ
ể chẵn (∑𝑓𝑖=2m): Me = 𝑥𝑚+ 𝑥𝑚+1 2 - Đặc điểm:
+ Không bị ảnh hưởng c a giá tr ủ ị t xu độ ất
+ Dữ liệu sử dụng thang đo thứ bậc, khoảng, t l ỷ ệ (iii) Mốt - M t là bi ố
ểu hiện xuất hiện ph bi
ổ ến nhất trong dãy số
- Xác định dựa vào tần số - Đặc điểm: + Dữ liệu sử d ng t ụ
ất cả các loại thang đo
+ Không bị ảnh hưởng c a giá tr ủ ị t xu độ ất (ngoại lai) + M t ộ s
ố trường hợp không có m t ho ố ặc có nhiều m t ố
(iv) So sánh trung bình, trung vị, mốt
c. Các mức độ đo độ biến thiên
- Khoảng biến thiên: Là chênh lệch giữa giá trị lớn nhất và nhỏ nhất trong dãy s . ố R = xmax - xmin - Khoảng tứ phân vị:
+ Tứ phân vị: Các giá trị chia tập hợp dữ liệu (đ được sắp xếp từ nhỏ đến
lớn) thành 4 phần bằng nhau.
+ Thập phân vị: Các giá trị chia tập hợp dữ liệu (đ được sắp xếp từ nh ỏ
đến lớn) thành 10 phần bằng nhau.
+ Bách phân vị: Các giá trị chia tập hợp dữ liệu (đ được sắp xếp từ nh ỏ
đến lớn) thành 100 phần bằng nhau.
+ Cách xác định bách phân vị:
• Xác định vị trí c a phân ủ vị thứ p: Lp =(n+1) p • Tính giá trị c a phâ ủ
n vị thứ p dựa vào vị trí
+ Khoảng tứ phân vị là: Là chênh lệch giữa giá trị tứ phân vị thứ ba và tứ
phân vị thứ nhất. IQR = Q3 Q – 1
- Phương sai: Là trung bình c ng ộ c a
ủ tổng bình phương độ lệch so với s ố trung bình
- Độ lệch chuẩn: Là căn bậc hai của phương sai
+ Độ lệch chuẩn của tổng thể: σ = √σ 2
+ Độ lệch chuẩn của mẫu: S= √𝑆2 - Hệ số biến thiên: + Là s ố tương i
đố (%) tnh bằng cách so sánh giữa
độ lệch chuẩn với số trung bình c ng ộ V = S/𝑥 × 100 + Là thước đo
độ biến thin tương i, đố c
ó thể dng để so sánh giữa các
hiện tượng khác loại hoặc c ng lo  ại và c s
ó ố bình qun khác nhau
d. Hình dáng phân phi dãy s:
- Hệ số Skewness: là thước đo độ đối xứng của phân phối - Biểu đồ h p
ộ ria mèo (boxplot) biểu diễn 5 mức độ th ng ố
kê mô tả: giá trị lớn
nhất (max), giá trị nhỏ nhất (min), tứ phân vị thứ nhất (Q1), tứ phân vị thứ ba (Q3) và trung vị (Q2)
- Quy tắc 3 sigma: Đối với phân ph i chu ố ẩn:
+ Khoảng 68% các quan sát nằm trong phạm vi (+) và (-) 1 lần độ lệch chuẩn so với trung bình
+ Khoảng 95% các quan sát nằm trong phạm vi (+) và (-) 2 lần độ lệch chuẩn so với trung bình
+ Khoảng 99,7% các quan sát nằm trong khoảng (+) và (-) 3 lần độ lệch chuẩn so với trung bình
2. Thống kê mô tả phản ánh mối liên hệ:
a. Hiệp phương sai: Phản ánh chiều hướng của mối liên hệ
b. Hệ số tương quan: Phản ánh chiều hướng và cường độ của mối liên hệ
Bài 4: Tng quan v xác suất và định lí gii hn trung tâm
1. Tng quan v xác sut:
a. Khái nim v xác su t, bi ấ ến ng u nhiên: ẫ - Xác suất là:
+ khả năng mà một sự kiện có thể xảy ra.
+ X/S cung cấp mối liên hệ giữa t ng ổ thể và mẫu.
- X là biến ngẫu nhiên nếu giá trị c a X=x là ủ hoàn toàn ngẫu nhiên.
- Xác suất để X nhận giá trị x là p(x)=P(X=x). - Nếu m t bi ộ
ến ngẫu X nhận giá trị xi, khi đó 1. 0

2. ∑𝑝( 𝑥𝑖 𝑥𝑖) =1 b. Phân ph i xác su
t ca biến ngu nhiên liên tc: - Phân ph i chu ố ẩn:
+ Dạng hình chuông, đối xứng qua giá trị trung tm μ, có đỉnh tại x=μ, đồ
thị tiệm cận 0 khi x→±∞. 1. E(X)=μ; V(X)=σ2
2. Diện tích dưới đường cong=1 3. Kí hiệu: X~N(μ,σ2).
4. Giá trị trung bình khácnhau–vị trí thay i d đổ ọc theo tr c x ụ
5. Phương sai khác nhau–đồ thị nh n ho ọ ặc thoải
+ Chuẩn hoá: Là quá trình chuyển một biến phân ph i chu ố ẩn về phân phối chuẩn hóa
+ Nếu X~N(μ,σ2), sử dụng công t ức dưới đy để h chuẩn hóa: Z = 𝑋−𝜇 𝜎 ~ N(0,1) -> Sử d ng b ụ ảng Z để tra X/S + Quy tắc đối xứng: • P(Z<-a) = P(Z>a) • P(Z>a) = 1 P(Z–
• P(a2. Định lí gii hn trung tâm:
a. Phân phi ca mu:
- Khi cỡ mẫu tăng ln (đặc biệt tăng đến vô hạn và tiệm cận về quy mô c a t ủ ng ổ
thể), phân phối của mẫu sẽ tiệm cận về phân ph i chu ố ẩn.
b. Phân phi ca trung bình mu:
- Bất kể biến ngẫu nhin ban đầu có dạng phân phối như thế nào, khi cỡ mẫu tăng lên phân ph i
ố của các trung bình mẫu tiệm cận về phân ph i chu ố ẩn.
- Bất kể biến ngẫu nhin ban đầu có dạng phân phối như thế nào, với m t ộ cỡ mẫu
n, độ lệch chuẩn của các trung bình mẫu (sai s bình ố
quân chọn mẫu) bằng 𝜎 √𝑛, kí
hiệu là SE (Standard error of the mean).
-> Bất kể tổng thể có phân ph i th ố
ế nào (chuẩn hay không chuẩn), khi cỡ mẫu đủ
lớn phân phối của các trung bình mẫu sẽ tuân theo quy luật phân ph i ố chuẩn và
chúng ta có thể sử d ng th ụ
ống k Z để tính xác suất cho bất k gi ỳ á trị trung bình nào
c. Định lí gii hn trung tâm: - Nếu X là m t
ộ biến ngẫu nhiên có giá trị trung bình là μ và phương sai là σ2, thì 𝑥 →N(𝜇,𝜎2𝑛) 𝑥−𝜇 𝜎
√𝑛 Z ~ N (0,1) as n → ∞
Bài 5: Ước lượng và kiểm định gi thuyết th ng kê
1. Ước lượng th ng kê:
a. Ước lượng (suy r ng) k ộ ết qu ả điều tra:
- Ước lượng điểm/ trung bình: thống kê tính từ mẫu được dng để ước lượng các tham s c ố a t ủ ổng thể
- Ước lượng bằng khoảng tin cậy: là khoảng giá trị được xác định từ th ng ố kê
mẫu mà với xác suất c th ụ ể, tham s c ố a t ủ ng
ổ thể sẽ thuộc khoảng đó - z,t làhệ s
ố tin cậy(giá trị tới hạn mức α c a
ủ phân phối chuẩn hoá và phân phối Student) - α m
– ức ý nghĩa (xác suất mắc sai lầm)
- (1-α) là xác suất hay trình độ tin cậy - Trong trường hợp t ng ổ
thể là hữu hạn, Chúng ta điều chỉnh phạm vi sai s trong ố
công thức xác định khoảng tin cậy. FPC=√𝑁−𝑛 𝑁−1
b. Xác định kích thước (quy mô) mu:
- Các yếu tố ảnh hưởng tới kch thước mẫu: + Hệ s tin c ố
ậy (z)/ Độ tin cậy của ước lượng
+ Phương sai (độ đồng đề u) của tổng thể + Phạm vi sai s ch ố n ọ mẫu/sai s ch ố n m ọ ẫu cho phép (𝜀) - M t s ộ
ố phương pháp xác định phương sai tổng thể:
+ Lấy phương sai lớn nhất hoặc t
ỷ lệ gần với 0,5 nhất trong các lần điều tra trước (nếu có)
+ Sử dụng kết quả c a nghiên c ủ
ứu có tính chất tương tự
+ Tiến hành nghiên cứu thử nghiệm + Lấy t
ỷ lệ bằng 0,5 hoặc ước lượng phương sai dựa vào khoảng biến thiên
𝜎 = 𝑅6= 𝑥𝑚𝑎𝑥− 𝑥𝑚𝑖𝑛 6
2. Kiểm định gi thuyết thng kê
a. Nhng vấn đề chung v kim định giá thuyết thng kê:
- Giả thuyết: là m t tuyên b ộ v ố ề tham s c ố a t ủ ng th ổ
ể cần được chứng minh
- Kiểm định giả thuyết là 1 quy trình dựa trên bằng chứng mẫu và lí thuyết xác suất để xác đ
ịnh xem giả thuyết đưa ra có phải là 1 tuyên bố hợp lí hay không
1) Bước 1: Nêu giả thuyết
- Giả thuyết không (H0): là tuyên b
ố về giá trị của tham s ố t ng ổ thể nhằm m c ụ
đch kiểm tra trn cơ ở bằng chứng c th ụ ể - Giả thuyết i
đố (H1): là tuyên bố được chấp nhận nếu dữ liệu mẫu cho hấy đủ
bằng chứng chứng minh giả thuyết là không sai 2) L ựa ch n m ọ ức ý nghĩa - Sai lầm loại I: bác b ỏ H0 khi H0 đúng
- Sai lầm loại II: chấp nhận H0 khi H0 sai 3) L ựa ch n ti ọ êu chu n ki ẩ ểm định
- Tiêu chuẩn kiểm định là giá trị được xác định từ dữ liệu mẫu, được sử dụng để
ra quyết định bác bỏ giả thuyết không
- Biết PS tổng thể (𝜎2): Zqs= 𝑥−𝜇0 𝜎 √𝑛
- Chưa biết PS tổng thể (𝑠2): Tqs= 𝑥−𝜇0  𝑠√𝑛
4) Xác định quy tắc ra quyết định:
- Quy tắc ra quyết định dựa vào miền bác bỏ
+ Nếu giá trị tiêu chuẩn kiểm định thu c ộ miền bác b ỏ (W ), có đủ cơ sở để bác bỏ H0 + Nếu giá trị c a t
ủ iêu chuẩn kiểm định không thu c mi ộ ền bác bỏ, chưa đủ cơ sở để bác bỏ H0
- Quy tắc ra quyết định dựa vào P-value:
+ P-value là xác suất c a giá ủ
trị tiêu chuẩn kiểm định từ ngưỡng tnh được
dựa trên thông tin mẫu với giả định giả thuyết không là đúng.
+ Các nguyên tắc ra quyết định để bác b gi
ỏ ả thuyết H0 với P-value là:
• Nếu p-value lớn hơn hoặc bằng α, chưa đủ cơ sở để bác bỏ giả thuyết H0.
• Nếu p-value nhỏ hơn α, bác bỏ giả thuyết H0.
- Quy tắc ra quyết định dựa vào Khoảng tin cậy: Bác bỏ giả thuyết H0 khi 𝜇0 không thu c kho ộ
ảng tin cậy (1 - 𝛼) của ước lượng giá trị trung bình. 5) Ra quyết định
- Xác định giá trị tiêu chuẩn kiểm định từ mẫu quan sát
- Dựa vào các quy tắc ra quyết định để ra quyết định. 6) Nêu kết luận - Có 2 trường hợp:
+ Nếu giá trị tiêu chuẩn kiểm định thu c ộ miền bác b /Giá tr ỏ ị xác suất nhỏ
hơn 𝛼=> Có đủ cơ sở
để bác bỏ giả thuyết H0
+ Nếu giá trị tiêu chuẩn kiểm định không thuộc miền bác bỏ/Giá trị xác
suất lớn hơn hoặc bằng 𝛼 => Chưa đủ cơ sở để bác b gi ỏ ả thuyết H0
b. Kiểm định giá tr trung bình ca 1 tng th:
- Giả sử nghiên cứu biến ngẫu nhiên X phân phối chuẩn
- Chưa biết 𝜇 song có cơ sở để giả đị
nh nó bằng 𝜇0 (H0: 𝜇 = 𝜇 0)
- Để kiểm định giả thuyết trên, lấy ngẫu nhin n đơn vị từ đó tính các thống kê mẫu.
- Tiêu chuẩn kiểm định
- Biết PS tổng thể (𝜎2): Zqs= 𝑥−𝜇0 𝜎 √𝑛
Nếu H0 đúng -> th ng kê Z s ố
ẽ tuân theo quy luật pp chuẩn hoá
- Chưa biết PS tổng thể (𝑠2): Tqs= 𝑥−𝜇0  𝑠√𝑛
Nếu H0 đúng -> thống kê T sẽ tuân theo quy luật phân ph i ố Student với bậc tự do là n-1
c. Kiểm định t l ca 1 t ng th ổ ể:
- Giả sử nghiên cứu m t t ộ ng t ổ hể, t l ỷ ệ chung là p.
- Chưa biết p song có cơ sở để giả đị ằ nh nó b ng p0 (H0:p=p0)
- Để kiểm định giả thuyết trên, lấy mẫu n đơn vị từ đó tnh các thống kê của mẫu.
- Tiêu chuẩn kiểm định
Bài 6: Phân tích tương quan và hồi quy
1. Mi liên h gia các hiện tượng
a. Liên h hàm s:
- Khái niệm: liên hệ hàm s là m ố i liên h ố ệ hoàn toàn chặt chẽ
- Đặc điểm: Liên hệ được biểu hiện trên từng đơn vị cá biệt
b. Liên h tương quan:
- Khái niệm: liên hệ tương quan là mối liên hệ không hoàn toàn chặt chẽ.
- Đặc điểm: Liên hệ không được biểu hiện trên từng đơn vị cá biệt mà phải quan sát s l ố ớn
2. Phân tích tương quan:
- Phn tch tương quan g m các k ồ thu ỹ
ật đo lường mối liên hệ giữa hai biến
- Hệ số tương quan đo lường mức độ chặt chẽ c a ủ m i li ố ên hệ tương quan tuyến tính giữa hai biến
r= (𝑥−𝑥)(𝑦−𝑦) (𝑛−1)𝑆𝑥𝑆𝑦 - Tác d ng: ụ
+ Xác định chiều hướng c a m ủ i l ố iên hệ
+ Đánh giá mức độ chặt chẽ c a liên h ủ
ệ tương quan tuyến tính
3. Phân tích hi quy
a. Phân tích hồi quy đơn: - Đường h i quy ồ
lý thuyết: là đường điều chỉnh bù trừ các chênh lệch ngẫu nhiên
nêu ra mối liên hệ cơ bản c a hi ủ ện tượng.
- Phương trình hồi quy: là phương trình xác định vị trí của đường h i ồ quy lý thuyết - Mô hình hồi quy t ng th ổ ể:
• 𝛼: phản ánh ảnh hưởng của các nguyên nhân khác (ngoài nguyên nhân x) tới kết quả y
• β: phản ánh ảnh hưởng trực tiếp c a nguyên nhân ủ x tới kết quả y. C th ụ ể,
khi x tăng thm 1 đơn vị thì y thay đổi trung bình β đơn vị
+ β > 0: x và y có mối liên hệ thuận (cùng chiều)
+ β < 0: x và y có mối liên hệ ịch (ngượ ngh c chiều)
- Phương trình hồi quy mẫu:
- Phương pháp OLS: Tìm các tham s sao c ố
ho tổng bình phương các chnh lệch
giữa giá trị thực tế và giá trị lý thuyết của tiêu thức kết quả là nh nh ỏ ất. + Giả thiết OLS:
• Giả thiết 1: Mô hình được ước lượng trn cơ sở mẫu ngẫu nhiên • Giả thiết 2: Kỳ ọ v ng toán của sai số ằ b ng không
• Giả thiết 3: Sai s tuân theo quy lu ố ật phân b chu ố ẩn
• Giả thiết 4: Phương sai của sai số bằng nhau (không đổi)
• Giả thiết 5: Không có tương quan giữa các phần dư (không có tự tương quan)
• Giả thiết 6: Giữa các biến c
độ lập không có tương quan tuyến tính hoàn hảo (đa c ng tuy ộ
ến) - Đối với hồi quy b i. ộ + N i dung: ộ b= ∑(𝑥𝑖 𝑛𝑖=1−𝑥 )( 𝑦𝑖−𝑦 ) ∑(𝑛𝑥𝑖 𝑖=1 −𝑥 )^2 a=𝑦-b𝑥
- Tính ∑𝑥, ∑𝑦, ∑𝑥 ∗ 𝑦, ∑𝑥^2 ∑ , 𝑦^2,
a= ∑𝑦 ∑𝑥2−∑𝑥∑𝑥y 𝑛∑𝑥2−(∑𝑥)2
b= 𝑛∑𝑥y− ∑𝑥∑𝑦 𝑛∑𝑥2−(∑𝑥)2
b. Phân tích hồi quy bội
- Bj: phản ánh ảnh hưởng thuần c a nguyên ủ
nhân xj tới kết quả y (khi các yếu tố
khác không đổi). Cụ thể, khi xj tăng thm 1 đơn vị thì y thay đổi trung bình βj đơn vị